Déterminants du vote Front National
Le Front National est-il favorisé par des taux d‘abstention élevés ? Cette question a ...
Nous avons testé 4 spécifications différentes, avec des transformations logarithmiques pour la
variable expliquée et pour ...
l’année disponible la plus proche,
o Soit, à défaut, les ratios du canton,
o Soit, à défaut, ceux du département.
Chômage
...
- Le score du Front National et le taux d’abstention non transformés,
- Une segmentation de communes avec les seuils suiva...
commun, tout autre moyen de transport),
- Structure croisée statut professionnel et temps de travail
o Salariés à temps co...
Taux d’abstention
Sans tenir compte de
l’endogénéité
En tenant compte de
l’endogénéité
Pourcentage d’abstention –
communes...
inscrits une augmentation de 1000 euros du revenu médian diminue le score du FN de 0,19%.
Là aussi, ne pas tenir compte de...
Sans tenir compte de
l’endogénéité
En tenant compte de
l’endogénéité
Appartement -0,054
(0,006)
-0,059
(0,006)
Maison cons...
25 à 64 ans – diplôme bac ou
après
-0,155
(0,012)
-0,113
(0,013)
Plus de 65 ans – pas de diplôme –
communes moins de 370 i...
Plus de 65 ans – diplôme bac ou
après – communes moins de 370
inscrits
-0,063
(0,048)
-0,039
(0,051)
Plus de 65 ans – dipl...
Catégorie socio-professionnelle
Sans tenir compte de
l’endogénéité
En tenant compte de
l’endogénéité
Agriculteur, artisan,...
Non salarié à temps partiel -0,020
(0,010)
-0,030
(0,010)
La catégorie de référence est celle des CDI à temps plein. Une a...
résidence, mais dans la même unité urbaine, et qui ne vont pas travailler en transports collectifs.
L’effet est sans ambig...
Un intervalle peut en cacher un autre
Régression
Références8.
Nous invitons le lecteur à se reporter à l’article sur l’end...
Prochain SlideShare
Chargement dans…5
×

Déterminants du vote Front national - SLPV analytics

416 vues

Publié le

Analyse des votes du 1er tour des élections législatives de 2012.

Publié dans : Actualités & Politique
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
416
Sur SlideShare
0
Issues des intégrations
0
Intégrations
101
Actions
Partages
0
Téléchargements
2
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Déterminants du vote Front national - SLPV analytics

  1. 1. Déterminants du vote Front National Le Front National est-il favorisé par des taux d‘abstention élevés ? Cette question a fait les gros titres des journaux après les municipales de 2014. Il n’est pas si simple d’y répondre, car les outils standards (corrélation, régression) donnent des réponses biaisées. Une fois l’endogénéité des données correctement prise en compte, l’association positive entre abstention et score du FN s’avère nettement plus prononcée que ne le laisserait croire une simple analyse de corrélation. Score du Front National et abstention : quelle corrélation ?1. Après les municipales de 2014, de nombreux articles de presse se sont interrogés sur le lien entre abstention et score du Front National. On trouvera ici et là deux exemples typiques de discussion sur le sujet. Ces analyses ont en commun de reposer sur des calculs de corrélation. Est-ce que le score du Front National est plus élevé là où l’abstention est la plus forte ? Quoi de plus efficace, et de plus simple, qu’une corrélation pour répondre à cette question. Et ce, d’autant que les outils de géo-visualisation facilitent le travail du statisticien. En superposant des indicateurs calculés à un niveau très fin, ils donnent une impression rassurante de profondeur d’analyse. Pourtant, ces calculs, et les conclusions qui en sont tirées, sont faux. La corrélation entre le score du Front National et le niveau de l’abstention est un calcul statistique biaisé. Comment une simple corrélation pourrait-elle être biaisée ? A cause d’un phénomène fondamental en statistique, l’endogénéité. Le lecteur intéressé pourra lire notre article sur l’endogénéité : il y trouvera une explication du problème, et quelques exemples. Dans le présent article, nous estimons un modèle reliant score de l’extrême droite et niveau d’abstention, en prenant soin de traiter le problème de l’endogénéité des données. Une autre faiblesse des analyses mentionnées plus haut est qu’elles ne tiennent pas compte de l’hétérogénéité des communes concernées. Notre modèle prend en compte une dizaine de caractéristiques des communes, au-delà des résultats électoraux, afin d’isoler l’effet de chaque variable toutes choses égales par ailleurs. Le modèle et les données2. Le lecteur qui n’est pas intéressé par les détails du modèle et des données peut aller directement à la section 5 pour les résultats de l’estimation. Les résultats présentés sont légèrement différents de ceux de la première version postée : l’ajout de la variable permettant de prendre en compte l’intensité de la pratique religieuse a modifié, la plupart du temps à la marge, l’ensemble des coefficients estimés. Le modèle A ce stade, nous ne nous appuyons pas sur un modèle structurel pour évaluer le lien entre abstention et score du Front National. Le modèle réduit que nous allons estimer relie le score du Front National et des partis assimilés, exprimé en pourcentage des suffrages exprimés avec : - L’abstention, calculée en pourcentage des inscrits - Et diverses caractéristiques des communes. Le modèle est un modèle linéaire : Score du FN = a + b*Taux d’abstention + c*caractéristique 1 + d*caractéristique 2 +…+u
  2. 2. Nous avons testé 4 spécifications différentes, avec des transformations logarithmiques pour la variable expliquée et pour le taux d’abstention : Score du FN non transformé vs Taux d’abstention non transformé, Score du FN en logarithme vs Taux d’abstention non transformé,…. Le modèle a aussi été segmenté par taille de communes : le niveau d’abstention est très différent suivant la taille de la commune (de 30% dans le premier décile de taille jusqu’à près de 43% dans le dernier), et le modèle obtenu est significativement différent selon la taille de la commune. Les données de vote Les données utilisées sont celles sur les votes au niveau des communes pour les législatives de 2012. Seules les données du premier tour sont utilisées. Ces données sont librement accessibles sur le site www.data.gouv.fr. Une observation dans le modèle résulte du croisement commune*circonscription. Une commune à cheval sur plusieurs circonscriptions intervient autant de fois dans le modèle. Nous avons agrégé les résultats du Front National et des candidats catégorisés extrême droite dans le fichier de données. L’essentiel est constitué par le FN : 3 528 663 suffrages exprimés pour ce parti, 49 499 pour les autres candidats. L’estimation se fait pour les départements de France métropolitaine, ainsi que la Martinique, la Guadeloupe et la Réunion. Pour les autres circonscriptions (Guyane, Mayotte, Nouvelle Calédonie, Polynésie, Saint Martin/Saint Barthélémy, Saint Pierre et Miquelon, Wallis et Futuna, français de l’étranger), nous ne disposons pas des caractéristiques des communes nécessaires au modèle. Les données sur les communes Revenus Nous avons utilisé les chiffres du dispositif revenus fiscaux localisés des ménages (RFLM) basés sur les fichiers exhaustifs de la Direction Générale des impôts, et disponibles depuis 2000. On trouve aussi, sur le site de l’INSEE, des revenus au niveau local pour les années 1998 à 2010 (Source : DGFiP, fichier « Impôt sur le revenu des personnes physiques). Mais cette série est moins homogène (ruptures en 1999 et 2006), n’est pas calculée par unité de consommation, et donne des résultats moins bons en prévision que le dispositif RFLM. Ces données sont disponibles au niveau communal pour la France métropolitaine, la Guadeloupe, la Martinique et la Réunion – hors dispositif RFLM pour ces trois DOM -, ainsi qu’au niveau des arrondissements de Paris, Lyon et Marseille. Les arrondissements ne correspondant pas à des circonscriptions législatives, il a fallu répartir les indicateurs sur les différentes circonscriptions concernées : - Les indicateurs du type nombre de ménages fiscaux ou nombre d’unités de consommation ont été répartis au prorata du nombre de circonscriptions auxquels appartient l’arrondissement (donc, divisés par 2 si l’arrondissement appartient 2 circonscriptions, ce qui est le cas majoritaire), - Les indicateurs du type médiane ont été affectés à chaque circonscription concernée, et on a fait la moyenne arithmétique de tous les indicateurs concernant une circonscription. Des indicateurs nominaux ont été calculés en utilisant l’évolution de l’indice des prix à la consommation. Enfin, le fichier présente des valeurs manquantes, que ce soit en totalité sur les années 1993 à 1999 ou après 2012, ou partiellement quand les règles du secret statistique n’autorisent pas la publication : - Pour les années totalement manquantes, les données ont été estimées en appliquant, aux données locales disponibles, l’évolution du PIB régional en valeur pour les données de revenu globales, et l’évolution du PIB par habitant pour les données par unité de consommation. - Pour les données partiellement manquantes, en utilisant : o Soit les ratios (nombre d’inscrits sur nombre de ménages fiscaux ou d’unité de consommation, revenu sur nombre de ménages fiscaux ou d’unité de consommation) de la même commune pour
  3. 3. l’année disponible la plus proche, o Soit, à défaut, les ratios du canton, o Soit, à défaut, ceux du département. Chômage Les demandes d’emploi en fin de mois (DEFM) sont disponibles au niveau de la commune sur le site de l’INSEE à partir de 2001, et jusqu’à 2011, à leur valeur à fin décembre, pour la France métropolitaine, la Guadeloupe, la Martinique et la Réunion. Comme pour les revenus, les valeurs manquantes sont estimées de deux manières différentes : - Soit, pour les données partiellement manquantes par le ratio DEFM sur inscrits, pour le canton, à défaut la zone d’emploi, ou à défaut le département, - Soit, pour les années totalement manquantes, en appliquant l’évolution départementale du chômage au sens du BIT aux données locales disponible. Nous sommes bien conscients de la non homogénéité entre les notions DEFM et chômage BIT, mais cela semble, sauf erreur de notre part, la meilleure solution à partir des données disponibles. Des indicateurs ont été construits aux niveaux de la commune, du canton et de la zone d’emploi, afin de comparer leur performance. Données du recensement Les autres données que nous utilisons sont issues du recensement. Les derniers fichiers détaillés par communes disponibles auprès de l’INSEE sont ceux de 2011. Les variables suivantes sont disponibles : - Structure par âge, sexe, catégorie socio professionnelle et niveau de diplôme, - Structure du parc de logements : maisons, appartement, résidences secondaires, logements vacants, avec la décomposition par année de construction, - Proportion de salariés/non salariés, et de temps partiel/temps complet - Proportion d’immigrés, - Structure de la population par éloignement du lieu de travail et moyen de transport utilisé, - Structure de la population par type de foyer (2 actifs, 1 actif, famille monoparentale,…) Les données par arrondissement pour Paris, Lyon et Marseille ont été affectées aux circonscriptions législatives des arrondissements concernés, et on a fait la moyenne des pourcentages concernés. Choix de spécification3. Segmentation des communes et transformation logarithmique de la variable expliquée et du taux d’abstention Dans une première segmentation, nous avons partagé les communes en 5 groupes, avec les seuils suivants : 700, 2100, 7000 et 21000 inscrits. Les autres segmentations testées sont calculées à partir de ces seuils, en retirant 10, 20, …, 500 au premier, 30, 60,…1500 au deuxième, etc… Cela fait donc 50 segmentations différentes. Le modèle est estimé pour ces 50 segmentations et les 4 configurations possibles de transformation logarithmique pour le score du Front National et le taux d’abstention. Le modèle retenu est celui qui minimise la somme des carrés des résidus sur l’ensemble des observations. Le modèle final est basé sur :
  4. 4. - Le score du Front National et le taux d’abstention non transformés, - Une segmentation de communes avec les seuils suivants, en termes d’inscrits : 370, 1100, 3700, 11100. Les autres variables du modèle Les variables rentrant dans le modèle, hors taux d’abstention, sont les suivantes, toutes exprimées en pourcentage d’effectifs au sein de la commune : - Structure croisée sexe âge (moins de 24 ans, entre 25 et 54 ans, plus de 55 ans), - Catégorie socio professionnelle des individus : o Agriculteurs, artisan, commerçant, chef d’entreprise, profession libérale, o Cadre supérieur de la fonction publique, o Cadre supérieur en entreprise, o Employé de la fonction publique, o Employé en entreprise, o Ouvrier, o Retraité. - Structure croisée sexe âge (moins de 24 ans, entre 25 et 64 ans, plus de 65 ans) diplôme (aucun diplôme, diplôme près baccalauréat, baccalauréat et au-dessus), - Type de ménage : o Homme ou femme vivant seule, o Famille monoparentale, o Famille dont les deux parents travaillent, o Famille où seul l’homme travaille o Famille où seule la femme travaille, ou où aucun des deux adultes ne travaillent, o Plusieurs personnes, sans famille. - Proportion d’immigrés, - Type d’habitat : o Maison, o Appartement, o Résidence secondaire, o Logement vacant. - Revenu médian par unité de consommation, - Taux de chômage de la zone d’emploi, - Structure croisée distance du lieu de travail (réside et travaille dans la même commune, réside dans une commune rurale et travaille dans une autre commune/réside dans une unité urbaine et travaille dans une autre commune de la même unité urbaine, réside dans une commune urbaine et travaille en dehors de l’unité urbaine de résidence) moyen de transport utilisé (transports en
  5. 5. commun, tout autre moyen de transport), - Structure croisée statut professionnel et temps de travail o Salariés à temps complet en CDI, o Salariés à temps complet, mais pas en CDI, o Salariés à temps partiel, o Non salariés à temps complet, o Non salariés à temps partiel. - Variable 0/1 signalant l’appartenance de la commune à une sous-préfecture pour laquelle la densité de religieux hommes est dans le dernier quartile de sa distribution. L’idée est de tester si une pratique religieuse catholique intense reste un frein au votre Front National, comme tendent à le montrer des études sociologiques qualitatives. Et enfin, le département de la commune rentre dans le modèle, sous forme d’une variable 0/1. Une variable a été testée, mais n’a finalement pas été utilisée : les faits constatés par la police et la gendarmerie. Ces données ne sont disponibles qu’au niveau du département et leur faible variabilité déstabilise le modèle (on pourra se rapporter à cet autre article, ou l’abstention est modélisée, et où cette variable est utilisée, sans qu’elle rentre significativement dans le modèle). Estimation du modèle4. Le modèle a été estimé à la fois par la méthode des moindres carrés et la méthode des variables instrumentales (doubles moindres carrés). Seuls les estimateurs obtenus par les doubles moindres carrés sont valides, car le biais d’endogénéité a été éliminé. Nous rapportons cependant les deux estimations, afin que le lecteur puisse constater le biais de diagnostic induit par une mauvaise stratégie d’estimation. Les 5 modèles par taille de commune ont été tout d’abord estimés séparément, puis on a testé toutes les égalités possibles entre coefficients correspondants à une même variable entre les 5 modèles. Seuls les résultats du modèle final sont montrés ci-dessous. Au total, le modèle repose sur 36 769 observations et 238 variables. Le R² calculé pour la méthode des moindres carrés est de 0,47. Deux tests ont été menés pour vérifier nos hypothèses sur l’endogénéité : - Le test de Sargan, ou test de sur-identification. Ce test permet de tester si les deux variables instrumentales utilisées donnent des résultats homogènes, si on estimait séparément le modèle avec chacune d’elles. Il consiste à tester simultanément la nullité des coefficients de la régression des résidus de la régression augmentée, réalisée pour le test de Hausman, sur la constante et la variable endogène. Ce test est largement accepté. - Le test de Hausman, ou test d‘exogénéité. Il permet de tester si la variable taux d’abstention est effectivement endogène dans notre modèle. Il consiste à tester si les coefficients estimés par les moindres carrés et les double moindre carrés sont significativement différents. Une autre manière de le mettre en œuvre consiste à effectuer une régression augmentée. On estime par les moindres carrés notre modèle, avec l’ajout de deux variables explicatives : les résidus de la régression des variables endogènes sur les instruments – il y a deux variables endogènes, car le taux d’abstention n’a pas le même coefficient pour les petites communes et les autres. Le test consiste alors à vérifier que les coefficients des résidus dans cette régression sont significativement non nuls, ce qui est le cas. Le taux d’abstention est donc bien endogène. Résultats détaillés5. Les tableaux ci-dessous donnent les coefficients estimés, avec, entre parenthèses, l’écart-type associé. Les coefficients significativement différents de 0 dans l’estimation par les doubles moindres carrés sont surlignés en gras.
  6. 6. Taux d’abstention Sans tenir compte de l’endogénéité En tenant compte de l’endogénéité Pourcentage d’abstention – communes de moins de 370 inscrits 0,074 (0,005) 0,422 (0,023) Pourcentage d’abstention – autres communes 0,194 (0,009) 0,514 (0,021) Le taux d’abstention est l’une des variables les plus significatives du modèle. L’association positive entre abstention et score du FN est très nette. 1% de plus d’abstention se traduit par 0,5% de plus de votes pour le FN. On voit que la non prise en compte de l’endogénéité conduit à largement sous-estimer l’effet favorable de l’abstention sur le score du FN. Taux de chômage de la zone d’emploi Sans tenir compte de l’endogénéité En tenant compte de l’endogénéité Taux de chômage 0,981 (0,041) 0,926 (0,043) Le taux de chômage est aussi une variable très significative, au même niveau que le taux d’abstention. L’effet est le même quel que soit la taille de la commune : 1% de chômage en plus donne 0,93% de vote supplémentaire au FN. Revenu médian par unité de consommation Sans tenir compte de l’endogénéité En tenant compte de l’endogénéité Revenu médian par unité de consommation – communes de moins de 370 inscrits 0,172 (0,065) -0,589 (0,086) Revenu médian par unité de consommation – communes entre 370 et 1100 inscrits -1,421 (0,166) -1,878 (0,210) Revenu médian par unité de consommation – communes entre 1100 et 3700 inscrits -1,122 (0,213) -1,788 (0,253) Revenu médian par unité de consommation – communes de plus de 3700 inscrits -1,170 (0,192) -1,918 (0,235) Le revenu médian par unité de consommation est aussi très significatif, même si à un niveau un peu moindre que le taux de chômage ou le taux d’abstention. Plus le revenu médian s’élève, plus le score du FN recule. L’effet s’accroît avec la taille de la commune. Dans les communes de plus de 3700
  7. 7. inscrits une augmentation de 1000 euros du revenu médian diminue le score du FN de 0,19%. Là aussi, ne pas tenir compte de l’endogénéité amènerait à une grossière erreur de diagnostic. On pourrait être mené à conclure que, dans les petites communes, revenu médian et score du FN sont associés positivement. Pratique religieuse Il n’y a pas de données disponibles de manière exhaustive au niveau commune sur la pratique religieuse. Afin d’appréhender si celle-ci peut avoir un impact sur le score du Front National, nous avons employé une voie détournée. Le nombre de religieux habitant une commune est une donnée disponible du recensement. Le pourcentage de religieux habitant la commune n’est cependant pas le bon indicateur. En effet, il y a deux fois moins de prêtres que de communes : les limites du diocèse d’un prêtre dépassent celles de la commune. Par ailleurs, l’effet que nous cherchons à mesurer – l’intensité de la pratique religieuse – est une caractéristique culturelle qui va bien au-delà des frontières communales. Après différents essais sur le niveau d’agrégation à retenir, nous avons calculé le pourcentage de religieux au niveau de la sous-préfecture (ou arrondissement), en différenciant les hommes des femmes. Puis nous avons créé des indicatrices correspondant aux quartiles de la distribution de ces pourcentages. Le seul coefficient significatif est celui du pourcentage d’hommes religieux pour le quartile supérieur : Sans tenir compte de l’endogénéité En tenant compte de l’endogénéité Communes appartenant aux 25% de sous-préfectures où il y a le plus de religieux hommes -0,011 (0,001) -0,010 (0,001) Dans les communes concernées, toutes choses égales par ailleurs, le FN obtient en moyenne 1% de votes en moins. Le fait que cela soit vrai uniquement pour le pourcentage d’hommes tend à montrer qu’il s’agit bien d’un phénomène spécifiquement lié au catholicisme. Proportion d’immigrés Sans tenir compte de l’endogénéité En tenant compte de l’endogénéité Proportion d’immigrés -0,050 (0,013) -0,089 (0,014) La proportion d’immigrés dans la commune a un effet significativement négatif sur le score du FN. 1% d’immigrés supplémentaires diminue le score du FN de 0,09%. Ce résultat pourra sembler étrange à certains. Il est très robuste. Nous avons testé de nombreuses spécifications, et le résultat obtenu est très stable. Rappelons que notre modèle contrôle pour de nombreuses autres variables, et en particulier le département. Toutes choses égales par ailleurs, être plus souvent en contact avec des immigrés diminue la tentation de voter FN. Là aussi, ne pas tenir compte de l’endogénéité amènerait à sous-estimer l’effet de cette variable. Type d’habitat
  8. 8. Sans tenir compte de l’endogénéité En tenant compte de l’endogénéité Appartement -0,054 (0,006) -0,059 (0,006) Maison construite avant 1946 0 0 Maison construite entre 1947 et 1990 0,000 (0,004) -0,003 (0,004) Maison construite après 1991 0,033 (0,005) 0,039 (0,005) Résidences secondaires -0,017 (0,004) -0,024 (0,004) Logements vacants 0,018 (0,008) 0,010 (0,009) Logements occasionnels -0,052 (0,030) -0,047 (0,032) Pour toutes les variables qui décrivent la structure de la population de la commune, la modélisation nécessite de prendre une catégorie de référence. Pour le type d’habitat, la catégorie de référence est le pourcentage de ménages vivant dans une maison construite avant 1946. L’effet le plus significatif vient du pourcentage de ménages vivant en appartement. Si ce pourcentage augmente de 1%, le vote FN diminue de 0,06%. Rappelons là encore que nous sommes toutes choses égales par ailleurs, et que le modèle contrôle en particulier pour le revenu : toutes choses égales par ailleurs, une proximité plus grande avec les voisins diminue le vote FN. Le pourcentage de maisons construites récemment a un effet légèrement positif sur le vote FN. C’est l’inverse pour le pourcentage de résidences secondaires. Diplôme Sans tenir compte de l’endogénéité En tenant compte de l’endogénéité Hommes Moins de 24 ans – pas de diplôme -0,050 (0,062) -0,122 (0,066) Moins de 24 ans – diplôme avant bac 0,155 (0,040) 0,050 (0,043) Moins de 24 ans – diplôme bac ou après -0,175 (0,037) -0,136 (0,040) 25 à 64 ans – pas de diplôme 0,031 (0,017) 0,006 (0,018) 25 à 64 ans – diplôme avant bac 0 0
  9. 9. 25 à 64 ans – diplôme bac ou après -0,155 (0,012) -0,113 (0,013) Plus de 65 ans – pas de diplôme – communes moins de 370 inscrits -0,050 (0,024) -0,014 (0,025) Plus de 65 ans – pas de diplôme – autre communes -0,204 (0,049) -0,164 (0,052) Plus de 65 ans – diplôme avant bac -0,047 (0,019) -0,001 (0,021) Plus de 65 ans – diplôme bac ou après -0,052 (0,027) 0,021 (0,029) Femmes Moins de 24 ans – pas de diplôme – -0,077 (0,080) -0,152 (0,085) Moins de 24 ans – diplôme avant bac 0,074 (0,051) 0,009 (0,054) Moins de 24 ans – diplôme bac ou après -0,065 (0,040) -0,054 (0,043) 25 à 64 ans – pas de diplôme – communes moins de 370 inscrits 0,030 (0,045) -0,017 (0,048) 25 à 64 ans – pas de diplôme – communes entre 370 et 1100 inscrits -0,071 (0,054) -0,184 (0,059) 25 à 64 ans – pas de diplôme – communes plus de 1100 inscrits -0,088 (0,058) -0,286 (0,065) 25 à 64 ans – diplôme avant bac -0,012 (0,043) -0,035 (0,046) 25 à 64 ans – diplôme bac ou après -0,170 (0,042) -0,143 (0,045) Plus de 65 ans – pas de diplôme -0,119 (0,044) -0,143 (0,047) Plus de 65 ans – diplôme avant bac – communes moins de 370 inscrits -0,067 (0,044) -0,069 (0,047) Plus de 65 ans – diplôme avant bac – communes entre 370 et 1100 inscrits -0,159 (0,052) -0,185 (0,055) Plus de 65 ans – diplôme avant bac – communes plus de 1100 inscrits -0,103 (0,056) -0,113 (0,059)
  10. 10. Plus de 65 ans – diplôme bac ou après – communes moins de 370 inscrits -0,063 (0,048) -0,039 (0,051) Plus de 65 ans – diplôme bac ou après – communes entre 370 et 1100 inscrits -0,149 (0,062) -0,185 (0,066) Plus de 65 ans – diplôme bac ou après – communes plus de 1100 inscrits -0,149 (0,070) -0,181 (0,075) La catégorie de référence est le pourcentage d’hommes de 25 à 64 ans ayant un diplôme de niveau en-dessous du bac. Tous les coefficients significatifs sont négatifs. Ainsi, la surreprésentation de toutes les catégories surlignées en gras dans le tableau ci-dessus amène à une baisse du score du Front National. Type de ménage Sans tenir compte de l’endogénéité En tenant compte de l’endogénéité Famille avec deux adultes actifs 0,013 (0,006) 0,028 (0,006) Famille homme actif femme inactive 0,044 (0,007) 0,053 (0,008) Famille avec deux adultes inactifs – communes moins de 370 inscrits 0,007 (0,006) 0,021 (0,006) Famille avec deux adultes inactifs – communes plus de 370 inscrits 0,039 (0,011) 0,060 (0,011) Famille monoparentale – communes moins de 11100 inscrits -0,006 (0,007) -0,001 (0,008) Famille monoparentale – communes plus de 11100 inscrits -0,231 (0,075) -0,249 (0,079) Personne vivant seule 0 0 Autres cas 0,004 (0,010) 0,008 (0,010) La catégorie de référence est constituée des personnes vivant seules. Le pourcentage de ménages où l’homme travaille et la femme ne travaille pas a un effet significatif positif sur le vote FN : s’il augmente de 1%, le vote FN progresse de 0,05%. Même chose pour les familles avec deux adultes inactifs. Dans les très grandes communes, une plus forte proportion de familles monoparentales fait baisser le score du FN : -0,3% de vote FN pour une augmentation de 1% de cette proportion.
  11. 11. Catégorie socio-professionnelle Sans tenir compte de l’endogénéité En tenant compte de l’endogénéité Agriculteur, artisan, commerçant, chef d’entreprise -0,016 (0,006) -0,006 (0,007) Cadre de la fonction publique -0,043 (0,010) -0,041 (0,011) Cadre en entreprise -0,007 (0,009) -0,008 (0,009) Employé de la fonction publique – communes moins de 11100 inscrits -0,007 (0,006) -0,001 (0,006) Employé de la fonction publique – communes plus de 11100 inscrits 0,207 (0,099) 0,215 (0,105) Employé en entreprise 0,016 (0,006) 0,010 (0,006) Ouvrier 0,022 (0,005) 0,014 (0,005) Retraité 0 0 La catégorie de référence est constituée des retraités. Une augmentation du nombre de cadres de la fonction publique fait baisser le score du FN. Une augmentation du nombre d’ouvriers le fait augmenter, comme une augmentation du nombre d’employés de la fonction publique dans les plus grandes communes. Statut professionnel et temps de travail Sans tenir compte de l’endogénéité En tenant compte de l’endogénéité CDI à temps plein 0 0 Autre salarié à temps plein – communes moins de 11100 inscrits 0,003 (0,005) -0,004 (0,005) Autre salarié à temps plein – communes plus de 11100 inscrits 0,063 (0,090) 0,041 (0,096) Salarié à temps partiel – communes moins de 370 inscrits -0,008 (0,004) -0,005 (0,004) Salarié à temps partiel – communes plus de 370 inscrits -0,060 (0,010) -0,063 (0,011) Non salarié à temps plein 0,007 (0,005) 0,003 (0,005)
  12. 12. Non salarié à temps partiel -0,020 (0,010) -0,030 (0,010) La catégorie de référence est celle des CDI à temps plein. Une augmentation du nombre de salariés à temps partiel diminue le score du FN. Distance du lieu de travail et moyen de transport Sans tenir compte de l’endogénéité En tenant compte de l’endogénéité Réside et travaille dans la même commune – transport collectif -0,032 (0,024) -0,054 (0,026) Réside et travaille dans la même commune – transport personnel – communes moins de 370 inscrits -0,015 (0,003) -0,014 (0,003) Réside et travaille dans la même commune – transport personnel – communes plus de 370 inscrits -0,042 (0,004) -0,039 (0,005) Travaille dans une autre commune que la commune de résidence, même unité urbaine – transport collectif – communes moins de 370 inscrits -0,004 (0,010) 0,002 (0,010) Travaille dans une autre commune que la commune de résidence, même unité urbaine – transport collectif – communes entre 370 et 1100 inscrits 0,085 (0,019) 0,081 (0,020) Travaille dans une autre commune que la commune de résidence, même unité urbaine – transport collectif – communes entre 1100 et 3700 inscrits -0,014 (0,026) -0,017 (0,027) Travaille dans une autre commune que la commune de résidence, même unité urbaine – transport collectif – communes plus de 3700 inscrits -0,129 (0,016) -0,127 (0,017) Travaille dans une autre commune que la commune de résidence, même unité urbaine – transport personnel 0 0 Travaille en dehors de l’unité urbaine de résidence – transport collectif -0,018 (0,018) -0,030 (0,019) Travaille en dehors de l’unité urbaine de résidence – transport personnel 0,003 (0,002) 0,001 (0,002) La population de référence est constituée des actifs qui ne travaillent pas dans leur commune de
  13. 13. résidence, mais dans la même unité urbaine, et qui ne vont pas travailler en transports collectifs. L’effet est sans ambiguïté : la proximité du lieu de travail et du lieu de résidence a un effet négatif sur le score du FN. Quand le lieu de travail n’est pas situé dans la même commune que la résidence, mais dans la même aire urbaine, l’effet sur le score du FN dépend du moyen de transport utilisé. Dans les grandes communes, le fait d’utiliser les transports en commun va diminuer le score du FN, par rapport à un transport personnel, mais c’est l’inverse dans les plus petites communes. Départements Nous ne retranscrivons ici que les 5 plus grands coefficients. Sans tenir compte de l’endogénéité En tenant compte de l’endogénéité Pyrénées Orientales – communes plus de 11100 inscrits 0,056 (0,031) 0,058 (0,033) Gard – communes entre 1100 et 3700 inscrits 0,071 (0,007) 0,082 (0,007) Vaucluse – Toutes communes sauf entre 3700 et 11100 inscrits 0,070 (0,006) 0,082 (0,006) Gard – communes plus de 3700 inscrits 0,071 (0,011) 0,085 (0,012) Vaucluse – communes entre 3700 et 11100 inscrits 0,103 (0,009) 0,116 (0,009) Les coefficients s’interprètent directement en pourcentage de votes pour le FN. Dans le Vaucluse, il est environ 10% au-dessus de ce qu’il devrait être compte-tenu des autres caractéristiques des communes de ce département C’est à vous6. Une modélisation du type de celle que nous exposons dans cet article présente une part d’arbitraire, voire de faiblesses. En voici quelques-unes. Laquelle vous semble la plus importante : &nbsp Le modèle est estimé par régression linéaire, alors que la variable expliquée est comprise entre 0 et 1 Le modèle retenu ne résulte pas d’une formalisation structurelle du choix qui se présente aux électeurs Le modèle manque de pouvoir explicatif, car la variable département encapsule une bonne partie de la variabilité de la variable expliquée Il faudrait que le modèle inclue les scores des autres familles politiques Voir la réponse Article reliés7. Biais Endogénéité
  14. 14. Un intervalle peut en cacher un autre Régression Références8. Nous invitons le lecteur à se reporter à l’article sur l’endogénéité.

×