Première enquête européenne sur les compétences linguistiques commission eu...
Déterminants du vote Front national - SLPV analytics
1. Déterminants du vote Front National
Le Front National est-il favorisé par des taux d‘abstention élevés ? Cette question a fait les gros
titres des journaux après les municipales de 2014. Il n’est pas si simple d’y répondre, car les outils
standards (corrélation, régression) donnent des réponses biaisées. Une fois l’endogénéité des
données correctement prise en compte, l’association positive entre abstention et score du FN
s’avère nettement plus prononcée que ne le laisserait croire une simple analyse de corrélation.
Score du Front National et abstention : quelle corrélation ?1.
Après les municipales de 2014, de nombreux articles de presse se sont interrogés sur le lien entre
abstention et score du Front National. On trouvera ici et là deux exemples typiques de discussion sur
le sujet. Ces analyses ont en commun de reposer sur des calculs de corrélation. Est-ce que le score
du Front National est plus élevé là où l’abstention est la plus forte ? Quoi de plus efficace, et de plus
simple, qu’une corrélation pour répondre à cette question.
Et ce, d’autant que les outils de géo-visualisation facilitent le travail du statisticien. En superposant
des indicateurs calculés à un niveau très fin, ils donnent une impression rassurante de profondeur
d’analyse.
Pourtant, ces calculs, et les conclusions qui en sont tirées, sont faux. La corrélation entre le score du
Front National et le niveau de l’abstention est un calcul statistique biaisé. Comment une simple
corrélation pourrait-elle être biaisée ? A cause d’un phénomène fondamental en statistique,
l’endogénéité.
Le lecteur intéressé pourra lire notre article sur l’endogénéité : il y trouvera une explication du
problème, et quelques exemples. Dans le présent article, nous estimons un modèle reliant score de
l’extrême droite et niveau d’abstention, en prenant soin de traiter le problème de l’endogénéité des
données.
Une autre faiblesse des analyses mentionnées plus haut est qu’elles ne tiennent pas compte de
l’hétérogénéité des communes concernées. Notre modèle prend en compte une dizaine de
caractéristiques des communes, au-delà des résultats électoraux, afin d’isoler l’effet de chaque
variable toutes choses égales par ailleurs.
Le modèle et les données2.
Le lecteur qui n’est pas intéressé par les détails du modèle et des données peut aller directement à
la section 5 pour les résultats de l’estimation. Les résultats présentés sont légèrement différents de
ceux de la première version postée : l’ajout de la variable permettant de prendre en compte
l’intensité de la pratique religieuse a modifié, la plupart du temps à la marge, l’ensemble des
coefficients estimés.
Le modèle
A ce stade, nous ne nous appuyons pas sur un modèle structurel pour évaluer le lien entre
abstention et score du Front National. Le modèle réduit que nous allons estimer relie le score du
Front National et des partis assimilés, exprimé en pourcentage des suffrages exprimés avec :
- L’abstention, calculée en pourcentage des inscrits
- Et diverses caractéristiques des communes.
Le modèle est un modèle linéaire :
Score du FN
=
a + b*Taux d’abstention + c*caractéristique 1 + d*caractéristique 2 +…+u
2. Nous avons testé 4 spécifications différentes, avec des transformations logarithmiques pour la
variable expliquée et pour le taux d’abstention : Score du FN non transformé vs Taux d’abstention
non transformé, Score du FN en logarithme vs Taux d’abstention non transformé,….
Le modèle a aussi été segmenté par taille de communes : le niveau d’abstention est très différent
suivant la taille de la commune (de 30% dans le premier décile de taille jusqu’à près de 43% dans le
dernier), et le modèle obtenu est significativement différent selon la taille de la commune.
Les données de vote
Les données utilisées sont celles sur les votes au niveau des communes pour les législatives de 2012.
Seules les données du premier tour sont utilisées. Ces données sont librement accessibles sur le site
www.data.gouv.fr.
Une observation dans le modèle résulte du croisement commune*circonscription. Une commune à
cheval sur plusieurs circonscriptions intervient autant de fois dans le modèle.
Nous avons agrégé les résultats du Front National et des candidats catégorisés extrême droite dans
le fichier de données. L’essentiel est constitué par le FN : 3 528 663 suffrages exprimés pour ce
parti, 49 499 pour les autres candidats.
L’estimation se fait pour les départements de France métropolitaine, ainsi que la Martinique, la
Guadeloupe et la Réunion. Pour les autres circonscriptions (Guyane, Mayotte, Nouvelle Calédonie,
Polynésie, Saint Martin/Saint Barthélémy, Saint Pierre et Miquelon, Wallis et Futuna, français de
l’étranger), nous ne disposons pas des caractéristiques des communes nécessaires au modèle.
Les données sur les communes
Revenus
Nous avons utilisé les chiffres du dispositif revenus fiscaux localisés des ménages (RFLM) basés sur
les fichiers exhaustifs de la Direction Générale des impôts, et disponibles depuis 2000. On trouve
aussi, sur le site de l’INSEE, des revenus au niveau local pour les années 1998 à 2010 (Source :
DGFiP, fichier « Impôt sur le revenu des personnes physiques). Mais cette série est moins homogène
(ruptures en 1999 et 2006), n’est pas calculée par unité de consommation, et donne des résultats
moins bons en prévision que le dispositif RFLM.
Ces données sont disponibles au niveau communal pour la France métropolitaine, la Guadeloupe, la
Martinique et la Réunion – hors dispositif RFLM pour ces trois DOM -, ainsi qu’au niveau des
arrondissements de Paris, Lyon et Marseille. Les arrondissements ne correspondant pas à des
circonscriptions législatives, il a fallu répartir les indicateurs sur les différentes circonscriptions
concernées :
- Les indicateurs du type nombre de ménages fiscaux ou nombre d’unités de consommation ont
été répartis au prorata du nombre de circonscriptions auxquels appartient l’arrondissement (donc,
divisés par 2 si l’arrondissement appartient 2 circonscriptions, ce qui est le cas majoritaire),
- Les indicateurs du type médiane ont été affectés à chaque circonscription concernée, et on a
fait la moyenne arithmétique de tous les indicateurs concernant une circonscription.
Des indicateurs nominaux ont été calculés en utilisant l’évolution de l’indice des prix à la
consommation.
Enfin, le fichier présente des valeurs manquantes, que ce soit en totalité sur les années 1993 à 1999
ou après 2012, ou partiellement quand les règles du secret statistique n’autorisent pas la
publication :
- Pour les années totalement manquantes, les données ont été estimées en appliquant, aux
données locales disponibles, l’évolution du PIB régional en valeur pour les données de revenu
globales, et l’évolution du PIB par habitant pour les données par unité de consommation.
- Pour les données partiellement manquantes, en utilisant :
o Soit les ratios (nombre d’inscrits sur nombre de ménages fiscaux ou d’unité de consommation,
revenu sur nombre de ménages fiscaux ou d’unité de consommation) de la même commune pour
3. l’année disponible la plus proche,
o Soit, à défaut, les ratios du canton,
o Soit, à défaut, ceux du département.
Chômage
Les demandes d’emploi en fin de mois (DEFM) sont disponibles au niveau de la commune sur le site
de l’INSEE à partir de 2001, et jusqu’à 2011, à leur valeur à fin décembre, pour la France
métropolitaine, la Guadeloupe, la Martinique et la Réunion.
Comme pour les revenus, les valeurs manquantes sont estimées de deux manières différentes :
- Soit, pour les données partiellement manquantes par le ratio DEFM sur inscrits, pour le
canton, à défaut la zone d’emploi, ou à défaut le département,
- Soit, pour les années totalement manquantes, en appliquant l’évolution départementale du
chômage au sens du BIT aux données locales disponible. Nous sommes bien conscients de la non
homogénéité entre les notions DEFM et chômage BIT, mais cela semble, sauf erreur de notre part, la
meilleure solution à partir des données disponibles.
Des indicateurs ont été construits aux niveaux de la commune, du canton et de la zone d’emploi, afin
de comparer leur performance.
Données du recensement
Les autres données que nous utilisons sont issues du recensement. Les derniers fichiers détaillés par
communes disponibles auprès de l’INSEE sont ceux de 2011. Les variables suivantes sont
disponibles :
- Structure par âge, sexe, catégorie socio professionnelle et niveau de diplôme,
- Structure du parc de logements : maisons, appartement, résidences secondaires, logements
vacants, avec la décomposition par année de construction,
- Proportion de salariés/non salariés, et de temps partiel/temps complet
- Proportion d’immigrés,
- Structure de la population par éloignement du lieu de travail et moyen de transport utilisé,
- Structure de la population par type de foyer (2 actifs, 1 actif, famille monoparentale,…)
Les données par arrondissement pour Paris, Lyon et Marseille ont été affectées aux circonscriptions
législatives des arrondissements concernés, et on a fait la moyenne des pourcentages concernés.
Choix de spécification3.
Segmentation des communes et transformation logarithmique de la variable expliquée et
du taux d’abstention
Dans une première segmentation, nous avons partagé les communes en 5 groupes, avec les seuils
suivants : 700, 2100, 7000 et 21000 inscrits. Les autres segmentations testées sont calculées à partir
de ces seuils, en retirant 10, 20, …, 500 au premier, 30, 60,…1500 au deuxième, etc… Cela fait donc
50 segmentations différentes.
Le modèle est estimé pour ces 50 segmentations et les 4 configurations possibles de transformation
logarithmique pour le score du Front National et le taux d’abstention. Le modèle retenu est celui qui
minimise la somme des carrés des résidus sur l’ensemble des observations.
Le modèle final est basé sur :
4. - Le score du Front National et le taux d’abstention non transformés,
- Une segmentation de communes avec les seuils suivants, en termes d’inscrits : 370, 1100,
3700, 11100.
Les autres variables du modèle
Les variables rentrant dans le modèle, hors taux d’abstention, sont les suivantes, toutes exprimées
en pourcentage d’effectifs au sein de la commune :
- Structure croisée sexe âge (moins de 24 ans, entre 25 et 54 ans, plus de 55 ans),
- Catégorie socio professionnelle des individus :
o Agriculteurs, artisan, commerçant, chef d’entreprise, profession libérale,
o Cadre supérieur de la fonction publique,
o Cadre supérieur en entreprise,
o Employé de la fonction publique,
o Employé en entreprise,
o Ouvrier,
o Retraité.
- Structure croisée sexe âge (moins de 24 ans, entre 25 et 64 ans, plus de 65 ans) diplôme
(aucun diplôme, diplôme près baccalauréat, baccalauréat et au-dessus),
- Type de ménage :
o Homme ou femme vivant seule,
o Famille monoparentale,
o Famille dont les deux parents travaillent,
o Famille où seul l’homme travaille
o Famille où seule la femme travaille, ou où aucun des deux adultes ne travaillent,
o Plusieurs personnes, sans famille.
- Proportion d’immigrés,
- Type d’habitat :
o Maison,
o Appartement,
o Résidence secondaire,
o Logement vacant.
- Revenu médian par unité de consommation,
- Taux de chômage de la zone d’emploi,
- Structure croisée distance du lieu de travail (réside et travaille dans la même commune, réside
dans une commune rurale et travaille dans une autre commune/réside dans une unité urbaine et
travaille dans une autre commune de la même unité urbaine, réside dans une commune urbaine et
travaille en dehors de l’unité urbaine de résidence) moyen de transport utilisé (transports en
5. commun, tout autre moyen de transport),
- Structure croisée statut professionnel et temps de travail
o Salariés à temps complet en CDI,
o Salariés à temps complet, mais pas en CDI,
o Salariés à temps partiel,
o Non salariés à temps complet,
o Non salariés à temps partiel.
- Variable 0/1 signalant l’appartenance de la commune à une sous-préfecture pour laquelle la
densité de religieux hommes est dans le dernier quartile de sa distribution. L’idée est de tester si
une pratique religieuse catholique intense reste un frein au votre Front National, comme tendent à
le montrer des études sociologiques qualitatives.
Et enfin, le département de la commune rentre dans le modèle, sous forme d’une variable 0/1.
Une variable a été testée, mais n’a finalement pas été utilisée : les faits constatés par la police et la
gendarmerie. Ces données ne sont disponibles qu’au niveau du département et leur faible variabilité
déstabilise le modèle (on pourra se rapporter à cet autre article, ou l’abstention est modélisée, et où
cette variable est utilisée, sans qu’elle rentre significativement dans le modèle).
Estimation du modèle4.
Le modèle a été estimé à la fois par la méthode des moindres carrés et la méthode des variables
instrumentales (doubles moindres carrés). Seuls les estimateurs obtenus par les doubles moindres
carrés sont valides, car le biais d’endogénéité a été éliminé. Nous rapportons cependant les deux
estimations, afin que le lecteur puisse constater le biais de diagnostic induit par une mauvaise
stratégie d’estimation.
Les 5 modèles par taille de commune ont été tout d’abord estimés séparément, puis on a testé toutes
les égalités possibles entre coefficients correspondants à une même variable entre les 5 modèles.
Seuls les résultats du modèle final sont montrés ci-dessous.
Au total, le modèle repose sur 36 769 observations et 238 variables. Le R² calculé pour la méthode
des moindres carrés est de 0,47.
Deux tests ont été menés pour vérifier nos hypothèses sur l’endogénéité :
- Le test de Sargan, ou test de sur-identification. Ce test permet de tester si les deux variables
instrumentales utilisées donnent des résultats homogènes, si on estimait séparément le modèle avec
chacune d’elles. Il consiste à tester simultanément la nullité des coefficients de la régression des
résidus de la régression augmentée, réalisée pour le test de Hausman, sur la constante et la variable
endogène. Ce test est largement accepté.
- Le test de Hausman, ou test d‘exogénéité. Il permet de tester si la variable taux d’abstention
est effectivement endogène dans notre modèle. Il consiste à tester si les coefficients estimés par les
moindres carrés et les double moindre carrés sont significativement différents. Une autre manière
de le mettre en œuvre consiste à effectuer une régression augmentée. On estime par les moindres
carrés notre modèle, avec l’ajout de deux variables explicatives : les résidus de la régression des
variables endogènes sur les instruments – il y a deux variables endogènes, car le taux d’abstention
n’a pas le même coefficient pour les petites communes et les autres. Le test consiste alors à vérifier
que les coefficients des résidus dans cette régression sont significativement non nuls, ce qui est le
cas. Le taux d’abstention est donc bien endogène.
Résultats détaillés5.
Les tableaux ci-dessous donnent les coefficients estimés, avec, entre parenthèses, l’écart-type
associé. Les coefficients significativement différents de 0 dans l’estimation par les doubles moindres
carrés sont surlignés en gras.
6. Taux d’abstention
Sans tenir compte de
l’endogénéité
En tenant compte de
l’endogénéité
Pourcentage d’abstention –
communes de moins de 370
inscrits
0,074
(0,005)
0,422
(0,023)
Pourcentage d’abstention – autres
communes
0,194
(0,009)
0,514
(0,021)
Le taux d’abstention est l’une des variables les plus significatives du modèle. L’association positive
entre abstention et score du FN est très nette. 1% de plus d’abstention se traduit par 0,5% de plus
de votes pour le FN.
On voit que la non prise en compte de l’endogénéité conduit à largement sous-estimer l’effet
favorable de l’abstention sur le score du FN.
Taux de chômage de la zone d’emploi
Sans tenir compte de
l’endogénéité
En tenant compte de
l’endogénéité
Taux de chômage 0,981
(0,041)
0,926
(0,043)
Le taux de chômage est aussi une variable très significative, au même niveau que le taux
d’abstention. L’effet est le même quel que soit la taille de la commune : 1% de chômage en plus
donne 0,93% de vote supplémentaire au FN.
Revenu médian par unité de consommation
Sans tenir compte de
l’endogénéité
En tenant compte de
l’endogénéité
Revenu médian par unité de
consommation – communes de
moins de 370 inscrits
0,172
(0,065)
-0,589
(0,086)
Revenu médian par unité de
consommation – communes entre
370 et 1100 inscrits
-1,421
(0,166)
-1,878
(0,210)
Revenu médian par unité de
consommation – communes entre
1100 et 3700 inscrits
-1,122
(0,213)
-1,788
(0,253)
Revenu médian par unité de
consommation – communes de
plus de 3700 inscrits
-1,170
(0,192)
-1,918
(0,235)
Le revenu médian par unité de consommation est aussi très significatif, même si à un niveau un peu
moindre que le taux de chômage ou le taux d’abstention. Plus le revenu médian s’élève, plus le score
du FN recule. L’effet s’accroît avec la taille de la commune. Dans les communes de plus de 3700
7. inscrits une augmentation de 1000 euros du revenu médian diminue le score du FN de 0,19%.
Là aussi, ne pas tenir compte de l’endogénéité amènerait à une grossière erreur de diagnostic. On
pourrait être mené à conclure que, dans les petites communes, revenu médian et score du FN sont
associés positivement.
Pratique religieuse
Il n’y a pas de données disponibles de manière exhaustive au niveau commune sur la pratique
religieuse. Afin d’appréhender si celle-ci peut avoir un impact sur le score du Front National, nous
avons employé une voie détournée.
Le nombre de religieux habitant une commune est une donnée disponible du recensement. Le
pourcentage de religieux habitant la commune n’est cependant pas le bon indicateur. En effet, il y a
deux fois moins de prêtres que de communes : les limites du diocèse d’un prêtre dépassent celles de
la commune. Par ailleurs, l’effet que nous cherchons à mesurer – l’intensité de la pratique religieuse
– est une caractéristique culturelle qui va bien au-delà des frontières communales.
Après différents essais sur le niveau d’agrégation à retenir, nous avons calculé le pourcentage de
religieux au niveau de la sous-préfecture (ou arrondissement), en différenciant les hommes des
femmes. Puis nous avons créé des indicatrices correspondant aux quartiles de la distribution de ces
pourcentages. Le seul coefficient significatif est celui du pourcentage d’hommes religieux pour le
quartile supérieur :
Sans tenir compte de
l’endogénéité
En tenant compte de
l’endogénéité
Communes appartenant aux 25%
de sous-préfectures où il y a le
plus de religieux hommes
-0,011
(0,001)
-0,010
(0,001)
Dans les communes concernées, toutes choses égales par ailleurs, le FN obtient en moyenne 1% de
votes en moins. Le fait que cela soit vrai uniquement pour le pourcentage d’hommes tend à montrer
qu’il s’agit bien d’un phénomène spécifiquement lié au catholicisme.
Proportion d’immigrés
Sans tenir compte de
l’endogénéité
En tenant compte de
l’endogénéité
Proportion d’immigrés -0,050
(0,013)
-0,089
(0,014)
La proportion d’immigrés dans la commune a un effet significativement négatif sur le score du FN.
1% d’immigrés supplémentaires diminue le score du FN de 0,09%.
Ce résultat pourra sembler étrange à certains. Il est très robuste. Nous avons testé de nombreuses
spécifications, et le résultat obtenu est très stable. Rappelons que notre modèle contrôle pour de
nombreuses autres variables, et en particulier le département. Toutes choses égales par ailleurs,
être plus souvent en contact avec des immigrés diminue la tentation de voter FN.
Là aussi, ne pas tenir compte de l’endogénéité amènerait à sous-estimer l’effet de cette variable.
Type d’habitat
8. Sans tenir compte de
l’endogénéité
En tenant compte de
l’endogénéité
Appartement -0,054
(0,006)
-0,059
(0,006)
Maison construite avant 1946 0 0
Maison construite entre 1947 et
1990
0,000
(0,004)
-0,003
(0,004)
Maison construite après 1991 0,033
(0,005)
0,039
(0,005)
Résidences secondaires -0,017
(0,004)
-0,024
(0,004)
Logements vacants 0,018
(0,008)
0,010
(0,009)
Logements occasionnels -0,052
(0,030)
-0,047
(0,032)
Pour toutes les variables qui décrivent la structure de la population de la commune, la modélisation
nécessite de prendre une catégorie de référence. Pour le type d’habitat, la catégorie de référence
est le pourcentage de ménages vivant dans une maison construite avant 1946.
L’effet le plus significatif vient du pourcentage de ménages vivant en appartement. Si ce
pourcentage augmente de 1%, le vote FN diminue de 0,06%. Rappelons là encore que nous sommes
toutes choses égales par ailleurs, et que le modèle contrôle en particulier pour le revenu : toutes
choses égales par ailleurs, une proximité plus grande avec les voisins diminue le vote FN.
Le pourcentage de maisons construites récemment a un effet légèrement positif sur le vote FN.
C’est l’inverse pour le pourcentage de résidences secondaires.
Diplôme
Sans tenir compte de
l’endogénéité
En tenant compte de
l’endogénéité
Hommes
Moins de 24 ans – pas de diplôme -0,050
(0,062)
-0,122
(0,066)
Moins de 24 ans – diplôme avant
bac
0,155
(0,040)
0,050
(0,043)
Moins de 24 ans – diplôme bac ou
après
-0,175
(0,037)
-0,136
(0,040)
25 à 64 ans – pas de diplôme 0,031
(0,017)
0,006
(0,018)
25 à 64 ans – diplôme avant bac 0 0
9. 25 à 64 ans – diplôme bac ou
après
-0,155
(0,012)
-0,113
(0,013)
Plus de 65 ans – pas de diplôme –
communes moins de 370 inscrits
-0,050
(0,024)
-0,014
(0,025)
Plus de 65 ans – pas de diplôme –
autre communes
-0,204
(0,049)
-0,164
(0,052)
Plus de 65 ans – diplôme avant
bac
-0,047
(0,019)
-0,001
(0,021)
Plus de 65 ans – diplôme bac ou
après
-0,052
(0,027)
0,021
(0,029)
Femmes
Moins de 24 ans – pas de diplôme
–
-0,077
(0,080)
-0,152
(0,085)
Moins de 24 ans – diplôme avant
bac
0,074
(0,051)
0,009
(0,054)
Moins de 24 ans – diplôme bac ou
après
-0,065
(0,040)
-0,054
(0,043)
25 à 64 ans – pas de diplôme –
communes moins de 370 inscrits
0,030
(0,045)
-0,017
(0,048)
25 à 64 ans – pas de diplôme –
communes entre 370 et 1100
inscrits
-0,071
(0,054)
-0,184
(0,059)
25 à 64 ans – pas de diplôme –
communes plus de 1100 inscrits
-0,088
(0,058)
-0,286
(0,065)
25 à 64 ans – diplôme avant bac -0,012
(0,043)
-0,035
(0,046)
25 à 64 ans – diplôme bac ou
après
-0,170
(0,042)
-0,143
(0,045)
Plus de 65 ans – pas de diplôme -0,119
(0,044)
-0,143
(0,047)
Plus de 65 ans – diplôme avant
bac – communes moins de 370
inscrits
-0,067
(0,044)
-0,069
(0,047)
Plus de 65 ans – diplôme avant
bac – communes entre 370 et
1100 inscrits
-0,159
(0,052)
-0,185
(0,055)
Plus de 65 ans – diplôme avant
bac – communes plus de 1100
inscrits
-0,103
(0,056)
-0,113
(0,059)
10. Plus de 65 ans – diplôme bac ou
après – communes moins de 370
inscrits
-0,063
(0,048)
-0,039
(0,051)
Plus de 65 ans – diplôme bac ou
après – communes entre 370 et
1100 inscrits
-0,149
(0,062)
-0,185
(0,066)
Plus de 65 ans – diplôme bac ou
après – communes plus de 1100
inscrits
-0,149
(0,070)
-0,181
(0,075)
La catégorie de référence est le pourcentage d’hommes de 25 à 64 ans ayant un diplôme de niveau
en-dessous du bac. Tous les coefficients significatifs sont négatifs. Ainsi, la surreprésentation de
toutes les catégories surlignées en gras dans le tableau ci-dessus amène à une baisse du score du
Front National.
Type de ménage
Sans tenir compte de
l’endogénéité
En tenant compte de
l’endogénéité
Famille avec deux adultes actifs 0,013
(0,006)
0,028
(0,006)
Famille homme actif femme
inactive
0,044
(0,007)
0,053
(0,008)
Famille avec deux adultes inactifs
– communes moins de 370 inscrits
0,007
(0,006)
0,021
(0,006)
Famille avec deux adultes inactifs
– communes plus de 370 inscrits
0,039
(0,011)
0,060
(0,011)
Famille monoparentale –
communes moins de 11100
inscrits
-0,006
(0,007)
-0,001
(0,008)
Famille monoparentale –
communes plus de 11100 inscrits
-0,231
(0,075)
-0,249
(0,079)
Personne vivant seule 0 0
Autres cas 0,004
(0,010)
0,008
(0,010)
La catégorie de référence est constituée des personnes vivant seules.
Le pourcentage de ménages où l’homme travaille et la femme ne travaille pas a un effet significatif
positif sur le vote FN : s’il augmente de 1%, le vote FN progresse de 0,05%. Même chose pour les
familles avec deux adultes inactifs.
Dans les très grandes communes, une plus forte proportion de familles monoparentales fait baisser
le score du FN : -0,3% de vote FN pour une augmentation de 1% de cette proportion.
11. Catégorie socio-professionnelle
Sans tenir compte de
l’endogénéité
En tenant compte de
l’endogénéité
Agriculteur, artisan, commerçant,
chef d’entreprise
-0,016
(0,006)
-0,006
(0,007)
Cadre de la fonction publique -0,043
(0,010)
-0,041
(0,011)
Cadre en entreprise -0,007
(0,009)
-0,008
(0,009)
Employé de la fonction publique –
communes moins de 11100
inscrits
-0,007
(0,006)
-0,001
(0,006)
Employé de la fonction publique –
communes plus de 11100 inscrits
0,207
(0,099)
0,215
(0,105)
Employé en entreprise 0,016
(0,006)
0,010
(0,006)
Ouvrier 0,022
(0,005)
0,014
(0,005)
Retraité 0 0
La catégorie de référence est constituée des retraités.
Une augmentation du nombre de cadres de la fonction publique fait baisser le score du FN.
Une augmentation du nombre d’ouvriers le fait augmenter, comme une augmentation du nombre
d’employés de la fonction publique dans les plus grandes communes.
Statut professionnel et temps de travail
Sans tenir compte de
l’endogénéité
En tenant compte de
l’endogénéité
CDI à temps plein 0 0
Autre salarié à temps plein –
communes moins de 11100
inscrits
0,003
(0,005)
-0,004
(0,005)
Autre salarié à temps plein –
communes plus de 11100 inscrits
0,063
(0,090)
0,041
(0,096)
Salarié à temps partiel –
communes moins de 370 inscrits
-0,008
(0,004)
-0,005
(0,004)
Salarié à temps partiel –
communes plus de 370 inscrits
-0,060
(0,010)
-0,063
(0,011)
Non salarié à temps plein 0,007
(0,005)
0,003
(0,005)
12. Non salarié à temps partiel -0,020
(0,010)
-0,030
(0,010)
La catégorie de référence est celle des CDI à temps plein. Une augmentation du nombre de salariés
à temps partiel diminue le score du FN.
Distance du lieu de travail et moyen de transport
Sans tenir compte de
l’endogénéité
En tenant compte de
l’endogénéité
Réside et travaille dans la même
commune – transport collectif
-0,032
(0,024)
-0,054
(0,026)
Réside et travaille dans la même
commune – transport personnel –
communes moins de 370 inscrits
-0,015
(0,003)
-0,014
(0,003)
Réside et travaille dans la même
commune – transport personnel –
communes plus de 370 inscrits
-0,042
(0,004)
-0,039
(0,005)
Travaille dans une autre
commune que la commune de
résidence, même unité urbaine –
transport collectif – communes
moins de 370 inscrits
-0,004
(0,010)
0,002
(0,010)
Travaille dans une autre
commune que la commune de
résidence, même unité urbaine –
transport collectif – communes
entre 370 et 1100 inscrits
0,085
(0,019)
0,081
(0,020)
Travaille dans une autre
commune que la commune de
résidence, même unité urbaine –
transport collectif – communes
entre 1100 et 3700 inscrits
-0,014
(0,026)
-0,017
(0,027)
Travaille dans une autre
commune que la commune de
résidence, même unité urbaine –
transport collectif – communes
plus de 3700 inscrits
-0,129
(0,016)
-0,127
(0,017)
Travaille dans une autre
commune que la commune de
résidence, même unité urbaine –
transport personnel
0 0
Travaille en dehors de l’unité
urbaine de résidence – transport
collectif
-0,018
(0,018)
-0,030
(0,019)
Travaille en dehors de l’unité
urbaine de résidence – transport
personnel
0,003
(0,002)
0,001
(0,002)
La population de référence est constituée des actifs qui ne travaillent pas dans leur commune de
13. résidence, mais dans la même unité urbaine, et qui ne vont pas travailler en transports collectifs.
L’effet est sans ambiguïté : la proximité du lieu de travail et du lieu de résidence a un effet négatif
sur le score du FN. Quand le lieu de travail n’est pas situé dans la même commune que la résidence,
mais dans la même aire urbaine, l’effet sur le score du FN dépend du moyen de transport utilisé.
Dans les grandes communes, le fait d’utiliser les transports en commun va diminuer le score du FN,
par rapport à un transport personnel, mais c’est l’inverse dans les plus petites communes.
Départements
Nous ne retranscrivons ici que les 5 plus grands coefficients.
Sans tenir compte de
l’endogénéité
En tenant compte de
l’endogénéité
Pyrénées Orientales – communes
plus de 11100 inscrits
0,056
(0,031)
0,058
(0,033)
Gard – communes entre 1100 et
3700 inscrits
0,071
(0,007)
0,082
(0,007)
Vaucluse – Toutes communes sauf
entre 3700 et 11100 inscrits
0,070
(0,006)
0,082
(0,006)
Gard – communes plus de 3700
inscrits
0,071
(0,011)
0,085
(0,012)
Vaucluse – communes entre 3700
et 11100 inscrits
0,103
(0,009)
0,116
(0,009)
Les coefficients s’interprètent directement en pourcentage de votes pour le FN. Dans le Vaucluse, il
est environ 10% au-dessus de ce qu’il devrait être compte-tenu des autres caractéristiques des
communes de ce département
C’est à vous6.
Une modélisation du type de celle que nous exposons dans cet article présente une part d’arbitraire,
voire de faiblesses. En voici quelques-unes. Laquelle vous semble la plus importante :
 
Le modèle est estimé par régression linéaire, alors que la variable expliquée est comprise entre 0 et 1
Le modèle retenu ne résulte pas d’une formalisation structurelle du choix qui se présente aux électeurs
Le modèle manque de pouvoir explicatif, car la variable département encapsule une bonne partie de la variabilité
de la variable expliquée
Il faudrait que le modèle inclue les scores des autres familles politiques
Voir la réponse
Article reliés7.
Biais
Endogénéité
14. Un intervalle peut en cacher un autre
Régression
Références8.
Nous invitons le lecteur à se reporter à l’article sur l’endogénéité.