1. L’Analyse Géométrique des Données en Science Politique
Par Flora Chanvril et Viviane Le Hay
Qu’est-ce que l’Analyse Géométrique des Données ?
L’Analyse Géométrique des Données (AGD) s’inscrit dans l’univers des méthodes multivariées. Elle permet de rendre compte de l’aspect multidimensionnel des
données traitées et d’analyser les clivages éventuels qui structurent une population. Le calcul de distances entre individus, déterminées par leur plus ou moins
grande proximité dans leurs réponses aux questions analysées, va permettre la construction d’axes factoriels, qui sont ensuite interprétés. L’AGD rend possible
une hiérarchisation des clivages, mais également un aller-retour entre variables et individus, selon que l’on se place dans l’espace des variables (une coordonnée
est associée à chaque modalité) ou dans l’espace des individus (une coordonnée est associée à chaque individu).
Axe 2 Immigration Axe 2 (0.187)
1.5 1.5
Espace des modalités actives Objectif scientifique : comprendre comment se Espace des modalités actives
structurent les électorats potentiels en termes de Immigrés++
1.0
ConfD
valeurs, d’opinions et d’attitudes ? 1.0
Sécurité
ConfD
FrSeProtéger
FrSeProtéger
Construction d’un espace politique à la veille de LibEntreprises++
AmélPrés++
0.5 0.5
HaussePrix
l’élection présidentielle de 2007 Retraite
VieEnfts-- Eco++
RéfOui
0
AmélPrés-- RéfNon
Axe 1 (0.195)
Axe 1 : 34% de variance expliquée 0 Axe 1
NiGNiD
Eco-- AmélPrés+ Il oppose des défiants pessimistes et anti-européens à des
VieEnfts+- optimistes pro-européens. FrS'ouvrir
FrS'ouvrir Immigrés-
-0.5 -0.5
LibEntreprises-- Axe 2 : 29.8% de variance expliquée Inégalités CoûtRevenus
Il oppose des dimensions de gauche à des dimensions de ConfG
LibEntreprises-
-1.0
droite. -1.0
Immigrés--
-0.8 -0.4 0 0.4 0.8 -0.8 -0.4 0 0.4 0.8
Source : CARME 2007, Chanvril F., Le Hay V., Chiche J. Source : CARME 2007, Chanvril F., Le Hay V., Chiche J.
Méthodologie
La méthode ici utilisée est une Analyse des Correspondances Multiples spécifique, adaptée à l’étude de variables catégorielles. Elle se différencie de l’analyse
standard par la non-prise en compte ponctuelle de modalités rares dans le calcul des distances entre individus.
Le choix du nombre d’axes s’effectue grâce aux taux modifiés de Benzécri, qui permettent de mesurer la part de variance expliquée par l’axe.
Pour chacun des axes, les variables actives qui expliquent le plus cette part de variance sont retenues pour l’interprétation. De même au sein de ces variables ne
sont retenues que les modalités qui expliquent le plus cette part de variance.
Un facteur structurant est une variable non prise en compte dans le calcul des distances entre individus. Celui-ci est projeté a posteriori dans le nuage des
individus afin d’étudier son impact sur la structuration de cet espace.
Présentation des données utilisées Projection du facteur structurant Ellipses de concentration des
dans l’espace des individus électorats potentiels
L’analyse présentée porte sur les données Axe 2
du Baromètre Politique Français - Vague 4 Les intentions de vote sont considérées
du 5-19 février 2007. 1.0
comme un facteur structurant le nuage des
Echantillon : interrogation de 5239 individus.
personnes représentatives de la population
âgée de 18 ans et plus et inscrites sur les Sarkozy Les ellipses de concentration constituent le
0.5
listes électorales. La représentativité des Le Pen
moyen le plus simple de mesurer et de
échantillons a été assurée par la méthode visualiser graphiquement la plus ou moins
des quotas (sexe croisé par l’âge, grande homogénéité à l’intérieur des
profession ou ancienne profession du chef 0 Axe 1
groupes, ainsi que la plus ou moins grande
de ménage, niveau de diplôme) après hétérogénéité entre les groupes.
stratification par région administrative et Dans notre exemple, l’axe gauche-droite
catégorie d’agglomération. Pour l’Ile-de- -0.5 constitué de l’axe 2 oppose clairement d’un
France, a été opérée une stratification par côté S. Royal et de l’autre J.-M. Le Pen et
Bayrou
département et catégorie d’agglomération. N. Sarkozy. L’électorat de F. Bayrou
Administration de l’enquête : les interviews -1.0 Royal apparaît beaucoup plus proche de celui de
ont eu lieu par téléphone. S. Royal que de celui de N. Sarkozy.
-1.0 -0.5 0 0.5 1.0
Source : CARME 2007, Chanvril F., Le Hay V., Chiche J.
Pour aller plus loin :
Le Roux (B) & Rouanet (H) (2010) Multiple Correspondence Analysis, SAGE Publications, Série « Quantitative Applications in the Social Sciences », Vol 163,
128p.
Chiche (J), Le Roux (B), Perrineau (P), Rouanet (H) (2000) « L’espace politique des électeurs français à la fin des années 1990. Nouveaux et anciens clivages,
hétérogénéité des électorats. », Revue française de science politique, Vol 50, n°3.