SlideShare une entreprise Scribd logo
1  sur  46
L'AFC pour les nuls Mise à jour du 16 août 2010 Rémi Bachelet   La version à jour de ce cours d’analyse factorielle des composantes est disponiblehttp://rb.ec-lille.fr Cette formation est également enregistrée en vidéo Source des images indiquées au-dessous Cours distribué sous licenceCreative Commons, selon les conditions suivantes :
Rémi BACHELET – Ecole Centrale de Lille 2 Comment utiliser ce cours : Mettre les diapos en format plein écran en cliquant sur Faire défiler l’animation en cliquant sur les diapositives (attention : cliquer sur une image ou un lien ouvre la page web correspondante)
Objectifs du cours d’Analyse Factorielle des Correspondances  Méthode développée notamment par Jean-Paul Benzécri(1970+) Comprendre les fondements de l’Analyse Factorielle des Correspondances Savoir quel est le processus de calcul et ses logiques Pouvoir expliquer le mapping produit par une AFC Également : Connaître quelques logiciels d’administration d’enquêtes et de traitement de données Avoir des éléments de comparaison AFC – ACP (ACP = Analyse en Composantes Principales).
Chapitre 1/4 Principes de l’AFC et données d’entrées Principe général de l’AFC Exemples : Les limites des représentations graphiques intuitives Comment donner du sens aux informations
Principe général de l’analyse factorielle des correspondances (AFC) « L’analyse factorielle traite des tableaux de nombres. Elle remplace un tableau de nombres difficile à analyser par une série de tableaux plus simples qui sont une bonne approximation de celui-ci »  Ces tableaux sont « simples », car ils sont exprimables sous forme de graphiques  Pourquoi « des correspondances » ? Pourquoi « factorielle » ?  Il s’agit de décomposer le tableau original en une somme de tableaux/matrices qui sont chacun le produit de facteurs simples.  Autrement dit, on les « met en facteurs » Principale source d’informations, et de l’exemple utilisé pour ce cours : Que sais-je ?  « L' analyse factorielle » - N°2095, Philippe CIBOIS, ed. PUF, épuisé, extrait disponible en ligne
Exemple : que deviennent les bacheliers ? destination université classes prépa autres total A 13 2 5 20 BDD' 20 2 8 30 CE 10 5 5 20 FGH 7 1 22 30 total 50 10 40 100 100 Stats MEN 1975 - 1975 204 489 lycéens
Une représentation graphique intuitive
Exemple : quels souhaits d’orientation ?
.. Pas toujours suffisante :
Comment donner du sens à ces données Idée : ce qui est intéressant, c’est de mettre en évidence ce qui est inattendu dans ces répartitions Inattendu = en quoi on dévie d’une répartition uniforme On va donc : Évaluer ce que serait une situation d’uniformité, d’indépendance  Calculer en quoi la situation constatée en diffère Exprimer cette différence graphiquement pour pouvoir l’analyser Interpréter le mapping obtenu … et en optimiser la lisibilité
Chapitre 2/4 Première opérations sur les matrices Matrice « T » des données d’entrée Matrice R des écarts à l’indépendance Mise en facteur d’une matrice Exprimer « simplement » R
Matrice « T » des données d’entrée destination université classes prépa autres total A 13 2 5 20 BDD' 20 2 8 30 CE 10 5 5 20 FGH 7 1 22 30 total 50 10 40 100 100 Ce tableau est aussi une matrice, appellons-la « T » Quelle matrice aurait-on si la répartition dans les filières post-Bac ne dépendait pas du type de Bac ?
8 2 10 1/ S’il y avait situation d’indépendance…  20 10 = 50 * 20% (produit matriciel /100 puisqu’on raisonne en %) 12 3 15  30 8 2 10  20 12 3 15  30 40 10 50 On reconstitue la matrice à partir de ses marges Appellons cette matrice « T0 »
2/La matrice des écarts à l’indépendance estT – T0 = R - = Quelle est la particularité de R ?
3/Comment exprimer simplement R? On décompose la matrice des écarts à l’indépendance en une somme de matrices..  R = T1 + T2 .. Chacune de ces matrices étant mise en facteur (le produit d’un vecteur ligne et d’un vecteur colonne).  T1 = C1L1 (une matrice dont la plus petite dimension est N « rang N » est décomposable au maximum en N matrices pouvant se mettre en facteurs  …  ici T = T0 + T1 + T2).  T est de rang 3, mais R est de rang 2….
Produit matriciel : exemple
Mise en facteur d’une matrice: exemple T=CL On met en facteur T comme le produit d’une matrice colonne C par une matrice ligne L T (2X2) C (1X2) L (2X1) Attention les règles de présentation du produit matricielne sont pas bien respectées dans nos diapos De plus, la multiplication des matrices n'est pas commutative (LC  CL)
R = T1 +T2 = C1L1 +C2L2 + = Attention le sens de multiplication écrit ici est LC au lieu de CL
Chapitre 3/4 D’une matrice à une présentation graphique Production et interprétation du mapping  Vecteurs colonne et vecteurs ligne Produit scalaire
3/ bisComment représenter graphiquement la décomposition ? Un vecteur colonne (resp. ligne) correspond à une modalité des données en colonnes (resp. lignes) Un axe unidimensionnel + un axe unidimensionnel = un repère
Un vecteur colonne correspond à une modalité des données en colonnes + =
Un vecteur colonne correspond à une modalité des données en colonnes
Un axe unidimensionnel + un axe unidimensionnel = un repère 1 1 A CE 1 2 BDD’ Univ. CPGE 2 -1 CE BDD’ A -4 -2 FGH 1 2 Univ Aut. 1 -1 CPGE -2 -1 Autres FGH
4/Que veut dire ce mapping ? Conjonction :  Produit scalaire positif Les Bac CE ont une affinité pour la prépa Opposition  Produit scalaire négatif Les Bacs A ne vont pas vers les « autres » (IUT, BTS) Quadrature Produit scalaire nul Les bacs A ne vont ni plus ni moins vers les prépas que la moyenne des bacheliers CE A Prépa Autres
Chapitre 4/4 Optimisation de la factorisation Le Chi-2 (2) comme métrique Degrés de liberté  Retour aux applications  Analyse de mappings
5/Mais ….. Quelle est la meilleure décomposition possible pour R ? En effet R = T1 + T2… mais il existe aussi R = T’1 + T’2 = T’’1 + T’’2 … Quel est le critère (la métrique) qui permet de définir les meilleurs T1 et T2? Pour une matrice de rang n, on cherche d’abord à trouver la meilleure T1,, puis la meilleure T2de telle manière à ce que le premier axe soit celui qui exprime le plus de sens..
La métrique que nous cherchons, c’est le Chi-2 (2) Le 2  représente l’écart à l’indépendance or cette indépendance, est exprimée par T0 … l’écart à l’indépendance peut donc se mesurer comme l’écart à T0 À partir de la matrice des données pour chaque cellule de T1 et T2, on calcule L’écart avec la cellule correspondante de T0au carré (d’où le « 2 » du 2) On divise par l’effectif théorique de cette cellule (on parle de 2 pondéré) Le 2 de la matriceest la somme de toutes les « contributions au 2 » de ses cellules Le pourcentage des contributions de T1 et T2 par rapport au 2 de R donne les contributions relatives de T1 et T2 au 2  de T
Note sur le 2 : ses degrés de liberté 2 (R) = 2 (T1) + 2 (T2) 2491 = 1998 + 493 Attention à considérer le 2 en proportion de la richesse en information le la matrice = de son nombre de ddl. À  partir des distributions marginales on peut obtenir plusieurs matrices Tn, mais pour chaque ligne et chaque colonne, la dernière “case” est imposée par la contrainte du total marginal Définition : On appelle degré de liberté par ligne (ddll) le nombre de colonnes (de modalités) diminué de 1.  On appelle degré de liberté par colonne (ddlc) le nombre de lignes (de modalités) diminué de 1. Le degré de liberté du khi-deux de la matrice est le produit ddll x ddlc = ddl. Pour une matrice donnée, le 2 à prendre en compte est en fait 2 / ddl http://brassens.upmf-grenoble.fr/IMSS/MathSHS/SHS1/Stat1/Diapo/COURS9_fichiers/frame.htm
Matrice T1  maximisant le 2dans notre cas 2 (R) = 2 (T1) + 2 (T2) 2491 = 1998 + 493 100% = 80.2% + 19.8% Cette ‘concentration’ de ce que l’on appelle le pourcentage de la variance expliquée par un axe est particulièrement intéressante lorsque la taille du tableau de données augmente… 2 (R) = 2 (T1) + 2 (T2) + 2 (T3) + 2 (T4) .. Pourquoi ?  On ne peut que représenter que deux axes à la fois sur un mapping … autant représenter les plus significatifs.
On obtient alors ce nouveau mapping .. Autre option configurable : ici, la taille des points est proportionnelle à l’effectif qu’ils représentent Pour relativiser leur importance, les axes sont dilatés proportionnellement au 2qu’ils expriment … Attention aux conséquences de ce choix, notamment la perte de la visibilité d’une quadrature …
Application : quels souhaits d’options?
Mapping des choix de filière / génie Premiers choix de génie / filière des 147 G2 en 2003
C’était les deux premiers axes = 62% de la variance expliquée On peut aussi regarder l’axe 3.. = 18%
Conclusion  Mise en œuvre logicielle  Sphinx, SPSS, SAS Généralisation de l’AFC Comparaison avec l’Analyse en Composantes Principales (ACP) Généralisation de l’AFC Pour approfondir
Mise en œuvre logicielle de l’AFC : Sphinx
Mise en œuvre logicielle : SPSS
Mise en œuvre logicielle : SAS
Généralisations de l’AFC Les ‘catégories’ des questionnaires sont souvent mutuellement exclusives : Sexe : H ou F Politique : gauche, centre, droite ,[object Object],Aux croisements de plus de deux caractéristiques : Analyse des Composantes Multiples (ACM) Bac X Orientation X sexe  Tableau de Burt
Autre méthode d’analyse de données proche : l’Analyse en Composantes Principales  ACP AFC Métriques Catégorielles Données T = T1 + T2 + T3 T - T0 = T1 + T2 Décomposition 2 2pondéré Métrique Attention, le poids des cellules à faible effectif est renforcé
Rapports entre ACP et AFC Si on a des données permettant de faire une AFC, peut-on y appliquer une ACP ? Non Si on a des données permettant de faire une ACP, peut-on y appliquer un AFC ? Oui ! .. Mais alors ? .. Alors on traite les données numériques, les nombres comme des catégories  Si par exemple on travaille sur des notes, 18/20 n’est plus « supérieur à » 10/20, il n’est pas non plus « plus proche » de 16/20 que de 10/20.
Effet particulier lorsque l’on traite des Likert Que voit-on sur une AFC s’il existe une relation linéaire entre deux Likert corrélées, comme par exemple   Q1 Aimez-vous les mathématiques (beaucoup/assez/un peu/pas du tout) Q2 Avez-vous de bonnes notes en mathématiques (très bonnes/bonnes/moyennes/mauvaises) ,[object Object],[object Object]
Autres cours de méthodologie: Explorer ou vérifier ? Deux catégories d’approches Éventails des démarches de recueil de données Conception de questionnaires Techniques d’entretien et reformulation Validité et Fiabilité des données Mesurer, tester des hypothèses
Merci de votre attention !
Rémi BACHELET  Enseignant-chercheur,    Ecole Centrale de Lille  Mon CV est disponible http://rb.ec-lille.fr Mes principaux cours à Centrale Gestion de projet, sociologie des organisations, recueil, analyse et traitement de données, prévention du plagiat, module de marchés financiers, cours de qualité et méthodes de résolution de problèmes, établir des cartes conceptuelles, utiliser Wikipédia et CentraleWiki, formation au coaching pédagogique et à l'encadrement
Analyse factorielle des_correspondances-afc
Analyse factorielle des_correspondances-afc

Contenu connexe

Tendances

Tendances (20)

Analyse de régression linéaire
Analyse de régression linéaire Analyse de régression linéaire
Analyse de régression linéaire
 
Regression lineaire simple
Regression lineaire simpleRegression lineaire simple
Regression lineaire simple
 
clustering
clusteringclustering
clustering
 
Analyse de données marketing : ACP et AFC
Analyse de données marketing : ACP et AFCAnalyse de données marketing : ACP et AFC
Analyse de données marketing : ACP et AFC
 
Questionnaire sous spss
Questionnaire sous spssQuestionnaire sous spss
Questionnaire sous spss
 
T test sur des échantillons appariés avec test de normalité
T test sur des  échantillons appariés  avec  test de normalité T test sur des  échantillons appariés  avec  test de normalité
T test sur des échantillons appariés avec test de normalité
 
5.2 Régression linéaire
5.2 Régression linéaire5.2 Régression linéaire
5.2 Régression linéaire
 
(Cours régression)
(Cours régression)(Cours régression)
(Cours régression)
 
Analyse de données avec SPSS (1).pdf
Analyse de données avec SPSS (1).pdfAnalyse de données avec SPSS (1).pdf
Analyse de données avec SPSS (1).pdf
 
Test de corrélation simple et test de Normalité
Test de corrélation simple  et  test de Normalité  Test de corrélation simple  et  test de Normalité
Test de corrélation simple et test de Normalité
 
Analyses des données par SPSS et R
Analyses  des données par  SPSS et RAnalyses  des données par  SPSS et R
Analyses des données par SPSS et R
 
Les arbres de décisions
Les arbres de décisionsLes arbres de décisions
Les arbres de décisions
 
Analyse de données avec spss,
Analyse de données avec spss,Analyse de données avec spss,
Analyse de données avec spss,
 
Ch4 andoneco [mode de compatibilité]
Ch4 andoneco [mode de compatibilité]Ch4 andoneco [mode de compatibilité]
Ch4 andoneco [mode de compatibilité]
 
Data mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes PrincipalesData mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes Principales
 
chapitre 1 régression simple.pdf
chapitre 1 régression simple.pdfchapitre 1 régression simple.pdf
chapitre 1 régression simple.pdf
 
5.1 K plus proches voisins
5.1 K plus proches voisins5.1 K plus proches voisins
5.1 K plus proches voisins
 
Analyse en Composantes Principales
Analyse en Composantes PrincipalesAnalyse en Composantes Principales
Analyse en Composantes Principales
 
Les systèmes de recommandations
Les systèmes de recommandationsLes systèmes de recommandations
Les systèmes de recommandations
 
5.3 Régression logistique
5.3 Régression logistique5.3 Régression logistique
5.3 Régression logistique
 

En vedette (7)

Tns ilres presentation_rgtr_general_conférence de presse mars 2013
Tns ilres presentation_rgtr_general_conférence de presse mars 2013Tns ilres presentation_rgtr_general_conférence de presse mars 2013
Tns ilres presentation_rgtr_general_conférence de presse mars 2013
 
0 g093g formation-analyse-statistique-avancee-avec-ibm-spss-statistics
0 g093g formation-analyse-statistique-avancee-avec-ibm-spss-statistics0 g093g formation-analyse-statistique-avancee-avec-ibm-spss-statistics
0 g093g formation-analyse-statistique-avancee-avec-ibm-spss-statistics
 
Satisfaction on the go ( multicanale )
Satisfaction on the go  ( multicanale )Satisfaction on the go  ( multicanale )
Satisfaction on the go ( multicanale )
 
Azizi methodes de traitement des donnees
Azizi methodes de traitement des donneesAzizi methodes de traitement des donnees
Azizi methodes de traitement des donnees
 
Facteur re
Facteur reFacteur re
Facteur re
 
13. Illou, perception de la qualité et analyses des coûts
13. Illou, perception de la qualité et analyses des coûts13. Illou, perception de la qualité et analyses des coûts
13. Illou, perception de la qualité et analyses des coûts
 
INF220 - Algo DUT SRC1 - Cours 1
INF220 - Algo DUT SRC1 - Cours 1INF220 - Algo DUT SRC1 - Cours 1
INF220 - Algo DUT SRC1 - Cours 1
 

Similaire à Analyse factorielle des_correspondances-afc

Statistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptxStatistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptx
TarekDHAHRI1
 
Cours algorithmique et complexite complet
Cours algorithmique et complexite completCours algorithmique et complexite complet
Cours algorithmique et complexite complet
Chahrawoods Dmz
 
Cours algorithmique et complexite
Cours algorithmique et complexite Cours algorithmique et complexite
Cours algorithmique et complexite
Saddem Chikh
 
Cours algorithmique et complexite complet
Cours algorithmique et complexite completCours algorithmique et complexite complet
Cours algorithmique et complexite complet
Chahrawoods Dmz
 
Mat lab1
Mat lab1Mat lab1
Mat lab1
fouadDD
 

Similaire à Analyse factorielle des_correspondances-afc (20)

Ponts castillo1 statistique
Ponts castillo1 statistiquePonts castillo1 statistique
Ponts castillo1 statistique
 
Statistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptxStatistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptx
 
Statistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptxStatistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptx
 
Chapitre 1 rappel
Chapitre 1 rappelChapitre 1 rappel
Chapitre 1 rappel
 
HDJZKZOZHSGSKZIZLBZZHZNLZ JE SGSJZOKZVSHZKSKSNHSJZ
HDJZKZOZHSGSKZIZLBZZHZNLZ JE SGSJZOKZVSHZKSKSNHSJZHDJZKZOZHSGSKZIZLBZZHZNLZ JE SGSJZOKZVSHZKSKSNHSJZ
HDJZKZOZHSGSKZIZLBZZHZNLZ JE SGSJZOKZVSHZKSKSNHSJZ
 
Chapitre 1 rappel
Chapitre 1   rappelChapitre 1   rappel
Chapitre 1 rappel
 
c1_3 traiter des données (1).pdf
c1_3 traiter des données  (1).pdfc1_3 traiter des données  (1).pdf
c1_3 traiter des données (1).pdf
 
Chapitre 3 NP-complétude
Chapitre 3 NP-complétudeChapitre 3 NP-complétude
Chapitre 3 NP-complétude
 
Chapitre 8 - Les tableaux et les pointeurs.pdf
Chapitre 8 - Les tableaux et les pointeurs.pdfChapitre 8 - Les tableaux et les pointeurs.pdf
Chapitre 8 - Les tableaux et les pointeurs.pdf
 
CHAPITRE VIII : Systèmes linéaires Modélisation & Simulation
CHAPITRE VIII :  Systèmes linéaires Modélisation & SimulationCHAPITRE VIII :  Systèmes linéaires Modélisation & Simulation
CHAPITRE VIII : Systèmes linéaires Modélisation & Simulation
 
Ch2-Notions de base & actions élémentaires.pdf
Ch2-Notions de base & actions élémentaires.pdfCh2-Notions de base & actions élémentaires.pdf
Ch2-Notions de base & actions élémentaires.pdf
 
Cours algorithmique et complexite complet
Cours algorithmique et complexite completCours algorithmique et complexite complet
Cours algorithmique et complexite complet
 
Cours algorithmique et complexite
Cours algorithmique et complexite Cours algorithmique et complexite
Cours algorithmique et complexite
 
Cours algorithmique et complexite complet
Cours algorithmique et complexite completCours algorithmique et complexite complet
Cours algorithmique et complexite complet
 
Initiation r
Initiation rInitiation r
Initiation r
 
Matlab Travaux Pratique
Matlab Travaux Pratique Matlab Travaux Pratique
Matlab Travaux Pratique
 
Introduction à MATLAB et Simulink.pdf
Introduction à MATLAB et Simulink.pdfIntroduction à MATLAB et Simulink.pdf
Introduction à MATLAB et Simulink.pdf
 
Introduction à MATLAB et Simulink.pdf
Introduction à MATLAB et Simulink.pdfIntroduction à MATLAB et Simulink.pdf
Introduction à MATLAB et Simulink.pdf
 
Cours de Matlab
Cours de MatlabCours de Matlab
Cours de Matlab
 
Mat lab1
Mat lab1Mat lab1
Mat lab1
 

Plus de Rémi Bachelet

Qpes 2017 atelier intégrer un mooc supports animation
Qpes 2017 atelier intégrer un mooc  supports animationQpes 2017 atelier intégrer un mooc  supports animation
Qpes 2017 atelier intégrer un mooc supports animation
Rémi Bachelet
 
projet outils basiques version 2013
projet outils basiques version 2013projet outils basiques version 2013
projet outils basiques version 2013
Rémi Bachelet
 

Plus de Rémi Bachelet (20)

Quel avenir pour les MOOC en entreprise ? oct 2017 - Séminaire ens cachan
Quel avenir pour les MOOC en entreprise ? oct 2017 - Séminaire ens cachan Quel avenir pour les MOOC en entreprise ? oct 2017 - Séminaire ens cachan
Quel avenir pour les MOOC en entreprise ? oct 2017 - Séminaire ens cachan
 
Anasup cfa rencontres 2017 - Transformation digitale et transformation des fo...
Anasup cfa rencontres 2017 - Transformation digitale et transformation des fo...Anasup cfa rencontres 2017 - Transformation digitale et transformation des fo...
Anasup cfa rencontres 2017 - Transformation digitale et transformation des fo...
 
QPES 2017 : Hybridation d’un MOOC : Quels moyens déployer ?
QPES 2017 : Hybridation d’un MOOC : Quels moyens déployer ?QPES 2017 : Hybridation d’un MOOC : Quels moyens déployer ?
QPES 2017 : Hybridation d’un MOOC : Quels moyens déployer ?
 
Qpes 2017 atelier intégrer un mooc supports animation
Qpes 2017 atelier intégrer un mooc  supports animationQpes 2017 atelier intégrer un mooc  supports animation
Qpes 2017 atelier intégrer un mooc supports animation
 
Emoocs2017 who wants to chat on a mooc v1.2
Emoocs2017   who wants to chat on a mooc v1.2Emoocs2017   who wants to chat on a mooc v1.2
Emoocs2017 who wants to chat on a mooc v1.2
 
Open Education: the MOOC Experience
Open Education: the MOOC ExperienceOpen Education: the MOOC Experience
Open Education: the MOOC Experience
 
Projet evaluation impact - solution du chapitre 4
Projet evaluation impact - solution du chapitre 4Projet evaluation impact - solution du chapitre 4
Projet evaluation impact - solution du chapitre 4
 
Projet evaluation impact - solution du chapitre 3
Projet evaluation impact - solution du chapitre 3Projet evaluation impact - solution du chapitre 3
Projet evaluation impact - solution du chapitre 3
 
Projet evaluation impact - solution du chapitre 2
Projet evaluation impact - solution du chapitre 2Projet evaluation impact - solution du chapitre 2
Projet evaluation impact - solution du chapitre 2
 
Projet evaluation impact - solution du chapitre 1
Projet evaluation impact - solution du chapitre 1Projet evaluation impact - solution du chapitre 1
Projet evaluation impact - solution du chapitre 1
 
Evaluation d'impact d'un projet
Evaluation d'impact d'un projetEvaluation d'impact d'un projet
Evaluation d'impact d'un projet
 
Gestion des risques Démarche
Gestion des risques DémarcheGestion des risques Démarche
Gestion des risques Démarche
 
Le e-learning et la désinstitutionnalisation du savoir
Le e-learning et la désinstitutionnalisation du savoirLe e-learning et la désinstitutionnalisation du savoir
Le e-learning et la désinstitutionnalisation du savoir
 
Integrer un MOOC en formation initiale - colloque QPES 2015
Integrer un MOOC en formation initiale - colloque QPES 2015Integrer un MOOC en formation initiale - colloque QPES 2015
Integrer un MOOC en formation initiale - colloque QPES 2015
 
Symposium E-Formation 2015 - les données dans les MOOC - juin 2015
Symposium E-Formation 2015  - les données dans les MOOC - juin 2015Symposium E-Formation 2015  - les données dans les MOOC - juin 2015
Symposium E-Formation 2015 - les données dans les MOOC - juin 2015
 
EMMOCs2015 - Do MOOC students come back for more? Recurring students in the G...
EMMOCs2015 - Do MOOC students come back for more?Recurring students in the G...EMMOCs2015 - Do MOOC students come back for more?Recurring students in the G...
EMMOCs2015 - Do MOOC students come back for more? Recurring students in the G...
 
eMOOCs2015 Does peer grading work?
eMOOCs2015 Does peer grading work?eMOOCs2015 Does peer grading work?
eMOOCs2015 Does peer grading work?
 
EMOOCs 2015 Barcamp -- Richer learning activities for MOOCs : 16 ideas
EMOOCs 2015 Barcamp -- Richer learning activities for MOOCs  : 16 ideas EMOOCs 2015 Barcamp -- Richer learning activities for MOOCs  : 16 ideas
EMOOCs 2015 Barcamp -- Richer learning activities for MOOCs : 16 ideas
 
D’une édition à l’autre - Innovations et chiffres des MOOC GdP successifs
D’une édition à l’autre - Innovations et chiffres des MOOC GdP successifsD’une édition à l’autre - Innovations et chiffres des MOOC GdP successifs
D’une édition à l’autre - Innovations et chiffres des MOOC GdP successifs
 
projet outils basiques version 2013
projet outils basiques version 2013projet outils basiques version 2013
projet outils basiques version 2013
 

Dernier

Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdf
ssuserc72852
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
AmgdoulHatim
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
ikospam0
 

Dernier (20)

STRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdf
STRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdfSTRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdf
STRATEGIE_D’APPRENTISSAGE flee_DU_FLE.pdf
 
Formation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxFormation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptx
 
Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024
 
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANKRAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
 
658708519-Power-Point-Management-Interculturel.pdf
658708519-Power-Point-Management-Interculturel.pdf658708519-Power-Point-Management-Interculturel.pdf
658708519-Power-Point-Management-Interculturel.pdf
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdf
 
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdf
 
Cours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiquesCours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiques
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
 
La mondialisation avantages et inconvénients
La mondialisation avantages et inconvénientsLa mondialisation avantages et inconvénients
La mondialisation avantages et inconvénients
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
 
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxIntégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptx
 
les_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkles_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhk
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
 
Les roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxLes roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptx
 
L'expression du but : fiche et exercices niveau C1 FLE
L'expression du but : fiche et exercices  niveau C1 FLEL'expression du but : fiche et exercices  niveau C1 FLE
L'expression du but : fiche et exercices niveau C1 FLE
 

Analyse factorielle des_correspondances-afc

  • 1. L'AFC pour les nuls Mise à jour du 16 août 2010 Rémi Bachelet La version à jour de ce cours d’analyse factorielle des composantes est disponiblehttp://rb.ec-lille.fr Cette formation est également enregistrée en vidéo Source des images indiquées au-dessous Cours distribué sous licenceCreative Commons, selon les conditions suivantes :
  • 2. Rémi BACHELET – Ecole Centrale de Lille 2 Comment utiliser ce cours : Mettre les diapos en format plein écran en cliquant sur Faire défiler l’animation en cliquant sur les diapositives (attention : cliquer sur une image ou un lien ouvre la page web correspondante)
  • 3. Objectifs du cours d’Analyse Factorielle des Correspondances Méthode développée notamment par Jean-Paul Benzécri(1970+) Comprendre les fondements de l’Analyse Factorielle des Correspondances Savoir quel est le processus de calcul et ses logiques Pouvoir expliquer le mapping produit par une AFC Également : Connaître quelques logiciels d’administration d’enquêtes et de traitement de données Avoir des éléments de comparaison AFC – ACP (ACP = Analyse en Composantes Principales).
  • 4. Chapitre 1/4 Principes de l’AFC et données d’entrées Principe général de l’AFC Exemples : Les limites des représentations graphiques intuitives Comment donner du sens aux informations
  • 5. Principe général de l’analyse factorielle des correspondances (AFC) « L’analyse factorielle traite des tableaux de nombres. Elle remplace un tableau de nombres difficile à analyser par une série de tableaux plus simples qui sont une bonne approximation de celui-ci » Ces tableaux sont « simples », car ils sont exprimables sous forme de graphiques Pourquoi « des correspondances » ? Pourquoi « factorielle » ? Il s’agit de décomposer le tableau original en une somme de tableaux/matrices qui sont chacun le produit de facteurs simples. Autrement dit, on les « met en facteurs » Principale source d’informations, et de l’exemple utilisé pour ce cours : Que sais-je ? « L' analyse factorielle » - N°2095, Philippe CIBOIS, ed. PUF, épuisé, extrait disponible en ligne
  • 6. Exemple : que deviennent les bacheliers ? destination université classes prépa autres total A 13 2 5 20 BDD' 20 2 8 30 CE 10 5 5 20 FGH 7 1 22 30 total 50 10 40 100 100 Stats MEN 1975 - 1975 204 489 lycéens
  • 8. Exemple : quels souhaits d’orientation ?
  • 9. .. Pas toujours suffisante :
  • 10. Comment donner du sens à ces données Idée : ce qui est intéressant, c’est de mettre en évidence ce qui est inattendu dans ces répartitions Inattendu = en quoi on dévie d’une répartition uniforme On va donc : Évaluer ce que serait une situation d’uniformité, d’indépendance Calculer en quoi la situation constatée en diffère Exprimer cette différence graphiquement pour pouvoir l’analyser Interpréter le mapping obtenu … et en optimiser la lisibilité
  • 11. Chapitre 2/4 Première opérations sur les matrices Matrice « T » des données d’entrée Matrice R des écarts à l’indépendance Mise en facteur d’une matrice Exprimer « simplement » R
  • 12. Matrice « T » des données d’entrée destination université classes prépa autres total A 13 2 5 20 BDD' 20 2 8 30 CE 10 5 5 20 FGH 7 1 22 30 total 50 10 40 100 100 Ce tableau est aussi une matrice, appellons-la « T » Quelle matrice aurait-on si la répartition dans les filières post-Bac ne dépendait pas du type de Bac ?
  • 13. 8 2 10 1/ S’il y avait situation d’indépendance… 20 10 = 50 * 20% (produit matriciel /100 puisqu’on raisonne en %) 12 3 15 30 8 2 10 20 12 3 15 30 40 10 50 On reconstitue la matrice à partir de ses marges Appellons cette matrice « T0 »
  • 14. 2/La matrice des écarts à l’indépendance estT – T0 = R - = Quelle est la particularité de R ?
  • 15. 3/Comment exprimer simplement R? On décompose la matrice des écarts à l’indépendance en une somme de matrices.. R = T1 + T2 .. Chacune de ces matrices étant mise en facteur (le produit d’un vecteur ligne et d’un vecteur colonne). T1 = C1L1 (une matrice dont la plus petite dimension est N « rang N » est décomposable au maximum en N matrices pouvant se mettre en facteurs … ici T = T0 + T1 + T2). T est de rang 3, mais R est de rang 2….
  • 17. Mise en facteur d’une matrice: exemple T=CL On met en facteur T comme le produit d’une matrice colonne C par une matrice ligne L T (2X2) C (1X2) L (2X1) Attention les règles de présentation du produit matricielne sont pas bien respectées dans nos diapos De plus, la multiplication des matrices n'est pas commutative (LC  CL)
  • 18. R = T1 +T2 = C1L1 +C2L2 + = Attention le sens de multiplication écrit ici est LC au lieu de CL
  • 19. Chapitre 3/4 D’une matrice à une présentation graphique Production et interprétation du mapping Vecteurs colonne et vecteurs ligne Produit scalaire
  • 20. 3/ bisComment représenter graphiquement la décomposition ? Un vecteur colonne (resp. ligne) correspond à une modalité des données en colonnes (resp. lignes) Un axe unidimensionnel + un axe unidimensionnel = un repère
  • 21. Un vecteur colonne correspond à une modalité des données en colonnes + =
  • 22. Un vecteur colonne correspond à une modalité des données en colonnes
  • 23. Un axe unidimensionnel + un axe unidimensionnel = un repère 1 1 A CE 1 2 BDD’ Univ. CPGE 2 -1 CE BDD’ A -4 -2 FGH 1 2 Univ Aut. 1 -1 CPGE -2 -1 Autres FGH
  • 24. 4/Que veut dire ce mapping ? Conjonction : Produit scalaire positif Les Bac CE ont une affinité pour la prépa Opposition Produit scalaire négatif Les Bacs A ne vont pas vers les « autres » (IUT, BTS) Quadrature Produit scalaire nul Les bacs A ne vont ni plus ni moins vers les prépas que la moyenne des bacheliers CE A Prépa Autres
  • 25. Chapitre 4/4 Optimisation de la factorisation Le Chi-2 (2) comme métrique Degrés de liberté Retour aux applications Analyse de mappings
  • 26. 5/Mais ….. Quelle est la meilleure décomposition possible pour R ? En effet R = T1 + T2… mais il existe aussi R = T’1 + T’2 = T’’1 + T’’2 … Quel est le critère (la métrique) qui permet de définir les meilleurs T1 et T2? Pour une matrice de rang n, on cherche d’abord à trouver la meilleure T1,, puis la meilleure T2de telle manière à ce que le premier axe soit celui qui exprime le plus de sens..
  • 27. La métrique que nous cherchons, c’est le Chi-2 (2) Le 2 représente l’écart à l’indépendance or cette indépendance, est exprimée par T0 … l’écart à l’indépendance peut donc se mesurer comme l’écart à T0 À partir de la matrice des données pour chaque cellule de T1 et T2, on calcule L’écart avec la cellule correspondante de T0au carré (d’où le « 2 » du 2) On divise par l’effectif théorique de cette cellule (on parle de 2 pondéré) Le 2 de la matriceest la somme de toutes les « contributions au 2 » de ses cellules Le pourcentage des contributions de T1 et T2 par rapport au 2 de R donne les contributions relatives de T1 et T2 au 2 de T
  • 28. Note sur le 2 : ses degrés de liberté 2 (R) = 2 (T1) + 2 (T2) 2491 = 1998 + 493 Attention à considérer le 2 en proportion de la richesse en information le la matrice = de son nombre de ddl. À partir des distributions marginales on peut obtenir plusieurs matrices Tn, mais pour chaque ligne et chaque colonne, la dernière “case” est imposée par la contrainte du total marginal Définition : On appelle degré de liberté par ligne (ddll) le nombre de colonnes (de modalités) diminué de 1. On appelle degré de liberté par colonne (ddlc) le nombre de lignes (de modalités) diminué de 1. Le degré de liberté du khi-deux de la matrice est le produit ddll x ddlc = ddl. Pour une matrice donnée, le 2 à prendre en compte est en fait 2 / ddl http://brassens.upmf-grenoble.fr/IMSS/MathSHS/SHS1/Stat1/Diapo/COURS9_fichiers/frame.htm
  • 29. Matrice T1 maximisant le 2dans notre cas 2 (R) = 2 (T1) + 2 (T2) 2491 = 1998 + 493 100% = 80.2% + 19.8% Cette ‘concentration’ de ce que l’on appelle le pourcentage de la variance expliquée par un axe est particulièrement intéressante lorsque la taille du tableau de données augmente… 2 (R) = 2 (T1) + 2 (T2) + 2 (T3) + 2 (T4) .. Pourquoi ?  On ne peut que représenter que deux axes à la fois sur un mapping … autant représenter les plus significatifs.
  • 30. On obtient alors ce nouveau mapping .. Autre option configurable : ici, la taille des points est proportionnelle à l’effectif qu’ils représentent Pour relativiser leur importance, les axes sont dilatés proportionnellement au 2qu’ils expriment … Attention aux conséquences de ce choix, notamment la perte de la visibilité d’une quadrature …
  • 31. Application : quels souhaits d’options?
  • 32. Mapping des choix de filière / génie Premiers choix de génie / filière des 147 G2 en 2003
  • 33. C’était les deux premiers axes = 62% de la variance expliquée On peut aussi regarder l’axe 3.. = 18%
  • 34. Conclusion Mise en œuvre logicielle Sphinx, SPSS, SAS Généralisation de l’AFC Comparaison avec l’Analyse en Composantes Principales (ACP) Généralisation de l’AFC Pour approfondir
  • 35. Mise en œuvre logicielle de l’AFC : Sphinx
  • 36. Mise en œuvre logicielle : SPSS
  • 37. Mise en œuvre logicielle : SAS
  • 38.
  • 39. Autre méthode d’analyse de données proche : l’Analyse en Composantes Principales ACP AFC Métriques Catégorielles Données T = T1 + T2 + T3 T - T0 = T1 + T2 Décomposition 2 2pondéré Métrique Attention, le poids des cellules à faible effectif est renforcé
  • 40. Rapports entre ACP et AFC Si on a des données permettant de faire une AFC, peut-on y appliquer une ACP ? Non Si on a des données permettant de faire une ACP, peut-on y appliquer un AFC ? Oui ! .. Mais alors ? .. Alors on traite les données numériques, les nombres comme des catégories Si par exemple on travaille sur des notes, 18/20 n’est plus « supérieur à » 10/20, il n’est pas non plus « plus proche » de 16/20 que de 10/20.
  • 41.
  • 42. Autres cours de méthodologie: Explorer ou vérifier ? Deux catégories d’approches Éventails des démarches de recueil de données Conception de questionnaires Techniques d’entretien et reformulation Validité et Fiabilité des données Mesurer, tester des hypothèses
  • 43. Merci de votre attention !
  • 44. Rémi BACHELET  Enseignant-chercheur,    Ecole Centrale de Lille Mon CV est disponible http://rb.ec-lille.fr Mes principaux cours à Centrale Gestion de projet, sociologie des organisations, recueil, analyse et traitement de données, prévention du plagiat, module de marchés financiers, cours de qualité et méthodes de résolution de problèmes, établir des cartes conceptuelles, utiliser Wikipédia et CentraleWiki, formation au coaching pédagogique et à l'encadrement