1. Analyse en Composante Principale
(ACP)
Réalisé par :
ELMOUSAOUI Khalid
ELHAMDAOUI Abderrahim
Encadrement:
professeur H. Satori
Faculté des Sciences Dhar El
Mahraz – Fès
MASTER BDSAS, S1
Année universitaire 2023-2024
2. ➢ Introduction
➢ Les données en ACP
➢ Réduction de la dimension
➢ Inertie totale
➢ Notion de covariance et ACP non-normée
➢ Notion de corrélation et ACP normée
➢ COMMENT EXTRAIRE LES Composantes principales
Plan du cours
3. ➢ Introduction :
I. Définition de l'ACP :
L'Analyse en Composantes Principales (ACP) est une méthode statistique qui vise à
transformer un ensemble de variables corrélées en un nouvel ensemble de variables non
corrélées, appelées composantes principales. Cette technique permet de réduire la
dimensionnalité des données tout en préservant au maximum l'information contenue dans
celles-ci.
4. ➢ Introduction :
II. les domaines d'application:
• Recherche Scientifique et Biomédicale
• Économie et Finance
• Psychologie et Sciences Sociales
• Géologie et Environnement
• Industrie et Ingénierie
• Informatique et Reconnaissance de Formes
• Marketing et Analyse de Données Clients
• Recherche Opérationnelle
• …
5. ➢ Introduction :
III. Les objectifs de l’ACP c’est de :
▪ Chercher à représenter graphiquement les individus en calculant les composantes
principales, qui représentent la projection des individus dans l’espace réduit.
▪ Chercher à représenter les variables en calculant les coefficients de corrélation entre les
variables et les composantes principales.
6. ➢ Introduction :
IV. PRINCIPE DE L’A.C.P
on cherche à définir k nouvelles variables combinaisons linéaires des p variables
initiales qui feront perdre le moins d’information possible.
• Ces variables seront appelées «composantes principales »,
• les axes qu’elles déterminent : « axes principaux »
• les formes linéaires associées : « facteurs principaux »
8. ➢ Les données en ACP :
o En ACP les données se présentent dans un tableau X à n lignes et p colonnes
où :
• chaque ligne représente un individu
• chaque colonne représente une variable
X est une matrice n × p de valeurs numériques
o Les variables sont quantitatives : la matrice X
est constituée de valeurs numériques.
9.
10. ➢ Les données en ACP :
Un individu est un élément de 𝑅𝑃
Le i ème individu :
Une variable est un élément de 𝑅𝑛
La j ème variable :
11. ➢ Les données en ACP :
▪ Données centrées
Moyennes par colonnes :
ҧ
𝑥𝑗 =
1
𝑛
1
𝑛
𝑥𝑖𝑗
12. ➢ Les données en ACP :
▪ Ecart-type
On peut calculer l’écart-type pour chaque variable :
𝑉 𝑥𝑗 =
1
𝑛
σ1
𝑛
(𝑥𝑖 − ഥ
𝑥𝑖)2
σ𝑖 = )
𝑉(𝑥𝑖
15. ➢ Les données en ACP :
▪ Données centrées réduites
Centrage puis réduction
16.
17. CENTRE DE GRAVITER
On appelle le point moyen ou centre de gravité le vecteur G des
moyennes arithmétiques de chaque variable:
G=(ഥ
𝒙𝟏, ഥ
𝒙𝟐, ഥ
𝒙𝟑, … , ഥ
𝒙𝒊)
18. ➢ Réduction de la dimension
➢ Inertie totale
Inertie totale (= variance empirique) du nuage de point NI :
avec ҧ
𝑥 = (𝑥1, ..., ഥ
𝑥𝑖 ).
19. ➢ Réduction de la dimension
▪ La matrice de variance-covariance
La matrice de variance-covariance associée à X est la matrice
20. ➢ Réduction de la dimension
▪ matrice de corrélation
La matrice de corrélation associée à X est la matrice
Rappel (coefficient de) corrélation de 2 variables :