pre.pdf

•

0 j'aime•20 vues

hackermarroc00

presenattion ACP

Sciences

Analyse en Composante Principale
(ACP)
Réalisé par :
ELMOUSAOUI Khalid
ELHAMDAOUI Abderrahim
Encadrement:
professeur H. Satori
Faculté des Sciences Dhar El
Mahraz – Fès
MASTER BDSAS, S1
Année universitaire 2023-2024

➢ Introduction
➢ Les données en ACP
➢ Réduction de la dimension
➢ Inertie totale
➢ Notion de covariance et ACP non-normée
➢ Notion de corrélation et ACP normée
➢ COMMENT EXTRAIRE LES Composantes principales
Plan du cours

➢ Introduction :
I. Définition de l'ACP :
L'Analyse en Composantes Principales (ACP) est une méthode statistique qui vise à
transformer un ensemble de variables corrélées en un nouvel ensemble de variables non
corrélées, appelées composantes principales. Cette technique permet de réduire la
dimensionnalité des données tout en préservant au maximum l'information contenue dans
celles-ci.

➢ Introduction :
II. les domaines d'application:
• Recherche Scientifique et Biomédicale
• Économie et Finance
• Psychologie et Sciences Sociales
• Géologie et Environnement
• Industrie et Ingénierie
• Informatique et Reconnaissance de Formes
• Marketing et Analyse de Données Clients
• Recherche Opérationnelle
• …

➢ Introduction :
III. Les objectifs de l’ACP c’est de :
▪ Chercher à représenter graphiquement les individus en calculant les composantes
principales, qui représentent la projection des individus dans l’espace réduit.
▪ Chercher à représenter les variables en calculant les coefficients de corrélation entre les
variables et les composantes principales.

➢ Introduction :
IV. PRINCIPE DE L’A.C.P
on cherche à définir k nouvelles variables combinaisons linéaires des p variables
initiales qui feront perdre le moins d’information possible.
• Ces variables seront appelées «composantes principales »,
• les axes qu’elles déterminent : « axes principaux »
• les formes linéaires associées : « facteurs principaux »

➢ Les données en ACP :
o En ACP les données se présentent dans un tableau X à n lignes et p colonnes
où :
• chaque ligne représente un individu
• chaque colonne représente une variable
X est une matrice n × p de valeurs numériques
o Les variables sont quantitatives : la matrice X
est constituée de valeurs numériques.

➢ Les données en ACP :
Un individu est un élément de 𝑅𝑃
Le i ème individu :
Une variable est un élément de 𝑅𝑛
La j ème variable :

➢ Les données en ACP :
▪ Données centrées
Moyennes par colonnes :
ҧ
𝑥𝑗 =
1
𝑛 ෍
1
𝑛
𝑥𝑖𝑗

➢ Les données en ACP :
▪ Ecart-type
On peut calculer l’écart-type pour chaque variable :
𝑉 𝑥𝑗 =
1
𝑛
σ1
𝑛
(𝑥𝑖 − ഥ
𝑥𝑖)2
σ𝑖 = )
𝑉(𝑥𝑖

➢ Les données en ACP :
▪ Centrage des données

➢ Les données en ACP :
▪ Données centrées réduites
Centrage puis réduction

CENTRE DE GRAVITER
On appelle le point moyen ou centre de gravité le vecteur G des
moyennes arithmétiques de chaque variable:
G=(ഥ
𝒙𝟏, ഥ
𝒙𝟐, ഥ
𝒙𝟑, … , ഥ
𝒙𝒊)

➢ Réduction de la dimension
➢ Inertie totale
Inertie totale (= variance empirique) du nuage de point NI :
avec ҧ
𝑥 = (𝑥1, ..., ഥ
𝑥𝑖 ).

➢ Réduction de la dimension
▪ La matrice de variance-covariance
La matrice de variance-covariance associée à X est la matrice

➢ Réduction de la dimension
▪ matrice de corrélation
La matrice de corrélation associée à X est la matrice
Rappel (coefficient de) corrélation de 2 variables :

Recommandé

• Les statistiques peuvent être vues en fonction de l'objectif fixé ;bawen34465

Présentation acpgrandprime1

2tc intrograndprime1

Cours acp mehdi_amanMehdi Aman

TS-TC-Statistiques-manuel-stagiaire.pdfFootballLovers9

9b567ad91347677ab6736e76a4115c80 statistiqueSamad Oulasri

2024 State of Marketing Report – by HubspotMarius Sescu

Everything You Need To Know About ChatGPTExpeed Software

Recommandé

• Les statistiques peuvent être vues en fonction de l'objectif fixé ;bawen34465

Présentation acpgrandprime1

2tc intrograndprime1

Cours acp mehdi_amanMehdi Aman

TS-TC-Statistiques-manuel-stagiaire.pdfFootballLovers9

9b567ad91347677ab6736e76a4115c80 statistiqueSamad Oulasri

2024 State of Marketing Report – by HubspotMarius Sescu

Everything You Need To Know About ChatGPTExpeed Software

RAPPORT PFE Projet urbain: -«El-Hamma d'un quartier à une ville» -«La créat...MassinissaDjender

Intervention dans le cadre de la journée SOUND du 26 avril 2024melodiefaury

La constellation d'Andromède.présentation.pptxirinahirbea

MÉMOIRE DE MASTER EN DIAGNOSTIC DES SYSTÈMES ÉNERGÉTIQUESMejdiAbassi1

La face cachée des jeux vidéo - Conférence de 15/05 2024Boris Krywicki

rapport de stage Organisme d’accueil Centre National d'Etudes & de Recherche...MassinissaDjender

Product Design Trends in 2024 | Teenage EngineeringsPixeldarts

How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow

AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork

Skeleton Culture CodeSkeleton Technologies

PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley

Content Methodology: A Best Practices Report (Webinar)contently

How to Prepare For a Successful Job Search for 2024Albert Qian

Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)

Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal

5 Public speaking tips from TED - Visualized summarySpeakerHub

ChatGPT and the Future of Work - Clark Boyd Clark Boyd

Getting into the tech field. what next Tessa Mero

Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray

How to have difficult conversations Rajiv Jayarajah, MAppComm, ACC

Introduction to Data ScienceChristy Abraham Joy

Time Management & Productivity - Best PracticesVit Horky

Contenu connexe

Dernier

RAPPORT PFE Projet urbain: -«El-Hamma d'un quartier à une ville» -«La créat...MassinissaDjender

Intervention dans le cadre de la journée SOUND du 26 avril 2024melodiefaury

La constellation d'Andromède.présentation.pptxirinahirbea

MÉMOIRE DE MASTER EN DIAGNOSTIC DES SYSTÈMES ÉNERGÉTIQUESMejdiAbassi1

La face cachée des jeux vidéo - Conférence de 15/05 2024Boris Krywicki

rapport de stage Organisme d’accueil Centre National d'Etudes & de Recherche...MassinissaDjender

Dernier (6)

RAPPORT PFE Projet urbain: -«El-Hamma d'un quartier à une ville» -«La créat...

Intervention dans le cadre de la journée SOUND du 26 avril 2024

La constellation d'Andromède.présentation.pptx

MÉMOIRE DE MASTER EN DIAGNOSTIC DES SYSTÈMES ÉNERGÉTIQUES

La face cachée des jeux vidéo - Conférence de 15/05 2024

rapport de stage Organisme d’accueil Centre National d'Etudes & de Recherche...

En vedette

Product Design Trends in 2024 | Teenage EngineeringsPixeldarts

How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow

AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork

Skeleton Culture CodeSkeleton Technologies

PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley

Content Methodology: A Best Practices Report (Webinar)contently

How to Prepare For a Successful Job Search for 2024Albert Qian

Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)

Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal

5 Public speaking tips from TED - Visualized summarySpeakerHub

ChatGPT and the Future of Work - Clark Boyd Clark Boyd

Getting into the tech field. what next Tessa Mero

Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray

How to have difficult conversations Rajiv Jayarajah, MAppComm, ACC

Introduction to Data ScienceChristy Abraham Joy

Time Management & Productivity - Best PracticesVit Horky

The six step guide to practical project managementMindGenius

Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36

Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools

12 Ways to Increase Your Influence at WorkGetSmarter

En vedette (20)

Product Design Trends in 2024 | Teenage Engineerings

How Race, Age and Gender Shape Attitudes Towards Mental Health

AI Trends in Creative Operations 2024 by Artwork Flow.pdf

Skeleton Culture Code

PEPSICO Presentation to CAGNY Conference Feb 2024

Content Methodology: A Best Practices Report (Webinar)

How to Prepare For a Successful Job Search for 2024

Social Media Marketing Trends 2024 // The Global Indie Insights

Trends In Paid Search: Navigating The Digital Landscape In 2024

5 Public speaking tips from TED - Visualized summary

ChatGPT and the Future of Work - Clark Boyd

Getting into the tech field. what next

Google's Just Not That Into You: Understanding Core Updates & Search Intent

How to have difficult conversations

Introduction to Data Science

Time Management & Productivity - Best Practices

The six step guide to practical project management

Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...

Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...

12 Ways to Increase Your Influence at Work

pre.pdf

1. Analyse en Composante Principale (ACP) Réalisé par : ELMOUSAOUI Khalid ELHAMDAOUI Abderrahim Encadrement: professeur H. Satori Faculté des Sciences Dhar El Mahraz – Fès MASTER BDSAS, S1 Année universitaire 2023-2024

2. ➢ Introduction ➢ Les données en ACP ➢ Réduction de la dimension ➢ Inertie totale ➢ Notion de covariance et ACP non-normée ➢ Notion de corrélation et ACP normée ➢ COMMENT EXTRAIRE LES Composantes principales Plan du cours

3. ➢ Introduction : I. Définition de l'ACP : L'Analyse en Composantes Principales (ACP) est une méthode statistique qui vise à transformer un ensemble de variables corrélées en un nouvel ensemble de variables non corrélées, appelées composantes principales. Cette technique permet de réduire la dimensionnalité des données tout en préservant au maximum l'information contenue dans celles-ci.

4. ➢ Introduction : II. les domaines d'application: • Recherche Scientifique et Biomédicale • Économie et Finance • Psychologie et Sciences Sociales • Géologie et Environnement • Industrie et Ingénierie • Informatique et Reconnaissance de Formes • Marketing et Analyse de Données Clients • Recherche Opérationnelle • …

5. ➢ Introduction : III. Les objectifs de l’ACP c’est de : ▪ Chercher à représenter graphiquement les individus en calculant les composantes principales, qui représentent la projection des individus dans l’espace réduit. ▪ Chercher à représenter les variables en calculant les coefficients de corrélation entre les variables et les composantes principales.

6. ➢ Introduction : IV. PRINCIPE DE L’A.C.P on cherche à définir k nouvelles variables combinaisons linéaires des p variables initiales qui feront perdre le moins d’information possible. • Ces variables seront appelées «composantes principales », • les axes qu’elles déterminent : « axes principaux » • les formes linéaires associées : « facteurs principaux »

7. axes principaux Axes initiales

8. ➢ Les données en ACP : o En ACP les données se présentent dans un tableau X à n lignes et p colonnes où : • chaque ligne représente un individu • chaque colonne représente une variable X est une matrice n × p de valeurs numériques o Les variables sont quantitatives : la matrice X est constituée de valeurs numériques.

10. ➢ Les données en ACP : Un individu est un élément de 𝑅𝑃 Le i ème individu : Une variable est un élément de 𝑅𝑛 La j ème variable :

11. ➢ Les données en ACP : ▪ Données centrées Moyennes par colonnes : ҧ 𝑥𝑗 = 1 𝑛 ෍ 1 𝑛 𝑥𝑖𝑗

12. ➢ Les données en ACP : ▪ Ecart-type On peut calculer l’écart-type pour chaque variable : 𝑉 𝑥𝑗 = 1 𝑛 σ1 𝑛 (𝑥𝑖 − ഥ 𝑥𝑖)2 σ𝑖 = ) 𝑉(𝑥𝑖

13.

14. ➢ Les données en ACP : ▪ Centrage des données

15. ➢ Les données en ACP : ▪ Données centrées réduites Centrage puis réduction

16.

17. CENTRE DE GRAVITER On appelle le point moyen ou centre de gravité le vecteur G des moyennes arithmétiques de chaque variable: G=(ഥ 𝒙𝟏, ഥ 𝒙𝟐, ഥ 𝒙𝟑, … , ഥ 𝒙𝒊)

18. ➢ Réduction de la dimension ➢ Inertie totale Inertie totale (= variance empirique) du nuage de point NI : avec ҧ 𝑥 = (𝑥1, ..., ഥ 𝑥𝑖 ).

19. ➢ Réduction de la dimension ▪ La matrice de variance-covariance La matrice de variance-covariance associée à X est la matrice

20. ➢ Réduction de la dimension ▪ matrice de corrélation La matrice de corrélation associée à X est la matrice Rappel (coefficient de) corrélation de 2 variables :

21.

22.

23.

24.

25.

26.

27.

28.

29.

30.

31.

32.

33. SUITE D’EXEMPLE PRINCIPAL