SlideShare une entreprise Scribd logo
1  sur  11
Télécharger pour lire hors ligne
Analyse en Composantes Principales
Jeu de données decathlon
Ce jeu de données contient 41 individus et 13 variables, 2 variables quantitatives sont illustratives, 1 variable
qualitative est illustrative.
1. Observation d’individus extrêmes
L’analyse des graphes ne révèle aucun individu singulier.
2. Distribution de l’inertie
L’inertie des axes factoriels indique d’une part si les variables sont structurées et suggère d’autre part le
nombre judicieux de composantes principales à étudier.
Les 2 premiers axes de l’ ACP expriment 50.09% de l’inertie totale du jeu de données ; cela signifie que
50.09% de la variabilité totale du nuage des individus (ou des variables) est représentée dans ce plan. C’est
un pourcentage assez important, et le premier plan représente donc convenablement la variabilité contenue
dans une grande part du jeu de données actif. Cette valeur est supérieure à la valeur référence de 37.53%, la
variabilité expliquée par ce plan est donc significative (cette intertie de référence est le quantile 0.95 de la
distribution des pourcentages d’inertie obtenus en simulant 1682 jeux de données aléatoires de dimensions
comparables sur la base d’une distribution normale).
Du fait de ces observations, il serait tout de même probablement préférable de considérer également dans
l’analyse les dimensions supérieures ou égales à la troisième.
1 2 3 4 5 6 7 8 9 10
051015202530
Figure 2 - Decomposition of the total inertia on the components of the ACP
Une estimation du nombre pertinent d’axes à interpréter suggère de restreindre l’analyse à la description des
3 premiers axes. Ces composantes révèlent un taux d’inertie supérieur à celle du quantile 0.95 de distributions
1
aléatoires (64.14% contre 51.38%). Cette observation suggère que seuls ces axes sont porteurs d’une véritable
information. En conséquence, la description de l’analyse sera restreinte à ces seuls axes.
3. Description du plan 1:2
−6 −4 −2 0 2 4 6 8
−4−2024
Dim 1 (32.72%)
Dim2(17.37%)
YURKOV
WARNERS
MARTINEAU
NOOL
BOURGUIGNON
Sebrle
Clay
Karpov
Macey
Warners
Nool
Averyanov
Drews
Parkhomenko
Lorenzo
Karlivans
Korkizoglou
Uldal
Casarsa
Figure 3.1 - Graphe des individus (ACP) Les individus libellés sont ceux ayant la plus grande contribution
à la construction du plan.
La probabilité critique du test de Wilks indique la variable dont les modalités sépare au mieux les individus
sur le plan (i.e. qui explique au mieux les distances entre individus).
Competition
0.366311
Il n’y a qu’une unique variable qualitative possible pour illustrer les distances entre individus : Competition.
2
−6 −4 −2 0 2 4 6 8
−4−2024
Dim 1 (32.72%)
Dim2(17.37%)
Parkhomenko
Averyanov
WARNERS
Clay
YURKOV
Lorenzo
Sebrle
Nool
Korkizoglou
Karlivans
MARTINEAU
Casarsa
Uldal
NOOL Warners
BOURGUIGNON
Drews
Macey
Karpov
Decastar
OlympicG
Figure 3.2 - Graphe des individus (ACP) Les individus libellés sont ceux ayant la plus grande contribution
à la construction du plan. Les individus sont colorés selon leur appartenance aux modalités de la variable
Competition.
−1.5 −1.0 −0.5 0.0 0.5 1.0 1.5
−1.0−0.50.00.51.0
Dim 1 (32.72%)
Dim2(17.37%)
100m
Long.jump
Shot.put
400m
110m.hurdle
Discus
Points
Figure 3.3 - Graphe des variables (ACP) Les variables en noir sont les variables actives, celles en bleu
sont les variables quantitatives supplémentaires (illustratives). Les variables libellées sont celles les mieux
représentées sur le plan.
3
−0.6 −0.4 −0.2 0.0 0.2
−0.3−0.10.10.20.3
Dim 1 (32.72%)
Dim2(17.37%)
Decastar
OlympicG
Figure 3.4 - Graphe des modalités (ACP) Les facteurs libellés sont ceux les mieux représentés sur le
plan.
La dimension 1 oppose des individus tels que Karpov, Sebrle, Clay et Macey (à droite du graphe, caractérisés
par une coordonnée fortement positive sur l’axe) à des individus comme BOURGUIGNON, Uldal, Lorenzo,
NOOL et Karlivans (à gauche du graphe, caractérisés par une coordonnée fortement négative sur l’axe).
Le groupe auquel les individus Karpov, Sebrle, Clay et Macey appartiennent (caractérisés par une coordonnée
positive sur l’axe) partage :
• de fortes valeurs pour les variables Points, High.jump, Discus, Shot.put et Long.jump (de la plus extrême
à la moins extrême).
• de faibles valeurs pour les variables 400m, 110m.hurdle, Rank et 100m (de la moins extrême à la plus
extrême).
Le groupe auquel les individus BOURGUIGNON, Uldal, Lorenzo, NOOL et Karlivans appartiennent (carac-
térisés par une coordonnées négative sur l’axe) partage :
• de fortes valeurs pour les variables 110m.hurdle, 100m et Rank (de la plus extrême à la moins extrême).
• de faibles valeurs pour les variables Discus, High.jump, Points et Shot.put (de la moins extrême à la
plus extrême).
Notons que la variable Points est extrêmement corrélée à cette dimension (corrélation de 0.91). Cette variable
pourrait donc résumer à elle seule la dimension 1.
La dimension 2 oppose des individus tels que Casarsa, YURKOV et Parkhomenko (en haut du graphe,
caractérisés par une coordonnées fortement positive sur l’axe) à des individus comme Warners, Drews et
WARNERS (en bas du graphe, caractérisés par une coordonnées fortement négative sur l’axe).
Le groupe auquel les individus Casarsa, YURKOV et Parkhomenko appartiennent (caractérisés par une
coordonnée positive sur l’axe) partage :
• de fortes valeurs pour la variable 400m.
• de faibles valeurs pour la variable Long.jump.
4
Le groupe auquel les individus Warners, Drews et WARNERS appartiennent (caractérisés par une coordonnées
négative sur l’axe) partage :
• de fortes valeurs pour la variable Pole.vault.
• de faibles valeurs pour la variable 110m.hurdle.
4. Description de la dimension 3
−4 −2 0 2 4
−2−1012
Dim 3 (14.05%)
Dim4(10.57%)
KARPOV
Parkhomenko
Terek
Clay
McMULLEN
Lorenzo
CLAY
Sebrle Nool
Korkizoglou
BERNARD
Bernard
Karlivans
ZSIVOCZKY
Barras
Zsivoczky
Smith
Macey
Karpov
Figure 4.1 - Graphe des individus (ACP) Les individus libellés sont ceux ayant la plus grande contribution
à la construction du plan.
La probabilité critique du test de Wilks indique la variable dont les modalités sépare au mieux les individus
sur le plan (i.e. qui explique au mieux les distances entre individus).
Competition
0.496903
Il n’y a qu’une unique variable qualitative possible pour illustrer les distances entre individus : Competition.
5
−4 −2 0 2 4
−2−1012
Dim 3 (14.05%)
Dim4(10.57%)
Nool
KARPOV
Karpov
Macey
Smith
BERNARD
Zsivoczky
McMULLEN
Terek
Bernard
Korkizoglou
Lorenzo
Barras
Clay
CLAY
Parkhomenko
Karlivans
Sebrle
ZSIVOCZKY
Decastar
OlympicG
Figure 4.2 - Graphe des individus (ACP) Les individus libellés sont ceux ayant la plus grande contribution
à la construction du plan. Les individus sont colorés selon leur appartenance aux modalités de la variable
Competition.
−1.5 −1.0 −0.5 0.0 0.5 1.0 1.5
−1.0−0.50.00.51.0
Dim 3 (14.05%)
Dim4(10.57%)
High.jump
110m.hurdle
Pole.vault
Javeline
1500m
Figure 4.3 - Graphe des variables (ACP) Les variables en noir sont les variables actives, celles en bleu
sont les variables quantitatives supplémentaires (illustratives). Les variables libellées sont celles les mieux
représentées sur le plan.
6
−0.1 0.0 0.1 0.2 0.3
−0.20−0.100.000.10
Dim 3 (14.05%)
Dim4(10.57%)
Decastar
OlympicG
Figure 4.4 - Graphe des modalités (ACP) Les facteurs libellés sont ceux les mieux représentés sur le
plan.
La dimension 3 oppose des individus tels que KARPOV, Korkizoglou, Terek et CLAY (à droite du graphe,
caractérisés par une coordonnée fortement positive sur l’axe) à des individus comme ZSIVOCZKY, Barras,
Zsivoczky, McMULLEN, Macey, Bernard et Smith (à gauche du graphe, caractérisés par une coordonnée
fortement négative sur l’axe).
Le groupe auquel les individus KARPOV, Korkizoglou, Terek et CLAY appartiennent (caractérisés par une
coordonnée positive sur l’axe) partage :
• de fortes valeurs pour la variable 1500m.
• de faibles valeurs pour la variable Javeline.
Le groupe auquel les individus ZSIVOCZKY, Barras, Zsivoczky, McMULLEN, Macey, Bernard et Smith
appartiennent (caractérisés par une coordonnées négative sur l’axe) partage :
• de faibles valeurs pour les variables 1500m et Pole.vault (de la moins extrême à la plus extrême).
7
5. Classification
−6 −4 −2 0 2 4 6 8
−4−2024
Dim 1 (32.72%)
Dim2(17.37%)
BOURGUIGNON
Casarsa
Uldal
Lorenzo
NOOL
MARTINEAU
Karlivans
Parkhomenko
Korkizoglou
YURKOV
Drews
Nool Averyanov
WARNERS Warners
Macey
Clay
Sebrle
Karpov
cluster 1
cluster 2
cluster 3
cluster 4
cluster 1
cluster 2
cluster 3
cluster 4
Figure 5 - Classification Ascendante Hierachique des individus. La classification réalisée sur les
individus fait apparaître 4 clusters.
Le cluster 1 est composé d’individus tels que YURKOV, MARTINEAU, NOOL, BOURGUIGNON,
Parkhomenko, Lorenzo, Karlivans, Uldal et Casarsa. Ce groupe est caractérisé par :
• de fortes valeurs pour les variables 100m, 110m.hurdle, 400m et Rank (de la plus extrême à la moins
extrême).
• de faibles valeurs pour les variables Shot.put, Long.jump et Points (de la moins extrême à la plus
extrême).
Le cluster 2 est composé d’individus tels que WARNERS, Warners, Nool, Averyanov, Drews et Korkizoglou.
Ce groupe est caractérisé par :
• de fortes valeurs pour les variables Pole.vault et 1500m (de la plus extrême à la moins extrême).
• de faibles valeurs pour les variables 100m et Javeline (de la moins extrême à la plus extrême).
Le cluster 3 est composé d’individus tels que Macey. Ce groupe est caractérisé par :
• de faibles valeurs pour les variables 1500m et Pole.vault (de la moins extrême à la plus extrême).
Le cluster 4 est composé d’individus tels que Sebrle, Clay et Karpov. Ce groupe est caractérisé par :
• de fortes valeurs pour les variables Points, Long.jump, Discus, Shot.put, Javeline et High.jump (de la
plus extrême à la moins extrême).
• de faibles valeurs pour les variables 110m.hurdle, Rank, 400m et 100m (de la moins extrême à la plus
extrême).
Annexes
dimdesc(res, axes = 1:3)
8
$Dim.1
$Dim.1$quanti
correlation p.value
Points 0.9561543 2.099191e-22
Long.jump 0.7418997 2.849886e-08
Shot.put 0.6225026 1.388321e-05
High.jump 0.5719453 9.362285e-05
Discus 0.5524665 1.802220e-04
Rank -0.6705104 1.616348e-06
400m -0.6796099 1.028175e-06
110m.hurdle -0.7462453 2.136962e-08
100m -0.7747198 2.778467e-09
$Dim.2
$Dim.2$quanti
correlation p.value
Discus 0.6063134 2.650745e-05
Shot.put 0.5983033 3.603567e-05
400m 0.5694378 1.020941e-04
1500m 0.4742238 1.734405e-03
High.jump 0.3502936 2.475025e-02
Javeline 0.3169891 4.344974e-02
Long.jump -0.3454213 2.696969e-02
$Dim.3
$Dim.3$quanti
correlation p.value
1500m 0.7821428 1.554450e-09
Pole.vault 0.6917567 5.480172e-07
Javeline -0.3896554 1.179331e-02
Figure 6 - Liste des variables caractéristiques des dimensions de l’analyse.
res.hcpc$desc.var
$quanti.var
Eta2 P-value
Points 0.7438620 4.908988e-11
100m 0.6581552 9.668613e-09
Pole.vault 0.5712977 5.972228e-07
Long.jump 0.5293255 3.246949e-06
110m.hurdle 0.4455078 6.229435e-05
400m 0.4425235 6.859144e-05
Shot.put 0.2869412 5.393490e-03
Discus 0.2777274 6.745695e-03
Rank 0.2693094 8.250830e-03
1500m 0.2602251 1.022178e-02
Javeline 0.2500899 1.293207e-02
High.jump 0.2255099 2.250558e-02
$quanti
$quanti$`1`
v.test Mean in category Overall mean sd in category
9
100m 4.741585 11.300833 10.99805 0.1445947
110m.hurdle 3.964894 15.060000 14.60585 0.3798903
400m 3.822084 50.686667 49.61634 1.0702051
Rank 2.667277 17.250000 12.12195 7.7041655
Shot.put -2.100392 14.056667 14.47707 0.8698116
Long.jump -3.406381 6.998333 7.26000 0.2586450
Points -4.131722 7661.916667 8005.36585 196.1718882
Overall sd p.value
100m 0.2597956 2.120526e-06
110m.hurdle 0.4660000 7.342867e-05
400m 1.1392975 1.323286e-04
Rank 7.8217805 7.646858e-03
Shot.put 0.8143118 3.569438e-02
Long.jump 0.3125193 6.583024e-04
Points 338.1839416 3.600552e-05
$quanti$`2`
v.test Mean in category Overall mean sd in category
Pole.vault 4.295481 5.021429 4.762439 0.1919024
1500m 2.602164 285.612857 279.024878 12.7576030
100m -1.969217 10.885714 10.998049 0.1539812
Javeline -2.125561 56.091429 58.316585 4.5043580
Overall sd p.value
Pole.vault 0.2745887 1.743152e-05
1500m 11.5300118 9.263766e-03
100m 0.2597956 4.892823e-02
Javeline 4.7675931 3.353983e-02
$quanti$`3`
v.test Mean in category Overall mean sd in category
1500m -2.893339 270.825000 279.024878 5.8957039
Pole.vault -3.715512 4.511667 4.762439 0.1635967
Overall sd p.value
1500m 11.5300118 0.0038117012
Pole.vault 0.2745887 0.0002027925
$quanti$`4`
v.test Mean in category Overall mean sd in category
Points 4.242103 8812.66667 8005.365854 68.78145745
Long.jump 3.468581 7.87000 7.260000 0.06480741
Discus 3.107539 50.16000 44.325610 1.19668988
Shot.put 2.974272 15.84000 14.477073 0.46568945
Javeline 2.586808 65.25667 58.316585 6.87867397
High.jump 2.289003 2.09000 1.976829 0.02449490
110m.hurdle -2.119695 14.05000 14.605854 0.06531973
Rank -2.299627 2.00000 12.121951 0.81649658
400m -2.333955 48.12000 49.616341 0.98634004
100m -2.745523 10.59667 10.998049 0.18080069
Overall sd p.value
Points 338.18394159 2.214348e-05
Long.jump 0.31251927 5.232144e-04
Discus 3.33639725 1.886523e-03
Shot.put 0.81431175 2.936847e-03
Javeline 4.76759315 9.686955e-03
10
High.jump 0.08785906 2.207917e-02
110m.hurdle 0.46599998 3.403177e-02
Rank 7.82178048 2.146935e-02
400m 1.13929751 1.959810e-02
100m 0.25979560 6.041458e-03
attr(,"class")
[1] "catdes" "list "
Figure 7 - Liste des variables caractéristiques des clusters de la classification.
11

Contenu connexe

En vedette

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by HubspotMarius Sescu
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTExpeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 

En vedette (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

FactoInvestigate R Package

  • 1. Analyse en Composantes Principales Jeu de données decathlon Ce jeu de données contient 41 individus et 13 variables, 2 variables quantitatives sont illustratives, 1 variable qualitative est illustrative. 1. Observation d’individus extrêmes L’analyse des graphes ne révèle aucun individu singulier. 2. Distribution de l’inertie L’inertie des axes factoriels indique d’une part si les variables sont structurées et suggère d’autre part le nombre judicieux de composantes principales à étudier. Les 2 premiers axes de l’ ACP expriment 50.09% de l’inertie totale du jeu de données ; cela signifie que 50.09% de la variabilité totale du nuage des individus (ou des variables) est représentée dans ce plan. C’est un pourcentage assez important, et le premier plan représente donc convenablement la variabilité contenue dans une grande part du jeu de données actif. Cette valeur est supérieure à la valeur référence de 37.53%, la variabilité expliquée par ce plan est donc significative (cette intertie de référence est le quantile 0.95 de la distribution des pourcentages d’inertie obtenus en simulant 1682 jeux de données aléatoires de dimensions comparables sur la base d’une distribution normale). Du fait de ces observations, il serait tout de même probablement préférable de considérer également dans l’analyse les dimensions supérieures ou égales à la troisième. 1 2 3 4 5 6 7 8 9 10 051015202530 Figure 2 - Decomposition of the total inertia on the components of the ACP Une estimation du nombre pertinent d’axes à interpréter suggère de restreindre l’analyse à la description des 3 premiers axes. Ces composantes révèlent un taux d’inertie supérieur à celle du quantile 0.95 de distributions 1
  • 2. aléatoires (64.14% contre 51.38%). Cette observation suggère que seuls ces axes sont porteurs d’une véritable information. En conséquence, la description de l’analyse sera restreinte à ces seuls axes. 3. Description du plan 1:2 −6 −4 −2 0 2 4 6 8 −4−2024 Dim 1 (32.72%) Dim2(17.37%) YURKOV WARNERS MARTINEAU NOOL BOURGUIGNON Sebrle Clay Karpov Macey Warners Nool Averyanov Drews Parkhomenko Lorenzo Karlivans Korkizoglou Uldal Casarsa Figure 3.1 - Graphe des individus (ACP) Les individus libellés sont ceux ayant la plus grande contribution à la construction du plan. La probabilité critique du test de Wilks indique la variable dont les modalités sépare au mieux les individus sur le plan (i.e. qui explique au mieux les distances entre individus). Competition 0.366311 Il n’y a qu’une unique variable qualitative possible pour illustrer les distances entre individus : Competition. 2
  • 3. −6 −4 −2 0 2 4 6 8 −4−2024 Dim 1 (32.72%) Dim2(17.37%) Parkhomenko Averyanov WARNERS Clay YURKOV Lorenzo Sebrle Nool Korkizoglou Karlivans MARTINEAU Casarsa Uldal NOOL Warners BOURGUIGNON Drews Macey Karpov Decastar OlympicG Figure 3.2 - Graphe des individus (ACP) Les individus libellés sont ceux ayant la plus grande contribution à la construction du plan. Les individus sont colorés selon leur appartenance aux modalités de la variable Competition. −1.5 −1.0 −0.5 0.0 0.5 1.0 1.5 −1.0−0.50.00.51.0 Dim 1 (32.72%) Dim2(17.37%) 100m Long.jump Shot.put 400m 110m.hurdle Discus Points Figure 3.3 - Graphe des variables (ACP) Les variables en noir sont les variables actives, celles en bleu sont les variables quantitatives supplémentaires (illustratives). Les variables libellées sont celles les mieux représentées sur le plan. 3
  • 4. −0.6 −0.4 −0.2 0.0 0.2 −0.3−0.10.10.20.3 Dim 1 (32.72%) Dim2(17.37%) Decastar OlympicG Figure 3.4 - Graphe des modalités (ACP) Les facteurs libellés sont ceux les mieux représentés sur le plan. La dimension 1 oppose des individus tels que Karpov, Sebrle, Clay et Macey (à droite du graphe, caractérisés par une coordonnée fortement positive sur l’axe) à des individus comme BOURGUIGNON, Uldal, Lorenzo, NOOL et Karlivans (à gauche du graphe, caractérisés par une coordonnée fortement négative sur l’axe). Le groupe auquel les individus Karpov, Sebrle, Clay et Macey appartiennent (caractérisés par une coordonnée positive sur l’axe) partage : • de fortes valeurs pour les variables Points, High.jump, Discus, Shot.put et Long.jump (de la plus extrême à la moins extrême). • de faibles valeurs pour les variables 400m, 110m.hurdle, Rank et 100m (de la moins extrême à la plus extrême). Le groupe auquel les individus BOURGUIGNON, Uldal, Lorenzo, NOOL et Karlivans appartiennent (carac- térisés par une coordonnées négative sur l’axe) partage : • de fortes valeurs pour les variables 110m.hurdle, 100m et Rank (de la plus extrême à la moins extrême). • de faibles valeurs pour les variables Discus, High.jump, Points et Shot.put (de la moins extrême à la plus extrême). Notons que la variable Points est extrêmement corrélée à cette dimension (corrélation de 0.91). Cette variable pourrait donc résumer à elle seule la dimension 1. La dimension 2 oppose des individus tels que Casarsa, YURKOV et Parkhomenko (en haut du graphe, caractérisés par une coordonnées fortement positive sur l’axe) à des individus comme Warners, Drews et WARNERS (en bas du graphe, caractérisés par une coordonnées fortement négative sur l’axe). Le groupe auquel les individus Casarsa, YURKOV et Parkhomenko appartiennent (caractérisés par une coordonnée positive sur l’axe) partage : • de fortes valeurs pour la variable 400m. • de faibles valeurs pour la variable Long.jump. 4
  • 5. Le groupe auquel les individus Warners, Drews et WARNERS appartiennent (caractérisés par une coordonnées négative sur l’axe) partage : • de fortes valeurs pour la variable Pole.vault. • de faibles valeurs pour la variable 110m.hurdle. 4. Description de la dimension 3 −4 −2 0 2 4 −2−1012 Dim 3 (14.05%) Dim4(10.57%) KARPOV Parkhomenko Terek Clay McMULLEN Lorenzo CLAY Sebrle Nool Korkizoglou BERNARD Bernard Karlivans ZSIVOCZKY Barras Zsivoczky Smith Macey Karpov Figure 4.1 - Graphe des individus (ACP) Les individus libellés sont ceux ayant la plus grande contribution à la construction du plan. La probabilité critique du test de Wilks indique la variable dont les modalités sépare au mieux les individus sur le plan (i.e. qui explique au mieux les distances entre individus). Competition 0.496903 Il n’y a qu’une unique variable qualitative possible pour illustrer les distances entre individus : Competition. 5
  • 6. −4 −2 0 2 4 −2−1012 Dim 3 (14.05%) Dim4(10.57%) Nool KARPOV Karpov Macey Smith BERNARD Zsivoczky McMULLEN Terek Bernard Korkizoglou Lorenzo Barras Clay CLAY Parkhomenko Karlivans Sebrle ZSIVOCZKY Decastar OlympicG Figure 4.2 - Graphe des individus (ACP) Les individus libellés sont ceux ayant la plus grande contribution à la construction du plan. Les individus sont colorés selon leur appartenance aux modalités de la variable Competition. −1.5 −1.0 −0.5 0.0 0.5 1.0 1.5 −1.0−0.50.00.51.0 Dim 3 (14.05%) Dim4(10.57%) High.jump 110m.hurdle Pole.vault Javeline 1500m Figure 4.3 - Graphe des variables (ACP) Les variables en noir sont les variables actives, celles en bleu sont les variables quantitatives supplémentaires (illustratives). Les variables libellées sont celles les mieux représentées sur le plan. 6
  • 7. −0.1 0.0 0.1 0.2 0.3 −0.20−0.100.000.10 Dim 3 (14.05%) Dim4(10.57%) Decastar OlympicG Figure 4.4 - Graphe des modalités (ACP) Les facteurs libellés sont ceux les mieux représentés sur le plan. La dimension 3 oppose des individus tels que KARPOV, Korkizoglou, Terek et CLAY (à droite du graphe, caractérisés par une coordonnée fortement positive sur l’axe) à des individus comme ZSIVOCZKY, Barras, Zsivoczky, McMULLEN, Macey, Bernard et Smith (à gauche du graphe, caractérisés par une coordonnée fortement négative sur l’axe). Le groupe auquel les individus KARPOV, Korkizoglou, Terek et CLAY appartiennent (caractérisés par une coordonnée positive sur l’axe) partage : • de fortes valeurs pour la variable 1500m. • de faibles valeurs pour la variable Javeline. Le groupe auquel les individus ZSIVOCZKY, Barras, Zsivoczky, McMULLEN, Macey, Bernard et Smith appartiennent (caractérisés par une coordonnées négative sur l’axe) partage : • de faibles valeurs pour les variables 1500m et Pole.vault (de la moins extrême à la plus extrême). 7
  • 8. 5. Classification −6 −4 −2 0 2 4 6 8 −4−2024 Dim 1 (32.72%) Dim2(17.37%) BOURGUIGNON Casarsa Uldal Lorenzo NOOL MARTINEAU Karlivans Parkhomenko Korkizoglou YURKOV Drews Nool Averyanov WARNERS Warners Macey Clay Sebrle Karpov cluster 1 cluster 2 cluster 3 cluster 4 cluster 1 cluster 2 cluster 3 cluster 4 Figure 5 - Classification Ascendante Hierachique des individus. La classification réalisée sur les individus fait apparaître 4 clusters. Le cluster 1 est composé d’individus tels que YURKOV, MARTINEAU, NOOL, BOURGUIGNON, Parkhomenko, Lorenzo, Karlivans, Uldal et Casarsa. Ce groupe est caractérisé par : • de fortes valeurs pour les variables 100m, 110m.hurdle, 400m et Rank (de la plus extrême à la moins extrême). • de faibles valeurs pour les variables Shot.put, Long.jump et Points (de la moins extrême à la plus extrême). Le cluster 2 est composé d’individus tels que WARNERS, Warners, Nool, Averyanov, Drews et Korkizoglou. Ce groupe est caractérisé par : • de fortes valeurs pour les variables Pole.vault et 1500m (de la plus extrême à la moins extrême). • de faibles valeurs pour les variables 100m et Javeline (de la moins extrême à la plus extrême). Le cluster 3 est composé d’individus tels que Macey. Ce groupe est caractérisé par : • de faibles valeurs pour les variables 1500m et Pole.vault (de la moins extrême à la plus extrême). Le cluster 4 est composé d’individus tels que Sebrle, Clay et Karpov. Ce groupe est caractérisé par : • de fortes valeurs pour les variables Points, Long.jump, Discus, Shot.put, Javeline et High.jump (de la plus extrême à la moins extrême). • de faibles valeurs pour les variables 110m.hurdle, Rank, 400m et 100m (de la moins extrême à la plus extrême). Annexes dimdesc(res, axes = 1:3) 8
  • 9. $Dim.1 $Dim.1$quanti correlation p.value Points 0.9561543 2.099191e-22 Long.jump 0.7418997 2.849886e-08 Shot.put 0.6225026 1.388321e-05 High.jump 0.5719453 9.362285e-05 Discus 0.5524665 1.802220e-04 Rank -0.6705104 1.616348e-06 400m -0.6796099 1.028175e-06 110m.hurdle -0.7462453 2.136962e-08 100m -0.7747198 2.778467e-09 $Dim.2 $Dim.2$quanti correlation p.value Discus 0.6063134 2.650745e-05 Shot.put 0.5983033 3.603567e-05 400m 0.5694378 1.020941e-04 1500m 0.4742238 1.734405e-03 High.jump 0.3502936 2.475025e-02 Javeline 0.3169891 4.344974e-02 Long.jump -0.3454213 2.696969e-02 $Dim.3 $Dim.3$quanti correlation p.value 1500m 0.7821428 1.554450e-09 Pole.vault 0.6917567 5.480172e-07 Javeline -0.3896554 1.179331e-02 Figure 6 - Liste des variables caractéristiques des dimensions de l’analyse. res.hcpc$desc.var $quanti.var Eta2 P-value Points 0.7438620 4.908988e-11 100m 0.6581552 9.668613e-09 Pole.vault 0.5712977 5.972228e-07 Long.jump 0.5293255 3.246949e-06 110m.hurdle 0.4455078 6.229435e-05 400m 0.4425235 6.859144e-05 Shot.put 0.2869412 5.393490e-03 Discus 0.2777274 6.745695e-03 Rank 0.2693094 8.250830e-03 1500m 0.2602251 1.022178e-02 Javeline 0.2500899 1.293207e-02 High.jump 0.2255099 2.250558e-02 $quanti $quanti$`1` v.test Mean in category Overall mean sd in category 9
  • 10. 100m 4.741585 11.300833 10.99805 0.1445947 110m.hurdle 3.964894 15.060000 14.60585 0.3798903 400m 3.822084 50.686667 49.61634 1.0702051 Rank 2.667277 17.250000 12.12195 7.7041655 Shot.put -2.100392 14.056667 14.47707 0.8698116 Long.jump -3.406381 6.998333 7.26000 0.2586450 Points -4.131722 7661.916667 8005.36585 196.1718882 Overall sd p.value 100m 0.2597956 2.120526e-06 110m.hurdle 0.4660000 7.342867e-05 400m 1.1392975 1.323286e-04 Rank 7.8217805 7.646858e-03 Shot.put 0.8143118 3.569438e-02 Long.jump 0.3125193 6.583024e-04 Points 338.1839416 3.600552e-05 $quanti$`2` v.test Mean in category Overall mean sd in category Pole.vault 4.295481 5.021429 4.762439 0.1919024 1500m 2.602164 285.612857 279.024878 12.7576030 100m -1.969217 10.885714 10.998049 0.1539812 Javeline -2.125561 56.091429 58.316585 4.5043580 Overall sd p.value Pole.vault 0.2745887 1.743152e-05 1500m 11.5300118 9.263766e-03 100m 0.2597956 4.892823e-02 Javeline 4.7675931 3.353983e-02 $quanti$`3` v.test Mean in category Overall mean sd in category 1500m -2.893339 270.825000 279.024878 5.8957039 Pole.vault -3.715512 4.511667 4.762439 0.1635967 Overall sd p.value 1500m 11.5300118 0.0038117012 Pole.vault 0.2745887 0.0002027925 $quanti$`4` v.test Mean in category Overall mean sd in category Points 4.242103 8812.66667 8005.365854 68.78145745 Long.jump 3.468581 7.87000 7.260000 0.06480741 Discus 3.107539 50.16000 44.325610 1.19668988 Shot.put 2.974272 15.84000 14.477073 0.46568945 Javeline 2.586808 65.25667 58.316585 6.87867397 High.jump 2.289003 2.09000 1.976829 0.02449490 110m.hurdle -2.119695 14.05000 14.605854 0.06531973 Rank -2.299627 2.00000 12.121951 0.81649658 400m -2.333955 48.12000 49.616341 0.98634004 100m -2.745523 10.59667 10.998049 0.18080069 Overall sd p.value Points 338.18394159 2.214348e-05 Long.jump 0.31251927 5.232144e-04 Discus 3.33639725 1.886523e-03 Shot.put 0.81431175 2.936847e-03 Javeline 4.76759315 9.686955e-03 10
  • 11. High.jump 0.08785906 2.207917e-02 110m.hurdle 0.46599998 3.403177e-02 Rank 7.82178048 2.146935e-02 400m 1.13929751 1.959810e-02 100m 0.25979560 6.041458e-03 attr(,"class") [1] "catdes" "list " Figure 7 - Liste des variables caractéristiques des clusters de la classification. 11