Vocabulaire  Représentations graphiques         Résumé NumériqueStatistique Descriptive - 1ère partie         Statistique ...
Vocabulaire                Représentations graphiques                       Résumé NumériqueRéférences      Statistique de...
Vocabulaire               Représentations graphiques                      Résumé NumériqueInformations sur le cours      1...
Vocabulaire               Représentations graphiques                      Résumé Numérique                                ...
Vocabulaire              Représentations graphiques                     Résumé NumériquePopulation, individu, variable    ...
Vocabulaire              Représentations graphiques                     Résumé NumériqueExemple - Questionnaire       Age ...
Vocabulaire              Représentations graphiques                     Résumé NumériqueExemple suite     Population = 20 ...
Vocabulaire                Représentations graphiques                       Résumé NumériqueTypes de variables 2 familles ...
Vocabulaire                Représentations graphiques                       Résumé NumériqueVariables Quantitatives 2 type...
Vocabulaire                  Représentations graphiques                         Résumé NumériqueVariables Qualitatives 2 c...
Vocabulaire              Représentations graphiques                     Résumé NumériqueDonnées Agrégées -1     Avec l’exe...
Vocabulaire                Représentations graphiques                       Résumé NumériqueDonnées Agrégées -2 Variable d...
Vocabulaire               Représentations graphiques                      Résumé NumériqueDonnées Agrégées -3 Variable Qua...
Vocabulaire               Représentations graphiques                      Résumé NumériqueDonnées Agrégées -4 Variable con...
Vocabulaire               Représentations graphiques                      Résumé NumériqueA propos des fréquences . . . Re...
Vocabulaire                 Représentations graphiques                        Résumé NumériqueVariables qualitatives : Un ...
Vocabulaire                Représentations graphiques                       Résumé NumériqueVariables qualitatives : Prése...
Vocabulaire              Représentations graphiques                     Résumé NumériqueVariables qualitatives : Les diagr...
Vocabulaire               Représentations graphiques                      Résumé NumériqueVariables quantitatives discrète...
Vocabulaire                   Représentations graphiques                          Résumé NumériqueVariables quantitatives ...
Vocabulaire                Représentations graphiques                       Résumé NumériqueVariables quantitatives contin...
Vocabulaire                Représentations graphiques                       Résumé NumériqueVariables quantitatives contin...
Vocabulaire                Représentations graphiques                       Résumé NumériqueVariables quantitatives : L’hi...
Vocabulaire                Représentations graphiques                       Résumé NumériqueVariables quantitatives : L’hi...
Vocabulaire                Représentations graphiques                       Résumé NumériqueVariables quantitatives : L’hi...
Vocabulaire              Représentations graphiques                     Résumé NumériqueFréquences cumulées     La fréquen...
Vocabulaire                Représentations graphiques                       Résumé NumériqueFonction de répartition     Fi...
Paramètres de position                                              Paramètres de dispersion                             V...
Paramètres de position                                           Paramètres de dispersion                             Voca...
Paramètres de position                                                Paramètres de dispersion                            ...
Paramètres de position                                                Paramètres de dispersion                            ...
Paramètres de position                                             Paramètres de dispersion                               ...
Paramètres de position                                             Paramètres de dispersion                               ...
Paramètres de position                                             Paramètres de dispersion                               ...
Paramètres de position                                                 Paramètres de dispersion                           ...
Paramètres de position                                            Paramètres de dispersion                              Vo...
Paramètres de position                                             Paramètres de dispersion                               ...
Paramètres de position                                            Paramètres de dispersion                              Vo...
Paramètres de position                                              Paramètres de dispersion                              ...
Paramètres de position                                            Paramètres de dispersion                              Vo...
Paramètres de position                                               Paramètres de dispersion                             ...
Paramètres de position                                             Paramètres de dispersion                               ...
Paramètres de position                                             Paramètres de dispersion                               ...
Paramètres de position                                             Paramètres de dispersion                               ...
Paramètres de position                                             Paramètres de dispersion                               ...
Paramètres de position                                            Paramètres de dispersion                              Vo...
Paramètres de position                                            Paramètres de dispersion                              Vo...
Paramètres de position                                                   Paramètres de dispersion                         ...
Paramètres de position                                                 Paramètres de dispersion                           ...
Paramètres de position                                              Paramètres de dispersion                              ...
Paramètres de position                                            Paramètres de dispersion                             Voc...
Paramètres de position                                            Paramètres de dispersion                              Vo...
Paramètres de position                                           Paramètres de dispersion                             Voca...
Paramètres de position                                             Paramètres de dispersion                               ...
Paramètres de position                                            Paramètres de dispersion                              Vo...
Paramètres de position                                             Paramètres de dispersion                               ...
Paramètres de position                                            Paramètres de dispersion                              Vo...
Paramètres de position                                         Paramètres de dispersion                           Vocabula...
Paramètres de position                                            Paramètres de dispersion                              Vo...
Paramètres de position                                         Paramètres de dispersion                           Vocabula...
Paramètres de position                                          Paramètres de dispersion                            Vocabu...
Paramètres de position                                               Paramètres de dispersion                             ...
Paramètres de position                                             Paramètres de dispersion                               ...
Prochain SlideShare
Chargement dans…5
×

Cours

2 967 vues

Publié le

Statistique Descriptive 1ère année, MASS, première partie.

Publié dans : Formation
0 commentaire
7 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
2 967
Sur SlideShare
0
Issues des intégrations
0
Intégrations
158
Actions
Partages
0
Téléchargements
0
Commentaires
0
J’aime
7
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Cours

  1. 1. Vocabulaire Représentations graphiques Résumé NumériqueStatistique Descriptive - 1ère partie Statistique pour une variable L1 MASS Université Rennes 2 Année 2010-2011 Semestre 2 MASS 1 Stat. Univariée
  2. 2. Vocabulaire Représentations graphiques Résumé NumériqueRéférences Statistique descriptive, cours et exercices corrigés Agnès Hamon et Nicolas Jégou Résumé du cours de statistique descriptive Yves Tillé MASS 1 Stat. Univariée
  3. 3. Vocabulaire Représentations graphiques Résumé NumériqueInformations sur le cours 12H Cours 12H TD-TP sur logiciel R Contrôle Continu : Un écrit de 2H et un mini-projet sous R Examen Terminal : Un écrit de 2H MASS 1 Stat. Univariée
  4. 4. Vocabulaire Représentations graphiques Résumé Numérique Plan1 Vocabulaire2 Représentations graphiques3 Résumé Numérique Paramètres de position Paramètres de dispersion Moments Paramètres de forme Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches MASS 1 Stat. Univariée
  5. 5. Vocabulaire Représentations graphiques Résumé NumériquePopulation, individu, variable Recueil des données sur les éléments constitutifs d’un ensemble ; Ex : Notes aux examens, marque des voitures formant le parc automobile de Rennes en 2005, etc. L’ensemble étudié = population ; Attention : la population ne sera pas toujours un ensemble d’êtres humains. Éléments qui le constituent = individus ; Caractère étudié = variable ; Sa valeur relevée sur un individu sera appelée observation. MASS 1 Stat. Univariée
  6. 6. Vocabulaire Représentations graphiques Résumé NumériqueExemple - Questionnaire Age Nombre de personnes Lecture X dans le foyer : Y journal : Z 1 17 4 de temps en temps 2 12 2 très rarement 3 15 3 très rarement . . . . . . . . . . . . 18 38 2 tous les jours 19 40 4 très rarement 20 42 5 de temps en temps MASS 1 Stat. Univariée
  7. 7. Vocabulaire Représentations graphiques Résumé NumériqueExemple suite Population = 20 personnes interrogées ; Individus renseignés sur 3 variables : L’âge, noté X ; Nombre de personnes dans le foyer, noté Y ; Fréquence de lecture, notée Z . Chaque individu est identifié par un numéro pour indexer les observations ; Exemple : x18 correspond à l’observation de la variable X faite sur l’individu 18, et dans le tableau on lit x18 =38. MASS 1 Stat. Univariée
  8. 8. Vocabulaire Représentations graphiques Résumé NumériqueTypes de variables 2 familles de variables : Si les observations sont des nombres, on parle de variable quantitative ; Si les observations se traduisent par un attribut, appartenance à une catégorie ou à un genre, la variable est dite qualitative ; On parle donc des valeurs possibles prises par une variable quantitative ; Et de modalités pour une variable qualitative. Sur l’exemple précédent, Y va. quantitative et Z va. qualitative. MASS 1 Stat. Univariée
  9. 9. Vocabulaire Représentations graphiques Résumé NumériqueVariables Quantitatives 2 types de variables : Variables discrètes dont l’ensemble possible des valeurs est fini ; Ex : Variable Y . Variables continues lorsque les réalisations possibles s’organisent sur une échelle continue des valeurs ; Ex : Variable X . Même si les observations prennent des valeurs entières, on comprend bien qu’un individu qui a 15 ans signifie que son âge appartient à l’intervalle [15; 16[. MASS 1 Stat. Univariée
  10. 10. Vocabulaire Représentations graphiques Résumé NumériqueVariables Qualitatives 2 catégories : Les modalités possèdent un ordre naturel, la variable est qualifiée d’ordinale ; Ex : Variable Z . Pas d’ordonnancement on parle de variable nominale ; Ex : Variable ”sexe” a deux modalités, "homme" et "femme", et est dite nominale. MASS 1 Stat. Univariée
  11. 11. Vocabulaire Représentations graphiques Résumé NumériqueDonnées Agrégées -1 Avec l’exemple précédent pour chacun des 20 individus, nous disposons des observations pour chaque variable : on parle de données brutes ou individuelles. Il n’est pas toujours possible de toutes les représenter (trop d’observations) et on présente les données dans un tableau synthétique et on parle alors de données agrégées. MASS 1 Stat. Univariée
  12. 12. Vocabulaire Représentations graphiques Résumé NumériqueDonnées Agrégées -2 Variable discrète : On regroupe les observations suivant les valeurs de la variable Valeurs 1 2 3 4 5 6 variable Y Effectifs n1 = 3 n2 = 9 n3 = 2 n4 = 4 n5 = 1 n6 = 1 observés MASS 1 Stat. Univariée
  13. 13. Vocabulaire Représentations graphiques Résumé NumériqueDonnées Agrégées -3 Variable Qualitative : On regroupe les observations suivant les modalités de la variable Modalités très de temps tous variable Z rarement en temps les jours Effectifs n1 = 6 n2 = 6 n3 = 8 observés MASS 1 Stat. Univariée
  14. 14. Vocabulaire Représentations graphiques Résumé NumériqueDonnées Agrégées -4 Variable continue : Regroupement suivant des classes Classes pour X [0 ;20[ [20 ;40[ [40 ;60[ [60 ;90[ Effectifs n1 = 6 n2 = 5 n3 = 5 n4 = 4 Choix des classes subjectif, autre exemple : Classes pour X [10 ;30[ [30 ;40[ [40 ;50[ [50 ;70[ [70 ;90[ Effectifs n1 = 7 n2 = 4 n3 = 4 n4 = 3 n5 = 2 MASS 1 Stat. Univariée
  15. 15. Vocabulaire Représentations graphiques Résumé NumériqueA propos des fréquences . . . Regrouper les données (slides précédents) : utile pour connaître les modalités (valeurs) les plus souvent observées, mais : Le nombre d’observations d’une valeur n’a de sens que si on le compare au nombre total d’observations : Dans une entreprise, 10 salariés gagnent plus de 60 ke/an Si l’entreprise a 50 salariés cela représente 20% Si l’entreprise a 5000 salariés cela représente 0,2% C’est la notion de fréquences qui formalise cela ; Avec n le nombre total d’observations et ni le nombre d’observations de la i-ème modalité, la fréquence de cette modalité est ni fi = n MASS 1 Stat. Univariée
  16. 16. Vocabulaire Représentations graphiques Résumé NumériqueVariables qualitatives : Un exemple On s’intéresse à la variable "état-civil", notée X , pour 20 personnes. M M D C C M C C C M C M V M V D C C C M Le domaine de la variable X est {M, D, C , V } ; M : marié(e) ; D : divorcé(e) : C : célibataire ; V : veuf(ve) ; La valeur de X pour le 3ème individu est : x3 = D. MASS 1 Stat. Univariée
  17. 17. Vocabulaire Représentations graphiques Résumé NumériqueVariables qualitatives : Présentation des données La variable est qualitative nominale et nous regroupons les observations suivant ses quatre modalités pour une présentation agrégée : xi ni fi C 9 0.45 Avec M 7 0.35 4 i=1 ni = 20 V 2 0.10 4 i=1 fi = 1 D 2 0.10 20 1 MASS 1 Stat. Univariée
  18. 18. Vocabulaire Représentations graphiques Résumé NumériqueVariables qualitatives : Les diagrammes Figure: Diagramme en barres ; Diagramme en secteurs MASS 1 Stat. Univariée
  19. 19. Vocabulaire Représentations graphiques Résumé NumériqueVariables quantitatives discrètes : Un exemple On s’intéresse à la variable "nombre de personnes par ménage", notée Z , pour un quartier composé de 50 ménages. 1 1 1 1 1 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 6 6 6 7 7 MASS 1 Stat. Univariée
  20. 20. Vocabulaire Représentations graphiques Résumé NumériqueVariables quantitatives discrètes : Présentation des données xi ni fi 1 5 0.1 2 9 0.18 3 15 0.30 4 10 0.20 5 6 0.12 6 3 0.06 7 2 0.04 Figure: Diagramme en bâtons 50 1 MASS 1 Stat. Univariée
  21. 21. Vocabulaire Représentations graphiques Résumé NumériqueVariables quantitatives continues : Un exemple On s’intéresse à la variable "taille" de 50 élèves d’une classe. 152 152 152 153 153 154 154 154 155 155 156 156 156 156 156 157 157 157 158 158 159 159 160 160 160 160 160 161 161 162 162 162 163 164 164 164 164 165 166 167 168 168 168 169 169 170 171 171 171 171 MASS 1 Stat. Univariée
  22. 22. Vocabulaire Représentations graphiques Résumé NumériqueVariables quantitatives continues : les classes On peut définir les classes suivantes et obtenir le tableau des données agrégées : Classes ni fi [151,5 ;155,5] [151,5 ;155,5] 10 0.20 [155,5 ;159,5] [155,5 ;159,5] 12 0.24 [159,5 ;163,5] [159,5 ;163,5] 11 0.22 [163,5 ;167,5] [163,5 ;167,5] 7 0.14 [167,5 ;171,5] [167,5 ;171,5] 10 0.2 50 1 MASS 1 Stat. Univariée
  23. 23. Vocabulaire Représentations graphiques Résumé NumériqueVariables quantitatives : L’histogramme - 1 Construction de l’histogramme à partir du tableau précédent. Les observations sur les n individus sont réparties dans k intervalles de la forme ([ei ; ei+1 ])i=1,...,k Nous graduons l’axe horizontal à l’échelle des valeurs (ei )i=1,...,k ; Pour la hauteur on traduit le fait que l’air de chaque rectangle correspond à la fréquence de la classe : fi = (ei+1 − ei ) × di MASS 1 Stat. Univariée
  24. 24. Vocabulaire Représentations graphiques Résumé NumériqueVariables quantitatives : L’histogramme - 2 En ordonnée on a donc la "densité" di : Figure: Histogramme des effectifs MASS 1 Stat. Univariée
  25. 25. Vocabulaire Représentations graphiques Résumé NumériqueVariables quantitatives : L’histogramme - 3 Et en agrégeant les deux dernières classes on obtient : Figure: Histogramme des effectifs avec les 2 dernières classes agrégées MASS 1 Stat. Univariée
  26. 26. Vocabulaire Représentations graphiques Résumé NumériqueFréquences cumulées La fréquence cumulée de la ième valeur, notée Fi , donnée par i Fi = f1 + . . . + fi = fj j=1 C’est la proportion des observations inférieures ou égales à la ième valeur de la variable : xi ni fi Fi 1 5 0.1 0.1 2 9 0.18 0.28 3 15 0.30 0.58 ··· ··· ··· ··· MASS 1 Stat. Univariée
  27. 27. Vocabulaire Représentations graphiques Résumé NumériqueFonction de répartition Figure: Fonction de répartition pour variable discrète et continue. MASS 1 Stat. Univariée
  28. 28. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesLe mode Mode = valeur distincte correspondant à l’effectif le plus élevé. Exemple avec variable "Etat-civil" xi ni fi C 9 0.45 M 7 0.35 Ici mode est C : célibataire. V 2 0.10 D 2 0.10 20 1 MASS 1 Stat. Univariée
  29. 29. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesLe mode - Qqs Remarques Le mode peut être calculé pour tous les types de variable ; Le mode n’est pas forcément unique ; Pour une variable continue découpée en classes, on peut définir une classe modale - cf après. MASS 1 Stat. Univariée
  30. 30. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesLa moyenne La moyenne est définie que sur une variable quantitative ; Elle est notée x et est définie par : ¯ n 1 x1 + x2 + . . . + xn x= ¯ xi = n n i=1 Elle peut aussi être calculée à partir des effectifs : J 1 x= ¯ nj xj n j=1 MASS 1 Stat. Univariée
  31. 31. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesLa moyenne - Exemple Variable : "Nombre d’enfants par famille" 0+0+1+1+1+2+3+4 0 0 1 1 1 2 3 4 x= ¯ 8 = 1.5 Tableau synthétique xj nj 0 2 2×0+3×1+1×2+1×3+1×4 1 3 x ¯ = 8 2 1 = 1.5 3 1 4 1 MASS 1 Stat. Univariée
  32. 32. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesLa médiane - 1 Médiane = valeur centrale de la série statistique, notée x1/2 . Obtenue de la manière suivante : On trie la série statistique par ordre croissant des valeurs observés. Ex : {3, 2, 1, 0, 0, 1, 2} devient {0, 0, 1, 1, 2, 2, 3}. La médiane est la valeur qui se trouve au milieu de la série ordonée ; Ici x1/2 = 1. MASS 1 Stat. Univariée
  33. 33. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesLa médiane - 2 - Cas où n est impair La médiane peut être définie comme l’inverse de la fonction de répartition pour la valeur 1/2. x1/2 = F −1 (0.5). Figure: Médiane quand n impair MASS 1 Stat. Univariée
  34. 34. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesLa médiane - 3 - Cas où n est pair : 2 valeurs se trouvent au milieu de la série ; Médiane = moyenne de ces 2 valeurs ; x1/2 = F −1 (0.5) ; La fonction de répartition correspond à un "palier". Figure: Médiane quand n pair MASS 1 Stat. Univariée
  35. 35. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesÉléments de comparaison des paramètres de position Exercice : On regarde la variable "nombre d’aces réussis" dans les 10 derniers matchs d’un joueur de l’équipe de France ; Aces 0 1 2 3 ... 11 12 13 Effectifs 4 2 3 0 ... 0 0 1 Mode ? Médiane ? Moyenne ? Interprétation ? Est-ce un mauvais serveur ? MASS 1 Stat. Univariée
  36. 36. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesÉléments de comparaison des paramètres de position Mode donne la valeur la plus fréquente mais ne tient pas compte des autres observations ; Médiane dépend de l’ordre des données mais peu sensible aux valeurs extrêmes ; Moyenne manque de robustesse ; Ex : une fois 13 aces permet d’augmenter facilement la moyenne alors qu’en réalité il ne sert jamais plus de 2 aces par match. MASS 1 Stat. Univariée
  37. 37. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesÉléments de comparaison des paramètres de position Suivant la distribution étudiée, les 3 mesures présentent leur propre intérêt. Il faut surtout éviter de faire des interprétations abusives et il est souvent utile de les comparer. MASS 1 Stat. Univariée
  38. 38. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesLe mode - Variable continue La classe modale n’est pas la classe de plus grande fréquence mais la classe de plus grande densité ; Classe modale = pic sur l’histogramme. MASS 1 Stat. Univariée
  39. 39. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesLa moyenne - Variable continue Les observations sont réparties dans J intervalles et J 1 x= ¯ nj cj , n j=1 ej +ej+1 où cj = 2 est le centre de classe. MASS 1 Stat. Univariée
  40. 40. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesLa médiane - Variable continue Regrouper en "classes" donc on se prive des valeurs mesurées pour ne garder que des intervalles ; Hyp : les données sont uniformément réparties dans les intervalles ; MASS 1 Stat. Univariée
  41. 41. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesExemple Temps en min. [0 ;2 [ [2 ;6 [ ... Fréquences (%) 40 40 ... Temps médian ∈ [2; 6[ ; L’hyp. nous donne : 10 % entre 2 et 3 min ; 10 % entre 3 et 4 min ; ... Donc le temps médian est de 3 min ; Sinon interpolation linéaire pour utiliser x1/2 = F −1 (0.5). MASS 1 Stat. Univariée
  42. 42. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesInterpolation linéaire Cela consiste à déterminer une équation de droite pour en déduire la valeur de x1/2 ; On sait que F (x1/2 ) = 0.5 et que x1/2 ∈ [ek ; ek+1 ] ; F (ek+1 ) − F (ek ) F (x1/2 ) ≈ F (ek ) + (x1/2 − ek ) ek+1 − ek MASS 1 Stat. Univariée
  43. 43. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesQuantiles - 1 La notion de quantile d’ordre p (où 0 < p < 1) généralise la médiane ; xp = F −1 (p). La fonction de répartition est discontinue ; On va présenter une manière de définir les quantiles. MASS 1 Stat. Univariée
  44. 44. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesQuantiles - 2 Si np est un nombre entier, alors 1 xp = {xnp + xnp+1 }. 2 Si np n’est pas un nombre entier, alors 1 xp = x[np] , 2 où [np] représente le plus petit entier supérieur ou égal à np. Notations : x1/4 = 1er quartile ; x1/2 = médiane ; x3/4 = 3ème quartile ; . . . MASS 1 Stat. Univariée
  45. 45. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesQuantiles - 3 - Exemple Avec la série suivante : {12, 13, 15, 16, 18, 19, 22, 24, 25, 27, 28, 34} ; Le 1er quartile nous donne np = 0.25 × 12 = 3 donc entier ; Et donc x3 + x4 15 + 16 x1/4 = = = 15.5; 2 2 Avec la série suivante : {12, 13, 15, 16, 18, 19, 22, 24, 25, 27} ; Le 1er quartile nous donne np = 0.25 × 10 = 2.5 donc pas entier ; Et donc x1/4 = x[2.5] = x3 = 15. MASS 1 Stat. Univariée
  46. 46. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesL’étendue L’étendue est simplement la différence entre la plus grande et la plus petite valeur ; E = xn − x1 . MASS 1 Stat. Univariée
  47. 47. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesLa distance interquartile La distance interquartile est la différence entre le 3ème et le 1er quartile ; IQ = x3/4 − x1/4 . MASS 1 Stat. Univariée
  48. 48. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesApplication X : "Journées d’absence au travail" X 0 1 2 3 4 5 6 7 8 9 10 11 ni 1 4 4 8 14 7 4 4 2 1 0 1 Donner un résumé numérique de la variable X . MASS 1 Stat. Univariée
  49. 49. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesLa variance La variance est la somme des carrés des écarts à la moyenne divisée par le nombre d’observations : n 1 σ2 = (xi − x )2 ¯ n i=1 Réécriture de la variance n 1 σ2 = xi2 − x 2 . ¯ n i=1 Démonstration : exercice. Mesure pas très parlante. MASS 1 Stat. Univariée
  50. 50. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesL’écart type Dispersion autour de la moyenne ; √ σ= Variance Cf. Exercices de TD pour interprétation simple d’un point de vue descriptif. MASS 1 Stat. Univariée
  51. 51. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesMoments - 1 On appelle moment d’ordre r, r ∈ N, le paramètre n 1 mr = xir . n i=1 On appelle moment centré d’ordre r le paramètre n 1 mr = (xi − x )r . ¯ n i=1 MASS 1 Stat. Univariée
  52. 52. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesMoments - 2 Les moments généralisent la plupart des paramètres. m1 = x, ¯ m1 = 0, m2 = σ2 + x 2 , ¯ m2 = σ2 . Les moments d’ordre 3,4 sont utilisés pour mesurer la symétrie et l’aplatissement. MASS 1 Stat. Univariée
  53. 53. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesSkewness Le skewness peut prendre des valeurs positives, négatives, ou nulles. L’asymétrie se mesure avec le coefficient d’asymétrie de Fisher m3 sk = . σ3 MASS 1 Stat. Univariée
  54. 54. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesExemple Figure: Asymétrie d’une distribution. Le skewness est positif quand la distribution est allongée à droite, comme par exemple lorsqu’on regarde les variables "revenus", "tailles des entreprises", etc. MASS 1 Stat. Univariée
  55. 55. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesKurtosis L’aplatissement est mesuré par le coef. d’aplatissement de Pearson : m4 β2 = 4 , σ ou le coef. d’aplatissement de Fisher : g2 = β2 − 3. MASS 1 Stat. Univariée
  56. 56. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesExemple Figure: Distribution mésokurtique et leptokurtique. Une courbe leptokurtique (g2 > 0) est plus pointue et possède des queues de distributions plus longues. MASS 1 Stat. Univariée
  57. 57. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesDiagramme en tiges et feuilles Le Stem and leaf diagram est un moyen rapide de présenter une variable quantitative ; Par exemple avec la série suivante : 15, 15, 16, 17, 18, 20, 21, 22, 23, 23, 23, 24, 25, 25, 26, 26, 27, 28, 28, 29, 30, 30, 32, 34, 35, 36, 39, 40, 43, 44. La tige du diagramme sera les dizaines et les feuilles seront les unités. MASS 1 Stat. Univariée
  58. 58. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesStem and leaf diagram Figure: Diagramme en tiges et feuilles. MASS 1 Stat. Univariée
  59. 59. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesBox-Plot - Composition Un rectangle qui s’étend du 1er au 3ème quartile. Divisé par une ligne correspondant à la médiane. Rectangle complété par 2 segments de droites. Calcul des bornes : b − = x0.25 − 1.5IQ et b + = x0.75 + 1.5IQ ; On identifie ensuite la plus petite et la plus grande observation comprise entre ces bornes, qu’on appelle "valeurs adjacentes" ; Les valeurs qui ne sont pas comprises entre les valeurs adjacentes, sont représentées par des points et sont appelées "valeurs extrêmes". MASS 1 Stat. Univariée
  60. 60. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesBox-Plot - Exemple Figure: Diagramme en boîte, ou box-plot. MASS 1 Stat. Univariée
  61. 61. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesBox-Plot - Exemple 2 Figure: Diagramme en boîte, ou box-plot. MASS 1 Stat. Univariée
  62. 62. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesExercices de fin de partie On pèse 50 élèves d’une classe et nous obtenons : 43 43 43 47 48 48 48 48 49 49 49 50 50 51 51 52 53 53 53 54 54 56 56 56 57 59 59 59 62 62 63 63 65 65 67 67 68 70 70 70 72 72 73 77 77 81 83 86 92 93 Construisez l’histogramme, la fonction de répartition en adoptant les classes suivantes : [40; 45], ]45; 50], ]50; 55], ]55; 60], ]60; 65], ]65; 70], ]70; 80], ]80; 100] MASS 1 Stat. Univariée
  63. 63. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustachesExercices de fin de partie 152 152 152 153 153 154 154 154 155 155 156 156 156 156 156 157 157 157 158 158 159 159 160 160 160 160 160 161 161 162 162 162 163 164 164 164 164 165 166 167 168 168 168 169 169 170 171 171 171 171 Calculez tous les paramètres (position, dispersion, etc.) sans prendre en compte les classes. MASS 1 Stat. Univariée

×