SlideShare une entreprise Scribd logo
1  sur  63
Vocabulaire
  Représentations graphiques
         Résumé Numérique




Statistique Descriptive - 1ère partie

         Statistique pour une variable

                        L1 MASS
                   Université Rennes 2
                    Année 2010-2011


                       Semestre 2



                    MASS 1     Stat. Univariée
Vocabulaire
                Représentations graphiques
                       Résumé Numérique




Références




      Statistique descriptive, cours et exercices corrigés
      Agnès Hamon et Nicolas Jégou
      Résumé du cours de statistique descriptive
      Yves Tillé




                                  MASS 1     Stat. Univariée
Vocabulaire
               Représentations graphiques
                      Résumé Numérique




Informations sur le cours




      12H Cours
      12H TD-TP sur logiciel R
      Contrôle Continu : Un écrit de 2H et un mini-projet sous R
      Examen Terminal : Un écrit de 2H




                                 MASS 1     Stat. Univariée
Vocabulaire
               Représentations graphiques
                      Résumé Numérique




                                       Plan
1   Vocabulaire
2   Représentations graphiques
3   Résumé Numérique
      Paramètres de position
      Paramètres de dispersion
      Moments
      Paramètres de forme
      Paramètres d’aplatissement
      Diagramme en tiges et feuilles
      Boîte à moustaches

                                 MASS 1     Stat. Univariée
Vocabulaire
              Représentations graphiques
                     Résumé Numérique




Population, individu, variable

     Recueil des données sur les éléments constitutifs d’un
     ensemble ;
     Ex : Notes aux examens, marque des voitures formant le parc
     automobile de Rennes en 2005, etc.
     L’ensemble étudié = population ;
     Attention : la population ne sera pas toujours un ensemble
     d’êtres humains.
     Éléments qui le constituent = individus ;
     Caractère étudié = variable ;
     Sa valeur relevée sur un individu sera appelée observation.


                                MASS 1     Stat. Univariée
Vocabulaire
              Représentations graphiques
                     Résumé Numérique




Exemple - Questionnaire

       Age   Nombre de personnes                     Lecture
       X       dans le foyer : Y                   journal : Z
   1   17                 4                 de temps en temps
   2   12                 2                      très rarement
   3   15                 3                      très rarement
   .
   .    .
        .                 .
                          .                             .
                                                        .
   .    .                 .                             .
  18   38                 2                      tous les jours
  19   40                 4                      très rarement
  20   42                 5                 de temps en temps

                                MASS 1     Stat. Univariée
Vocabulaire
              Représentations graphiques
                     Résumé Numérique




Exemple suite


     Population = 20 personnes interrogées ;
     Individus renseignés sur 3 variables :
         L’âge, noté X ;
         Nombre de personnes dans le foyer, noté Y ;
         Fréquence de lecture, notée Z .
     Chaque individu est identifié par un numéro pour indexer les
     observations ;
     Exemple : x18 correspond à l’observation de la variable X faite
     sur l’individu 18, et dans le tableau on lit x18 =38.



                                MASS 1     Stat. Univariée
Vocabulaire
                Représentations graphiques
                       Résumé Numérique




Types de variables

 2 familles de variables :
      Si les observations sont des nombres, on parle de variable
      quantitative ;
      Si les observations se traduisent par un attribut, appartenance
      à une catégorie ou à un genre, la variable est dite qualitative ;
      On parle donc des valeurs possibles prises par une variable
      quantitative ;
      Et de modalités pour une variable qualitative.
 Sur l’exemple précédent, Y va. quantitative et Z va. qualitative.


                                  MASS 1     Stat. Univariée
Vocabulaire
                Représentations graphiques
                       Résumé Numérique




Variables Quantitatives


 2 types de variables :
      Variables discrètes dont l’ensemble possible des valeurs est fini ;
      Ex : Variable Y .
      Variables continues lorsque les réalisations possibles
      s’organisent sur une échelle continue des valeurs ;
      Ex : Variable X .
      Même si les observations prennent des valeurs entières, on
      comprend bien qu’un individu qui a 15 ans signifie que son âge
      appartient à l’intervalle [15; 16[.



                                  MASS 1     Stat. Univariée
Vocabulaire
                  Représentations graphiques
                         Résumé Numérique




Variables Qualitatives


 2 catégories :
      Les modalités possèdent un ordre naturel, la variable est
      qualifiée d’ordinale ;
      Ex : Variable Z .
      Pas d’ordonnancement on parle de variable nominale ;
      Ex : Variable ”sexe” a deux modalités, "homme" et "femme",
      et est dite nominale.




                                    MASS 1     Stat. Univariée
Vocabulaire
              Représentations graphiques
                     Résumé Numérique




Données Agrégées -1



     Avec l’exemple précédent pour chacun des 20 individus, nous
     disposons des observations pour chaque variable : on parle de
     données brutes ou individuelles.
     Il n’est pas toujours possible de toutes les représenter (trop
     d’observations) et on présente les données dans un tableau
     synthétique et on parle alors de données agrégées.




                                MASS 1     Stat. Univariée
Vocabulaire
                Représentations graphiques
                       Résumé Numérique




Données Agrégées -2


 Variable discrète :
      On regroupe les observations suivant les valeurs de la variable

   Valeurs         1             2             3            4      5        6
  variable Y
   Effectifs    n1 = 3        n2 = 9          n3 = 2     n4 = 4   n5 = 1   n6 = 1
   observés




                                  MASS 1       Stat. Univariée
Vocabulaire
               Représentations graphiques
                      Résumé Numérique




Données Agrégées -3

 Variable Qualitative :
      On regroupe les observations suivant les modalités de la
      variable

             Modalités           très       de temps            tous
             variable Z      rarement       en temps          les jours
              Effectifs         n1 = 6         n2 = 6          n3 = 8
              observés



                                 MASS 1     Stat. Univariée
Vocabulaire
               Représentations graphiques
                      Résumé Numérique




Données Agrégées -4


 Variable continue :
     Regroupement suivant des classes
       Classes pour X        [0 ;20[        [20 ;40[     [40 ;60[    [60 ;90[
          Effectifs          n1 = 6          n2 = 5        n3 = 5     n4 = 4
     Choix des classes subjectif, autre exemple :
       Classes pour X       [10 ;30[        [30 ;40[      [40 ;50[   [50 ;70[   [70 ;90[
          Effectifs           n1 = 7         n2 = 4         n3 = 4    n4 = 3     n5 = 2



                                 MASS 1        Stat. Univariée
Vocabulaire
               Représentations graphiques
                      Résumé Numérique




A propos des fréquences . . .
 Regrouper les données (slides précédents) : utile pour connaître les
 modalités (valeurs) les plus souvent observées, mais :
     Le nombre d’observations d’une valeur n’a de sens que si on le
     compare au nombre total d’observations :
          Dans une entreprise, 10 salariés gagnent plus de 60 ke/an
          Si l’entreprise a 50 salariés cela représente 20%
          Si l’entreprise a 5000 salariés cela représente 0,2%
     C’est la notion de fréquences qui formalise cela ;
     Avec n le nombre total d’observations et ni le nombre
     d’observations de la i-ème modalité, la fréquence de cette
     modalité est
                                      ni
                                 fi =
                                      n
                                 MASS 1     Stat. Univariée
Vocabulaire
                 Représentations graphiques
                        Résumé Numérique




Variables qualitatives : Un exemple
  On s’intéresse à la variable "état-civil", notée X , pour 20 personnes.

               M     M      D      C      C   M      C     C    C   M
               C     M      V      M      V   D      C     C    C   M


       Le domaine de la variable X est {M, D, C , V } ;
       M : marié(e) ;
       D : divorcé(e) :
       C : célibataire ;
       V : veuf(ve) ;
       La valeur de X pour le 3ème individu est : x3 = D.
                                   MASS 1     Stat. Univariée
Vocabulaire
                Représentations graphiques
                       Résumé Numérique




Variables qualitatives : Présentation des données
  La variable est qualitative nominale et nous regroupons les
  observations suivant ses quatre modalités pour une présentation
  agrégée :

                    xi     ni       fi
                    C       9     0.45
                                              Avec
                    M       7     0.35            4
                                                  i=1 ni = 20
                    V       2     0.10            4
                                                  i=1 fi = 1
                    D       2     0.10
                           20        1

                                  MASS 1     Stat. Univariée
Vocabulaire
              Représentations graphiques
                     Résumé Numérique




Variables qualitatives : Les diagrammes




         Figure: Diagramme en barres ; Diagramme en secteurs

                                MASS 1     Stat. Univariée
Vocabulaire
               Représentations graphiques
                      Résumé Numérique




Variables quantitatives discrètes : Un exemple

  On s’intéresse à la variable "nombre de personnes par ménage",
  notée Z , pour un quartier composé de 50 ménages.

                 1     1    1     1     1   2    2    2       2   2
                 2     2    2     2     3   3    3    3       3   3
                 3     3    3     3     3   3    3    3       3   4
                 4     4    4     4     4   4    4    4       4   5
                 5     5    5     5     5   6    6    6       7   7



                                 MASS 1     Stat. Univariée
Vocabulaire
                   Représentations graphiques
                          Résumé Numérique




Variables quantitatives discrètes : Présentation des données

   xi   ni    fi
    1   5    0.1
    2   9    0.18
    3   15   0.30
    4   10   0.20
    5   6    0.12
    6   3    0.06
    7   2    0.04
                                                Figure: Diagramme en bâtons
        50    1

                                     MASS 1     Stat. Univariée
Vocabulaire
                Représentations graphiques
                       Résumé Numérique




Variables quantitatives continues : Un exemple

 On s’intéresse à la variable "taille" de 50 élèves d’une classe.

             152 152 152 153 153 154 154 154 155 155
             156 156 156 156 156 157 157 157 158 158
             159 159 160 160 160 160 160 161 161 162
             162 162 163 164 164 164 164 165 166 167
             168 168 168 169 169 170 171 171 171 171




                                  MASS 1     Stat. Univariée
Vocabulaire
                Représentations graphiques
                       Résumé Numérique




Variables quantitatives continues : les classes
  On peut définir les classes suivantes et obtenir le tableau des
  données agrégées :

                                             Classes             ni    fi
              [151,5 ;155,5]           [151,5 ;155,5]            10   0.20
              [155,5 ;159,5]           [155,5 ;159,5]            12   0.24
              [159,5 ;163,5]           [159,5 ;163,5]            11   0.22
              [163,5 ;167,5]           [163,5 ;167,5]            7    0.14
              [167,5 ;171,5]           [167,5 ;171,5]            10   0.2
                                                                 50    1

                                  MASS 1       Stat. Univariée
Vocabulaire
                Représentations graphiques
                       Résumé Numérique




Variables quantitatives : L’histogramme - 1
  Construction de l’histogramme à partir du tableau précédent.
      Les observations sur les n individus sont réparties dans k
      intervalles de la forme

                                   ([ei ; ei+1 ])i=1,...,k

      Nous graduons l’axe horizontal à l’échelle des valeurs
      (ei )i=1,...,k ;
      Pour la hauteur on traduit le fait que l’air de chaque rectangle
      correspond à la fréquence de la classe :

                                 fi = (ei+1 − ei ) × di

                                  MASS 1     Stat. Univariée
Vocabulaire
                Représentations graphiques
                       Résumé Numérique




Variables quantitatives : L’histogramme - 2
  En ordonnée on a donc la "densité" di :




                      Figure: Histogramme des effectifs
                                  MASS 1     Stat. Univariée
Vocabulaire
                Représentations graphiques
                       Résumé Numérique




Variables quantitatives : L’histogramme - 3
  Et en agrégeant les deux dernières classes on obtient :




   Figure: Histogramme des effectifs avec les 2 dernières classes agrégées
                                  MASS 1     Stat. Univariée
Vocabulaire
              Représentations graphiques
                     Résumé Numérique




Fréquences cumulées
     La fréquence cumulée de la ième valeur, notée Fi , donnée par
                                                           i
                           Fi = f1 + . . . + fi =               fj
                                                          j=1

     C’est la proportion des observations inférieures ou égales à la
     ième valeur de la variable :

                          xi       ni       fi       Fi
                           1        5      0.1       0.1
                           2        9      0.18     0.28
                           3       15      0.30     0.58
                         ···      ···      ···      ···
                                MASS 1      Stat. Univariée
Vocabulaire
                Représentations graphiques
                       Résumé Numérique




Fonction de répartition




     Figure: Fonction de répartition pour variable discrète et continue.

                                  MASS 1     Stat. Univariée
Paramètres de position
                                              Paramètres de dispersion
                             Vocabulaire      Moments
              Représentations graphiques      Paramètres de forme
                     Résumé Numérique         Paramètres d’aplatissement
                                              Diagramme en tiges et feuilles
                                              Boîte à moustaches


Le mode

     Mode = valeur distincte correspondant à l’effectif le plus élevé.
     Exemple avec variable "Etat-civil"
              xi    ni       fi
              C      9     0.45
              M      7     0.35
                                           Ici mode est C : célibataire.
              V      2     0.10
              D      2     0.10
                    20        1


                                  MASS 1      Stat. Univariée
Paramètres de position
                                           Paramètres de dispersion
                             Vocabulaire   Moments
              Représentations graphiques   Paramètres de forme
                     Résumé Numérique      Paramètres d’aplatissement
                                           Diagramme en tiges et feuilles
                                           Boîte à moustaches


Le mode - Qqs Remarques




     Le mode peut être calculé pour tous les types de variable ;
     Le mode n’est pas forcément unique ;
     Pour une variable continue découpée en classes, on peut
     définir une classe modale - cf après.




                                MASS 1     Stat. Univariée
Paramètres de position
                                                Paramètres de dispersion
                              Vocabulaire       Moments
               Représentations graphiques       Paramètres de forme
                      Résumé Numérique          Paramètres d’aplatissement
                                                Diagramme en tiges et feuilles
                                                Boîte à moustaches


La moyenne

     La moyenne est définie que sur une variable quantitative ;
     Elle est notée x et est définie par :
                    ¯
                                  n
                             1                x1 + x2 + . . . + xn
                     x=
                     ¯                 xi =
                             n                        n
                                 i=1

     Elle peut aussi être calculée à partir des effectifs :
                                                 J
                                            1
                                      x=
                                      ¯               nj xj
                                            n
                                                j=1



                                 MASS 1         Stat. Univariée
Paramètres de position
                                                Paramètres de dispersion
                              Vocabulaire       Moments
               Représentations graphiques       Paramètres de forme
                      Résumé Numérique          Paramètres d’aplatissement
                                                Diagramme en tiges et feuilles
                                                Boîte à moustaches


La moyenne - Exemple
     Variable : "Nombre d’enfants par famille"

                                                             0+0+1+1+1+2+3+4
       0   0    1    1     1     2    3     4        x=
                                                     ¯              8            = 1.5
     Tableau synthétique
               xj     nj
               0      2
                                            2×0+3×1+1×2+1×3+1×4
               1      3         x
                                ¯     =              8
               2      1               =                       1.5
               3      1
               4      1
                                 MASS 1         Stat. Univariée
Paramètres de position
                                             Paramètres de dispersion
                               Vocabulaire   Moments
                Représentations graphiques   Paramètres de forme
                       Résumé Numérique      Paramètres d’aplatissement
                                             Diagramme en tiges et feuilles
                                             Boîte à moustaches


La médiane - 1


      Médiane = valeur centrale de la série statistique, notée x1/2 .
      Obtenue de la manière suivante :
           On trie la série statistique par ordre croissant des valeurs
           observés.
           Ex : {3, 2, 1, 0, 0, 1, 2} devient {0, 0, 1, 1, 2, 2, 3}.
           La médiane est la valeur qui se trouve au milieu de la série
           ordonée ;
           Ici x1/2 = 1.




                                  MASS 1     Stat. Univariée
Paramètres de position
                                             Paramètres de dispersion
                               Vocabulaire   Moments
                Représentations graphiques   Paramètres de forme
                       Résumé Numérique      Paramètres d’aplatissement
                                             Diagramme en tiges et feuilles
                                             Boîte à moustaches


La médiane - 2 - Cas où n est impair




      La médiane peut être
      définie comme l’inverse de
      la fonction de répartition
      pour la valeur 1/2.
      x1/2 = F −1 (0.5).


                                             Figure: Médiane quand n impair


                                  MASS 1     Stat. Univariée
Paramètres de position
                                             Paramètres de dispersion
                               Vocabulaire   Moments
                Représentations graphiques   Paramètres de forme
                       Résumé Numérique      Paramètres d’aplatissement
                                             Diagramme en tiges et feuilles
                                             Boîte à moustaches


La médiane - 3 - Cas où n est pair :



      2 valeurs se trouvent au
      milieu de la série ;
      Médiane = moyenne de ces
      2 valeurs ;
      x1/2 = F −1 (0.5) ;
      La fonction de répartition
      correspond à un "palier".

                                             Figure: Médiane quand n pair


                                  MASS 1     Stat. Univariée
Paramètres de position
                                                 Paramètres de dispersion
                               Vocabulaire       Moments
                Représentations graphiques       Paramètres de forme
                       Résumé Numérique          Paramètres d’aplatissement
                                                 Diagramme en tiges et feuilles
                                                 Boîte à moustaches


Éléments de comparaison des paramètres de position


  Exercice :
       On regarde la variable "nombre d’aces réussis" dans les 10
       derniers matchs d’un joueur de l’équipe de France ;
                  Aces         0     1       2   3     ...         11   12        13
                Effectifs       4     2       3   0     ...         0     0        1
       Mode ? Médiane ? Moyenne ?
       Interprétation ? Est-ce un mauvais serveur ?



                                   MASS 1        Stat. Univariée
Paramètres de position
                                            Paramètres de dispersion
                              Vocabulaire   Moments
               Représentations graphiques   Paramètres de forme
                      Résumé Numérique      Paramètres d’aplatissement
                                            Diagramme en tiges et feuilles
                                            Boîte à moustaches


Éléments de comparaison des paramètres de position


      Mode donne la valeur la plus fréquente mais ne tient pas
      compte des autres observations ;
      Médiane dépend de l’ordre des données mais peu sensible aux
      valeurs extrêmes ;
      Moyenne manque de robustesse ;
      Ex : une fois 13 aces permet d’augmenter facilement la
      moyenne alors qu’en réalité il ne sert jamais plus de 2 aces par
      match.



                                 MASS 1     Stat. Univariée
Paramètres de position
                                             Paramètres de dispersion
                               Vocabulaire   Moments
                Représentations graphiques   Paramètres de forme
                       Résumé Numérique      Paramètres d’aplatissement
                                             Diagramme en tiges et feuilles
                                             Boîte à moustaches


Éléments de comparaison des paramètres de position




  Suivant la distribution étudiée, les 3 mesures présentent leur propre
  intérêt.
  Il faut surtout éviter de faire des interprétations abusives et il est
  souvent utile de les comparer.




                                  MASS 1     Stat. Univariée
Paramètres de position
                                            Paramètres de dispersion
                              Vocabulaire   Moments
               Représentations graphiques   Paramètres de forme
                      Résumé Numérique      Paramètres d’aplatissement
                                            Diagramme en tiges et feuilles
                                            Boîte à moustaches


Le mode - Variable continue




      La classe modale n’est pas la classe de plus grande fréquence
      mais la classe de plus grande densité ;
      Classe modale = pic sur l’histogramme.




                                 MASS 1     Stat. Univariée
Paramètres de position
                                              Paramètres de dispersion
                                Vocabulaire   Moments
                 Représentations graphiques   Paramètres de forme
                        Résumé Numérique      Paramètres d’aplatissement
                                              Diagramme en tiges et feuilles
                                              Boîte à moustaches


La moyenne - Variable continue



      Les observations sont réparties dans J intervalles et
                                               J
                                         1
                                      x=
                                      ¯             nj cj ,
                                         n
                                              j=1

                ej +ej+1
      où cj =       2      est le centre de classe.




                                   MASS 1     Stat. Univariée
Paramètres de position
                                            Paramètres de dispersion
                              Vocabulaire   Moments
               Représentations graphiques   Paramètres de forme
                      Résumé Numérique      Paramètres d’aplatissement
                                            Diagramme en tiges et feuilles
                                            Boîte à moustaches


La médiane - Variable continue




      Regrouper en "classes" donc on se prive des valeurs mesurées
      pour ne garder que des intervalles ;
      Hyp : les données sont uniformément réparties dans les
      intervalles ;




                                 MASS 1     Stat. Univariée
Paramètres de position
                                               Paramètres de dispersion
                              Vocabulaire      Moments
               Représentations graphiques      Paramètres de forme
                      Résumé Numérique         Paramètres d’aplatissement
                                               Diagramme en tiges et feuilles
                                               Boîte à moustaches


Exemple

                Temps en min.               [0 ;2 [    [2 ;6 [      ...
               Fréquences (%)                 40          40        ...


     Temps médian ∈ [2; 6[ ;
     L’hyp. nous donne :
          10 % entre 2 et 3 min ;
          10 % entre 3 et 4 min ;
          ...
     Donc le temps médian est de 3 min ;
     Sinon interpolation linéaire pour utiliser x1/2 = F −1 (0.5).

                                 MASS 1        Stat. Univariée
Paramètres de position
                                             Paramètres de dispersion
                               Vocabulaire   Moments
                Représentations graphiques   Paramètres de forme
                       Résumé Numérique      Paramètres d’aplatissement
                                             Diagramme en tiges et feuilles
                                             Boîte à moustaches


Interpolation linéaire



      Cela consiste à déterminer une équation de droite pour en
      déduire la valeur de x1/2 ;
      On sait que F (x1/2 ) = 0.5 et que x1/2 ∈ [ek ; ek+1 ] ;

                                                        F (ek+1 ) − F (ek )
              F (x1/2 ) ≈ F (ek ) + (x1/2 − ek )
                                                            ek+1 − ek




                                  MASS 1     Stat. Univariée
Paramètres de position
                                             Paramètres de dispersion
                               Vocabulaire   Moments
                Représentations graphiques   Paramètres de forme
                       Résumé Numérique      Paramètres d’aplatissement
                                             Diagramme en tiges et feuilles
                                             Boîte à moustaches


Quantiles - 1



      La notion de quantile d’ordre p (où 0 < p < 1) généralise la
      médiane ;

                                      xp = F −1 (p).
      La fonction de répartition est discontinue ;
      On va présenter une manière de définir les quantiles.




                                  MASS 1     Stat. Univariée
Paramètres de position
                                             Paramètres de dispersion
                               Vocabulaire   Moments
                Représentations graphiques   Paramètres de forme
                       Résumé Numérique      Paramètres d’aplatissement
                                             Diagramme en tiges et feuilles
                                             Boîte à moustaches


Quantiles - 2

      Si np est un nombre entier, alors
                                    1
                                xp = {xnp + xnp+1 }.
                                    2
      Si np n’est pas un nombre entier, alors
                                           1
                                       xp = x[np] ,
                                           2
      où [np] représente le plus petit entier supérieur ou égal à np.
      Notations : x1/4 = 1er quartile ; x1/2 = médiane ; x3/4 = 3ème
      quartile ; . . .

                                  MASS 1     Stat. Univariée
Paramètres de position
                                             Paramètres de dispersion
                               Vocabulaire   Moments
                Représentations graphiques   Paramètres de forme
                       Résumé Numérique      Paramètres d’aplatissement
                                             Diagramme en tiges et feuilles
                                             Boîte à moustaches


Quantiles - 3 - Exemple

      Avec la série suivante :
      {12, 13, 15, 16, 18, 19, 22, 24, 25, 27, 28, 34} ;
      Le 1er quartile nous donne np = 0.25 × 12 = 3 donc entier ;
      Et donc
                            x3 + x4      15 + 16
                      x1/4 =         =            = 15.5;
                                2           2
      Avec la série suivante : {12, 13, 15, 16, 18, 19, 22, 24, 25, 27} ;
      Le 1er quartile nous donne np = 0.25 × 10 = 2.5 donc pas
      entier ;
      Et donc
                              x1/4 = x[2.5] = x3 = 15.

                                  MASS 1     Stat. Univariée
Paramètres de position
                                            Paramètres de dispersion
                              Vocabulaire   Moments
               Représentations graphiques   Paramètres de forme
                      Résumé Numérique      Paramètres d’aplatissement
                                            Diagramme en tiges et feuilles
                                            Boîte à moustaches


L’étendue




      L’étendue est simplement la différence entre la plus grande et
      la plus petite valeur ;

                                     E = xn − x1 .




                                 MASS 1     Stat. Univariée
Paramètres de position
                                            Paramètres de dispersion
                              Vocabulaire   Moments
               Représentations graphiques   Paramètres de forme
                      Résumé Numérique      Paramètres d’aplatissement
                                            Diagramme en tiges et feuilles
                                            Boîte à moustaches


La distance interquartile




      La distance interquartile est la différence entre le 3ème et le
      1er quartile ;

                                  IQ = x3/4 − x1/4 .




                                 MASS 1     Stat. Univariée
Paramètres de position
                                                   Paramètres de dispersion
                                 Vocabulaire       Moments
                  Représentations graphiques       Paramètres de forme
                         Résumé Numérique          Paramètres d’aplatissement
                                                   Diagramme en tiges et feuilles
                                                   Boîte à moustaches


Application


  X : "Journées d’absence au travail"

          X   0      1    2     3      4       5    6     7     8     9     10      11
         ni   1      4    4     8     14       7    4     4     2     1      0      1


      Donner un résumé numérique de la variable X .




                                    MASS 1         Stat. Univariée
Paramètres de position
                                                 Paramètres de dispersion
                              Vocabulaire        Moments
               Représentations graphiques        Paramètres de forme
                      Résumé Numérique           Paramètres d’aplatissement
                                                 Diagramme en tiges et feuilles
                                                 Boîte à moustaches


La variance
      La variance est la somme des carrés des écarts à la moyenne
      divisée par le nombre d’observations :
                                                 n
                                            1
                                σ2 =                  (xi − x )2
                                                            ¯
                                            n
                                                i=1


                         Réécriture de la variance
                                            n
                                     1
                            σ2 =                 xi2 − x 2 .
                                                       ¯
                                     n
                                         i=1

      Démonstration : exercice.
      Mesure pas très parlante.
                                 MASS 1          Stat. Univariée
Paramètres de position
                                              Paramètres de dispersion
                              Vocabulaire     Moments
               Représentations graphiques     Paramètres de forme
                      Résumé Numérique        Paramètres d’aplatissement
                                              Diagramme en tiges et feuilles
                                              Boîte à moustaches


L’écart type



      Dispersion autour de la moyenne ;
                                            √
                                    σ=       Variance
      Cf. Exercices de TD pour interprétation simple d’un point de
      vue descriptif.




                                 MASS 1       Stat. Univariée
Paramètres de position
                                            Paramètres de dispersion
                             Vocabulaire    Moments
              Représentations graphiques    Paramètres de forme
                     Résumé Numérique       Paramètres d’aplatissement
                                            Diagramme en tiges et feuilles
                                            Boîte à moustaches


Moments - 1


     On appelle moment d’ordre r, r ∈ N, le paramètre
                                                  n
                                           1
                                   mr =                xir .
                                           n
                                                 i=1

     On appelle moment centré d’ordre r le paramètre
                                            n
                                   1
                              mr =               (xi − x )r .
                                                       ¯
                                   n
                                           i=1




                                MASS 1      Stat. Univariée
Paramètres de position
                                            Paramètres de dispersion
                              Vocabulaire   Moments
               Représentations graphiques   Paramètres de forme
                      Résumé Numérique      Paramètres d’aplatissement
                                            Diagramme en tiges et feuilles
                                            Boîte à moustaches


Moments - 2



     Les moments généralisent la plupart des paramètres.
         m1   = x,
                ¯
         m1   = 0,
         m2   = σ2 + x 2 ,
                     ¯
         m2   = σ2 .
     Les moments d’ordre 3,4 sont utilisés pour mesurer la symétrie
     et l’aplatissement.




                                 MASS 1     Stat. Univariée
Paramètres de position
                                           Paramètres de dispersion
                             Vocabulaire   Moments
              Représentations graphiques   Paramètres de forme
                     Résumé Numérique      Paramètres d’aplatissement
                                           Diagramme en tiges et feuilles
                                           Boîte à moustaches


Skewness



     Le skewness peut prendre des valeurs positives, négatives, ou
     nulles.
     L’asymétrie se mesure avec le coefficient d’asymétrie de Fisher
                                              m3
                                       sk =      .
                                              σ3




                                MASS 1     Stat. Univariée
Paramètres de position
                                             Paramètres de dispersion
                               Vocabulaire   Moments
                Représentations graphiques   Paramètres de forme
                       Résumé Numérique      Paramètres d’aplatissement
                                             Diagramme en tiges et feuilles
                                             Boîte à moustaches


Exemple




                   Figure: Asymétrie d’une distribution.


  Le skewness est positif quand la distribution est allongée à droite,
  comme par exemple lorsqu’on regarde les variables "revenus",
  "tailles des entreprises", etc.

                                  MASS 1     Stat. Univariée
Paramètres de position
                                            Paramètres de dispersion
                              Vocabulaire   Moments
               Représentations graphiques   Paramètres de forme
                      Résumé Numérique      Paramètres d’aplatissement
                                            Diagramme en tiges et feuilles
                                            Boîte à moustaches


Kurtosis



      L’aplatissement est mesuré par le coef. d’aplatissement de
      Pearson :
                                       m4
                                 β2 = 4 ,
                                       σ
      ou le coef. d’aplatissement de Fisher :

                                     g2 = β2 − 3.




                                 MASS 1     Stat. Univariée
Paramètres de position
                                             Paramètres de dispersion
                               Vocabulaire   Moments
                Représentations graphiques   Paramètres de forme
                       Résumé Numérique      Paramètres d’aplatissement
                                             Diagramme en tiges et feuilles
                                             Boîte à moustaches


Exemple




            Figure: Distribution mésokurtique et leptokurtique.


  Une courbe leptokurtique (g2 > 0) est plus pointue et possède des
  queues de distributions plus longues.


                                  MASS 1     Stat. Univariée
Paramètres de position
                                            Paramètres de dispersion
                              Vocabulaire   Moments
               Représentations graphiques   Paramètres de forme
                      Résumé Numérique      Paramètres d’aplatissement
                                            Diagramme en tiges et feuilles
                                            Boîte à moustaches


Diagramme en tiges et feuilles


      Le Stem and leaf diagram est un moyen rapide de présenter
      une variable quantitative ;
      Par exemple avec la série suivante :
        15, 15, 16, 17, 18, 20, 21, 22, 23, 23, 23, 24, 25, 25, 26,
        26, 27, 28, 28, 29, 30, 30, 32, 34, 35, 36, 39, 40, 43, 44.
      La tige du diagramme sera les dizaines et les feuilles seront les
      unités.



                                 MASS 1     Stat. Univariée
Paramètres de position
                                         Paramètres de dispersion
                           Vocabulaire   Moments
            Représentations graphiques   Paramètres de forme
                   Résumé Numérique      Paramètres d’aplatissement
                                         Diagramme en tiges et feuilles
                                         Boîte à moustaches


Stem and leaf diagram




              Figure: Diagramme en tiges et feuilles.



                              MASS 1     Stat. Univariée
Paramètres de position
                                            Paramètres de dispersion
                              Vocabulaire   Moments
               Représentations graphiques   Paramètres de forme
                      Résumé Numérique      Paramètres d’aplatissement
                                            Diagramme en tiges et feuilles
                                            Boîte à moustaches


Box-Plot - Composition


      Un rectangle qui s’étend du 1er au 3ème quartile.
      Divisé par une ligne correspondant à la médiane.
      Rectangle complété par 2 segments de droites.
          Calcul des bornes : b − = x0.25 − 1.5IQ et b + = x0.75 + 1.5IQ ;
          On identifie ensuite la plus petite et la plus grande observation
          comprise entre ces bornes, qu’on appelle "valeurs adjacentes" ;
          Les valeurs qui ne sont pas comprises entre les valeurs
          adjacentes, sont représentées par des points et sont appelées
          "valeurs extrêmes".



                                 MASS 1     Stat. Univariée
Paramètres de position
                                         Paramètres de dispersion
                           Vocabulaire   Moments
            Représentations graphiques   Paramètres de forme
                   Résumé Numérique      Paramètres d’aplatissement
                                         Diagramme en tiges et feuilles
                                         Boîte à moustaches


Box-Plot - Exemple




             Figure: Diagramme en boîte, ou box-plot.


                              MASS 1     Stat. Univariée
Paramètres de position
                                          Paramètres de dispersion
                            Vocabulaire   Moments
             Représentations graphiques   Paramètres de forme
                    Résumé Numérique      Paramètres d’aplatissement
                                          Diagramme en tiges et feuilles
                                          Boîte à moustaches


Box-Plot - Exemple 2




             Figure: Diagramme en boîte, ou box-plot.



                               MASS 1     Stat. Univariée
Paramètres de position
                                               Paramètres de dispersion
                                 Vocabulaire   Moments
                  Représentations graphiques   Paramètres de forme
                         Résumé Numérique      Paramètres d’aplatissement
                                               Diagramme en tiges et feuilles
                                               Boîte à moustaches


Exercices de fin de partie
  On pèse 50 élèves d’une classe et nous obtenons :

                       43 43 43 47 48 48 48 48 49 49
                       49 50 50 51 51 52 53 53 53 54
                       54 56 56 56 57 59 59 59 62 62
                       63 63 65 65 67 67 68 70 70 70
                       72 72 73 77 77 81 83 86 92 93

  Construisez l’histogramme, la fonction de répartition en adoptant
  les classes suivantes :
  [40; 45], ]45; 50], ]50; 55], ]55; 60], ]60; 65], ]65; 70], ]70; 80], ]80; 100]
                                    MASS 1     Stat. Univariée
Paramètres de position
                                             Paramètres de dispersion
                               Vocabulaire   Moments
                Représentations graphiques   Paramètres de forme
                       Résumé Numérique      Paramètres d’aplatissement
                                             Diagramme en tiges et feuilles
                                             Boîte à moustaches


Exercices de fin de partie


              152 152 152 153 153 154 154 154 155 155
              156 156 156 156 156 157 157 157 158 158
              159 159 160 160 160 160 160 161 161 162
              162 162 163 164 164 164 164 165 166 167
              168 168 168 169 169 170 171 171 171 171

  Calculez tous les paramètres (position, dispersion, etc.) sans
  prendre en compte les classes.


                                  MASS 1     Stat. Univariée

Contenu connexe

Tendances

L'anglais des affaires : Téléchargeable sur www.coursdefsjes.com
L'anglais des affaires  : Téléchargeable sur www.coursdefsjes.comL'anglais des affaires  : Téléchargeable sur www.coursdefsjes.com
L'anglais des affaires : Téléchargeable sur www.coursdefsjes.comcours fsjes
 
La gestion budgétaire de la production
La gestion budgétaire de la production La gestion budgétaire de la production
La gestion budgétaire de la production Hajar EL GUERI
 
Cours pour entreprise -analyse financiere
Cours pour entreprise   -analyse financiereCours pour entreprise   -analyse financiere
Cours pour entreprise -analyse financieremumu97139
 
Stat4 Principes Des Tests Statistiques
Stat4  Principes Des Tests StatistiquesStat4  Principes Des Tests Statistiques
Stat4 Principes Des Tests StatistiquesJean-Louis ESTRADE
 
Analyse de données marketing : ACP et AFC
Analyse de données marketing : ACP et AFCAnalyse de données marketing : ACP et AFC
Analyse de données marketing : ACP et AFCYannig Roth
 
Projet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesProjet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesJean-Marc Dupont
 
Processus et techniques d'inventaire
Processus et techniques d'inventaire Processus et techniques d'inventaire
Processus et techniques d'inventaire Marwoua Ben Salem
 
M diagnostic financier
M diagnostic financierM diagnostic financier
M diagnostic financierArafah Lachhab
 
Cours+ gestion-budgétaire
Cours+ gestion-budgétaireCours+ gestion-budgétaire
Cours+ gestion-budgétaireghita ghaytouta
 
Regression lineaire Multiple (Autosaved) (Autosaved)
Regression lineaire Multiple (Autosaved) (Autosaved)Regression lineaire Multiple (Autosaved) (Autosaved)
Regression lineaire Multiple (Autosaved) (Autosaved)Pierre Robentz Cassion
 
Choix de l’analyse statistique appropriée
 Choix de l’analyse statistique appropriée  Choix de l’analyse statistique appropriée
Choix de l’analyse statistique appropriée Adad Med Chérif
 
Alimentation et Nutrition - Prévention des maladies chroniques
Alimentation et Nutrition - Prévention des maladies chroniquesAlimentation et Nutrition - Prévention des maladies chroniques
Alimentation et Nutrition - Prévention des maladies chroniquesGreenFacts
 
Présentation générale de Sage 100 gestion commerciale i7
Présentation générale de Sage 100 gestion commerciale i7Présentation générale de Sage 100 gestion commerciale i7
Présentation générale de Sage 100 gestion commerciale i7Sage france
 
Cours echantillonnage et estimations
Cours echantillonnage et estimationsCours echantillonnage et estimations
Cours echantillonnage et estimationsMehdi Rajawi
 
Assurance notions de base IMA 2011
Assurance notions de base IMA 2011Assurance notions de base IMA 2011
Assurance notions de base IMA 2011PELTIER Claire
 
audit des immobilisations
audit des immobilisationsaudit des immobilisations
audit des immobilisationsSoukaina Lbl
 

Tendances (20)

L'anglais des affaires : Téléchargeable sur www.coursdefsjes.com
L'anglais des affaires  : Téléchargeable sur www.coursdefsjes.comL'anglais des affaires  : Téléchargeable sur www.coursdefsjes.com
L'anglais des affaires : Téléchargeable sur www.coursdefsjes.com
 
La gestion budgétaire de la production
La gestion budgétaire de la production La gestion budgétaire de la production
La gestion budgétaire de la production
 
Cours pour entreprise -analyse financiere
Cours pour entreprise   -analyse financiereCours pour entreprise   -analyse financiere
Cours pour entreprise -analyse financiere
 
Stat4 Principes Des Tests Statistiques
Stat4  Principes Des Tests StatistiquesStat4  Principes Des Tests Statistiques
Stat4 Principes Des Tests Statistiques
 
Analyse de données marketing : ACP et AFC
Analyse de données marketing : ACP et AFCAnalyse de données marketing : ACP et AFC
Analyse de données marketing : ACP et AFC
 
Projet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesProjet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de données
 
Processus et techniques d'inventaire
Processus et techniques d'inventaire Processus et techniques d'inventaire
Processus et techniques d'inventaire
 
M diagnostic financier
M diagnostic financierM diagnostic financier
M diagnostic financier
 
Cours+ gestion-budgétaire
Cours+ gestion-budgétaireCours+ gestion-budgétaire
Cours+ gestion-budgétaire
 
Attestationenseignement
AttestationenseignementAttestationenseignement
Attestationenseignement
 
Mesures d'association épidémiologique_15 01 2017
Mesures d'association épidémiologique_15 01 2017Mesures d'association épidémiologique_15 01 2017
Mesures d'association épidémiologique_15 01 2017
 
Regression lineaire Multiple (Autosaved) (Autosaved)
Regression lineaire Multiple (Autosaved) (Autosaved)Regression lineaire Multiple (Autosaved) (Autosaved)
Regression lineaire Multiple (Autosaved) (Autosaved)
 
Choix de l’analyse statistique appropriée
 Choix de l’analyse statistique appropriée  Choix de l’analyse statistique appropriée
Choix de l’analyse statistique appropriée
 
Alimentation et Nutrition - Prévention des maladies chroniques
Alimentation et Nutrition - Prévention des maladies chroniquesAlimentation et Nutrition - Prévention des maladies chroniques
Alimentation et Nutrition - Prévention des maladies chroniques
 
Test khi deux
Test khi deuxTest khi deux
Test khi deux
 
Présentation générale de Sage 100 gestion commerciale i7
Présentation générale de Sage 100 gestion commerciale i7Présentation générale de Sage 100 gestion commerciale i7
Présentation générale de Sage 100 gestion commerciale i7
 
Le role de siaap
Le role de siaapLe role de siaap
Le role de siaap
 
Cours echantillonnage et estimations
Cours echantillonnage et estimationsCours echantillonnage et estimations
Cours echantillonnage et estimations
 
Assurance notions de base IMA 2011
Assurance notions de base IMA 2011Assurance notions de base IMA 2011
Assurance notions de base IMA 2011
 
audit des immobilisations
audit des immobilisationsaudit des immobilisations
audit des immobilisations
 

En vedette

Statistique descriptive S1et S2
Statistique descriptive S1et S2 Statistique descriptive S1et S2
Statistique descriptive S1et S2 samos56
 
Compta analyt cours exercices
Compta analyt cours exercicesCompta analyt cours exercices
Compta analyt cours exercicesRidouan LAMGHARI
 
Mathématique financiére 1ére année lycée
Mathématique financiére 1ére année lycéeMathématique financiére 1ére année lycée
Mathématique financiére 1ére année lycéeTaha Can
 
Statistique descriptives s1+s2
Statistique descriptives s1+s2Statistique descriptives s1+s2
Statistique descriptives s1+s2Taha Can
 
Exercices corrigés de mathématiques financières
Exercices corrigés de mathématiques financièresExercices corrigés de mathématiques financières
Exercices corrigés de mathématiques financièreseri8p7f4ku
 
Exercices d analyse financière
Exercices d analyse financièreExercices d analyse financière
Exercices d analyse financièreAbde LLatif
 
Analysefinanciers- cours simplifié + cas pratiques
Analysefinanciers- cours simplifié + cas pratiquesAnalysefinanciers- cours simplifié + cas pratiques
Analysefinanciers- cours simplifié + cas pratiquesaminaalammi
 
Mathematique financiere
Mathematique financiereMathematique financiere
Mathematique financiereMa Ac
 
Analyse financiére (bilan + ratios)
Analyse financiére (bilan + ratios)Analyse financiére (bilan + ratios)
Analyse financiére (bilan + ratios)Taha Can
 
Comptabilite generale (cours+exercices corriges)
Comptabilite generale (cours+exercices corriges)Comptabilite generale (cours+exercices corriges)
Comptabilite generale (cours+exercices corriges)Taha Can
 

En vedette (10)

Statistique descriptive S1et S2
Statistique descriptive S1et S2 Statistique descriptive S1et S2
Statistique descriptive S1et S2
 
Compta analyt cours exercices
Compta analyt cours exercicesCompta analyt cours exercices
Compta analyt cours exercices
 
Mathématique financiére 1ére année lycée
Mathématique financiére 1ére année lycéeMathématique financiére 1ére année lycée
Mathématique financiére 1ére année lycée
 
Statistique descriptives s1+s2
Statistique descriptives s1+s2Statistique descriptives s1+s2
Statistique descriptives s1+s2
 
Exercices corrigés de mathématiques financières
Exercices corrigés de mathématiques financièresExercices corrigés de mathématiques financières
Exercices corrigés de mathématiques financières
 
Exercices d analyse financière
Exercices d analyse financièreExercices d analyse financière
Exercices d analyse financière
 
Analysefinanciers- cours simplifié + cas pratiques
Analysefinanciers- cours simplifié + cas pratiquesAnalysefinanciers- cours simplifié + cas pratiques
Analysefinanciers- cours simplifié + cas pratiques
 
Mathematique financiere
Mathematique financiereMathematique financiere
Mathematique financiere
 
Analyse financiére (bilan + ratios)
Analyse financiére (bilan + ratios)Analyse financiére (bilan + ratios)
Analyse financiére (bilan + ratios)
 
Comptabilite generale (cours+exercices corriges)
Comptabilite generale (cours+exercices corriges)Comptabilite generale (cours+exercices corriges)
Comptabilite generale (cours+exercices corriges)
 

Similaire à Cours

Statistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptxStatistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptxTarekDHAHRI1
 
Statistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptxStatistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptxTarekDHAHRI1
 
Statistique descriptives s1 de bien www.learneconomie.blogspot.com]
Statistique descriptives  s1 de bien www.learneconomie.blogspot.com]Statistique descriptives  s1 de bien www.learneconomie.blogspot.com]
Statistique descriptives s1 de bien www.learneconomie.blogspot.com]jamal yasser
 
Analyse bivariée_AD math ingenierie .pdf
Analyse bivariée_AD math ingenierie .pdfAnalyse bivariée_AD math ingenierie .pdf
Analyse bivariée_AD math ingenierie .pdfSaraElMendili
 
Spss les premieres notions 1
Spss les premieres notions 1Spss les premieres notions 1
Spss les premieres notions 1Adad Med Chérif
 
14284 chapitre-8-statistique
14284 chapitre-8-statistique14284 chapitre-8-statistique
14284 chapitre-8-statistiqueAlilo Mabhoour
 
S1 mq i - statistique descriptive i - vocabulaire statistique
S1   mq i - statistique descriptive i - vocabulaire statistiqueS1   mq i - statistique descriptive i - vocabulaire statistique
S1 mq i - statistique descriptive i - vocabulaire statistiqueAbdeslam ELMOUDEN
 
Cours stat. achrit tsge1
Cours stat. achrit tsge1Cours stat. achrit tsge1
Cours stat. achrit tsge1Ma Ac
 
TS-TC-Statistiques-manuel-stagiaire.pdf
TS-TC-Statistiques-manuel-stagiaire.pdfTS-TC-Statistiques-manuel-stagiaire.pdf
TS-TC-Statistiques-manuel-stagiaire.pdfFootballLovers9
 
Statistique Descriptive
Statistique DescriptiveStatistique Descriptive
Statistique Descriptivebacplus
 
Statistique Descriptive
Statistique DescriptiveStatistique Descriptive
Statistique Descriptivebacplus
 
7490_chap02.pdf
7490_chap02.pdf7490_chap02.pdf
7490_chap02.pdfSaidSousdi
 
9b567ad91347677ab6736e76a4115c80 statistique
9b567ad91347677ab6736e76a4115c80 statistique9b567ad91347677ab6736e76a4115c80 statistique
9b567ad91347677ab6736e76a4115c80 statistiqueSamad Oulasri
 
(Statdes regression biv_ensta_21oct2010)
(Statdes regression biv_ensta_21oct2010)(Statdes regression biv_ensta_21oct2010)
(Statdes regression biv_ensta_21oct2010)mohamedchaouche
 
Cours Statistique descriptive pr Falloul
Cours Statistique descriptive pr FalloulCours Statistique descriptive pr Falloul
Cours Statistique descriptive pr FalloulProfesseur Falloul
 
Chapitre 1 et 2 [Enregistrement automatique].pptx
Chapitre 1 et 2 [Enregistrement automatique].pptxChapitre 1 et 2 [Enregistrement automatique].pptx
Chapitre 1 et 2 [Enregistrement automatique].pptxdalaamaima
 

Similaire à Cours (20)

Statistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptxStatistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptx
 
Statistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptxStatistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptx
 
Statistique descriptives s1 de bien www.learneconomie.blogspot.com]
Statistique descriptives  s1 de bien www.learneconomie.blogspot.com]Statistique descriptives  s1 de bien www.learneconomie.blogspot.com]
Statistique descriptives s1 de bien www.learneconomie.blogspot.com]
 
Cours masterlyon
Cours masterlyonCours masterlyon
Cours masterlyon
 
Statistique descriptive ch1
Statistique descriptive ch1Statistique descriptive ch1
Statistique descriptive ch1
 
Analyse bivariée_AD math ingenierie .pdf
Analyse bivariée_AD math ingenierie .pdfAnalyse bivariée_AD math ingenierie .pdf
Analyse bivariée_AD math ingenierie .pdf
 
Spss les premieres notions 1
Spss les premieres notions 1Spss les premieres notions 1
Spss les premieres notions 1
 
14284 chapitre-8-statistique
14284 chapitre-8-statistique14284 chapitre-8-statistique
14284 chapitre-8-statistique
 
S1 mq i - statistique descriptive i - vocabulaire statistique
S1   mq i - statistique descriptive i - vocabulaire statistiqueS1   mq i - statistique descriptive i - vocabulaire statistique
S1 mq i - statistique descriptive i - vocabulaire statistique
 
Cours stat. achrit tsge1
Cours stat. achrit tsge1Cours stat. achrit tsge1
Cours stat. achrit tsge1
 
TS-TC-Statistiques-manuel-stagiaire.pdf
TS-TC-Statistiques-manuel-stagiaire.pdfTS-TC-Statistiques-manuel-stagiaire.pdf
TS-TC-Statistiques-manuel-stagiaire.pdf
 
Statistique Descriptive
Statistique DescriptiveStatistique Descriptive
Statistique Descriptive
 
Statistique Descriptive
Statistique DescriptiveStatistique Descriptive
Statistique Descriptive
 
7490_chap02.pdf
7490_chap02.pdf7490_chap02.pdf
7490_chap02.pdf
 
6 sigma -chapitre4 : Analyser
6 sigma -chapitre4 : Analyser6 sigma -chapitre4 : Analyser
6 sigma -chapitre4 : Analyser
 
9b567ad91347677ab6736e76a4115c80 statistique
9b567ad91347677ab6736e76a4115c80 statistique9b567ad91347677ab6736e76a4115c80 statistique
9b567ad91347677ab6736e76a4115c80 statistique
 
(Statdes regression biv_ensta_21oct2010)
(Statdes regression biv_ensta_21oct2010)(Statdes regression biv_ensta_21oct2010)
(Statdes regression biv_ensta_21oct2010)
 
Cours Statistique descriptive pr Falloul
Cours Statistique descriptive pr FalloulCours Statistique descriptive pr Falloul
Cours Statistique descriptive pr Falloul
 
Chapitre 1 et 2 [Enregistrement automatique].pptx
Chapitre 1 et 2 [Enregistrement automatique].pptxChapitre 1 et 2 [Enregistrement automatique].pptx
Chapitre 1 et 2 [Enregistrement automatique].pptx
 
Note tech 4
Note tech 4Note tech 4
Note tech 4
 

Dernier

Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdf
Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdfBibdoc 2024 - Les intelligences artificielles en bibliotheque.pdf
Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdfAtelier Canopé 37 - Tours
 
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdf
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdfBibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdf
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdfAtelier Canopé 37 - Tours
 
M2i Webinar - CPF 2024 : une stratégie pour booster les performances RH
M2i Webinar - CPF 2024 : une stratégie pour booster les performances RHM2i Webinar - CPF 2024 : une stratégie pour booster les performances RH
M2i Webinar - CPF 2024 : une stratégie pour booster les performances RHM2i Formation
 
Chana Orloff.pptx Sculptrice franco-ukranienne
Chana Orloff.pptx Sculptrice franco-ukranienneChana Orloff.pptx Sculptrice franco-ukranienne
Chana Orloff.pptx Sculptrice franco-ukranienneTxaruka
 
L'Unité de Spiritualité Eudiste se joint à toute l'Église Universelle et en p...
L'Unité de Spiritualité Eudiste se joint à toute l'Église Universelle et en p...L'Unité de Spiritualité Eudiste se joint à toute l'Église Universelle et en p...
L'Unité de Spiritualité Eudiste se joint à toute l'Église Universelle et en p...Unidad de Espiritualidad Eudista
 
Copilot your everyday AI companion- OFFICE 365-
Copilot your everyday AI companion- OFFICE 365-Copilot your everyday AI companion- OFFICE 365-
Copilot your everyday AI companion- OFFICE 365-Majida Antonios, M.Ed.
 
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24Newsletter SPW Agriculture en province du Luxembourg du 10-04-24
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24BenotGeorges3
 
Calendrier de la semaine du 8 au 12 avril
Calendrier de la semaine du 8 au 12 avrilCalendrier de la semaine du 8 au 12 avril
Calendrier de la semaine du 8 au 12 avrilfrizzole
 
0234567778999876554345678898765566.15.ppt
0234567778999876554345678898765566.15.ppt0234567778999876554345678898765566.15.ppt
0234567778999876554345678898765566.15.pptessiben
 
Aux origines de la sociologie : du XIXème au début XX ème siècle
Aux origines de la sociologie : du XIXème au début XX ème siècleAux origines de la sociologie : du XIXème au début XX ème siècle
Aux origines de la sociologie : du XIXème au début XX ème siècleAmar LAKEL, PhD
 
La Base unique départementale - Quel bilan, au bout de 5 ans .pdf
La Base unique départementale - Quel bilan, au bout de 5 ans .pdfLa Base unique départementale - Quel bilan, au bout de 5 ans .pdf
La Base unique départementale - Quel bilan, au bout de 5 ans .pdfbdp12
 

Dernier (12)

Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdf
Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdfBibdoc 2024 - Les intelligences artificielles en bibliotheque.pdf
Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdf
 
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdf
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdfBibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdf
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdf
 
M2i Webinar - CPF 2024 : une stratégie pour booster les performances RH
M2i Webinar - CPF 2024 : une stratégie pour booster les performances RHM2i Webinar - CPF 2024 : une stratégie pour booster les performances RH
M2i Webinar - CPF 2024 : une stratégie pour booster les performances RH
 
Chana Orloff.pptx Sculptrice franco-ukranienne
Chana Orloff.pptx Sculptrice franco-ukranienneChana Orloff.pptx Sculptrice franco-ukranienne
Chana Orloff.pptx Sculptrice franco-ukranienne
 
Bulletin des bibliotheques Burkina Faso mars 2024
Bulletin des bibliotheques Burkina Faso mars 2024Bulletin des bibliotheques Burkina Faso mars 2024
Bulletin des bibliotheques Burkina Faso mars 2024
 
L'Unité de Spiritualité Eudiste se joint à toute l'Église Universelle et en p...
L'Unité de Spiritualité Eudiste se joint à toute l'Église Universelle et en p...L'Unité de Spiritualité Eudiste se joint à toute l'Église Universelle et en p...
L'Unité de Spiritualité Eudiste se joint à toute l'Église Universelle et en p...
 
Copilot your everyday AI companion- OFFICE 365-
Copilot your everyday AI companion- OFFICE 365-Copilot your everyday AI companion- OFFICE 365-
Copilot your everyday AI companion- OFFICE 365-
 
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24Newsletter SPW Agriculture en province du Luxembourg du 10-04-24
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24
 
Calendrier de la semaine du 8 au 12 avril
Calendrier de la semaine du 8 au 12 avrilCalendrier de la semaine du 8 au 12 avril
Calendrier de la semaine du 8 au 12 avril
 
0234567778999876554345678898765566.15.ppt
0234567778999876554345678898765566.15.ppt0234567778999876554345678898765566.15.ppt
0234567778999876554345678898765566.15.ppt
 
Aux origines de la sociologie : du XIXème au début XX ème siècle
Aux origines de la sociologie : du XIXème au début XX ème siècleAux origines de la sociologie : du XIXème au début XX ème siècle
Aux origines de la sociologie : du XIXème au début XX ème siècle
 
La Base unique départementale - Quel bilan, au bout de 5 ans .pdf
La Base unique départementale - Quel bilan, au bout de 5 ans .pdfLa Base unique départementale - Quel bilan, au bout de 5 ans .pdf
La Base unique départementale - Quel bilan, au bout de 5 ans .pdf
 

Cours

  • 1. Vocabulaire Représentations graphiques Résumé Numérique Statistique Descriptive - 1ère partie Statistique pour une variable L1 MASS Université Rennes 2 Année 2010-2011 Semestre 2 MASS 1 Stat. Univariée
  • 2. Vocabulaire Représentations graphiques Résumé Numérique Références Statistique descriptive, cours et exercices corrigés Agnès Hamon et Nicolas Jégou Résumé du cours de statistique descriptive Yves Tillé MASS 1 Stat. Univariée
  • 3. Vocabulaire Représentations graphiques Résumé Numérique Informations sur le cours 12H Cours 12H TD-TP sur logiciel R Contrôle Continu : Un écrit de 2H et un mini-projet sous R Examen Terminal : Un écrit de 2H MASS 1 Stat. Univariée
  • 4. Vocabulaire Représentations graphiques Résumé Numérique Plan 1 Vocabulaire 2 Représentations graphiques 3 Résumé Numérique Paramètres de position Paramètres de dispersion Moments Paramètres de forme Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches MASS 1 Stat. Univariée
  • 5. Vocabulaire Représentations graphiques Résumé Numérique Population, individu, variable Recueil des données sur les éléments constitutifs d’un ensemble ; Ex : Notes aux examens, marque des voitures formant le parc automobile de Rennes en 2005, etc. L’ensemble étudié = population ; Attention : la population ne sera pas toujours un ensemble d’êtres humains. Éléments qui le constituent = individus ; Caractère étudié = variable ; Sa valeur relevée sur un individu sera appelée observation. MASS 1 Stat. Univariée
  • 6. Vocabulaire Représentations graphiques Résumé Numérique Exemple - Questionnaire Age Nombre de personnes Lecture X dans le foyer : Y journal : Z 1 17 4 de temps en temps 2 12 2 très rarement 3 15 3 très rarement . . . . . . . . . . . . 18 38 2 tous les jours 19 40 4 très rarement 20 42 5 de temps en temps MASS 1 Stat. Univariée
  • 7. Vocabulaire Représentations graphiques Résumé Numérique Exemple suite Population = 20 personnes interrogées ; Individus renseignés sur 3 variables : L’âge, noté X ; Nombre de personnes dans le foyer, noté Y ; Fréquence de lecture, notée Z . Chaque individu est identifié par un numéro pour indexer les observations ; Exemple : x18 correspond à l’observation de la variable X faite sur l’individu 18, et dans le tableau on lit x18 =38. MASS 1 Stat. Univariée
  • 8. Vocabulaire Représentations graphiques Résumé Numérique Types de variables 2 familles de variables : Si les observations sont des nombres, on parle de variable quantitative ; Si les observations se traduisent par un attribut, appartenance à une catégorie ou à un genre, la variable est dite qualitative ; On parle donc des valeurs possibles prises par une variable quantitative ; Et de modalités pour une variable qualitative. Sur l’exemple précédent, Y va. quantitative et Z va. qualitative. MASS 1 Stat. Univariée
  • 9. Vocabulaire Représentations graphiques Résumé Numérique Variables Quantitatives 2 types de variables : Variables discrètes dont l’ensemble possible des valeurs est fini ; Ex : Variable Y . Variables continues lorsque les réalisations possibles s’organisent sur une échelle continue des valeurs ; Ex : Variable X . Même si les observations prennent des valeurs entières, on comprend bien qu’un individu qui a 15 ans signifie que son âge appartient à l’intervalle [15; 16[. MASS 1 Stat. Univariée
  • 10. Vocabulaire Représentations graphiques Résumé Numérique Variables Qualitatives 2 catégories : Les modalités possèdent un ordre naturel, la variable est qualifiée d’ordinale ; Ex : Variable Z . Pas d’ordonnancement on parle de variable nominale ; Ex : Variable ”sexe” a deux modalités, "homme" et "femme", et est dite nominale. MASS 1 Stat. Univariée
  • 11. Vocabulaire Représentations graphiques Résumé Numérique Données Agrégées -1 Avec l’exemple précédent pour chacun des 20 individus, nous disposons des observations pour chaque variable : on parle de données brutes ou individuelles. Il n’est pas toujours possible de toutes les représenter (trop d’observations) et on présente les données dans un tableau synthétique et on parle alors de données agrégées. MASS 1 Stat. Univariée
  • 12. Vocabulaire Représentations graphiques Résumé Numérique Données Agrégées -2 Variable discrète : On regroupe les observations suivant les valeurs de la variable Valeurs 1 2 3 4 5 6 variable Y Effectifs n1 = 3 n2 = 9 n3 = 2 n4 = 4 n5 = 1 n6 = 1 observés MASS 1 Stat. Univariée
  • 13. Vocabulaire Représentations graphiques Résumé Numérique Données Agrégées -3 Variable Qualitative : On regroupe les observations suivant les modalités de la variable Modalités très de temps tous variable Z rarement en temps les jours Effectifs n1 = 6 n2 = 6 n3 = 8 observés MASS 1 Stat. Univariée
  • 14. Vocabulaire Représentations graphiques Résumé Numérique Données Agrégées -4 Variable continue : Regroupement suivant des classes Classes pour X [0 ;20[ [20 ;40[ [40 ;60[ [60 ;90[ Effectifs n1 = 6 n2 = 5 n3 = 5 n4 = 4 Choix des classes subjectif, autre exemple : Classes pour X [10 ;30[ [30 ;40[ [40 ;50[ [50 ;70[ [70 ;90[ Effectifs n1 = 7 n2 = 4 n3 = 4 n4 = 3 n5 = 2 MASS 1 Stat. Univariée
  • 15. Vocabulaire Représentations graphiques Résumé Numérique A propos des fréquences . . . Regrouper les données (slides précédents) : utile pour connaître les modalités (valeurs) les plus souvent observées, mais : Le nombre d’observations d’une valeur n’a de sens que si on le compare au nombre total d’observations : Dans une entreprise, 10 salariés gagnent plus de 60 ke/an Si l’entreprise a 50 salariés cela représente 20% Si l’entreprise a 5000 salariés cela représente 0,2% C’est la notion de fréquences qui formalise cela ; Avec n le nombre total d’observations et ni le nombre d’observations de la i-ème modalité, la fréquence de cette modalité est ni fi = n MASS 1 Stat. Univariée
  • 16. Vocabulaire Représentations graphiques Résumé Numérique Variables qualitatives : Un exemple On s’intéresse à la variable "état-civil", notée X , pour 20 personnes. M M D C C M C C C M C M V M V D C C C M Le domaine de la variable X est {M, D, C , V } ; M : marié(e) ; D : divorcé(e) : C : célibataire ; V : veuf(ve) ; La valeur de X pour le 3ème individu est : x3 = D. MASS 1 Stat. Univariée
  • 17. Vocabulaire Représentations graphiques Résumé Numérique Variables qualitatives : Présentation des données La variable est qualitative nominale et nous regroupons les observations suivant ses quatre modalités pour une présentation agrégée : xi ni fi C 9 0.45 Avec M 7 0.35 4 i=1 ni = 20 V 2 0.10 4 i=1 fi = 1 D 2 0.10 20 1 MASS 1 Stat. Univariée
  • 18. Vocabulaire Représentations graphiques Résumé Numérique Variables qualitatives : Les diagrammes Figure: Diagramme en barres ; Diagramme en secteurs MASS 1 Stat. Univariée
  • 19. Vocabulaire Représentations graphiques Résumé Numérique Variables quantitatives discrètes : Un exemple On s’intéresse à la variable "nombre de personnes par ménage", notée Z , pour un quartier composé de 50 ménages. 1 1 1 1 1 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 6 6 6 7 7 MASS 1 Stat. Univariée
  • 20. Vocabulaire Représentations graphiques Résumé Numérique Variables quantitatives discrètes : Présentation des données xi ni fi 1 5 0.1 2 9 0.18 3 15 0.30 4 10 0.20 5 6 0.12 6 3 0.06 7 2 0.04 Figure: Diagramme en bâtons 50 1 MASS 1 Stat. Univariée
  • 21. Vocabulaire Représentations graphiques Résumé Numérique Variables quantitatives continues : Un exemple On s’intéresse à la variable "taille" de 50 élèves d’une classe. 152 152 152 153 153 154 154 154 155 155 156 156 156 156 156 157 157 157 158 158 159 159 160 160 160 160 160 161 161 162 162 162 163 164 164 164 164 165 166 167 168 168 168 169 169 170 171 171 171 171 MASS 1 Stat. Univariée
  • 22. Vocabulaire Représentations graphiques Résumé Numérique Variables quantitatives continues : les classes On peut définir les classes suivantes et obtenir le tableau des données agrégées : Classes ni fi [151,5 ;155,5] [151,5 ;155,5] 10 0.20 [155,5 ;159,5] [155,5 ;159,5] 12 0.24 [159,5 ;163,5] [159,5 ;163,5] 11 0.22 [163,5 ;167,5] [163,5 ;167,5] 7 0.14 [167,5 ;171,5] [167,5 ;171,5] 10 0.2 50 1 MASS 1 Stat. Univariée
  • 23. Vocabulaire Représentations graphiques Résumé Numérique Variables quantitatives : L’histogramme - 1 Construction de l’histogramme à partir du tableau précédent. Les observations sur les n individus sont réparties dans k intervalles de la forme ([ei ; ei+1 ])i=1,...,k Nous graduons l’axe horizontal à l’échelle des valeurs (ei )i=1,...,k ; Pour la hauteur on traduit le fait que l’air de chaque rectangle correspond à la fréquence de la classe : fi = (ei+1 − ei ) × di MASS 1 Stat. Univariée
  • 24. Vocabulaire Représentations graphiques Résumé Numérique Variables quantitatives : L’histogramme - 2 En ordonnée on a donc la "densité" di : Figure: Histogramme des effectifs MASS 1 Stat. Univariée
  • 25. Vocabulaire Représentations graphiques Résumé Numérique Variables quantitatives : L’histogramme - 3 Et en agrégeant les deux dernières classes on obtient : Figure: Histogramme des effectifs avec les 2 dernières classes agrégées MASS 1 Stat. Univariée
  • 26. Vocabulaire Représentations graphiques Résumé Numérique Fréquences cumulées La fréquence cumulée de la ième valeur, notée Fi , donnée par i Fi = f1 + . . . + fi = fj j=1 C’est la proportion des observations inférieures ou égales à la ième valeur de la variable : xi ni fi Fi 1 5 0.1 0.1 2 9 0.18 0.28 3 15 0.30 0.58 ··· ··· ··· ··· MASS 1 Stat. Univariée
  • 27. Vocabulaire Représentations graphiques Résumé Numérique Fonction de répartition Figure: Fonction de répartition pour variable discrète et continue. MASS 1 Stat. Univariée
  • 28. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches Le mode Mode = valeur distincte correspondant à l’effectif le plus élevé. Exemple avec variable "Etat-civil" xi ni fi C 9 0.45 M 7 0.35 Ici mode est C : célibataire. V 2 0.10 D 2 0.10 20 1 MASS 1 Stat. Univariée
  • 29. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches Le mode - Qqs Remarques Le mode peut être calculé pour tous les types de variable ; Le mode n’est pas forcément unique ; Pour une variable continue découpée en classes, on peut définir une classe modale - cf après. MASS 1 Stat. Univariée
  • 30. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches La moyenne La moyenne est définie que sur une variable quantitative ; Elle est notée x et est définie par : ¯ n 1 x1 + x2 + . . . + xn x= ¯ xi = n n i=1 Elle peut aussi être calculée à partir des effectifs : J 1 x= ¯ nj xj n j=1 MASS 1 Stat. Univariée
  • 31. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches La moyenne - Exemple Variable : "Nombre d’enfants par famille" 0+0+1+1+1+2+3+4 0 0 1 1 1 2 3 4 x= ¯ 8 = 1.5 Tableau synthétique xj nj 0 2 2×0+3×1+1×2+1×3+1×4 1 3 x ¯ = 8 2 1 = 1.5 3 1 4 1 MASS 1 Stat. Univariée
  • 32. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches La médiane - 1 Médiane = valeur centrale de la série statistique, notée x1/2 . Obtenue de la manière suivante : On trie la série statistique par ordre croissant des valeurs observés. Ex : {3, 2, 1, 0, 0, 1, 2} devient {0, 0, 1, 1, 2, 2, 3}. La médiane est la valeur qui se trouve au milieu de la série ordonée ; Ici x1/2 = 1. MASS 1 Stat. Univariée
  • 33. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches La médiane - 2 - Cas où n est impair La médiane peut être définie comme l’inverse de la fonction de répartition pour la valeur 1/2. x1/2 = F −1 (0.5). Figure: Médiane quand n impair MASS 1 Stat. Univariée
  • 34. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches La médiane - 3 - Cas où n est pair : 2 valeurs se trouvent au milieu de la série ; Médiane = moyenne de ces 2 valeurs ; x1/2 = F −1 (0.5) ; La fonction de répartition correspond à un "palier". Figure: Médiane quand n pair MASS 1 Stat. Univariée
  • 35. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches Éléments de comparaison des paramètres de position Exercice : On regarde la variable "nombre d’aces réussis" dans les 10 derniers matchs d’un joueur de l’équipe de France ; Aces 0 1 2 3 ... 11 12 13 Effectifs 4 2 3 0 ... 0 0 1 Mode ? Médiane ? Moyenne ? Interprétation ? Est-ce un mauvais serveur ? MASS 1 Stat. Univariée
  • 36. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches Éléments de comparaison des paramètres de position Mode donne la valeur la plus fréquente mais ne tient pas compte des autres observations ; Médiane dépend de l’ordre des données mais peu sensible aux valeurs extrêmes ; Moyenne manque de robustesse ; Ex : une fois 13 aces permet d’augmenter facilement la moyenne alors qu’en réalité il ne sert jamais plus de 2 aces par match. MASS 1 Stat. Univariée
  • 37. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches Éléments de comparaison des paramètres de position Suivant la distribution étudiée, les 3 mesures présentent leur propre intérêt. Il faut surtout éviter de faire des interprétations abusives et il est souvent utile de les comparer. MASS 1 Stat. Univariée
  • 38. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches Le mode - Variable continue La classe modale n’est pas la classe de plus grande fréquence mais la classe de plus grande densité ; Classe modale = pic sur l’histogramme. MASS 1 Stat. Univariée
  • 39. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches La moyenne - Variable continue Les observations sont réparties dans J intervalles et J 1 x= ¯ nj cj , n j=1 ej +ej+1 où cj = 2 est le centre de classe. MASS 1 Stat. Univariée
  • 40. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches La médiane - Variable continue Regrouper en "classes" donc on se prive des valeurs mesurées pour ne garder que des intervalles ; Hyp : les données sont uniformément réparties dans les intervalles ; MASS 1 Stat. Univariée
  • 41. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches Exemple Temps en min. [0 ;2 [ [2 ;6 [ ... Fréquences (%) 40 40 ... Temps médian ∈ [2; 6[ ; L’hyp. nous donne : 10 % entre 2 et 3 min ; 10 % entre 3 et 4 min ; ... Donc le temps médian est de 3 min ; Sinon interpolation linéaire pour utiliser x1/2 = F −1 (0.5). MASS 1 Stat. Univariée
  • 42. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches Interpolation linéaire Cela consiste à déterminer une équation de droite pour en déduire la valeur de x1/2 ; On sait que F (x1/2 ) = 0.5 et que x1/2 ∈ [ek ; ek+1 ] ; F (ek+1 ) − F (ek ) F (x1/2 ) ≈ F (ek ) + (x1/2 − ek ) ek+1 − ek MASS 1 Stat. Univariée
  • 43. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches Quantiles - 1 La notion de quantile d’ordre p (où 0 < p < 1) généralise la médiane ; xp = F −1 (p). La fonction de répartition est discontinue ; On va présenter une manière de définir les quantiles. MASS 1 Stat. Univariée
  • 44. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches Quantiles - 2 Si np est un nombre entier, alors 1 xp = {xnp + xnp+1 }. 2 Si np n’est pas un nombre entier, alors 1 xp = x[np] , 2 où [np] représente le plus petit entier supérieur ou égal à np. Notations : x1/4 = 1er quartile ; x1/2 = médiane ; x3/4 = 3ème quartile ; . . . MASS 1 Stat. Univariée
  • 45. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches Quantiles - 3 - Exemple Avec la série suivante : {12, 13, 15, 16, 18, 19, 22, 24, 25, 27, 28, 34} ; Le 1er quartile nous donne np = 0.25 × 12 = 3 donc entier ; Et donc x3 + x4 15 + 16 x1/4 = = = 15.5; 2 2 Avec la série suivante : {12, 13, 15, 16, 18, 19, 22, 24, 25, 27} ; Le 1er quartile nous donne np = 0.25 × 10 = 2.5 donc pas entier ; Et donc x1/4 = x[2.5] = x3 = 15. MASS 1 Stat. Univariée
  • 46. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches L’étendue L’étendue est simplement la différence entre la plus grande et la plus petite valeur ; E = xn − x1 . MASS 1 Stat. Univariée
  • 47. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches La distance interquartile La distance interquartile est la différence entre le 3ème et le 1er quartile ; IQ = x3/4 − x1/4 . MASS 1 Stat. Univariée
  • 48. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches Application X : "Journées d’absence au travail" X 0 1 2 3 4 5 6 7 8 9 10 11 ni 1 4 4 8 14 7 4 4 2 1 0 1 Donner un résumé numérique de la variable X . MASS 1 Stat. Univariée
  • 49. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches La variance La variance est la somme des carrés des écarts à la moyenne divisée par le nombre d’observations : n 1 σ2 = (xi − x )2 ¯ n i=1 Réécriture de la variance n 1 σ2 = xi2 − x 2 . ¯ n i=1 Démonstration : exercice. Mesure pas très parlante. MASS 1 Stat. Univariée
  • 50. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches L’écart type Dispersion autour de la moyenne ; √ σ= Variance Cf. Exercices de TD pour interprétation simple d’un point de vue descriptif. MASS 1 Stat. Univariée
  • 51. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches Moments - 1 On appelle moment d’ordre r, r ∈ N, le paramètre n 1 mr = xir . n i=1 On appelle moment centré d’ordre r le paramètre n 1 mr = (xi − x )r . ¯ n i=1 MASS 1 Stat. Univariée
  • 52. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches Moments - 2 Les moments généralisent la plupart des paramètres. m1 = x, ¯ m1 = 0, m2 = σ2 + x 2 , ¯ m2 = σ2 . Les moments d’ordre 3,4 sont utilisés pour mesurer la symétrie et l’aplatissement. MASS 1 Stat. Univariée
  • 53. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches Skewness Le skewness peut prendre des valeurs positives, négatives, ou nulles. L’asymétrie se mesure avec le coefficient d’asymétrie de Fisher m3 sk = . σ3 MASS 1 Stat. Univariée
  • 54. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches Exemple Figure: Asymétrie d’une distribution. Le skewness est positif quand la distribution est allongée à droite, comme par exemple lorsqu’on regarde les variables "revenus", "tailles des entreprises", etc. MASS 1 Stat. Univariée
  • 55. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches Kurtosis L’aplatissement est mesuré par le coef. d’aplatissement de Pearson : m4 β2 = 4 , σ ou le coef. d’aplatissement de Fisher : g2 = β2 − 3. MASS 1 Stat. Univariée
  • 56. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches Exemple Figure: Distribution mésokurtique et leptokurtique. Une courbe leptokurtique (g2 > 0) est plus pointue et possède des queues de distributions plus longues. MASS 1 Stat. Univariée
  • 57. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches Diagramme en tiges et feuilles Le Stem and leaf diagram est un moyen rapide de présenter une variable quantitative ; Par exemple avec la série suivante : 15, 15, 16, 17, 18, 20, 21, 22, 23, 23, 23, 24, 25, 25, 26, 26, 27, 28, 28, 29, 30, 30, 32, 34, 35, 36, 39, 40, 43, 44. La tige du diagramme sera les dizaines et les feuilles seront les unités. MASS 1 Stat. Univariée
  • 58. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches Stem and leaf diagram Figure: Diagramme en tiges et feuilles. MASS 1 Stat. Univariée
  • 59. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches Box-Plot - Composition Un rectangle qui s’étend du 1er au 3ème quartile. Divisé par une ligne correspondant à la médiane. Rectangle complété par 2 segments de droites. Calcul des bornes : b − = x0.25 − 1.5IQ et b + = x0.75 + 1.5IQ ; On identifie ensuite la plus petite et la plus grande observation comprise entre ces bornes, qu’on appelle "valeurs adjacentes" ; Les valeurs qui ne sont pas comprises entre les valeurs adjacentes, sont représentées par des points et sont appelées "valeurs extrêmes". MASS 1 Stat. Univariée
  • 60. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches Box-Plot - Exemple Figure: Diagramme en boîte, ou box-plot. MASS 1 Stat. Univariée
  • 61. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches Box-Plot - Exemple 2 Figure: Diagramme en boîte, ou box-plot. MASS 1 Stat. Univariée
  • 62. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches Exercices de fin de partie On pèse 50 élèves d’une classe et nous obtenons : 43 43 43 47 48 48 48 48 49 49 49 50 50 51 51 52 53 53 53 54 54 56 56 56 57 59 59 59 62 62 63 63 65 65 67 67 68 70 70 70 72 72 73 77 77 81 83 86 92 93 Construisez l’histogramme, la fonction de répartition en adoptant les classes suivantes : [40; 45], ]45; 50], ]50; 55], ]55; 60], ]60; 65], ]65; 70], ]70; 80], ]80; 100] MASS 1 Stat. Univariée
  • 63. Paramètres de position Paramètres de dispersion Vocabulaire Moments Représentations graphiques Paramètres de forme Résumé Numérique Paramètres d’aplatissement Diagramme en tiges et feuilles Boîte à moustaches Exercices de fin de partie 152 152 152 153 153 154 154 154 155 155 156 156 156 156 156 157 157 157 158 158 159 159 160 160 160 160 160 161 161 162 162 162 163 164 164 164 164 165 166 167 168 168 168 169 169 170 171 171 171 171 Calculez tous les paramètres (position, dispersion, etc.) sans prendre en compte les classes. MASS 1 Stat. Univariée