SlideShare une entreprise Scribd logo
1  sur  14
Télécharger pour lire hors ligne
FIIFO 3                                                        PROBABILITES - STATISTIQUES



                                    STATISTIQUE
                                    DESCRIPTIVE


1.     MÉTHODE STATISTIQUE

       1.1.    HISTORIQUE ET DÉFINITION

        Aussi loin que l'on remonte dans le temps et dans l'espace ( en Chine et en Égypte, par
exemple), les États ont toujours senti le besoin de disposer d'informations sur leurs sujets ou
sur les biens qu'ils possèdent et produisent. Mais les recensements de population et de
ressources, les statistiques (du latin status : état ) sont restées purement descriptives jusqu'au
17ème siècle.

       Puis s'est développé le calcul des probabilités et des méthodes statistiques sont
apparues en Allemagne, en Angleterre et en France. Beaucoup de scientifiques de tous ordre
ont apporté leur contribution au développement de cette science : PASCAL, HUYGENS,
BERNOULLI, MOIVRE, LAPLACE, GAUSS, MENDEL, PEARSON, FISCHER etc....

      Actuellement, beaucoup de domaines utilisent les méthodes statistiques ( médecine,
agronomie, sociologie, industrie etc....).

Définition : La Statistique, c'est l'étude des variations observables. C'est une méthode qui
             consiste à réunir des données chiffrées sur des ensembles nombreux, puis à les
             analyser et à les interpréter.


       1.2.    MÉTHODES STATISTIQUES

         • 1ère étape :On collecte des données :
                              ◊ soit de manière exhaustive
                              ◊ soit par sondage
            ème
         • 2 étape : On trie les données que l’on organise en tableaux, diagrammes, etc...
         • 3ème étape : On interprète les résultats : on les compare avec ceux déduits de la
                   théorie des probabilités.

On pourra donc :
      ⇒ évaluer une grandeur statistique comme la moyenne ou la variance (estimateurs,
         intervalles de confiance ).
      ⇒ savoir si deux populations sont comparables (tests d’hypothèses).
      ⇒ déterminer si deux grandeurs sont liées et de quelle façon ( corrélation, ajustement
         analytique).




J-P LENOIR                                  Page 3                                  CHAPITRE 1
FIIFO 3                                                        PROBABILITES - STATISTIQUES


       Les conclusions, toujours entachées d'un certain pourcentage d'incertitude, nous
permettent alors de prendre une décision.

2.     SÉRIES STATISTIQUES A UNE VARIABLE

       2.1.   TERMINOLOGIE

POPULATION :          Ensemble que l'on observe et qui sera soumis à une analyse statistique.
                      Chaque élément de cet ensemble est un individu ou unité statistique.

ÉCHANTILLON :         C'est un sous ensemble de la population considérée. Le nombre
                      d'individus dans l’échantillon est la taille de l'échantillon.

CARACTÈRE :           C'est la propriété ou l'aspect singulier que l'on se propose d'observer
                      dans la population ou l'échantillon. Un caractère qui fait le sujet d'une
                      étude porte aussi le nom de variable statistique.

       Différents types de variables statistiques :

       • Lorsque la variable ne se prête pas à des valeurs numériques, elle est dite
         qualitative (exemple : opinions politiques, couleurs des yeux...) .Elle peut être
         ordonnée ou non, dichotomique ou non.
       • Lorsque la variable peut être exprimée numériquement, elle est dite quantitative
         ( ou mesurable). Dans ce cas, elle peut être discontinue ou continue.
              ♦ Elle est discontinue si elle ne prend que des valeurs isolées les unes des
                autres. Une variable discontinue qui ne prend que des valeurs entières est
                dite discrète (exemple : nombre d'enfants d'une famille).
              ♦ Elle est dite continue lorsqu'elle peut prendre toutes les valeurs d'un
                intervalle fini ou infini (exemple : diamètre de pièces, salaires...).


       2.2.   COMMENT ORGANISER LES DONNÉES

        On regroupe toutes les données de la série statistique dans un tableau indiquant la
répartition des individus selon le caractère étudié. Le regroupement s'effectue par classes :

• Si le caractère est qualitatif ou discontinu, une classe contient tous les individus ayant la
  même modalité ou la même valeur du caractère.
• Si le caractère est continu, une classe est un intervalle.
       ◊ Pour construire ces intervalles, on respecte les règles suivantes :
                1. Le nombre de classes est compris entre 5 et 20 (de préférence entre 6 et 12)
                2. Chaque fois que cela est possible, les amplitudes des classes sont égales.
                3. Chaque classe (sauf la dernière) contient sa borne inférieure mais pas sa
                   borne supérieure.
       ◊ Dans les calculs, une classe sera représentée par son centre, qui est le milieu de
          l'intervalle.



J-P LENOIR                                  Page 4                                  CHAPITRE 1
FIIFO 3                                                    PROBABILITES - STATISTIQUES


      ◊ Une fois la classe constituée, on considère les individus répartis uniformément entre
        les deux bornes ( ce qui entraîne une perte d'informations par rapport aux données
        brutes).




J-P LENOIR                               Page 5                                 CHAPITRE 1
FIIFO 3                                                                 PROBABILITES - STATISTIQUES


       ◊ Que faut-il indiquer pour chaque classe ?

    1. L’effectif :     nombre d'individus de la classe : on le note ni (i est l’indice de la classe).


    2. La fréquence : proportion d'individus de la population ou de l'échantillon appartenant
                     à la classe : on la note fi.


                                        ni
       fi et ni sont liés par : f i =        où N est le nombre total d’individus dans la population.
                                        N

       Remarque : On peut remplacer fi par fi×100 qui représente alors un pourcentage.

                           k                                k

       On a toujours : ∑ ni = N              0 ≤ fi ≤ 1    ∑f     i   = 1
                          i =1                             i =1

               où k représente le nombre de classes


    3. L'effectif (ou la fréquence) cumulé (e) : effectif ( ou fréquence) de la classe augmenté
       (e) de ceux (ou celles) des classes précédentes(lorsque la variable statistique est
       quantitative). La fréquence cumulée est une fonction F de la borne supérieure de la
       classe (dans le cas d’une variable statistique continue).



       2.3.    DIAGRAMMES

               Ils servent à visualiser la répartition des individus.

• Pour une variable statistique qualitative :

       On utilise des diagrammes à secteurs circulaires, des diagrammes en tuyaux
       d'orgue, des diagrammes en bandes. Le principe est de représenter des aires
       proportionnelles aux fréquences de la variable statistique.

• Pour une variable statistique discrète :

       On utilise un diagramme différentiel en bâtons, complété du diagramme des
       fréquences cumulées appelé diagramme cumulatif. Le diagramme cumulatif est la
       représentation graphique d’une fonction F, appelée fonction de répartition de la
       variable statistique.


               Exemple : nombre d’erreurs d’assemblage sur un ensemble d’appareils



J-P LENOIR                                        Page 6                                 CHAPITRE 1
FIIFO 3                                                       PROBABILITES - STATISTIQUES




 nombre     nombre    fréquences
d’erreurs d’appareils cumulées
    0         101        0.26
    1         140        0.61
    2          92        0.84
    3          42        0.94
    4          18        0.99
    5           3          1




                                    Diagramme cumulatif




                                nombre d’erreurs d’assemblage

• Pour une variable statistique continue :

       1. Le diagramme représentant la série est un histogramme : ce sont des rectangles
          juxtaposés dont chacune des bases est égale à l’intervalle de chaque classe et dont la
          hauteur est telle que l’aire de chaque rectangle soit proportionnelle aux
          effectifs(histogramme des effectifs) ou aux fréquences de la classe correspondante
          (histogramme des fréquences).

       2. On obtient le polygone des effectifs (ou des fréquences) en reliant les milieux des
          bases supérieures des rectangles.

       3. La courbe cumulative ( ou polygone des fréquences cumulées ) est obtenue en
          portant les points dont les abscisses représentent la borne supérieure de chaque
          classe et les ordonnées les fréquences cumulées correspondantes, puis en reliant ces


J-P LENOIR                                   Page 7                                CHAPITRE 1
FIIFO 3                                                      PROBABILITES - STATISTIQUES


          points par des segments de droite. Son équivalent dans la théorie probabiliste est la
          fonction de répartition.




J-P LENOIR                                Page 8                                  CHAPITRE 1
FIIFO 3                                                       PROBABILITES - STATISTIQUES


       Exemple : nombre de ventes effectuées en un mois par 50 employés d’une compagnie

         Dans cet exemple la variable statistique( le nombre de ventes), quoique discrète, doit
être traitée comme une variable continue car elle prend un grand nombre de valeurs.

                                                                    HISTOGRAMME




  nombre de        nombre   fréquences
  ventes : x     d’employés cumulées
 80 ≤ x < 90          2        0.04
 90 ≤ x < 100         6        0.16
100 ≤ x < 110        10        0.36
110 ≤ x < 120        14        0.64
120 ≤ x < 130         9        0.82
130 ≤ x < 140         7        0.96
140 ≤ x < 150         2          1




                                           médiane

       On remarque que :      → F est une fonction croissante.
                              → On a toujours : 0 ≤ F( x) ≤ 1 .


3.     CARACTÉRISTIQUES                      NUMÉRIQUES                 D’UNE         SÉRIE
       QUANTITATIVE

       3.1.     CARACTÉRISTIQUES DE POSITION

                3.1.1. Le mode

       Le mode, désigné par Mo est la valeur de la variable statistique la plus fréquente.



J-P LENOIR                                 Page 9                                  CHAPITRE 1
FIIFO 3                                                         PROBABILITES - STATISTIQUES


       Dans le cas d'une variable statistique continue, on parle plutôt de classe modale.

       NB : Le mode ou la classe modale n'est pas obligatoirement unique.

               3.1.2. La médiane

       La médiane, désignée par Me, est la valeur de la variable telle qu'il y ait autant
d'observations, en dessous d'elle qu'au dessus ou, ce qui revient au même, la valeur
correspondant à 50% des observations.

       Comment la déterminer?

            • Si la variable est discrète :

               On désigne par n le nombre d’observations .
                                                   n + 1 ème
                   ⇒ Si n est impair : Me est la (      )    observation.
                                                     2

                    ⇒ Si n est pair : n = 2k. Me est la moyenne arithmétique des deux
                     observations centrales.
                                          k ème observation + ( k + 1) ème observation
                                    Me =
                                                               2

            • Si la variable est continue, Me vérifie F(Me) = 0.5 ,où F est la fonction de
              répartition de la variable. On détermine alors un intervalle médian(intervalle
              contenant la médiane), puis on procède à l'intérieur de cette classe à une
              interpolation linéaire.

       Généralisation : notion de quantiles

       Quantile d'ordre 1/4 : C’est la valeur Q1 tel que F(Q1) = 0.25.
       Quantile d'ordre 3/4 : C’est la valeur Q3 tel que F(Q3) = 0.75 (on a Me = Q2).
       Déciles d'ordre 1/10, 2/10.... : F(D1)=0.1, F(D2)=0.2...

             Remarque : Ces éléments se déterminent facilement à partir des courbes
                                                                      n          n
       cumulatives, en cherchant les abscisses des points d'ordonnées   pour Me,   pour
                                                                      2          4
       Q1...


               3.1.3. La moyenne

       Lorsque x désigne la variable statistique, la valeur moyenne, ou moyenne de la série se
note m ou x . Elle est l'analogue d'un centre de gravité.

1e r cas : si les observations ne sont pas groupées (la série est dite non classée)



J-P LENOIR                                    Page 10                                 CHAPITRE 1
FIIFO 3                                            PROBABILITES - STATISTIQUES




                  1 n
             x=     ∑x
                  n j =1 j
                             n = effectif total   xj = j ème valeur de la variable




J-P LENOIR                        Page 11                                 CHAPITRE 1
FIIFO 3                                                            PROBABILITES - STATISTIQUES


2ème cas : si les observations sont groupées ( la série est dite classée)

                                                                  xi = centre de la classe i
                        k          k
                     1
                x=     ∑n x =
                     n i =1 i i
                                  ∑f x   i   i                    ni = effectif de la classe i
                                  i =1



       n= effectif total                                          fi = fréquence de la classe i

       On effectue en fait ici une moyenne arithmétique pondérée.

NB : Dans le cas d’une variable continue, cette moyenne pondérée n'est qu'une valeur
approchée de la vraie valeur moyenne de la série car on remplace chaque xj par le centre de la
classe à laquelle il appartient.

Pourquoi utiliser la moyenne arithmétique?

        Elle a été choisie parmi d'autres types de moyenne (géométrique, harmonique...) car elle
possède une propriété extrêmement intéressante:
        Lorsqu'on se livre à des observations scientifiques, les mesures ne sont pas toujours
exactement identiques d'une fois sur l'autre, même lorsque les conditions semblent être
similaires. Il se produit ce que l’on appelle une erreur d'observation . On a la relation suivante :

                     valeur observée = valeur exacte + erreur d'observation

       avec: xi = valeur observée                          xe = valeur exacte

              xi - xe = erreur d'observation

On décide alors de prendre pour xe la valeur qui minimise les erreurs d’observation , en fait la
moyenne des carrés de ces erreurs ( critère des moindres carrés) . Le calcul prouve que la
meilleure valeur estimant xe suivant ce critère est x .

Propriété : La moyenne x des valeurs observées d’une grandeur x correspond à la meilleure
            estimation de xe .

        Cela ne signifie pas que x soit la valeur exacte xe de la grandeur observée mais que c'est
la meilleure évaluation possible que l'on puisse en faire selon le critère des moindres carrés.


       3.2.    CARACTÉRISTIQUES DE DISPERSION


               3.2.1. L’étendue

L'étendue, notée e, représente la différence entre les valeurs extrêmes de la distribution : e = xn-x1.



J-P LENOIR                                       Page 12                                   CHAPITRE 1
FIIFO 3                                                                          PROBABILITES - STATISTIQUES


                  3.2.2. L’intervalle interquartile

L'intervalle interquartile, noté I, est la différence entre les deux quartiles Q3 et Q1 :

                                                      I = Q3 - Q1

       Cet intervalle contient 50% de la population en en éliminant 25% à chaque extrémité.
Cette caractéristique est nettement meilleure que l'étendue.


                  3.2.3. La variance

C'est la caractéristique de dispersion la plus utilisée avec l'écart quadratique moyen.

        1er cas : série non classée

                                                     1 n
                                                 Vx = ∑ ( x j − x ) 2
                                                     n j=1

        2ème cas : série classée

                                        1 k                  k
                                    Vx = ∑ n i (x i − x) = ∑ f i (x i − x) 2
                                                        2
                                        n i=1              i =1



        Dans le cas d’une variable statistique continue, xi représente le centre de la ième classe.

La variance est donc toujours positive ou nulle. Les formules ci-dessus imposent de calculer
les différences (xi- x )2 ce qui est assez fastidieux. On peut éviter cet inconvénient en utilisant le
théorème de Koenig.
Autre expression de la variance : Théorème de KOENIG

        1er cas: série non classée

                                                      1 n 2
                                                Vx = ( ∑ x j ) − x 2
                                                      n j=1

        2ème cas: série classée

                                          1 k                    k
                                    Vx = ( ∑ n i x i ) − x = ( ∑ f i x i 2 ) − x 2
                                                    2     2
                                          n i=1                i =1



Démonstration:
        k                     k                                k                 k                 k        k
Vx = ∑ f i ( x i − x ) 2 = ∑ f i ( x i 2 − 2 x i x + x 2 ) = ∑ f i x i 2 − 2 x ( ∑ f i x i ) + x 2 ∑ f i = ∑ f i x i 2 − x 2
       i =1                  i =1                             i =1              i =1              i =1     i =1




J-P LENOIR                                             Page 13                                              CHAPITRE 1
FIIFO 3                                                                   PROBABILITES - STATISTIQUES

                 k                                  k
       car :   ∑f x    i i   =x          et       ∑f       i   =1
                i =1                               i =1


               3.2.4. Écart quadratique moyen

        Par définition, l’écart quadratique moyen d’une série statistique est la racine carrée
de la variance. On le note sx
        A la différence de la variance qui correspond à un carré, l'écart quadratique moyen est
homogène à la variable statistique et s'exprime dans les mêmes unités. Il permet de mesurer la
dispersion de la distribution statistique autour de sa valeur moyenne.


       3.3.    DÉTERMINATION GRAPHIQUE DE LA MOYENNE ET DE L’ÉCART
               QUADRATIQUE MOYEN D’UNE DISTRIBUTION GAUSSIENNE A
               L’AIDE DE LA DROITE DE HENRY

        On connaît plusieurs distributions statistiques particulières donnant la fréquence
théorique d'apparition d'une valeur x en fonction de x ( on reviendra en détail sur ces notions
dans les chapitres suivants) . L'une des plus importantes est la distribution gaussienne ou
distribution normale.
        La fréquence théorique d’apparition d'une valeur xi est donnée par :

                                                                          2
                                                           1  xi − m 
                                                                     

                                                          −          
                                                 1         2 σ 
                                                                     
                                  f (x i ) =        e                

                                               σ 2π

       où m est la moyenne théorique et σ l’écart-type théorique de la distribution gaussienne.
       La représentation graphique de cette fonction f' est la fameuse courbe "en cloche".




J-P LENOIR                                      Page 14                                   CHAPITRE 1
FIIFO 3                                                      PROBABILITES - STATISTIQUES


                                                      X −m
       On associe à la variable X , la variable T =        ,appelée variable gaussienne centrée
                                                        σ
réduite (sa moyenne est nulle et son écart-type égal à 1).




J-P LENOIR                                Page 15                                 CHAPITRE 1
FIIFO 3                                                          PROBABILITES - STATISTIQUES


Méthode de la DROITE DE HENRY :

        Elle permet à la fois :
                1) De tester si la distribution donnée est gaussienne.
                2) Si elle l’est, de déterminer m et σ.

        Il faut pour cela utiliser du papier gausso-arithmétique contenant :

                1) en abscisses : les valeurs x, prises par la variable X.
                2) en ordonnées :
                       • à droite : les valeurs t de la variable gaussienne centrée réduite T.
                       • à gauche : les valeurs de la fonction de répartition de la loi T.

        Que faire?

        1. On calcule pour chaque valeur de xis, borne supérieure d'une classe, la fréquence
           cumulée correspondante F(xis).
        2. On porte les points de coordonnées(xis , F(xis) sur le papier gausso-arithmétique (en
           utilisant l'échelle de gauche des ordonnées).

Si les points sont alignés :

• La droite obtenue est la droite de Henry de la distribution.

• On en déduit que la variable statistique a une distribution gaussienne. Comme les fonctions
  de répartition des variables T et X, notées respectivement F et Π se correspondent, on a :
                            x −m                                                             X −m
  F( x is ) = Π( t is ) = Π( is   ) et la relation affine entre T et X est de la forme : T =
                                σ                                                             σ

• On peut alors déterminer graphiquement m et σ :

    L'abscisse du point d'intersection de la droite de Henry avec la droite d'équation t = 0 est m.

   L'abscisse du point d'intersection de la droite de Henry avec la droite d'équation t = 1 est
m+σ.




J-P LENOIR                                  Page 16                                   CHAPITRE 1

Contenu connexe

Tendances

S1 mq i - statistique descriptive i - résumés des chapitres
S1   mq i - statistique descriptive i - résumés des chapitresS1   mq i - statistique descriptive i - résumés des chapitres
S1 mq i - statistique descriptive i - résumés des chapitresAbdeslam ELMOUDEN
 
Presentation stat desc
Presentation stat descPresentation stat desc
Presentation stat deschassan1488
 
Cours Statistique descriptive pr Falloul
Cours Statistique descriptive pr FalloulCours Statistique descriptive pr Falloul
Cours Statistique descriptive pr FalloulProfesseur Falloul
 
GP Chapitre 2 : Les méthodes de prévision
GP Chapitre 2 : Les méthodes de prévision GP Chapitre 2 : Les méthodes de prévision
GP Chapitre 2 : Les méthodes de prévision ibtissam el hassani
 
S3.echantillonnage estimation-s3
S3.echantillonnage estimation-s3S3.echantillonnage estimation-s3
S3.echantillonnage estimation-s3Jamal Yasser
 
Analyse de régression multiple
Analyse de régression multipleAnalyse de régression multiple
Analyse de régression multipleAdad Med Chérif
 
ANOVA à 1 facteur, Analyse de variance, (One-way ANOVA)
ANOVA  à 1 facteur, Analyse de variance, (One-way ANOVA)ANOVA  à 1 facteur, Analyse de variance, (One-way ANOVA)
ANOVA à 1 facteur, Analyse de variance, (One-way ANOVA)Adad Med Chérif
 
Spss les premieres notions 1
Spss les premieres notions 1Spss les premieres notions 1
Spss les premieres notions 1Adad Med Chérif
 
Statistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptxStatistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptxTarekDHAHRI1
 
Test de corrélation simple et test de Normalité
Test de corrélation simple  et  test de Normalité  Test de corrélation simple  et  test de Normalité
Test de corrélation simple et test de Normalité Adad Med Chérif
 
Cours echantillonnage et estimations
Cours echantillonnage et estimationsCours echantillonnage et estimations
Cours echantillonnage et estimationsMehdi Rajawi
 
Tour d'horizon sur la E-logistique 2015
Tour d'horizon sur la E-logistique 2015Tour d'horizon sur la E-logistique 2015
Tour d'horizon sur la E-logistique 2015ENSAM Casablanca
 
chapitre 1 régression simple.pdf
chapitre 1 régression simple.pdfchapitre 1 régression simple.pdf
chapitre 1 régression simple.pdfAnassFarkadi
 

Tendances (20)

S1 mq i - statistique descriptive i - résumés des chapitres
S1   mq i - statistique descriptive i - résumés des chapitresS1   mq i - statistique descriptive i - résumés des chapitres
S1 mq i - statistique descriptive i - résumés des chapitres
 
statistique descriptive
statistique descriptivestatistique descriptive
statistique descriptive
 
Questionnaire sous spss
Questionnaire sous spssQuestionnaire sous spss
Questionnaire sous spss
 
Presentation stat desc
Presentation stat descPresentation stat desc
Presentation stat desc
 
Cours Statistique descriptive pr Falloul
Cours Statistique descriptive pr FalloulCours Statistique descriptive pr Falloul
Cours Statistique descriptive pr Falloul
 
GP Chapitre 2 : Les méthodes de prévision
GP Chapitre 2 : Les méthodes de prévision GP Chapitre 2 : Les méthodes de prévision
GP Chapitre 2 : Les méthodes de prévision
 
S3.echantillonnage estimation-s3
S3.echantillonnage estimation-s3S3.echantillonnage estimation-s3
S3.echantillonnage estimation-s3
 
Methodologie des enquete
Methodologie des enqueteMethodologie des enquete
Methodologie des enquete
 
Analyse de régression multiple
Analyse de régression multipleAnalyse de régression multiple
Analyse de régression multiple
 
Test khi deux
Test khi deuxTest khi deux
Test khi deux
 
ANOVA à 1 facteur, Analyse de variance, (One-way ANOVA)
ANOVA  à 1 facteur, Analyse de variance, (One-way ANOVA)ANOVA  à 1 facteur, Analyse de variance, (One-way ANOVA)
ANOVA à 1 facteur, Analyse de variance, (One-way ANOVA)
 
Spss les premieres notions 1
Spss les premieres notions 1Spss les premieres notions 1
Spss les premieres notions 1
 
Calcul des prévisions
Calcul des prévisionsCalcul des prévisions
Calcul des prévisions
 
[Fsjes tanger.com]stat1 exoscorrige-splanche2
[Fsjes tanger.com]stat1 exoscorrige-splanche2[Fsjes tanger.com]stat1 exoscorrige-splanche2
[Fsjes tanger.com]stat1 exoscorrige-splanche2
 
Statistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptxStatistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptx
 
Test de corrélation simple et test de Normalité
Test de corrélation simple  et  test de Normalité  Test de corrélation simple  et  test de Normalité
Test de corrélation simple et test de Normalité
 
Cours echantillonnage et estimations
Cours echantillonnage et estimationsCours echantillonnage et estimations
Cours echantillonnage et estimations
 
Tour d'horizon sur la E-logistique 2015
Tour d'horizon sur la E-logistique 2015Tour d'horizon sur la E-logistique 2015
Tour d'horizon sur la E-logistique 2015
 
(Cours régression)
(Cours régression)(Cours régression)
(Cours régression)
 
chapitre 1 régression simple.pdf
chapitre 1 régression simple.pdfchapitre 1 régression simple.pdf
chapitre 1 régression simple.pdf
 

En vedette

Cours stat. achrit tsge1
Cours stat. achrit tsge1Cours stat. achrit tsge1
Cours stat. achrit tsge1Ma Ac
 
Statistique descriptive S1et S2
Statistique descriptive S1et S2 Statistique descriptive S1et S2
Statistique descriptive S1et S2 samos56
 
Module 21 mathématique financière
Module 21   mathématique financièreModule 21   mathématique financière
Module 21 mathématique financièreLeo Nsync
 
Finance participative et cadre réglementaire
Finance participative et cadre réglementaireFinance participative et cadre réglementaire
Finance participative et cadre réglementaireFinPart
 
Mourabaha bancaire
Mourabaha bancaireMourabaha bancaire
Mourabaha bancairechafiimaher
 
Les finances islamiques en France
Les finances islamiques en FranceLes finances islamiques en France
Les finances islamiques en FranceASCAME
 
Marketing des produits et services bancaires islamiques: cas du Maroc
Marketing des produits et services bancaires islamiques: cas du MarocMarketing des produits et services bancaires islamiques: cas du Maroc
Marketing des produits et services bancaires islamiques: cas du MarocAbdellah El Jazzar HAJJI
 
Le risque de liquidité des banques islamiques
Le risque de liquidité des banques islamiquesLe risque de liquidité des banques islamiques
Le risque de liquidité des banques islamiquesAde Med
 
Finance Islamique Hassoune
Finance Islamique HassouneFinance Islamique Hassoune
Finance Islamique HassouneISEConsult
 
Techniques de financement islamiques au Maroc
Techniques de financement islamiques au Maroc Techniques de financement islamiques au Maroc
Techniques de financement islamiques au Maroc Ade Med
 
Paie et déclarations sociales et fiscales
Paie et déclarations sociales et fiscalesPaie et déclarations sociales et fiscales
Paie et déclarations sociales et fiscales穆罕 默德穆罕
 
Gestion Paie marocaine et RH avec openerp
Gestion Paie marocaine et RH avec openerpGestion Paie marocaine et RH avec openerp
Gestion Paie marocaine et RH avec openerpHORIYASOFT
 
Exercices d analyse financière
Exercices d analyse financièreExercices d analyse financière
Exercices d analyse financièreAbde LLatif
 
Les banques islamiques etude de positionnement - spécificités réglementaire...
Les banques islamiques   etude de positionnement - spécificités réglementaire...Les banques islamiques   etude de positionnement - spécificités réglementaire...
Les banques islamiques etude de positionnement - spécificités réglementaire...FINALIANCE
 
Analyse financière s4/s5
Analyse financière s4/s5Analyse financière s4/s5
Analyse financière s4/s5Rajae Moudrikah
 
Finance islamique et capital risque
Finance islamique et capital risqueFinance islamique et capital risque
Finance islamique et capital risqueMounia HM
 
la comptabilité générale Exercices de journale balance et grand livre
la comptabilité générale Exercices de journale balance et grand livrela comptabilité générale Exercices de journale balance et grand livre
la comptabilité générale Exercices de journale balance et grand livresemmah el
 
Tables statistiques
Tables statistiquesTables statistiques
Tables statistiquesYoucef63000
 
Tests relatifs aux variances et aux moyennes
Tests relatifs aux variances et aux moyennesTests relatifs aux variances et aux moyennes
Tests relatifs aux variances et aux moyennesYoucef63000
 

En vedette (20)

Cours stat. achrit tsge1
Cours stat. achrit tsge1Cours stat. achrit tsge1
Cours stat. achrit tsge1
 
Statistique descriptive S1et S2
Statistique descriptive S1et S2 Statistique descriptive S1et S2
Statistique descriptive S1et S2
 
Module 21 mathématique financière
Module 21   mathématique financièreModule 21   mathématique financière
Module 21 mathématique financière
 
Finance participative et cadre réglementaire
Finance participative et cadre réglementaireFinance participative et cadre réglementaire
Finance participative et cadre réglementaire
 
Mourabaha bancaire
Mourabaha bancaireMourabaha bancaire
Mourabaha bancaire
 
Les finances islamiques en France
Les finances islamiques en FranceLes finances islamiques en France
Les finances islamiques en France
 
Marketing des produits et services bancaires islamiques: cas du Maroc
Marketing des produits et services bancaires islamiques: cas du MarocMarketing des produits et services bancaires islamiques: cas du Maroc
Marketing des produits et services bancaires islamiques: cas du Maroc
 
Le risque de liquidité des banques islamiques
Le risque de liquidité des banques islamiquesLe risque de liquidité des banques islamiques
Le risque de liquidité des banques islamiques
 
Finance Islamique Hassoune
Finance Islamique HassouneFinance Islamique Hassoune
Finance Islamique Hassoune
 
La banque islamique
La banque islamiqueLa banque islamique
La banque islamique
 
Techniques de financement islamiques au Maroc
Techniques de financement islamiques au Maroc Techniques de financement islamiques au Maroc
Techniques de financement islamiques au Maroc
 
Paie et déclarations sociales et fiscales
Paie et déclarations sociales et fiscalesPaie et déclarations sociales et fiscales
Paie et déclarations sociales et fiscales
 
Gestion Paie marocaine et RH avec openerp
Gestion Paie marocaine et RH avec openerpGestion Paie marocaine et RH avec openerp
Gestion Paie marocaine et RH avec openerp
 
Exercices d analyse financière
Exercices d analyse financièreExercices d analyse financière
Exercices d analyse financière
 
Les banques islamiques etude de positionnement - spécificités réglementaire...
Les banques islamiques   etude de positionnement - spécificités réglementaire...Les banques islamiques   etude de positionnement - spécificités réglementaire...
Les banques islamiques etude de positionnement - spécificités réglementaire...
 
Analyse financière s4/s5
Analyse financière s4/s5Analyse financière s4/s5
Analyse financière s4/s5
 
Finance islamique et capital risque
Finance islamique et capital risqueFinance islamique et capital risque
Finance islamique et capital risque
 
la comptabilité générale Exercices de journale balance et grand livre
la comptabilité générale Exercices de journale balance et grand livrela comptabilité générale Exercices de journale balance et grand livre
la comptabilité générale Exercices de journale balance et grand livre
 
Tables statistiques
Tables statistiquesTables statistiques
Tables statistiques
 
Tests relatifs aux variances et aux moyennes
Tests relatifs aux variances et aux moyennesTests relatifs aux variances et aux moyennes
Tests relatifs aux variances et aux moyennes
 

Similaire à Statistique descriptive ch1

Stat2 Statistiques Descriptives
Stat2  Statistiques DescriptivesStat2  Statistiques Descriptives
Stat2 Statistiques DescriptivesJean-Louis ESTRADE
 
Statistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptxStatistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptxTarekDHAHRI1
 
Statistiquess2 111117154933-phpapp01
Statistiquess2 111117154933-phpapp01Statistiquess2 111117154933-phpapp01
Statistiquess2 111117154933-phpapp01printif
 
Nb statistique www.ista.ii.ma
Nb statistique www.ista.ii.maNb statistique www.ista.ii.ma
Nb statistique www.ista.ii.maGhanii Bakouri
 
TS-TC-Statistiques-manuel-stagiaire.pdf
TS-TC-Statistiques-manuel-stagiaire.pdfTS-TC-Statistiques-manuel-stagiaire.pdf
TS-TC-Statistiques-manuel-stagiaire.pdfFootballLovers9
 
étude d'une série statistiquebiostat.pdf
étude d'une série statistiquebiostat.pdfétude d'une série statistiquebiostat.pdf
étude d'une série statistiquebiostat.pdfHimaWari26
 
7490_chap02.pdf
7490_chap02.pdf7490_chap02.pdf
7490_chap02.pdfSaidSousdi
 
La statistique sanitaire - CSI--1.pptx
La statistique sanitaire - CSI--1.pptxLa statistique sanitaire - CSI--1.pptx
La statistique sanitaire - CSI--1.pptxtaoufikakabli3
 
La biométrie_étude de la variation des caractèr_231021_115212.pdf
La biométrie_étude de la variation des caractèr_231021_115212.pdfLa biométrie_étude de la variation des caractèr_231021_115212.pdf
La biométrie_étude de la variation des caractèr_231021_115212.pdfAbdennourAmrani
 
14284 chapitre-8-statistique
14284 chapitre-8-statistique14284 chapitre-8-statistique
14284 chapitre-8-statistiqueAlilo Mabhoour
 
9b567ad91347677ab6736e76a4115c80 statistique
9b567ad91347677ab6736e76a4115c80 statistique9b567ad91347677ab6736e76a4115c80 statistique
9b567ad91347677ab6736e76a4115c80 statistiqueSamad Oulasri
 
S1 mq i - statistique descriptive i - vocabulaire statistique
S1   mq i - statistique descriptive i - vocabulaire statistiqueS1   mq i - statistique descriptive i - vocabulaire statistique
S1 mq i - statistique descriptive i - vocabulaire statistiqueAbdeslam ELMOUDEN
 
Cours stat descr
Cours stat descrCours stat descr
Cours stat descrhassan1488
 

Similaire à Statistique descriptive ch1 (20)

Statistiques- S2
Statistiques- S2Statistiques- S2
Statistiques- S2
 
Stat2 Statistiques Descriptives
Stat2  Statistiques DescriptivesStat2  Statistiques Descriptives
Stat2 Statistiques Descriptives
 
Statistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptxStatistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptx
 
Statistiquess2 111117154933-phpapp01
Statistiquess2 111117154933-phpapp01Statistiquess2 111117154933-phpapp01
Statistiquess2 111117154933-phpapp01
 
Nb statistique www.ista.ii.ma
Nb statistique www.ista.ii.maNb statistique www.ista.ii.ma
Nb statistique www.ista.ii.ma
 
TS-TC-Statistiques-manuel-stagiaire.pdf
TS-TC-Statistiques-manuel-stagiaire.pdfTS-TC-Statistiques-manuel-stagiaire.pdf
TS-TC-Statistiques-manuel-stagiaire.pdf
 
étude d'une série statistiquebiostat.pdf
étude d'une série statistiquebiostat.pdfétude d'une série statistiquebiostat.pdf
étude d'une série statistiquebiostat.pdf
 
pmi définition variance
pmi définition variancepmi définition variance
pmi définition variance
 
7490_chap02.pdf
7490_chap02.pdf7490_chap02.pdf
7490_chap02.pdf
 
Cours1
Cours1Cours1
Cours1
 
La statistique sanitaire - CSI--1.pptx
La statistique sanitaire - CSI--1.pptxLa statistique sanitaire - CSI--1.pptx
La statistique sanitaire - CSI--1.pptx
 
La biométrie_étude de la variation des caractèr_231021_115212.pdf
La biométrie_étude de la variation des caractèr_231021_115212.pdfLa biométrie_étude de la variation des caractèr_231021_115212.pdf
La biométrie_étude de la variation des caractèr_231021_115212.pdf
 
14284 chapitre-8-statistique
14284 chapitre-8-statistique14284 chapitre-8-statistique
14284 chapitre-8-statistique
 
9b567ad91347677ab6736e76a4115c80 statistique
9b567ad91347677ab6736e76a4115c80 statistique9b567ad91347677ab6736e76a4115c80 statistique
9b567ad91347677ab6736e76a4115c80 statistique
 
S1 mq i - statistique descriptive i - vocabulaire statistique
S1   mq i - statistique descriptive i - vocabulaire statistiqueS1   mq i - statistique descriptive i - vocabulaire statistique
S1 mq i - statistique descriptive i - vocabulaire statistique
 
Cours stat descr
Cours stat descrCours stat descr
Cours stat descr
 
Statistiques descriptives
Statistiques descriptivesStatistiques descriptives
Statistiques descriptives
 
Stat1 Les Indices
Stat1  Les IndicesStat1  Les Indices
Stat1 Les Indices
 
STATISTIQUE-Cours
STATISTIQUE-CoursSTATISTIQUE-Cours
STATISTIQUE-Cours
 
Controle de gestion
Controle de gestionControle de gestion
Controle de gestion
 

Statistique descriptive ch1

  • 1. FIIFO 3 PROBABILITES - STATISTIQUES STATISTIQUE DESCRIPTIVE 1. MÉTHODE STATISTIQUE 1.1. HISTORIQUE ET DÉFINITION Aussi loin que l'on remonte dans le temps et dans l'espace ( en Chine et en Égypte, par exemple), les États ont toujours senti le besoin de disposer d'informations sur leurs sujets ou sur les biens qu'ils possèdent et produisent. Mais les recensements de population et de ressources, les statistiques (du latin status : état ) sont restées purement descriptives jusqu'au 17ème siècle. Puis s'est développé le calcul des probabilités et des méthodes statistiques sont apparues en Allemagne, en Angleterre et en France. Beaucoup de scientifiques de tous ordre ont apporté leur contribution au développement de cette science : PASCAL, HUYGENS, BERNOULLI, MOIVRE, LAPLACE, GAUSS, MENDEL, PEARSON, FISCHER etc.... Actuellement, beaucoup de domaines utilisent les méthodes statistiques ( médecine, agronomie, sociologie, industrie etc....). Définition : La Statistique, c'est l'étude des variations observables. C'est une méthode qui consiste à réunir des données chiffrées sur des ensembles nombreux, puis à les analyser et à les interpréter. 1.2. MÉTHODES STATISTIQUES • 1ère étape :On collecte des données : ◊ soit de manière exhaustive ◊ soit par sondage ème • 2 étape : On trie les données que l’on organise en tableaux, diagrammes, etc... • 3ème étape : On interprète les résultats : on les compare avec ceux déduits de la théorie des probabilités. On pourra donc : ⇒ évaluer une grandeur statistique comme la moyenne ou la variance (estimateurs, intervalles de confiance ). ⇒ savoir si deux populations sont comparables (tests d’hypothèses). ⇒ déterminer si deux grandeurs sont liées et de quelle façon ( corrélation, ajustement analytique). J-P LENOIR Page 3 CHAPITRE 1
  • 2. FIIFO 3 PROBABILITES - STATISTIQUES Les conclusions, toujours entachées d'un certain pourcentage d'incertitude, nous permettent alors de prendre une décision. 2. SÉRIES STATISTIQUES A UNE VARIABLE 2.1. TERMINOLOGIE POPULATION : Ensemble que l'on observe et qui sera soumis à une analyse statistique. Chaque élément de cet ensemble est un individu ou unité statistique. ÉCHANTILLON : C'est un sous ensemble de la population considérée. Le nombre d'individus dans l’échantillon est la taille de l'échantillon. CARACTÈRE : C'est la propriété ou l'aspect singulier que l'on se propose d'observer dans la population ou l'échantillon. Un caractère qui fait le sujet d'une étude porte aussi le nom de variable statistique. Différents types de variables statistiques : • Lorsque la variable ne se prête pas à des valeurs numériques, elle est dite qualitative (exemple : opinions politiques, couleurs des yeux...) .Elle peut être ordonnée ou non, dichotomique ou non. • Lorsque la variable peut être exprimée numériquement, elle est dite quantitative ( ou mesurable). Dans ce cas, elle peut être discontinue ou continue. ♦ Elle est discontinue si elle ne prend que des valeurs isolées les unes des autres. Une variable discontinue qui ne prend que des valeurs entières est dite discrète (exemple : nombre d'enfants d'une famille). ♦ Elle est dite continue lorsqu'elle peut prendre toutes les valeurs d'un intervalle fini ou infini (exemple : diamètre de pièces, salaires...). 2.2. COMMENT ORGANISER LES DONNÉES On regroupe toutes les données de la série statistique dans un tableau indiquant la répartition des individus selon le caractère étudié. Le regroupement s'effectue par classes : • Si le caractère est qualitatif ou discontinu, une classe contient tous les individus ayant la même modalité ou la même valeur du caractère. • Si le caractère est continu, une classe est un intervalle. ◊ Pour construire ces intervalles, on respecte les règles suivantes : 1. Le nombre de classes est compris entre 5 et 20 (de préférence entre 6 et 12) 2. Chaque fois que cela est possible, les amplitudes des classes sont égales. 3. Chaque classe (sauf la dernière) contient sa borne inférieure mais pas sa borne supérieure. ◊ Dans les calculs, une classe sera représentée par son centre, qui est le milieu de l'intervalle. J-P LENOIR Page 4 CHAPITRE 1
  • 3. FIIFO 3 PROBABILITES - STATISTIQUES ◊ Une fois la classe constituée, on considère les individus répartis uniformément entre les deux bornes ( ce qui entraîne une perte d'informations par rapport aux données brutes). J-P LENOIR Page 5 CHAPITRE 1
  • 4. FIIFO 3 PROBABILITES - STATISTIQUES ◊ Que faut-il indiquer pour chaque classe ? 1. L’effectif : nombre d'individus de la classe : on le note ni (i est l’indice de la classe). 2. La fréquence : proportion d'individus de la population ou de l'échantillon appartenant à la classe : on la note fi. ni fi et ni sont liés par : f i = où N est le nombre total d’individus dans la population. N Remarque : On peut remplacer fi par fi×100 qui représente alors un pourcentage. k k On a toujours : ∑ ni = N 0 ≤ fi ≤ 1 ∑f i = 1 i =1 i =1 où k représente le nombre de classes 3. L'effectif (ou la fréquence) cumulé (e) : effectif ( ou fréquence) de la classe augmenté (e) de ceux (ou celles) des classes précédentes(lorsque la variable statistique est quantitative). La fréquence cumulée est une fonction F de la borne supérieure de la classe (dans le cas d’une variable statistique continue). 2.3. DIAGRAMMES Ils servent à visualiser la répartition des individus. • Pour une variable statistique qualitative : On utilise des diagrammes à secteurs circulaires, des diagrammes en tuyaux d'orgue, des diagrammes en bandes. Le principe est de représenter des aires proportionnelles aux fréquences de la variable statistique. • Pour une variable statistique discrète : On utilise un diagramme différentiel en bâtons, complété du diagramme des fréquences cumulées appelé diagramme cumulatif. Le diagramme cumulatif est la représentation graphique d’une fonction F, appelée fonction de répartition de la variable statistique. Exemple : nombre d’erreurs d’assemblage sur un ensemble d’appareils J-P LENOIR Page 6 CHAPITRE 1
  • 5. FIIFO 3 PROBABILITES - STATISTIQUES nombre nombre fréquences d’erreurs d’appareils cumulées 0 101 0.26 1 140 0.61 2 92 0.84 3 42 0.94 4 18 0.99 5 3 1 Diagramme cumulatif nombre d’erreurs d’assemblage • Pour une variable statistique continue : 1. Le diagramme représentant la série est un histogramme : ce sont des rectangles juxtaposés dont chacune des bases est égale à l’intervalle de chaque classe et dont la hauteur est telle que l’aire de chaque rectangle soit proportionnelle aux effectifs(histogramme des effectifs) ou aux fréquences de la classe correspondante (histogramme des fréquences). 2. On obtient le polygone des effectifs (ou des fréquences) en reliant les milieux des bases supérieures des rectangles. 3. La courbe cumulative ( ou polygone des fréquences cumulées ) est obtenue en portant les points dont les abscisses représentent la borne supérieure de chaque classe et les ordonnées les fréquences cumulées correspondantes, puis en reliant ces J-P LENOIR Page 7 CHAPITRE 1
  • 6. FIIFO 3 PROBABILITES - STATISTIQUES points par des segments de droite. Son équivalent dans la théorie probabiliste est la fonction de répartition. J-P LENOIR Page 8 CHAPITRE 1
  • 7. FIIFO 3 PROBABILITES - STATISTIQUES Exemple : nombre de ventes effectuées en un mois par 50 employés d’une compagnie Dans cet exemple la variable statistique( le nombre de ventes), quoique discrète, doit être traitée comme une variable continue car elle prend un grand nombre de valeurs. HISTOGRAMME nombre de nombre fréquences ventes : x d’employés cumulées 80 ≤ x < 90 2 0.04 90 ≤ x < 100 6 0.16 100 ≤ x < 110 10 0.36 110 ≤ x < 120 14 0.64 120 ≤ x < 130 9 0.82 130 ≤ x < 140 7 0.96 140 ≤ x < 150 2 1 médiane On remarque que : → F est une fonction croissante. → On a toujours : 0 ≤ F( x) ≤ 1 . 3. CARACTÉRISTIQUES NUMÉRIQUES D’UNE SÉRIE QUANTITATIVE 3.1. CARACTÉRISTIQUES DE POSITION 3.1.1. Le mode Le mode, désigné par Mo est la valeur de la variable statistique la plus fréquente. J-P LENOIR Page 9 CHAPITRE 1
  • 8. FIIFO 3 PROBABILITES - STATISTIQUES Dans le cas d'une variable statistique continue, on parle plutôt de classe modale. NB : Le mode ou la classe modale n'est pas obligatoirement unique. 3.1.2. La médiane La médiane, désignée par Me, est la valeur de la variable telle qu'il y ait autant d'observations, en dessous d'elle qu'au dessus ou, ce qui revient au même, la valeur correspondant à 50% des observations. Comment la déterminer? • Si la variable est discrète : On désigne par n le nombre d’observations . n + 1 ème ⇒ Si n est impair : Me est la ( ) observation. 2 ⇒ Si n est pair : n = 2k. Me est la moyenne arithmétique des deux observations centrales. k ème observation + ( k + 1) ème observation Me = 2 • Si la variable est continue, Me vérifie F(Me) = 0.5 ,où F est la fonction de répartition de la variable. On détermine alors un intervalle médian(intervalle contenant la médiane), puis on procède à l'intérieur de cette classe à une interpolation linéaire. Généralisation : notion de quantiles Quantile d'ordre 1/4 : C’est la valeur Q1 tel que F(Q1) = 0.25. Quantile d'ordre 3/4 : C’est la valeur Q3 tel que F(Q3) = 0.75 (on a Me = Q2). Déciles d'ordre 1/10, 2/10.... : F(D1)=0.1, F(D2)=0.2... Remarque : Ces éléments se déterminent facilement à partir des courbes n n cumulatives, en cherchant les abscisses des points d'ordonnées pour Me, pour 2 4 Q1... 3.1.3. La moyenne Lorsque x désigne la variable statistique, la valeur moyenne, ou moyenne de la série se note m ou x . Elle est l'analogue d'un centre de gravité. 1e r cas : si les observations ne sont pas groupées (la série est dite non classée) J-P LENOIR Page 10 CHAPITRE 1
  • 9. FIIFO 3 PROBABILITES - STATISTIQUES 1 n x= ∑x n j =1 j n = effectif total xj = j ème valeur de la variable J-P LENOIR Page 11 CHAPITRE 1
  • 10. FIIFO 3 PROBABILITES - STATISTIQUES 2ème cas : si les observations sont groupées ( la série est dite classée) xi = centre de la classe i k k 1 x= ∑n x = n i =1 i i ∑f x i i ni = effectif de la classe i i =1 n= effectif total fi = fréquence de la classe i On effectue en fait ici une moyenne arithmétique pondérée. NB : Dans le cas d’une variable continue, cette moyenne pondérée n'est qu'une valeur approchée de la vraie valeur moyenne de la série car on remplace chaque xj par le centre de la classe à laquelle il appartient. Pourquoi utiliser la moyenne arithmétique? Elle a été choisie parmi d'autres types de moyenne (géométrique, harmonique...) car elle possède une propriété extrêmement intéressante: Lorsqu'on se livre à des observations scientifiques, les mesures ne sont pas toujours exactement identiques d'une fois sur l'autre, même lorsque les conditions semblent être similaires. Il se produit ce que l’on appelle une erreur d'observation . On a la relation suivante : valeur observée = valeur exacte + erreur d'observation avec: xi = valeur observée xe = valeur exacte xi - xe = erreur d'observation On décide alors de prendre pour xe la valeur qui minimise les erreurs d’observation , en fait la moyenne des carrés de ces erreurs ( critère des moindres carrés) . Le calcul prouve que la meilleure valeur estimant xe suivant ce critère est x . Propriété : La moyenne x des valeurs observées d’une grandeur x correspond à la meilleure estimation de xe . Cela ne signifie pas que x soit la valeur exacte xe de la grandeur observée mais que c'est la meilleure évaluation possible que l'on puisse en faire selon le critère des moindres carrés. 3.2. CARACTÉRISTIQUES DE DISPERSION 3.2.1. L’étendue L'étendue, notée e, représente la différence entre les valeurs extrêmes de la distribution : e = xn-x1. J-P LENOIR Page 12 CHAPITRE 1
  • 11. FIIFO 3 PROBABILITES - STATISTIQUES 3.2.2. L’intervalle interquartile L'intervalle interquartile, noté I, est la différence entre les deux quartiles Q3 et Q1 : I = Q3 - Q1 Cet intervalle contient 50% de la population en en éliminant 25% à chaque extrémité. Cette caractéristique est nettement meilleure que l'étendue. 3.2.3. La variance C'est la caractéristique de dispersion la plus utilisée avec l'écart quadratique moyen. 1er cas : série non classée 1 n Vx = ∑ ( x j − x ) 2 n j=1 2ème cas : série classée 1 k k Vx = ∑ n i (x i − x) = ∑ f i (x i − x) 2 2 n i=1 i =1 Dans le cas d’une variable statistique continue, xi représente le centre de la ième classe. La variance est donc toujours positive ou nulle. Les formules ci-dessus imposent de calculer les différences (xi- x )2 ce qui est assez fastidieux. On peut éviter cet inconvénient en utilisant le théorème de Koenig. Autre expression de la variance : Théorème de KOENIG 1er cas: série non classée 1 n 2 Vx = ( ∑ x j ) − x 2 n j=1 2ème cas: série classée 1 k k Vx = ( ∑ n i x i ) − x = ( ∑ f i x i 2 ) − x 2 2 2 n i=1 i =1 Démonstration: k k k k k k Vx = ∑ f i ( x i − x ) 2 = ∑ f i ( x i 2 − 2 x i x + x 2 ) = ∑ f i x i 2 − 2 x ( ∑ f i x i ) + x 2 ∑ f i = ∑ f i x i 2 − x 2 i =1 i =1 i =1 i =1 i =1 i =1 J-P LENOIR Page 13 CHAPITRE 1
  • 12. FIIFO 3 PROBABILITES - STATISTIQUES k k car : ∑f x i i =x et ∑f i =1 i =1 i =1 3.2.4. Écart quadratique moyen Par définition, l’écart quadratique moyen d’une série statistique est la racine carrée de la variance. On le note sx A la différence de la variance qui correspond à un carré, l'écart quadratique moyen est homogène à la variable statistique et s'exprime dans les mêmes unités. Il permet de mesurer la dispersion de la distribution statistique autour de sa valeur moyenne. 3.3. DÉTERMINATION GRAPHIQUE DE LA MOYENNE ET DE L’ÉCART QUADRATIQUE MOYEN D’UNE DISTRIBUTION GAUSSIENNE A L’AIDE DE LA DROITE DE HENRY On connaît plusieurs distributions statistiques particulières donnant la fréquence théorique d'apparition d'une valeur x en fonction de x ( on reviendra en détail sur ces notions dans les chapitres suivants) . L'une des plus importantes est la distribution gaussienne ou distribution normale. La fréquence théorique d’apparition d'une valeur xi est donnée par : 2 1  xi − m    −   1 2 σ    f (x i ) = e   σ 2π où m est la moyenne théorique et σ l’écart-type théorique de la distribution gaussienne. La représentation graphique de cette fonction f' est la fameuse courbe "en cloche". J-P LENOIR Page 14 CHAPITRE 1
  • 13. FIIFO 3 PROBABILITES - STATISTIQUES X −m On associe à la variable X , la variable T = ,appelée variable gaussienne centrée σ réduite (sa moyenne est nulle et son écart-type égal à 1). J-P LENOIR Page 15 CHAPITRE 1
  • 14. FIIFO 3 PROBABILITES - STATISTIQUES Méthode de la DROITE DE HENRY : Elle permet à la fois : 1) De tester si la distribution donnée est gaussienne. 2) Si elle l’est, de déterminer m et σ. Il faut pour cela utiliser du papier gausso-arithmétique contenant : 1) en abscisses : les valeurs x, prises par la variable X. 2) en ordonnées : • à droite : les valeurs t de la variable gaussienne centrée réduite T. • à gauche : les valeurs de la fonction de répartition de la loi T. Que faire? 1. On calcule pour chaque valeur de xis, borne supérieure d'une classe, la fréquence cumulée correspondante F(xis). 2. On porte les points de coordonnées(xis , F(xis) sur le papier gausso-arithmétique (en utilisant l'échelle de gauche des ordonnées). Si les points sont alignés : • La droite obtenue est la droite de Henry de la distribution. • On en déduit que la variable statistique a une distribution gaussienne. Comme les fonctions de répartition des variables T et X, notées respectivement F et Π se correspondent, on a : x −m X −m F( x is ) = Π( t is ) = Π( is ) et la relation affine entre T et X est de la forme : T = σ σ • On peut alors déterminer graphiquement m et σ : L'abscisse du point d'intersection de la droite de Henry avec la droite d'équation t = 0 est m. L'abscisse du point d'intersection de la droite de Henry avec la droite d'équation t = 1 est m+σ. J-P LENOIR Page 16 CHAPITRE 1