Cours - Méthodes
1. Diagramme en boîte et écart-interquartile
DÉFINITION : Diagramme en boîte
Le diagramme en boîte d’une ...
Cours - Méthodes
DÉFINITION : Intervalle et écart interquartile
Pour une série statistique de premier et troisième quartil...
Cours - Méthodes
2. Variance et écart-type
DÉFINITION : Variance et écart-type
Soit x1, x2, . . . , xn une série statistiq...
Cours - Méthodes
MÉTHODE 4 Déterminer l’écart-type avec la calculatrice : série de valeurs Ex. 23 p. 257
Exercice d’applic...
Cours - Méthodes
REMARQUE : La moyenne x et l’écart-type σ s’expriment dans la même unité que les valeurs
de la série (ana...
Prochain SlideShare
Chargement dans…5
×

Cours statistiques

630 vues

Publié le

Cours sur les statistiques

Publié dans : Formation
  • Soyez le premier à commenter

Cours statistiques

  1. 1. Cours - Méthodes 1. Diagramme en boîte et écart-interquartile DÉFINITION : Diagramme en boîte Le diagramme en boîte d’une série statistique est le graphique suivant : Valeur minimale Valeur maximale médianeQ1 Q3 où l’axe est gradué régulièrement de sorte que l’on puisse y faire figurer les valeurs minimale et maximale, le 1er quartile Q1, la médiane et le 3e quartile Q3 (voir lexique pour les rappels). MÉTHODE 1 Tracer un diagramme en boîte Ex. 13 p. 255 Exercice d’application Dans une exploitation agricole, on a prélevé un échantillon de 125 tomates cerise afin de vérifier leur calibrage. On obtient les résultats suivants : Diamètre (en mm) 35 36 37 38 39 40 Effectif 21 27 16 23 17 21 Dresser le diagramme en boîte de cette série statistique. Correction On peut commencer par calculer les effectifs cumulés croissants : Diamètre (en mm) 35 36 37 38 39 40 Effectifs cumulés croissants 21 48 64 87 104 125 On détermine ensuite les valeurs nécessaires au tracé du diagramme en boîte. • La valeur minimale de cette série est 35 et sa valeur maximale est 40. • On calcule 125 2 = 62, 5 donc la médiane est la 63e valeur c’est-à-dire 37. • On calcule 125 4 = 31, 25 donc Q1 est la 32e valeur c’est-à-dire Q1 = 36. • On calcule 125 × 3 4 = 93, 75 donc Q3 est la 94e valeur c’est-à-dire Q3 = 39. On en déduit alors le diagramme en boîte de la série : 34 35 36 37 38 39 40 41 Min Max MédianeQ1 Q3 REMARQUE : Pour une série constituée d’un nombre suffisamment élevé de valeurs diffé- rentes, le diagramme en boîte sépare la série en quatre sous-séries d’effectifs sensiblement égaux, regroupant donc chacune environ 25 % des valeurs. 250 Chapitre SP1. Statistiques
  2. 2. Cours - Méthodes DÉFINITION : Intervalle et écart interquartile Pour une série statistique de premier et troisième quartiles Q1 et Q3 : l’intervalle interquartile de la série est [Q1 ; Q3] ; l’écart interquartile est Q3 − Q1. Exemple Dans l’exemple précédent, l’intervalle interquartile est [36 ; 39] et l’écart interquar- tile est 39 − 36 = 3. REMARQUES : L’intervalle interquartile contient au moins (et environ, si la série est constituée d’un nombre suffisamment élevé de valeurs différentes) la moitié des valeurs de la série. L’écart interquartile est insensible aux valeurs extrêmes. L’écart interquartile est un indicateur de dispersion de la série : plus il est faible, plus la série est homogène. D’une manière générale, un indicateur qui permet de décrire les écarts entre différentes valeurs de la série est dit « de dispersion ». C’est le cas de l’étendue par exemple. MÉTHODE 2 Comparer deux séries statistiques Ex. 15 p. 256 Tracer les diagrammes en boîte de deux séries (ou plus) sur le même graphique permet de les comparer, notamment en observant leur écart interquartile respectif, même si elles n’ont pas le même effectif. Exercice d’application On donne ci-dessous les diagrammes en boîte des séries statistiques donnant les temps des coureurs des deux demi-finales du 100 m masculin aux championnats du monde d’athlétisme de 2013. 9,8 9,9 10,0 10,1 10,2 10,3 10,4 Temps (en s) Demi-finale no 1 Demi-finale no 2 1) Dans quelle demi-finale les coureurs ont-ils été globalement les plus rapides ? 2) Laquelle a été la plus équilibrée ? Correction 1) On remarque que tous les indicateurs (minimum, Q1, médiane, Q3 et maximum) de la demi- finale no 2 sont inférieurs à ceux de la demi-finale no 1 : les coureurs de la demi-finale no 2 ont donc été globalement plus rapides. 2) Quand on mesure avec une règle graduée, on constate que l’écart-interquartile est plus petit pour la demi-finale no 2 que pour la demi-finale no 1 (et l’étendue sensiblement égale), on peut donc penser que la demi-finale no 2 a été plus équilibrée. Chapitre SP1. Statistiques 251
  3. 3. Cours - Méthodes 2. Variance et écart-type DÉFINITION : Variance et écart-type Soit x1, x2, . . . , xn une série statistique de moyenne x. La variance V est donnée par la formule : V = (x1 − x)2 + (x2 − x)2 + . . . + (xn − x)2 n = n ∑ i=1 (xi − x)2 n . Si l’on peut écrire la série sous forme de tableau d’effectifs : Valeur x1 x2 ... xp Effectif n1 n2 ... np La formule précédente de la variance devient : V = n1 (x1 − x)2 + n2 (x2 − x)2 + . . . + np (xn − x)2 n1 + n2 + . . . + np = p ∑ i=1 ni (xi − x)2 p ∑ i=1 ni . L’écart-type σ d’une série statistique est σ = √ V. MÉTHODE 3 Déterminer l’écart-type Ex. 23 p. 257 et Ex. 24 p. 257 Exercice d’application 1) Déterminer l’écart-type σ de la série de valeurs 2 ; 3 ; 4 ; 8 ; 9 ; 12 ; 13 et 41. 2) Déterminer l’écart-type σ de la série. Valeur 0 1 2 3 Effectif 4 18 6 4 Correction 1) On commence par calculer la moyenne ¯x = 2 + 3 + 4 + 8 + 9 + 12 + 13 + 41 8 = 11, 5. On en déduit que la variance est : V = (2 − 11, 5)2 + (3 − 11, 5)2 + (4 − 11, 5)2 + . . . + (13 − 11, 5)2 + (41 − 11, 5)2 8 V = 1110 8 = 138, 75. L’écart-type est σ = √ 138, 75 ≈ 11, 8. 2) On commence par calculer la moyenne x = 4 × 0 + 18 × 1 + 6 × 2 + 4 × 3 4 + 18 + 6 + 4 = 1,312 5. On en déduit que la variance est : V = 4 (0 − 1,312 5)2 + 18 (1 − 1,312 5)2 + 6 (2 − 1,312 5)2 + 4 (3 − 1,312 5)2 4 + 18 + 6 + 4 = 22,875 32 ≈ 0,715. L’écart-type est σ = 22,875 32 ≈ 0,8. 252 Chapitre SP1. Statistiques
  4. 4. Cours - Méthodes MÉTHODE 4 Déterminer l’écart-type avec la calculatrice : série de valeurs Ex. 23 p. 257 Exercice d’application Déterminer l’écart-type σ de la série de valeurs 2 ; 3 ; 4 ; 8 ; 9 ; 12 ; 13 et 41. Correction Calculatrice TI • On appuie sur la touche ; • on choisit le menu 1:Edite... ; • on saisit les valeurs 2 ; 3 ; etc. dans L1 ; • on appuie sur la touche puis on appuie sur la flèche de droite pour se déplacer sur CALC ; • on choisit 1:Stats 1-Var puis on écrit L1 avec puis afin d’obtenir et on valide avec ; • l’écart-type est la valeur donc σ ≈ 11, 8 (et la moyenne est x = 11,5). Calculatrice CASIO • On appuie sur la touche et on choisit le menu 2 : STAT ; • on saisit les valeurs 2 ; 3 ; etc. dans List 1 ; • on choisit le menu CALC puis SET ; • on règle 1Var XLIST sur List 1 et 1Var Freq sur 1 puis on appuie sur la touche ; • on choisit le menu 1VAR ; • l’écart-type est donc σ ≈ 11, 8 (et la moyenne est x = 11,5). MÉTHODE 5 Déterminer l’écart-type avec la calculatrice : tableau d’effectifs Ex. 24 p. 257 Exercice d’application Déterminer l’écart-type σ de la série. Valeur 0 1 2 3 Effectif 4 18 6 4 Correction Calculatrice TI • On appuie sur la touche ; • on choisit le menu 1:Edite... ; • on saisit les valeurs 0 ; 1 ; 2 et 3 dans L1 et les effectifs 4 ; 18 ; 6 et 4 dans L2 ; • on appuie sur la touche puis on appuie sur la flèche de droite pour se déplacer sur CALC ; • on choisit 1:Stats 1-Var puis on écrit L1,L2 afin d’obtenir et on valide avec ; • l’écart-type est donc σ ≈ 0, 8 (et la moyenne est x ≈ 1, 3125). Calculatrice CASIO • On appuie sur la touche et on choisit le menu 2 : STAT ; • on saisit les valeurs 0 ; 1 ; 2 et 3 dans List 1 et les effectifs 4 ; 18 ; 6 et 4 dans List 2 ; • on choisit le menu CALC ; • on règle 1Var XLIST sur List 1 et 1Var Freq sur List 2 puis on appuie sur la touche ; • on choisit le menu 1VAR ; • l’écart-type est donc σ ≈ 0, 8 (et la moyenne est x ≈ 1, 3125). REMARQUES : La variance et l’écart-type sont des indicateurs de dispersion autour de la moyenne, plus ils sont petits, plus la série est homogène. Généralement, on détermine la variance et l’écart-type à l’aide de la calculatrice. Chapitre SP1. Statistiques 253
  5. 5. Cours - Méthodes REMARQUE : La moyenne x et l’écart-type σ s’expriment dans la même unité que les valeurs de la série (analyse dimensionnelle). Cela a un sens de parler des intervalles [x − σ ; x + σ], [x − 2σ ; x + 2σ], etc. qui sont souvent utilisés en statistiques. Exemple Lors d’un TP ayant pour but de mesurer la masse volumique d’un métal, exprimée en g/cm3, les sept groupes d’une classe ont trouvé : 7,95 ; 8,02 ; 7,61 ; 8,11 ; 8,02 ; 8,05 ; 8,04. La calculatrice donne la moyenne x ≈ 7,97 g/cm3 et l’écart-type σ ≈ 0,15 g/cm3 de cette série de valeurs. L’intervalle [x − 2σ ; x + 2σ] est donc [7,67 ; 8,27] à 10−2 près, dont on peut remarquer qu’il contient 6 des 7 valeurs, soit 6 7 ≈ 86 % des valeurs. 3. Résumé d’une série statistique MÉTHODE 6 Résumer une série statistique Ex. 30 p. 258 On peut résumer une série statistique, c’est-à-dire en donner une tendance globale, par : • le couple médiane-écart interquartile, qui n’est pas sensible aux valeurs extrêmes : on le privilégie donc quand on étudie une série dont les valeurs extrêmes sont moins importantes ou moins significatives que les valeurs centrales ; • le couple moyenne-écart-type, qui est sensible aux valeurs extrêmes : on le privilégie donc quand on étudie une série dont les valeurs extrêmes sont aussi importantes ou aussi signi- ficatives que les autres. Dans les deux cas, on utilise un indicateur de position (la médiane ou la moyenne) et un indicateur de dispersion (l’écart interquartile ou l’écart-type). Exercice d’application Pour chacune des deux situations suivantes, dire s’il est préférable de résumer la série sta- tistique correspondante par le couple médiane-écart interquartile ou par le couple moyenne- écart-type. • Situation 1 : On étudie la série statistique des salaires et allocations chômage des Français en 2014 en vue d’en observer les inégalités. • Situation 2 : On étudie les résultats d’une enquête d’un fabricant de chaussures portant sur la taille de chaussure de ses clients afin de déterminer la production de quelles pointures privilégier. Correction • Dans la situation 1, les valeurs extrêmes sont très importantes puisque ce sont elles qui illustrent les plus grandes inégalités : on préférera donc le couple moyenne-écart-type. • Dans la situation 2, le fabricant souhaite savoir quelles pointures sont les plus portées et ne s’intéresse donc pas aux très petites et très grandes pointures peu portées par ses clients mais plutôt aux valeurs centrales : on préférera donc le couple médiane-écart interquartile. 254 Chapitre SP1. Statistiques

×