1. Cours - Méthodes
1. Diagramme en boîte et écart-interquartile
DÉFINITION : Diagramme en boîte
Le diagramme en boîte d’une série statistique est le graphique suivant :
Valeur minimale Valeur maximale
médianeQ1 Q3
où l’axe est gradué régulièrement de sorte que l’on puisse y faire figurer les valeurs minimale
et maximale, le 1er quartile Q1, la médiane et le 3e quartile Q3 (voir lexique pour les rappels).
MÉTHODE 1 Tracer un diagramme en boîte Ex. 13 p. 255
Exercice d’application
Dans une exploitation agricole, on a prélevé un échantillon de 125 tomates cerise afin de vérifier
leur calibrage.
On obtient les résultats suivants :
Diamètre (en mm) 35 36 37 38 39 40
Effectif 21 27 16 23 17 21
Dresser le diagramme en boîte de cette série statistique.
Correction
On peut commencer par calculer les effectifs cumulés croissants :
Diamètre (en mm) 35 36 37 38 39 40
Effectifs cumulés
croissants
21 48 64 87 104 125
On détermine ensuite les valeurs nécessaires au tracé du diagramme en boîte.
• La valeur minimale de cette série est 35 et sa valeur maximale est 40.
• On calcule
125
2
= 62, 5 donc la médiane est la 63e valeur c’est-à-dire 37.
• On calcule
125
4
= 31, 25 donc Q1 est la 32e valeur c’est-à-dire Q1 = 36.
• On calcule
125 × 3
4
= 93, 75 donc Q3 est la 94e valeur c’est-à-dire Q3 = 39.
On en déduit alors le diagramme en boîte de la série :
34 35 36 37 38 39 40 41
Min Max
MédianeQ1 Q3
REMARQUE : Pour une série constituée d’un nombre suffisamment élevé de valeurs diffé-
rentes, le diagramme en boîte sépare la série en quatre sous-séries d’effectifs sensiblement
égaux, regroupant donc chacune environ 25 % des valeurs.
250 Chapitre SP1. Statistiques
2. Cours - Méthodes
DÉFINITION : Intervalle et écart interquartile
Pour une série statistique de premier et troisième quartiles Q1 et Q3 :
l’intervalle interquartile de la série est [Q1 ; Q3] ;
l’écart interquartile est Q3 − Q1.
Exemple Dans l’exemple précédent, l’intervalle interquartile est [36 ; 39] et l’écart interquar-
tile est 39 − 36 = 3.
REMARQUES :
L’intervalle interquartile contient au moins (et environ, si la série est constituée d’un
nombre suffisamment élevé de valeurs différentes) la moitié des valeurs de la série.
L’écart interquartile est insensible aux valeurs extrêmes.
L’écart interquartile est un indicateur de dispersion de la série : plus il est faible, plus la
série est homogène.
D’une manière générale, un indicateur qui permet de décrire les écarts entre différentes
valeurs de la série est dit « de dispersion ». C’est le cas de l’étendue par exemple.
MÉTHODE 2 Comparer deux séries statistiques Ex. 15 p. 256
Tracer les diagrammes en boîte de deux séries (ou plus) sur le même graphique permet de
les comparer, notamment en observant leur écart interquartile respectif, même si elles n’ont
pas le même effectif.
Exercice d’application
On donne ci-dessous les diagrammes en boîte des séries statistiques donnant les temps des
coureurs des deux demi-finales du 100 m masculin aux championnats du monde d’athlétisme
de 2013.
9,8 9,9 10,0 10,1 10,2 10,3 10,4 Temps (en s)
Demi-finale no 1
Demi-finale no 2
1) Dans quelle demi-finale les coureurs ont-ils été globalement les plus rapides ?
2) Laquelle a été la plus équilibrée ?
Correction
1) On remarque que tous les indicateurs (minimum, Q1, médiane, Q3 et maximum) de la demi-
finale no 2 sont inférieurs à ceux de la demi-finale no 1 : les coureurs de la demi-finale no 2
ont donc été globalement plus rapides.
2) Quand on mesure avec une règle graduée, on constate que l’écart-interquartile est plus petit
pour la demi-finale no 2 que pour la demi-finale no 1 (et l’étendue sensiblement égale), on
peut donc penser que la demi-finale no 2 a été plus équilibrée.
Chapitre SP1. Statistiques 251
3. Cours - Méthodes
2. Variance et écart-type
DÉFINITION : Variance et écart-type
Soit x1, x2, . . . , xn une série statistique de moyenne x.
La variance V est donnée par la formule :
V =
(x1 − x)2
+ (x2 − x)2
+ . . . + (xn − x)2
n
=
n
∑
i=1
(xi − x)2
n
.
Si l’on peut écrire la série sous forme de tableau d’effectifs :
Valeur x1 x2 ... xp
Effectif n1 n2 ... np
La formule précédente de la variance devient :
V =
n1 (x1 − x)2
+ n2 (x2 − x)2
+ . . . + np (xn − x)2
n1 + n2 + . . . + np
=
p
∑
i=1
ni (xi − x)2
p
∑
i=1
ni
.
L’écart-type σ d’une série statistique est σ =
√
V.
MÉTHODE 3 Déterminer l’écart-type Ex. 23 p. 257 et Ex. 24 p. 257
Exercice d’application
1) Déterminer l’écart-type σ de la série de valeurs 2 ; 3 ; 4 ; 8 ; 9 ; 12 ; 13 et 41.
2) Déterminer l’écart-type σ de la série.
Valeur 0 1 2 3
Effectif 4 18 6 4
Correction
1) On commence par calculer la moyenne ¯x =
2 + 3 + 4 + 8 + 9 + 12 + 13 + 41
8
= 11, 5.
On en déduit que la variance est :
V =
(2 − 11, 5)2 + (3 − 11, 5)2 + (4 − 11, 5)2 + . . . + (13 − 11, 5)2 + (41 − 11, 5)2
8
V =
1110
8
= 138, 75.
L’écart-type est σ =
√
138, 75 ≈ 11, 8.
2) On commence par calculer la moyenne x =
4 × 0 + 18 × 1 + 6 × 2 + 4 × 3
4 + 18 + 6 + 4
= 1,312 5.
On en déduit que la variance est :
V =
4 (0 − 1,312 5)2
+ 18 (1 − 1,312 5)2
+ 6 (2 − 1,312 5)2
+ 4 (3 − 1,312 5)2
4 + 18 + 6 + 4
=
22,875
32
≈ 0,715.
L’écart-type est σ =
22,875
32
≈ 0,8.
252 Chapitre SP1. Statistiques
4. Cours - Méthodes
MÉTHODE 4 Déterminer l’écart-type avec la calculatrice : série de valeurs Ex. 23 p. 257
Exercice d’application
Déterminer l’écart-type σ de la série de valeurs 2 ; 3 ; 4 ; 8 ; 9 ; 12 ; 13 et 41.
Correction
Calculatrice TI
• On appuie sur la touche ;
• on choisit le menu 1:Edite... ;
• on saisit les valeurs 2 ; 3 ; etc. dans L1 ;
• on appuie sur la touche puis on appuie
sur la flèche de droite pour se déplacer
sur CALC ;
• on choisit 1:Stats 1-Var puis on écrit
L1 avec puis afin d’obtenir
et on valide avec ;
• l’écart-type est la valeur
donc σ ≈ 11, 8 (et la moyenne est x = 11,5).
Calculatrice CASIO
• On appuie sur la touche et on choisit
le menu 2 : STAT ;
• on saisit les valeurs 2 ; 3 ; etc. dans List 1 ;
• on choisit le menu CALC puis SET ;
• on règle 1Var XLIST sur List 1 et
1Var Freq sur 1 puis on appuie sur la
touche ;
• on choisit le menu 1VAR ;
• l’écart-type est
donc σ ≈ 11, 8 (et la moyenne est x = 11,5).
MÉTHODE 5 Déterminer l’écart-type avec la calculatrice : tableau d’effectifs Ex. 24 p. 257
Exercice d’application
Déterminer l’écart-type σ de la série.
Valeur 0 1 2 3
Effectif 4 18 6 4
Correction
Calculatrice TI
• On appuie sur la touche ;
• on choisit le menu 1:Edite... ;
• on saisit les valeurs 0 ; 1 ; 2 et 3 dans L1 et
les effectifs 4 ; 18 ; 6 et 4 dans L2 ;
• on appuie sur la touche puis on appuie
sur la flèche de droite pour se déplacer
sur CALC ;
• on choisit 1:Stats 1-Var puis on écrit L1,L2
afin d’obtenir et
on valide avec ;
• l’écart-type est donc
σ ≈ 0, 8 (et la moyenne est x ≈ 1, 3125).
Calculatrice CASIO
• On appuie sur la touche et on choisit
le menu 2 : STAT ;
• on saisit les valeurs 0 ; 1 ; 2 et 3 dans List 1
et les effectifs 4 ; 18 ; 6 et 4 dans List 2 ;
• on choisit le menu CALC ;
• on règle 1Var XLIST sur List 1 et
1Var Freq sur List 2 puis on appuie sur
la touche ;
• on choisit le menu 1VAR ;
• l’écart-type est donc
σ ≈ 0, 8 (et la moyenne est x ≈ 1, 3125).
REMARQUES :
La variance et l’écart-type sont des indicateurs de dispersion autour de la moyenne, plus
ils sont petits, plus la série est homogène.
Généralement, on détermine la variance et l’écart-type à l’aide de la calculatrice.
Chapitre SP1. Statistiques 253
5. Cours - Méthodes
REMARQUE : La moyenne x et l’écart-type σ s’expriment dans la même unité que les valeurs
de la série (analyse dimensionnelle).
Cela a un sens de parler des intervalles [x − σ ; x + σ], [x − 2σ ; x + 2σ], etc. qui sont souvent
utilisés en statistiques.
Exemple Lors d’un TP ayant pour but de mesurer la masse volumique d’un métal, exprimée
en g/cm3, les sept groupes d’une classe ont trouvé :
7,95 ; 8,02 ; 7,61 ; 8,11 ; 8,02 ; 8,05 ; 8,04.
La calculatrice donne la moyenne x ≈ 7,97 g/cm3 et l’écart-type σ ≈ 0,15 g/cm3 de cette série
de valeurs.
L’intervalle [x − 2σ ; x + 2σ] est donc [7,67 ; 8,27] à 10−2 près, dont on peut remarquer qu’il
contient 6 des 7 valeurs, soit
6
7
≈ 86 % des valeurs.
3. Résumé d’une série statistique
MÉTHODE 6 Résumer une série statistique Ex. 30 p. 258
On peut résumer une série statistique, c’est-à-dire en donner une tendance globale, par :
• le couple médiane-écart interquartile, qui n’est pas sensible aux valeurs extrêmes : on le
privilégie donc quand on étudie une série dont les valeurs extrêmes sont moins importantes
ou moins significatives que les valeurs centrales ;
• le couple moyenne-écart-type, qui est sensible aux valeurs extrêmes : on le privilégie donc
quand on étudie une série dont les valeurs extrêmes sont aussi importantes ou aussi signi-
ficatives que les autres.
Dans les deux cas, on utilise un indicateur de position (la médiane ou la moyenne) et un
indicateur de dispersion (l’écart interquartile ou l’écart-type).
Exercice d’application
Pour chacune des deux situations suivantes, dire s’il est préférable de résumer la série sta-
tistique correspondante par le couple médiane-écart interquartile ou par le couple moyenne-
écart-type.
• Situation 1 : On étudie la série statistique des salaires et allocations chômage des Français
en 2014 en vue d’en observer les inégalités.
• Situation 2 : On étudie les résultats d’une enquête d’un fabricant de chaussures portant sur
la taille de chaussure de ses clients afin de déterminer la production de quelles pointures
privilégier.
Correction
• Dans la situation 1, les valeurs extrêmes sont très importantes puisque ce sont elles qui
illustrent les plus grandes inégalités : on préférera donc le couple moyenne-écart-type.
• Dans la situation 2, le fabricant souhaite savoir quelles pointures sont les plus portées et
ne s’intéresse donc pas aux très petites et très grandes pointures peu portées par ses clients
mais plutôt aux valeurs centrales : on préférera donc le couple médiane-écart interquartile.
254 Chapitre SP1. Statistiques