4- TEST D’AJUSTEMENT D’UNE DISTRIBUTION OBSERVEE A UNE.pptx
1. caractère donné, que celui-ci soit
quantitatif ou qualitatif.
Pour cela, on examine à partir d’un
échantillon issu de cette population,
comment varie la distribution
observée (tableau de fréquences,
histogramme, polygone de
fréquences…).
Il est intéressant, chaque fois que
2. ²
i
o
i
c
i
i np
c
n
i
p
i
o
i
c
4-2 Principe du test d’ajustement
La vérification de la conformité de la répartition théorique choisie à la répartition expérimentale observée est faite au moyen du test du
.
En pratique la série statistique est constituée par n observations réparties en k classes correspondant :
- soit à des modalités diverses d’un caractère qualitatif
- soit à des valeurs d’un caractère quantitatif
Soit
l’effectif observé de la classe i et
l’effectif attendu (ou calculé) de cette classe.
avec
étant l’effectif global de l’échantillon
= probabilité qu’une observation appartienne à la classe i.
Ainsi, lorsque la répartition observée est conforme à la répartition théorique, les différences entre
et
seraient faibles, dues seulement aux fluctuations d’échantillonnage.
On démontre que dans ce cas :
3. Exemple
On veut savoir si la glycémie d’un
individu dans une population donnée,
suit une distribution normale.
La moyenne et la variance ne sont pas
connues.
Elles sont estimées respectivement par
la moyenne m et la variance s² d’un
échantillon
aléatoire extrait de cette population.
Le nombre de ddl est alors (k-1-2).
4. On calcule sous l’hypothèse nulle, les
effectifs attendus ci dans chaque classe
On forme =
On compare avec lu sur la table du à
(k-1-r) ddl avec = 5%
Si on rejette H0
Il y a une différence significative entre
la répartition observée et la répartition
théorique ; on précise le degré de
signification.
5. Dans le cas où un ci < 5, il faut faire des
regroupements de classe.
Attention! Ces conditions sont posées
sur les effectifs calculés et non sur les
effectifs observés.
6. X X < 35 35 x < 45 45 x < 55 55 x < 65 65 x < 75 75 x < 85 85 x < 95 95 x < 105 105 x
0 2 5 9 17 10 6 1 0
i
o
Exemple 2
On veut savoir si la distribution suivie par le poids d’un individu adulte dans une population donnée peut être co
Les mesures faites au niveau d’un échantillon aléatoire extrait de cette population, sont les suivantes :
Que concluez-vous ?
7. Solution
On teste :
H0 : « la distribution observée est conforme à une distribution normale ».
La moyenne µ et la variance
²
de la répartition théorique sont estimées à partir des données de l’échantillon m = 70 et s² = 179,56.
On calcule les différents pi correspondant à chaque classe, puis ci = n pi
8. Classes oi pi ci = n pi
X < 35 0 0,0048 0,240
35 X < 45 2 0,02664 1,332
45 X < 55 5 0,09996 4,998
55 X < 65 9 0,2243 11,215
65 X < 75 17 0,2886 14,430
75 X < 85 10 0,2243 11,215
85 X < 95 6 0,09996 4,998
95 X < 105 1 0,02664 1,332
X ≥ 105 0 0,0048 0,240
Total 50 1
9. Classes oi ci
X < 55 7 6,57 0,02814
55 X < 65 9 11,215 0,43746
65 X < 75 17 14,43 0,45772
75 X < 85 10 11,215 0,13162
X ≥ 85 7 6,57 0,02814
Total 50 =1,08308
i
i
i
c
c
o )²
(
2
0
Classes oi ci
X < 55 7 6,57 0,02814
55 X < 65 9 11,215 0,43746
65 X < 75 17 14,43 0,45772
75 X < 85 10 11,215 0,13162
X ≥ 85 7 6,57 0,02814
Total 50 =1,08308
i
i
i
c
c
o )²
(
2
0
56
,
179
70
35
s
m
X
On calcule ainsi :
p1 = P(X < 35) = P( Z <
)
= P( Z < -2,61) = 0,0048
Z étant la variable normale centrée réduite Z =
10. • p2 = P(35 X < 45) = P(- 2,61 Z < - 1,86) = 0,02664 etc…
• Certaines valeurs de ci étant inférieures à 5, nous
regroupons certaines classes.
•
• Le nombre de ddl est k-1-r
• k étant le nombre de classes retenu k=5, et r le nombre de
paramètres estimés r=2 .
•
• On compare à lu sur la table du à 2 ddl.
• = 5,99
• < H0 n’est pas rejetée.
• L’hypothèse de normalité est retenue.
11. les poids en grammes de 112 nouveau-
nés, notés au niveau d’une maternité
d’Alger.
Peut-on considérer que la variable
«poids » suit une loi normale ?
Poids Effectif
[1000 1500[ 2
[1500 2000[ 6
[2000 2500[ 8
[2500 3000[ 20
[3000 3500[ 50
[3500 4000[ 18
[4000 4500[ 6
[4500 5000[ 2
12. Estimation de µ et de
µ est estimé par m et est estimée par
s²
Les calculs de m et s² se font après un
changement de variable y =
13. xi yi ni ni yi ni y²i
1250 -3 2 -6 18
1750 -2 6 -12 24
2250 -1 8 -8 8
2750 0 20 0 0
3250 1 50 50 50
3750 2 18 36 72
4250 3 6 18 54
4750 4 2 8 32
Total 112 86 258
14. • my= = = 0,76 et = = =1,73
•
• Donc = 500( )+2750 = 3134 et = (500)²
= 432352
•
• Test de la normalité
•
• On fait le changement de variable Z = =
15. Classes Valeurs
centrées réduites
[1000 1500[ [- 3,25 2,49[ 2 0,0095 1,064
[1500 2000[ [- 2,49 1,73[ 6 0,03 3,36
[2000 2500[ [- 1,73 0,96[ 8 0,13 14,56
[2500 3000[ [- 0,96 0,20[ 20 0,25 28
[3000 3500[ [- 0,20 0,56[ 50 0,29 32,48
[3500 4000[ [ 0,56 1,32[ 18 0,195 21,84
[4000 4500[ [ 1,32 2,08[ 6 0,075 8,4
[4500 5000[ [ 2,08 2,84[ 2 0,019 2,128
i
i n
o
i
p i
i np
c
16. Classes
[1000 2500[ 16 18,98 0,468
[2500 3000[ 20 28 2,286
[3000 3500[ 50 32,48 9,450
[3500 4000[ 18 21,84 0,675
[4000 5000[ 8 10,53 0,608
Total 112 112 13,487 =
i
c
i
oi
c
i
i
i
c
c
o )²
(
2
0
2
0
2
²
2
Certains
étant inférieurs à 5, nous devons faire des regroupements de classes.
On compare
avec
lu sur la table de
à k – 1 – r = 5 – 1 – 2 = 2 ddl
= 5,99
H0 est rejetée. La distribution observée est significativement différente d’une distribution normale avec u