SlideShare une entreprise Scribd logo
1  sur  14
Télécharger pour lire hors ligne
Statistiques inférentielles - BTS 2ème année - Page 1 G. COSTANTINI http://bacamaths.net/
ÉCHANTILLONNAGE - ESTIMATION
- Partie A - Échantillonnage -
L'objectif de cette partie est de répondre à la problématique suivante : comment, à partir d'informations (couple
moyenne-écart-type ou proportion) connues sur une population, peut-on prévoir celles d'un échantillon ?
Nous distinguerons deux cas : celui où l'on étudie une moyenne dans un échantillon et celui où l'on étudie une
proportion dans un échantillon.
A.1. Étude de la moyenne d'un échantillon
On dispose d'une population sur laquelle est définie une variable aléatoire X dont on connaît l'espérance (ou la
moyenne) m et l'écart-type s.
On s'intéresse aux échantillons de taille n. Auront-ils tous la même moyenne ? Non, certains peuvent être
constitués d'éléments atypiques et avoir une moyenne très différente de celle de la population (surtout si
l'échantillon est de petite taille).
Notons X la variable aléatoire qui, à chaque échantillon de taille n, associe sa moyenne ( X s'appelle encore la
distribution des moyennes des échantillons). Que peut-on dire de cette variable aléatoire X ?
Théorème Central Limite - Version 1 - (Version faible)
Contexte : variable aléatoire X qui suit une loi normale sur la population
X Ê N(m ; s)
On prélève, au hasard, un échantillon (tirages avec remise(1)
ou assimilés) de taille n de moyenne X .
Alors la variable aléatoire X suit également une loi normale :
X Ê N ;
n
sæ ö
mç ÷
è ø
(1)
Un tirage avec remise est encore appelé "tirage non exhaustif". Si on fait un tirage sans remise (tirage exhaustif), on modifie la taille de la
population au fur et à mesure des tirages, ce qui compliquerait les calculs (intervention d'un facteur d'exhaustivité). Ceci dit, pour des grandes
populations le tirage sans remise s'assimile à un tirage avec remise.
Echantillons de taille n ... mim5m4m3m2m1
Population
Moyenne m connue.
Ecart-type s connu.
{
m
Atténuation de la dispersion par
le processus d'échantillonnage.
Statistiques inférentielles - BTS 2ème année - Page 2 G. COSTANTINI http://bacamaths.net/
Démonstration :
Notons E = {x1 ; x2 ; ... ; xn} un échantillon de n éléments prélevés au hasard dans la population.
Pour tout i compris entre 1 et n, notons Xi la variable aléatoire correspondant à la valeur du i-ème élément xi de
l'échantillon. Nous savons, par hypothèse, que :
E(Xi) = m et s(Xi) = s
La moyenne X des n valeurs de l'échantillon est :
X = 1 2 ... nX X X
n
+ + +
D'après les propriétés de la loi normale, nous savons qu'une combinaison linéraire de variables aléatoire qui
suivent la loi normale est encore une variable aléatoire qui suit la loi normale. Comme chaque variable
aléatoire Xi suit ici la loi normale N(m, s), la variable aléatoire moyenne X suit donc également une loi
normale. Calculons ses paramètres.
D'après la propriété de linéarité de l'espérance :
E ( )X = 1 2( ) ( ) ... ( )nE X E X E X
n
+ + +
=
n
n
m
= m
D'après les propriétés de la variance :
V( )X = 1 2
2
( ) ( ) ... ( )nV X V X V X
n
+ + +
=
2
2
n
n
s
=
2
n
s
D'où : s( )X =
n
s
Théorème Central Limite - Version 2 - (Version forte)
Contexte : variable aléatoire X qui suit une loi quelconque sur la population avec E(X) = m et s(X) = s.
On prélève, au hasard, un échantillon (tirages avec remise ou assimilés) de taille n, avec n  30, de moyenne X .
Alors la variable aléatoire X suit approximativement une loi normale :
X Ê N ;
n
sæ ö
mç ÷
è ø
Ce théorème dû aux mathématiciens De Moivre et Laplace est de démonstration très difficile. Il est admis ici.
Remarque : il ne faut pas confondre l'écart-type
n
s
de la variable aléatoire X (qui est définie sur l'ensemble
des échantillons possibles de taille n) avec l'écart-type d'un échantillon prélevé. L'écart-type de l'échantillon
prélevé n'interviendra pas dans nos calculs dans cette partie. Pour éviter cette confusion, la quantité
n
s
sera
parfois appelée "erreur type".
Exemple :
Les statistiques des notes obtenues en mathématiques au BAC STI en France pour l'année 2006 sont :
Moyenne nationale : m =10,44
Écart-type : s = 1,46
Une classe de BTS comporte 35 élèves en 2006/2007 issus d'un BAC STI en 2006.
Statistiques inférentielles - BTS 2ème année - Page 3 G. COSTANTINI http://bacamaths.net/
Calculer la probabilité que la moyenne de cette classe soit supérieure à 10.
Ici, nous ne connaissons pas la loi sur la population, mais l'effectif n de l'échantillon est supérieur à 30.
Nous allons donc pouvoir utiliser le T.C.L. 2.
Notons X la variable aléatoire qui, à tout échantillon de taille n = 35, fait correspondre sa moyenne.
Alors : X Ê N ;
n
sæ ö
mç ÷
è ø
= N
1,46
10,44;
35
æ ö
ç ÷
è ø
Posons T =
10,44
1,46
35
X -
ainsi T Ê N(0 ; 1).
Nous obtenons alors par centrage et réduction :
P( X  10) = P
10,44 10 10,44
1,46 1,46
35 35
X
æ ö
ç ÷- -
ç ÷
ç ÷
ç ÷
è ø

= P(T  -1,78)
= P(T  1,78)
= Π(1,78)
Et par lecture directe de la table de la loi normale centrée-réduite :
Π(1,78) = 0,9625
Conclusion : il y a environ 96% de chance que, dans cette classe de BTS, la moyenne des notes au baccalauréat
de Mathématiques soit supérieure à 10.
A.2. Étude d'une proportion dans un échantillon
Cette fois-ci, on dispose d'une population sur laquelle on étudie un caractère (ou attribut) A dont on connaît la
proportion p dans la population.
On s'intéresse aux échantillons de taille n. La proportion du caractère A dans les échantillons sera-t-elle
toujours la même ? Evidemment non, cette proportion varie en fonction de l'échantillon choisi. Notons F la
variable aléatoire qui, à chaque échantillon de taille n, associe sa proportion du caractère A (F s'appelle
distribution des fréquence des échantillons). Que peut-on dire de cette variable aléatoire F ?
1-Π(t)Π(-t)
t-t
Remarque : P(T  t) = P(T  -t)
En effet :
P(T  t) = 1 - P(T  t) = 1 - Π(t) = Π(-t) = P(T  -t)
Echantillons de taille n ... pip5p4p3p2p1
Population
Proportion p connue
du caractère A
{
A
1 - pp
AA
Statistiques inférentielles - BTS 2ème année - Page 4 G. COSTANTINI http://bacamaths.net/
Théorème
Contexte : une population sur laquelle on étudie un caractère A répandu avec une fréquence p.
On prélève, au hasard, un échantillon (tirages avec remise ou assimilés) de taille n avec n  30.
On note F la fréquence du caractère A dans l'échantillon.
Alors la variable aléatoire F suit approximativement une loi normale :
F Ê N
(1 )
;
p p
p
n
æ ö-
ç ÷ç ÷
è ø
Démonstration :
Nous allons avoir ici un modèle binomial ou apparenté dont on sait qu'il converge vers la loi normale.
Pour tout i compris entre 1 et n, notons Xi la variable aléatoire définie par :
Xi =
1 si le -ème élément de l'échantillon possède l'attribut
0 sinon
i Aì
í
î
La variable aléatoire Xi suit une loi de Bernoulli de paramètre p.
La variable aléatoire X = X1 + X2 + ... + Xn est donc binomiale de paramètres n et p :
X Ê B(n, p)
En conséquence : E(X) = np et s(X) = (1 )np p-
La variable aléatoire F =
X
n
correpond ainsi à la fréquence de l'attribut A dans l'échantillon.
D'après les propriétés de l'espérance et de l'écart-type :
E(F) =
( )E X
n
= p et s(F) =
( )X
n
s
=
(1 )p p
n
-
Exemple :
Une élection a eu lieu et un candidat a eu 40 % des voix.
On prélève un échantillon de 100 bulletins de vote.
Quelle est la probabilité que, dans l'échantillon, le candidat ait entre 35 % et 45 % des voix ?
Ici, nous avons n = 100 et p = 0,4. La variable aléatoire F correspondant à la fréquence des votes pour le
candidat dans l'échantillon vérifie donc :
F Ê N
0,4 0,6
0,4;
100
æ ö´
ç ÷ç ÷
è ø
= N
0,24
0,4;
10
æ ö
ç ÷ç ÷
è ø
Posons T =
0,4
0,24
10
F -
ainsi T Ê N(0 ; 1). Nous obtenons alors par centrage et réduction :
P(0,35  F  0,45) = P(-1,02  T  1,02) = 2Π(1,02) - 1
Et par lecture directe de la table de la loi normale centrée-réduite Π(1,02) = 0,8461.
D'où : P(0,35  F  0,45) = 0,6922
Il y a donc environ 69 % de chance que, dans un échantillon de taille n = 100, le candidat ait entre 35 % et
45 % des voix.
Statistiques inférentielles - BTS 2ème année - Page 5 G. COSTANTINI http://bacamaths.net/
En analysant l'exercice ci-dessus, on constate que l'on dispose des informations sur la population (ici,
l'ensemble des votes) parce que l'élection a déjà eu lieu. On en déduit des informations sur l'échantillon. Mais,
dans la pratique, c'est souvent le phénomène réciproque que nous étudierons : les élections n'ont pas encore eu
lieu et on voudrait retrouver les informations sur la population grâce un sondage réalisé sur un échantillon.
D'où la deuxième partie de ce document consacrée à l'estimation.
- Partie B - Estimation -
L'objectif de cette partie est de répondre à la problématique suivante : comment, à partir d'informations (couple
moyenne/écart-type ou proportion) calculées sur un échantillon, retrouver ou plutôt estimer celles d'une
population entière ? L'estimation est le problème réciproque de l'échantillonnage. (Mais nous aurons besoin des résultats
établis sur la théorie de l'échantillonnage pour passer à la phase estimative).
Nous distinguerons deux cas : celui où l'on cherche à estimer la moyenne m d'une variable aléatoire définie sur
une population et celui où l'on cherche à estimer la proportion d'individus p ayant tel caractère dans la
population.
B.1. Estimation d'une moyenne
B.1.1. Estimation ponctuelle
Contexte : on considère une variable aléatoire X sur une population de moyenne (ou espérance) m inconnue et
d'écart-type s inconnu (ou connu). On suppose que l'on a prélevé un échantillon de taille n (tirage avec remise
ou assimilé) sur lequel on a calculé la moyenne me et l'écart-type se.
Une estimation ponctuelle μ« de la moyenne m de la population est :
μ« = me
Une estimation ponctuelle s« de l'écart-type se de la population est :
s« =
1
n
n -
se
Proportion : p inconnueMoyenne : m inconnue
Ecart-type : s connu ou inconnu
Echantillon de taille nEchantillon de taille n
PopulationPopulation
pe
connue
me connue
se connu
ESTIMATION d'une PROPORTIONESTIMATION d'une MOYENNE
Statistiques inférentielles - BTS 2ème année - Page 6 G. COSTANTINI http://bacamaths.net/
Le coefficient
1
n
n -
s'appelle correction de biais. Lorsque la taille n de l'échantillon est assez grand (en
pratique n  30), ce coefficient est très voisin de 1, si bien que, dans ce cas, on peut estimer s«  se.
Exemple :
Une université comporte 1500 étudiants. On mesure la taille de 20 d'entre eux. La moyenne me et l'écart-type se
calculés à partir de cet échantillon sont :
me = 176 cm et se = 6 cm
Nous pouvons donc estimer les paramètres de la population :
μ« = 176 cm et s« =
20
19
´ 6  6,16 cm
Remarque :
Nous n'avons fait qu'une estimation, il est bien sûr impossible de retrouver les vraies caractéristiques m et s de
la population.
L'estimation ponctuelle permet surtout de disposer d'une valeur de référence pour poursuivre/affiner les calculs.
On souhaiterait notamment pouvoir faire une estimation par intervalle, en contrôlant le risque pris.
B.1.2. Estimation par intervalle de confiance
Le contexte est le même que le précédent, sauf que nous allons raisonner en deux temps, une phase a priori (ou
prévisionnelle) dans lequelle on suppose que l'échantillon n'est pas encore prélevé et une phase a posteriori
dans laquelle on suppose connue la moyenne me et l'écart-type se de l'échantillon et donc la moyenne estimée μ«
et l'écart-type estimé s« de la population.
- PHASE A PRIORI - Mise en place du modèle prévisionnel -
Nous avons vu, dans la théorie sur l'échantillonnage, que si X est la variable aléatoire correspondant à la
moyenne d'un échantillon de taille n pris au hasard, alors le Théorème Central Limite permet d'affirmer que X
suit approximativement une loi normale :
X Ê N ;
n
sæ ö
mç ÷
è ø
Nous allons chercher un intervalle qui contient m avec une confiance arbitraire de 95% (cela pourrait aussi être 99% ou
un autre coefficient de confiance). Nous cherchons donc un rayon r tel que :
P( X - r  m  X + r) = 0,95
Probabilité que la moyenne m de la
population tombe dans un intervalle
du type [ X - r ; X + r]
X + rX - r
Xm
Statistiques inférentielles - BTS 2ème année - Page 7 G. COSTANTINI http://bacamaths.net/
Cette disposition des inégalités n'est pas pratique mais il y a une correspondance remarquable entre deux
événements qui va nous faciliter les calculs :
X - r  m  X + r
Retranchons X et m dans chaque membre :
- m - r  - X  r - m
Multiplions par -1 : r + m  X  m - r
Remettons les inégalités dans l'ordre croissant :
m - r  X  r + m
Nous sommes ainsi ramenés à calculer :
P(m - r  X  m + r) = 0,95
On sait que la variable aléatoire T =
X
n
-m
s
= ( )
n
X -m
s
suit la loi normale centrée-réduite N(0 ; 1).
Nous obtenons donc, par centrage et réduction :
P
r X r
n n n
æ ö
ç ÷m - -m -m m + -m
ç ÷
s s sç ÷
ç ÷
è ø
  = 0,95
P
r n r n
T
æ ö
-ç ÷ç ÷s sè ø
  = 0,95
P
r n r n
T
æ ö
-ç ÷ç ÷s sè ø
  = 0,95
2Π
r næ ö
ç ÷ç ÷sè ø
- 1 = 0,95
Π
r næ ö
ç ÷ç ÷sè ø
= 0,975
Π(t) = 0,975 où t =
r n
s
Nous cherchons donc, par lecture inverse de la table de la loi normale centrée réduite une borne t telle que :
Π(t) = 0,975
La borne t = 1,96 convient.
La borne t dépend du coefficient de confiance choisi.
Avec un coefficient de confiance de 99%, nous aurions obtenu :
2Π
r næ ö
ç ÷ç ÷sè ø
- 1 = 0,99
Dans la pratique, nous partirons
de cette écriture pour déterminer
un intervalle de confiance.
Probabilité que la moyenne X de
l'échantillon tombe dans un
intervalle centré en m.
m
Cette propriété découle de la
symétrie de la valeur absolue :
|X - Y|  r
Cela signifie que l'écart entre X
et Y est inférieur à r, ce qui s'écrit
indifféremment :
-r  X - Y  r
Y - r  X  Y + r
Ou encore :
-r  Y - X  r
X - r  Y  X + r
On constate ici que le fait de ne pas
connaître m n'est pas gênant, à ce stade.
Rappel : si T Ê N(0 ; 1) alors :
P(-a  T  a) = 2Π(a) -1
En effet :
P(-a  T  a) = Π(a) - Π(-a)
= Π(a) - (1 - Π(a))
= 2Π(a) -1
m + rm- r
X m
Statistiques inférentielles - BTS 2ème année - Page 8 G. COSTANTINI http://bacamaths.net/
Π(t) = 0,995
t = 2,575
Par la suite, nous noterons t le réel tel que 2Π(t) - 1 = C où C est le degré de confiance choisi.
Ainsi, notre réel r recherché est tel que :
r n
s
= t
Le rayon r de l'intervalle cherché est : r t
n
s
=
- PHASE A POSTERIORI - Utilisation des valeurs estimées ponctuellement -
Nous supposons maintenant que l'échantillon a été tiré, nous obtenons donc une représentation me de la
variable aléatoire X :
Nous pouvons affirmer que l'intervalle obtenu pour cet échantillon
e e;t t
n n
s sé ù
m - m +ê ú
ë û
fait partie d'une famille dans laquelle 95 % contiennent la vraie moyenne m de la population.
On l'appelle intervalle de confiance à 95 % (ou autre selon le coefficient de confiance décidé préalablement).
Pour calculer les bornes de cet intervalle, deux cas de figure se présentent selon que nous connaissons ou pas
l'écart-type s de la population. S'il est connu, il n'y a rien à faire :
IC = e e;t t
n n
s sé ù
m - m +ê ú
ë û
Si l'écart-type s de la population n'est pas connu, on le remplace par son estimation ponctuelle s« =
1
n
n -
se.
Dans ce cas, nous obtenons : r = e
1
n
t
n n
s
-
= e
1
t
n
s
-
Nous pouvons donc estimer avec une confiance de 95 % (ou 99 % selon le cas) que la moyenne m de la
population appartient à l'intervalle :
IC = e e
e e;
1 1
t t
n n
s sé ù
m - m +ê ú
- -ë û
Remarques :
· L'intervalle de confiance est centré en la valeur me car c'est la seule valeur de référence que nous disposons.
· Le centre de l'intervalle de confiance (à savoir me) dépend de l'échantillon choisi (puisque me en dépend).
Son rayon en dépend aussi lorsqu'on ne connaît pas l'écart-type de la population.
· La vraie valeur m de la moyenne de la population peut ne pas appartenir à l'intervalle de confiance.
· Le rayon de l'intervalle de confiance (à savoir la quantité r =t
n
s
) dépend du degré de confiance C choisi.
Plus le degré de confiance C est proche de 100%, et plus la borne t sera élevée et donc le rayon grand.
On ne retiendra pas cette formule.
Dans la pratique, on refait les calculs.
me + rme - r
mem
Statistiques inférentielles - BTS 2ème année - Page 9 G. COSTANTINI http://bacamaths.net/
Illustration :
Exemple :
Une université comporte 1500 étudiants. On mesure la taille de 20 d'entre eux. La moyenne me et l'écart-type se
calculés à partir de cet échantillon sont :
me = 176 cm et se = 6 cm
Nous avons déjà estimé ponctuellement les paramètres de la population :
μ« = 176 cm et s« =
20
19
´ 6  6,16 cm
Déterminons maintenant une estimation de m par intervalle de confiance à 95% (ou au risque de 5 %).
Notons X la variable aléatoire correspondant à la moyenne d'un échantillon de taille 20 pris au hasard.
Nous savons que : X Ê N ;
n
sæ ö
mç ÷
è ø
= N ;
20
sæ ö
mç ÷
è ø
On calcule un rayon r tel que : P(m - r  X  m + r) = 0,95
On pose T =
20
X r-
s
, ainsi T suit la loi normale centrée-réduite N(0 ; 1).
Nous avons donc : P
20 20r r
T
æ ö
-ç ÷ç ÷s sè ø
  = 0,95
2Π
20ræ ö
ç ÷ç ÷sè ø
- 1 = 0,95
Π
20ræ ö
ç ÷ç ÷sè ø
= 0,975
Π(t) = 0,975 où t =
20r
s
Nous cherchons donc, par lecture inverse de la table de la loi normale centrée réduite une borne t telle que :
Π(t) = 0,975
La borne t = 1,96 convient.
Ainsi, notre réel r recherché est tel que :
20r
s
= 1,96
m
μ« = me
99%
99%
95%
μ« = me
μ« = me
XPopulation
Echantillon 1
Echantillon 2
Echantillon 3
Un intervalle de
confiance ne contient
pas forcément la
moyenne m de la
population.
Un intervalle de
confiance à 95 % est
plus petit qu'un
intervalle de confiance
à 99%. Il risque moins
de contenir la valeur
moyenne m.
Statistiques inférentielles - BTS 2ème année - Page 10 G. COSTANTINI http://bacamaths.net/
r =
1,96
20
´s
Mais une fois l'échantillon tiré, nous avons obtenu un écart-type estimé s«  6,16 cm.
D'où : r  2,7
La réalisation de l'intervalle de confiance à 95% sur cet échantillon est :
IC = [176 - 2,7 ; 176 + 2,7]
IC = [173,3 ; 178,7]
Nous pouvons donc estimer, avec une confiance de 95 % que la taille moyenne de la population est comprise
entre 173,3 cm et 178,7 cm.
B.2. Estimation d'une proportion
B.2.1. Estimation ponctuelle
Contexte : on considère un caractère (ou attribut) A sur une population dont la proportion p est inconnue. On
suppose que l'on a prélevé un échantillon de taille n (tirage avec remise ou assimilé) sur lequel on a calculé la
proportion pe d'individus ayant le caractère A.
Notons F la variable aléatoire correspondant à la proportion du caractère A dans un échantillon de taille n pris
au hasard. On rappelle qu'alors F suit approximativement une loi normale :
F Ê N( ); pp s où sp =
(1 )p p
n
-
Une estimation ponctuelle p« de la proportion p de l'attribut A dans la population est :
p« = pe
Une estimation ponctuelle sp« de l'écart-type sp est selon le cas :
1
n
n -
e e(1 )p p
n
-
= e e(1 )
1
p p
n
-
-
si n  30
e e(1 )p p
n
-
si n > 30
1
4n
si statisticien pessimiste
Exemple :
À quelques jours d'une élection, un candidat fait effectuer un sondage. Sur les 150 personnes interrogées, 45 se
disent prêtes à voter pour lui aux prochaines élections.
La proportion d'individus prête à voter pour ce candidat dans l'échantillon est ici de pe =
45
150
= 0,3.
On estime donc qu'il en est de même dans la population (comment pourrait-on faire autrement ?) :
p« = pe = 0,3
Quand à l'indication sp, on peut ici l'estimer par :
sp« = e e(1 )p p
n
-
=
0,3 0,7
150
´
 0,037
Ces estimations ponctuelles de
l'écart-type ne sont pas utiles dans
l'immédiat. Elle serviront pour la
détermination d'un intervalle de
confiance de la proportion.
Correction de biais.
Statistiques inférentielles - BTS 2ème année - Page 11 G. COSTANTINI http://bacamaths.net/
On voudrait aller plus loin et, au lieu d'une simple proportion, calculer un intervalle contenant, avec une
confiance arbitraire fixée au départ, la proportion p d'individus prêts à voter pour ce candidat.
B.2.2. Estimation par intervalle de confiance
Le contexte est le même que le précédent. Nous avons vu, dans la théorie sur l'échantillonnage, que si F est la
variable aléatoire correspondant à la proportion d'un caractère dans un échantillon de taille n pris au hasard,
alors F suit approximativement une loi normale :
F Ê N( ); pp s où sp =
(1 )p p
n
-
Nous avons déjà remarqué que le fait que p soit inconnu n'est pas gênant dans les calculs a priori. Le problème
ici, c'est que nous ne connaissons pas l'écart-type
(1 )p p
n
-
. Nous le remplaçerons, dans la phase a posteriori,
par son estimation ponctuelle (qui est e e(1 )
1
p p
n
-
-
en général ou e e(1 )p p
n
-
si la correction de biais n'est
pas proposée ou encore
1
4n
si nous voulons une hypothèse pessimiste).
Cherchons un intervalle qui contient p avec une confiance arbitraire de 90 % (cela pourrait être un autre coefficient de
confiance). Nous cherchons donc un rayon r tel que :
P(F - r  p  F + r) = 0,90
Nous avons déjà vu que cette probabilité pouvait s'écrire de manière plus pratique :
P(p - r  F  p + r) = 0,90
On sait que la variable aléatoire T =
p
F p-
s
suit la loi normale centrée réduite N(0 ; 1).
Nous obtenons donc, par centrage et réduction :
P
p p p
p r p F p p r pæ ö- - - + -
ç ÷
ç ÷s s sè ø
  = 0,90
P
p p
r r
T
æ ö-
ç ÷
ç ÷s sè ø
  = 0,90
2Π
p
ræ ö
ç ÷
ç ÷sè ø
- 1 = 0,90
Π
p
ræ ö
ç ÷
ç ÷sè ø
= 0,95
On cherche une borne t telle que : Π(t) = 0,95 avec t =
p
r
s
Par lecture inverse de la table de la loi normale centrée réduite N(0 ; 1) :
t = 1,645
Ce qui nous permet de calculer r : r = t sp
Supposons maintenant l'échantillon prélevé. Nous avons donc une estimation pontuelle de p et sp.
Ainsi, la réalisation de l'intervalle de confiance dans l'échantillon est :
Statistiques inférentielles - BTS 2ème année - Page 12 G. COSTANTINI http://bacamaths.net/
IC = e e e e
e e
(1 ) (1 )
;
1 1
p p p p
p t p t
n n
é ù- -
- +ê ú
- -ê úë û
Remarques :
· Si on n'effectue pas la correction de biais, l'intervalle de confiance est :
IC = e e e e
e e
(1 ) (1 )
;
p p p p
p t p t
n n
é ù- -
- +ê ú
ê úë û
· On peut également se placer dans une hypothèse pessimiste en choisissant un écart-type maximal. Nous
savons que la parabole d'équation y = x(1 - x) admet un maximum égal à
1
4
en
1
2
.
Ainsi l'écart-type maximal est
1
4n
. Il a, de plus, l'avantage d'être indépendant de p.
Dans ce cas, la réalisation de l'intervalle de confiance dans l'échantillon est :
IC = e e
1 1
;
4 4
p t p t
n n
é ù
- +ê ú
ë û
Exemple :
A quelques jours d'une élection, un candidat fait faire un sondage. Sur les 150 personnes interrogées, 45 se
disent prêtes à voter pour lui aux prochaines élections.
La proportion d'individus prête à voter pour ce candidat dans l'échantillon est ici de pe =
45
150
= 0,3.
On a déjà estimé ponctuellement : p« = pe = 0,3 et sp«  0,037
Déterminons maintenant une estimation de p par intervalle de confiance à 80%.
Notons F la variable aléatoire correspondant à la proportion d'individus prêts à voter pour ce candidat dans un
échantillon de taille 150 pris au hasard.
Nous avons vu qu'approximativement :
F Ê N( ); pp s où sp =
(1 )p p
n
-
On cherche un rayon r tel que : P(p - r  F  p + r) = 0,8
2Π
p
ræ ö
ç ÷
ç ÷sè ø
- 1 = 0,8
Π
p
ræ ö
ç ÷
ç ÷sè ø
= 0,9
Par lecture inverse de la table de la loi normale centrée-réduite, on cherche une borne t telle que :
Π(t) = 0,9 avec t =
p
r
s
La valeur t  1,28 convient donc : r = 1,28 sp
Supposons maintenant l'échantillon prélevé. Une estimation ponctuelle de sp est sp«  0,037.
D'où : r  0,047
On ne retiendra pas cette formule.
Dans la pratique, on refait les calculs.
Statistiques inférentielles - BTS 2ème année - Page 13 G. COSTANTINI http://bacamaths.net/
La réalisation de l'intervalle de confiance dans cet échantillon est alors
IC = [0,3 - 0,047 ; 0,3 + 0,047]
IC = [0,253 ; 0,347]
IC% = [25,3 ; 34,7]
Nous pouvons estimer, avec une confiance de 80 %, que la proportion d'individus dans la population prêts à
voter pour le candidat en question est comprise entre 25,3 % et 34,7 %.
Exercice :
Une usine fabrique des câbles. Un câble est considéré comme conforme si sa résistance à la rupture X est
supérieure à 3 tonnes. L'ingénieur responsable de la production voudrait connaître, en moyenne, la résistance à
la rupture des câbles fabriqués.
Il n'est, bien sûr, pas question de faire le test sur toute la production (l'usine perdrait toute sa production !).
Un technicien prélève donc un échantillon de 100 câbles dans la production. Notons X la variable aléatoire
correspondant à la force à exercer sur le câble pour le rompre. Le technicien obtient les résultats suivants :
E( X ) = 3,5 tonnes
s( X ) = 0,4 tonne
Proportion de câbles dont la résistance est supérieure à 3 tonnes : pe = 0,85
1. a. Donner une estimation ponctuelle de la moyenne m et de l'écart-type s de la variable aléatoire X dans la
production.
b. Déterminer une estimation par intervalle de confiance à 95 % de la moyenne m de X.
2. a. Donner une estimation ponctuelle de la proportion p de câbles conformes dans la production.
b. Déterminer une estimation par intervalle de confiance à 90 % de cette proportion.
Statistiques inférentielles - BTS 2ème année - Page 14 G. COSTANTINI http://bacamaths.net/
- RÉSUMÉ -
- Echantillonnage -
- Estimation -
Echantillons de taille n de moyenne X
X Ê N ;
n
sæ ö
mç ÷
è ø
où m et s sont la moyenne et l'écart-type
dans la population.
Echantillons de taille n avec une fréquence F
F Ê N
(1 )
;
p p
p
n
æ ö-
ç ÷ç ÷
è ø
où p est la proportion dans la population.
PROPORTIONMOYENNE
Proportion inconnue p dans une population.
Echantillon de taille n connu avec une proportion pe.
F Une estimation ponctuelle de p est pe.
F Une estimation ponctuelle de sp est e e(1 )
1
p p
n
-
-
si
n  30 ou e e(1 )p p
n
-
sinon (n > 30).
F Pour estimer p par intervalle avec une confiance C
(par ex 95%), on cherche un rayon r tel que :
P(p - r  F  p + r) = C
où F Ê N( ); pp s avec sp =
(1 )p p
n
-
On exprime r en fonction de sp et on remplace sp par
son estimation ponctuelle.
IC = [pe - r ; pe + r]
Population de moyenne m inconnue et d'écart-type s.
Echantillon de taille n connu de moyenne me et d'écart-type se.
F Une estimation ponctuelle de m est me.
F Une estimation ponctuelle de s est
1
n
n -
se si n  30 ou
tout simplement se sinon (n > 30).
F Pour estimer m par intervalle avec une confiance C (par
ex 95%), on cherche un rayon r tel que :
P(m - r  X  m + r) = C
où X Ê N ;
n
sæ ö
mç ÷
è ø
On exprime r en fonction de s et on remplace s par sa valeur
connue ou son estimation ponctuelle.
IC = [me - r ; me + r]
PROPORTIONMOYENNE
Coefficient de confiance 80 % 90 % 95 % 99 %
Valeur de P(t) 0,9 0,95 0,975 0,995
Borne t 1,28 1,645 1,96 2,575

Contenu connexe

Tendances

Chapitre1:Introduction aux méthodes de sondage
Chapitre1:Introduction aux méthodes de sondageChapitre1:Introduction aux méthodes de sondage
Chapitre1:Introduction aux méthodes de sondageMahamadou Haro
 
Exercices corrigés
Exercices corrigésExercices corrigés
Exercices corrigéshadhoum
 
Mathematique financiere
Mathematique financiereMathematique financiere
Mathematique financiereMa Ac
 
exemple de concours du master économétrie, statistique et modélisation appliq...
exemple de concours du master économétrie, statistique et modélisation appliq...exemple de concours du master économétrie, statistique et modélisation appliq...
exemple de concours du master économétrie, statistique et modélisation appliq...jamal yasser
 
methode echantillonnage
methode echantillonnagemethode echantillonnage
methode echantillonnageMouhcine Rabi
 
Exercices corrige macroeconomie s2 de bien[learneconomie.blogspot.com]
Exercices corrige macroeconomie  s2  de bien[learneconomie.blogspot.com]Exercices corrige macroeconomie  s2  de bien[learneconomie.blogspot.com]
Exercices corrige macroeconomie s2 de bien[learneconomie.blogspot.com]Jamal Yasser
 
La fiscalité cours is exercices - corrigés
La fiscalité cours is   exercices - corrigésLa fiscalité cours is   exercices - corrigés
La fiscalité cours is exercices - corrigésAziz Hamouche
 
Exercices corrigés-de-la-comptabilité-analytique-faculté-pluridisciplinaire-n...
Exercices corrigés-de-la-comptabilité-analytique-faculté-pluridisciplinaire-n...Exercices corrigés-de-la-comptabilité-analytique-faculté-pluridisciplinaire-n...
Exercices corrigés-de-la-comptabilité-analytique-faculté-pluridisciplinaire-n...amin lord
 
Cours complet math financière
Cours complet math financièreCours complet math financière
Cours complet math financièreMarouane Chidali
 
La comptabilité Génerale Exercices de cpc
La comptabilité Génerale Exercices de cpcLa comptabilité Génerale Exercices de cpc
La comptabilité Génerale Exercices de cpcsemmah el
 
Rapport de stage d’initiation: Fiduciaire
Rapport de stage d’initiation: FiduciaireRapport de stage d’initiation: Fiduciaire
Rapport de stage d’initiation: FiduciaireJadroun Sofiane
 
Rapport de stage bts finances comptabilite et gestion d entreprises
Rapport de stage  bts finances comptabilite et gestion  d entreprises Rapport de stage  bts finances comptabilite et gestion  d entreprises
Rapport de stage bts finances comptabilite et gestion d entreprises Constant Mousso
 
Rapport de stage societe commerciale
Rapport de stage societe commercialeRapport de stage societe commerciale
Rapport de stage societe commercialesalek abdeljabar
 
cour complet de microeconomie
cour complet de microeconomiecour complet de microeconomie
cour complet de microeconomieJamal Yasser
 
La comptabilité pour les nuls Avec plan comptable général ( PDFDrive ).pdf
La comptabilité pour les nuls Avec plan comptable général ( PDFDrive ).pdfLa comptabilité pour les nuls Avec plan comptable général ( PDFDrive ).pdf
La comptabilité pour les nuls Avec plan comptable général ( PDFDrive ).pdfLarsaoui Tarik
 
Exercices corriges math fin
Exercices corriges math finExercices corriges math fin
Exercices corriges math finYassineHammoucha
 
Cours de gestion de portefeuille et des risques Pr Falloul
Cours de gestion de portefeuille et des risques Pr Falloul Cours de gestion de portefeuille et des risques Pr Falloul
Cours de gestion de portefeuille et des risques Pr Falloul Professeur Falloul
 
série d'exercices décisions financières et choix d'investissement
série d'exercices décisions financières et choix d'investissementsérie d'exercices décisions financières et choix d'investissement
série d'exercices décisions financières et choix d'investissementLotfi TALEB, ESSECT
 
Concepts de Base Economie Industrielle
Concepts de Base Economie IndustrielleConcepts de Base Economie Industrielle
Concepts de Base Economie IndustrielleMansour Jribi
 

Tendances (20)

Chapitre1:Introduction aux méthodes de sondage
Chapitre1:Introduction aux méthodes de sondageChapitre1:Introduction aux méthodes de sondage
Chapitre1:Introduction aux méthodes de sondage
 
Exercices corrigés
Exercices corrigésExercices corrigés
Exercices corrigés
 
Cours résumé-de-fiscalite
Cours résumé-de-fiscaliteCours résumé-de-fiscalite
Cours résumé-de-fiscalite
 
Mathematique financiere
Mathematique financiereMathematique financiere
Mathematique financiere
 
exemple de concours du master économétrie, statistique et modélisation appliq...
exemple de concours du master économétrie, statistique et modélisation appliq...exemple de concours du master économétrie, statistique et modélisation appliq...
exemple de concours du master économétrie, statistique et modélisation appliq...
 
methode echantillonnage
methode echantillonnagemethode echantillonnage
methode echantillonnage
 
Exercices corrige macroeconomie s2 de bien[learneconomie.blogspot.com]
Exercices corrige macroeconomie  s2  de bien[learneconomie.blogspot.com]Exercices corrige macroeconomie  s2  de bien[learneconomie.blogspot.com]
Exercices corrige macroeconomie s2 de bien[learneconomie.blogspot.com]
 
La fiscalité cours is exercices - corrigés
La fiscalité cours is   exercices - corrigésLa fiscalité cours is   exercices - corrigés
La fiscalité cours is exercices - corrigés
 
Exercices corrigés-de-la-comptabilité-analytique-faculté-pluridisciplinaire-n...
Exercices corrigés-de-la-comptabilité-analytique-faculté-pluridisciplinaire-n...Exercices corrigés-de-la-comptabilité-analytique-faculté-pluridisciplinaire-n...
Exercices corrigés-de-la-comptabilité-analytique-faculté-pluridisciplinaire-n...
 
Cours complet math financière
Cours complet math financièreCours complet math financière
Cours complet math financière
 
La comptabilité Génerale Exercices de cpc
La comptabilité Génerale Exercices de cpcLa comptabilité Génerale Exercices de cpc
La comptabilité Génerale Exercices de cpc
 
Rapport de stage d’initiation: Fiduciaire
Rapport de stage d’initiation: FiduciaireRapport de stage d’initiation: Fiduciaire
Rapport de stage d’initiation: Fiduciaire
 
Rapport de stage bts finances comptabilite et gestion d entreprises
Rapport de stage  bts finances comptabilite et gestion  d entreprises Rapport de stage  bts finances comptabilite et gestion  d entreprises
Rapport de stage bts finances comptabilite et gestion d entreprises
 
Rapport de stage societe commerciale
Rapport de stage societe commercialeRapport de stage societe commerciale
Rapport de stage societe commerciale
 
cour complet de microeconomie
cour complet de microeconomiecour complet de microeconomie
cour complet de microeconomie
 
La comptabilité pour les nuls Avec plan comptable général ( PDFDrive ).pdf
La comptabilité pour les nuls Avec plan comptable général ( PDFDrive ).pdfLa comptabilité pour les nuls Avec plan comptable général ( PDFDrive ).pdf
La comptabilité pour les nuls Avec plan comptable général ( PDFDrive ).pdf
 
Exercices corriges math fin
Exercices corriges math finExercices corriges math fin
Exercices corriges math fin
 
Cours de gestion de portefeuille et des risques Pr Falloul
Cours de gestion de portefeuille et des risques Pr Falloul Cours de gestion de portefeuille et des risques Pr Falloul
Cours de gestion de portefeuille et des risques Pr Falloul
 
série d'exercices décisions financières et choix d'investissement
série d'exercices décisions financières et choix d'investissementsérie d'exercices décisions financières et choix d'investissement
série d'exercices décisions financières et choix d'investissement
 
Concepts de Base Economie Industrielle
Concepts de Base Economie IndustrielleConcepts de Base Economie Industrielle
Concepts de Base Economie Industrielle
 

Similaire à S3.echantillonnage estimation-s3

éChantillonnage estimation
éChantillonnage   estimationéChantillonnage   estimation
éChantillonnage estimationmarouane hdidou
 
S1 mq i - statistique descriptive i - vocabulaire statistique
S1   mq i - statistique descriptive i - vocabulaire statistiqueS1   mq i - statistique descriptive i - vocabulaire statistique
S1 mq i - statistique descriptive i - vocabulaire statistiqueAbdeslam ELMOUDEN
 
Mathématiques Générales.pdf
Mathématiques Générales.pdfMathématiques Générales.pdf
Mathématiques Générales.pdfKarimBara2
 
Paramètres statistiques.pdf
Paramètres statistiques.pdfParamètres statistiques.pdf
Paramètres statistiques.pdfssuser50a397
 
Into_GA.ppt
Into_GA.pptInto_GA.ppt
Into_GA.pptbetadir
 
Mettre obligatoirement le titre de la leçon ici
Mettre obligatoirement le titre de la leçon iciMettre obligatoirement le titre de la leçon ici
Mettre obligatoirement le titre de la leçon iciwospro-academy
 
Statistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptxStatistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptxTarekDHAHRI1
 
Statistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptxStatistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptxTarekDHAHRI1
 
Aates ch08 lois-a-densite
Aates ch08 lois-a-densiteAates ch08 lois-a-densite
Aates ch08 lois-a-densiteManar Sefiane
 
La biométrie_étude de la variation des caractèr_231021_115212.pdf
La biométrie_étude de la variation des caractèr_231021_115212.pdfLa biométrie_étude de la variation des caractèr_231021_115212.pdf
La biométrie_étude de la variation des caractèr_231021_115212.pdfAbdennourAmrani
 
Bac 2015 : les sujets de MATHEMATIQUES tombés à Washington (obligatoire et sp...
Bac 2015 : les sujets de MATHEMATIQUES tombés à Washington (obligatoire et sp...Bac 2015 : les sujets de MATHEMATIQUES tombés à Washington (obligatoire et sp...
Bac 2015 : les sujets de MATHEMATIQUES tombés à Washington (obligatoire et sp...Anacours
 
T test sur des échantillons appariés avec test de normalité
T test sur des  échantillons appariés  avec  test de normalité T test sur des  échantillons appariés  avec  test de normalité
T test sur des échantillons appariés avec test de normalité Adad Med Chérif
 

Similaire à S3.echantillonnage estimation-s3 (20)

éChantillonnage estimation
éChantillonnage   estimationéChantillonnage   estimation
éChantillonnage estimation
 
Stat1
Stat1Stat1
Stat1
 
S1 mq i - statistique descriptive i - vocabulaire statistique
S1   mq i - statistique descriptive i - vocabulaire statistiqueS1   mq i - statistique descriptive i - vocabulaire statistique
S1 mq i - statistique descriptive i - vocabulaire statistique
 
Lois de-statistiques-descriptive
Lois de-statistiques-descriptiveLois de-statistiques-descriptive
Lois de-statistiques-descriptive
 
Mathématiques Générales.pdf
Mathématiques Générales.pdfMathématiques Générales.pdf
Mathématiques Générales.pdf
 
Vraisembl
VraisemblVraisembl
Vraisembl
 
Vraisembl
VraisemblVraisembl
Vraisembl
 
Paramètres statistiques.pdf
Paramètres statistiques.pdfParamètres statistiques.pdf
Paramètres statistiques.pdf
 
Classifieur d'entropie maximale (MaxEnt)
Classifieur d'entropie maximale (MaxEnt)Classifieur d'entropie maximale (MaxEnt)
Classifieur d'entropie maximale (MaxEnt)
 
Into_GA.ppt
Into_GA.pptInto_GA.ppt
Into_GA.ppt
 
Mettre obligatoirement le titre de la leçon ici
Mettre obligatoirement le titre de la leçon iciMettre obligatoirement le titre de la leçon ici
Mettre obligatoirement le titre de la leçon ici
 
Methodologie des enquete
Methodologie des enqueteMethodologie des enquete
Methodologie des enquete
 
Statistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptxStatistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptx
 
Statistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptxStatistiques descriptives [PDF].pptx
Statistiques descriptives [PDF].pptx
 
Cox
CoxCox
Cox
 
Aates ch08 lois-a-densite
Aates ch08 lois-a-densiteAates ch08 lois-a-densite
Aates ch08 lois-a-densite
 
La biométrie_étude de la variation des caractèr_231021_115212.pdf
La biométrie_étude de la variation des caractèr_231021_115212.pdfLa biométrie_étude de la variation des caractèr_231021_115212.pdf
La biométrie_étude de la variation des caractèr_231021_115212.pdf
 
Cours masterlyon
Cours masterlyonCours masterlyon
Cours masterlyon
 
Bac 2015 : les sujets de MATHEMATIQUES tombés à Washington (obligatoire et sp...
Bac 2015 : les sujets de MATHEMATIQUES tombés à Washington (obligatoire et sp...Bac 2015 : les sujets de MATHEMATIQUES tombés à Washington (obligatoire et sp...
Bac 2015 : les sujets de MATHEMATIQUES tombés à Washington (obligatoire et sp...
 
T test sur des échantillons appariés avec test de normalité
T test sur des  échantillons appariés  avec  test de normalité T test sur des  échantillons appariés  avec  test de normalité
T test sur des échantillons appariés avec test de normalité
 

Plus de Jamal Yasser

Exame bac 2016 learneconomie.blogspot.com
Exame bac 2016  learneconomie.blogspot.comExame bac 2016  learneconomie.blogspot.com
Exame bac 2016 learneconomie.blogspot.comJamal Yasser
 
Stratégie industrielles-de-amahmoud www.learneconomie.blogspot.com
Stratégie industrielles-de-amahmoud www.learneconomie.blogspot.comStratégie industrielles-de-amahmoud www.learneconomie.blogspot.com
Stratégie industrielles-de-amahmoud www.learneconomie.blogspot.comJamal Yasser
 
exrcices informatique de gestion
exrcices informatique de gestionexrcices informatique de gestion
exrcices informatique de gestionJamal Yasser
 
Examen audit taleb guelmim s6
Examen audit   taleb guelmim s6Examen audit   taleb guelmim s6
Examen audit taleb guelmim s6Jamal Yasser
 
Examen controle de gestion s6
Examen controle de gestion s6Examen controle de gestion s6
Examen controle de gestion s6Jamal Yasser
 
R esume economie monetaire s4
R esume economie monetaire s4R esume economie monetaire s4
R esume economie monetaire s4Jamal Yasser
 
Droit commerciale s44
Droit commerciale s44 Droit commerciale s44
Droit commerciale s44 Jamal Yasser
 
Cours economie industriel
Cours economie industriel Cours economie industriel
Cours economie industriel Jamal Yasser
 
Exercices d analyse financière s4
Exercices d analyse financière s4 Exercices d analyse financière s4
Exercices d analyse financière s4 Jamal Yasser
 
Exercice compta s22
Exercice compta s22Exercice compta s22
Exercice compta s22Jamal Yasser
 
Exam termenologie s2 2015
Exam termenologie s2 2015Exam termenologie s2 2015
Exam termenologie s2 2015Jamal Yasser
 
Politique monetaire s4 2016
Politique monetaire s4 2016Politique monetaire s4 2016
Politique monetaire s4 2016Jamal Yasser
 
Microeconomie s1 [www.learneconomie.blogspot.com]
Microeconomie s1 [www.learneconomie.blogspot.com]Microeconomie s1 [www.learneconomie.blogspot.com]
Microeconomie s1 [www.learneconomie.blogspot.com]Jamal Yasser
 
Finances publiques-maroc
Finances publiques-marocFinances publiques-maroc
Finances publiques-marocJamal Yasser
 
Le controle budgétaire
Le controle budgétaireLe controle budgétaire
Le controle budgétaireJamal Yasser
 
Exercices de la Comptabilité des Sociétés s4
Exercices de la Comptabilité des Sociétés s4Exercices de la Comptabilité des Sociétés s4
Exercices de la Comptabilité des Sociétés s4Jamal Yasser
 
Examens Droit Commercial et des Sociétés s4 2014/2015
Examens Droit Commercial et des Sociétés s4 2014/2015Examens Droit Commercial et des Sociétés s4 2014/2015
Examens Droit Commercial et des Sociétés s4 2014/2015Jamal Yasser
 

Plus de Jamal Yasser (20)

Exame bac 2016 learneconomie.blogspot.com
Exame bac 2016  learneconomie.blogspot.comExame bac 2016  learneconomie.blogspot.com
Exame bac 2016 learneconomie.blogspot.com
 
Stratégie industrielles-de-amahmoud www.learneconomie.blogspot.com
Stratégie industrielles-de-amahmoud www.learneconomie.blogspot.comStratégie industrielles-de-amahmoud www.learneconomie.blogspot.com
Stratégie industrielles-de-amahmoud www.learneconomie.blogspot.com
 
exrcices informatique de gestion
exrcices informatique de gestionexrcices informatique de gestion
exrcices informatique de gestion
 
Examen audit taleb guelmim s6
Examen audit   taleb guelmim s6Examen audit   taleb guelmim s6
Examen audit taleb guelmim s6
 
Exercice 7
Exercice 7Exercice 7
Exercice 7
 
Examen controle de gestion s6
Examen controle de gestion s6Examen controle de gestion s6
Examen controle de gestion s6
 
R esume economie monetaire s4
R esume economie monetaire s4R esume economie monetaire s4
R esume economie monetaire s4
 
Droit commerciale s44
Droit commerciale s44 Droit commerciale s44
Droit commerciale s44
 
Cours economie industriel
Cours economie industriel Cours economie industriel
Cours economie industriel
 
Qcm audit s6
Qcm audit s6Qcm audit s6
Qcm audit s6
 
Exercices d analyse financière s4
Exercices d analyse financière s4 Exercices d analyse financière s4
Exercices d analyse financière s4
 
Exercice compta s22
Exercice compta s22Exercice compta s22
Exercice compta s22
 
Exam termenologie s2 2015
Exam termenologie s2 2015Exam termenologie s2 2015
Exam termenologie s2 2015
 
Resume audit 2016
Resume audit 2016Resume audit 2016
Resume audit 2016
 
Politique monetaire s4 2016
Politique monetaire s4 2016Politique monetaire s4 2016
Politique monetaire s4 2016
 
Microeconomie s1 [www.learneconomie.blogspot.com]
Microeconomie s1 [www.learneconomie.blogspot.com]Microeconomie s1 [www.learneconomie.blogspot.com]
Microeconomie s1 [www.learneconomie.blogspot.com]
 
Finances publiques-maroc
Finances publiques-marocFinances publiques-maroc
Finances publiques-maroc
 
Le controle budgétaire
Le controle budgétaireLe controle budgétaire
Le controle budgétaire
 
Exercices de la Comptabilité des Sociétés s4
Exercices de la Comptabilité des Sociétés s4Exercices de la Comptabilité des Sociétés s4
Exercices de la Comptabilité des Sociétés s4
 
Examens Droit Commercial et des Sociétés s4 2014/2015
Examens Droit Commercial et des Sociétés s4 2014/2015Examens Droit Commercial et des Sociétés s4 2014/2015
Examens Droit Commercial et des Sociétés s4 2014/2015
 

Dernier

Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdf
Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdfBibdoc 2024 - Les intelligences artificielles en bibliotheque.pdf
Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdfAtelier Canopé 37 - Tours
 
L'Unité de Spiritualité Eudiste se joint à toute l'Église Universelle et en p...
L'Unité de Spiritualité Eudiste se joint à toute l'Église Universelle et en p...L'Unité de Spiritualité Eudiste se joint à toute l'Église Universelle et en p...
L'Unité de Spiritualité Eudiste se joint à toute l'Église Universelle et en p...Unidad de Espiritualidad Eudista
 
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24Newsletter SPW Agriculture en province du Luxembourg du 10-04-24
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24BenotGeorges3
 
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...Atelier Canopé 37 - Tours
 
La Base unique départementale - Quel bilan, au bout de 5 ans .pdf
La Base unique départementale - Quel bilan, au bout de 5 ans .pdfLa Base unique départementale - Quel bilan, au bout de 5 ans .pdf
La Base unique départementale - Quel bilan, au bout de 5 ans .pdfbdp12
 
Chana Orloff.pptx Sculptrice franco-ukranienne
Chana Orloff.pptx Sculptrice franco-ukranienneChana Orloff.pptx Sculptrice franco-ukranienne
Chana Orloff.pptx Sculptrice franco-ukranienneTxaruka
 
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdf
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdfBibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdf
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdfAtelier Canopé 37 - Tours
 
Calendrier de la semaine du 8 au 12 avril
Calendrier de la semaine du 8 au 12 avrilCalendrier de la semaine du 8 au 12 avril
Calendrier de la semaine du 8 au 12 avrilfrizzole
 
Pas de vagues. pptx Film français
Pas de vagues.  pptx   Film     françaisPas de vagues.  pptx   Film     français
Pas de vagues. pptx Film françaisTxaruka
 
Copilot your everyday AI companion- OFFICE 365-
Copilot your everyday AI companion- OFFICE 365-Copilot your everyday AI companion- OFFICE 365-
Copilot your everyday AI companion- OFFICE 365-Majida Antonios, M.Ed.
 
Aux origines de la sociologie : du XIXème au début XX ème siècle
Aux origines de la sociologie : du XIXème au début XX ème siècleAux origines de la sociologie : du XIXème au début XX ème siècle
Aux origines de la sociologie : du XIXème au début XX ème siècleAmar LAKEL, PhD
 
Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptx
Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptxPrésentation - Initiatives - CECOSDA - OIF - Fact Checking.pptx
Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptxJCAC
 

Dernier (13)

Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdf
Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdfBibdoc 2024 - Les intelligences artificielles en bibliotheque.pdf
Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdf
 
L'Unité de Spiritualité Eudiste se joint à toute l'Église Universelle et en p...
L'Unité de Spiritualité Eudiste se joint à toute l'Église Universelle et en p...L'Unité de Spiritualité Eudiste se joint à toute l'Église Universelle et en p...
L'Unité de Spiritualité Eudiste se joint à toute l'Église Universelle et en p...
 
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24Newsletter SPW Agriculture en province du Luxembourg du 10-04-24
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24
 
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...
 
La Base unique départementale - Quel bilan, au bout de 5 ans .pdf
La Base unique départementale - Quel bilan, au bout de 5 ans .pdfLa Base unique départementale - Quel bilan, au bout de 5 ans .pdf
La Base unique départementale - Quel bilan, au bout de 5 ans .pdf
 
Chana Orloff.pptx Sculptrice franco-ukranienne
Chana Orloff.pptx Sculptrice franco-ukranienneChana Orloff.pptx Sculptrice franco-ukranienne
Chana Orloff.pptx Sculptrice franco-ukranienne
 
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdf
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdfBibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdf
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdf
 
Calendrier de la semaine du 8 au 12 avril
Calendrier de la semaine du 8 au 12 avrilCalendrier de la semaine du 8 au 12 avril
Calendrier de la semaine du 8 au 12 avril
 
Pas de vagues. pptx Film français
Pas de vagues.  pptx   Film     françaisPas de vagues.  pptx   Film     français
Pas de vagues. pptx Film français
 
Copilot your everyday AI companion- OFFICE 365-
Copilot your everyday AI companion- OFFICE 365-Copilot your everyday AI companion- OFFICE 365-
Copilot your everyday AI companion- OFFICE 365-
 
Aux origines de la sociologie : du XIXème au début XX ème siècle
Aux origines de la sociologie : du XIXème au début XX ème siècleAux origines de la sociologie : du XIXème au début XX ème siècle
Aux origines de la sociologie : du XIXème au début XX ème siècle
 
Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptx
Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptxPrésentation - Initiatives - CECOSDA - OIF - Fact Checking.pptx
Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptx
 
Bulletin des bibliotheques Burkina Faso mars 2024
Bulletin des bibliotheques Burkina Faso mars 2024Bulletin des bibliotheques Burkina Faso mars 2024
Bulletin des bibliotheques Burkina Faso mars 2024
 

S3.echantillonnage estimation-s3

  • 1. Statistiques inférentielles - BTS 2ème année - Page 1 G. COSTANTINI http://bacamaths.net/ ÉCHANTILLONNAGE - ESTIMATION - Partie A - Échantillonnage - L'objectif de cette partie est de répondre à la problématique suivante : comment, à partir d'informations (couple moyenne-écart-type ou proportion) connues sur une population, peut-on prévoir celles d'un échantillon ? Nous distinguerons deux cas : celui où l'on étudie une moyenne dans un échantillon et celui où l'on étudie une proportion dans un échantillon. A.1. Étude de la moyenne d'un échantillon On dispose d'une population sur laquelle est définie une variable aléatoire X dont on connaît l'espérance (ou la moyenne) m et l'écart-type s. On s'intéresse aux échantillons de taille n. Auront-ils tous la même moyenne ? Non, certains peuvent être constitués d'éléments atypiques et avoir une moyenne très différente de celle de la population (surtout si l'échantillon est de petite taille). Notons X la variable aléatoire qui, à chaque échantillon de taille n, associe sa moyenne ( X s'appelle encore la distribution des moyennes des échantillons). Que peut-on dire de cette variable aléatoire X ? Théorème Central Limite - Version 1 - (Version faible) Contexte : variable aléatoire X qui suit une loi normale sur la population X Ê N(m ; s) On prélève, au hasard, un échantillon (tirages avec remise(1) ou assimilés) de taille n de moyenne X . Alors la variable aléatoire X suit également une loi normale : X Ê N ; n sæ ö mç ÷ è ø (1) Un tirage avec remise est encore appelé "tirage non exhaustif". Si on fait un tirage sans remise (tirage exhaustif), on modifie la taille de la population au fur et à mesure des tirages, ce qui compliquerait les calculs (intervention d'un facteur d'exhaustivité). Ceci dit, pour des grandes populations le tirage sans remise s'assimile à un tirage avec remise. Echantillons de taille n ... mim5m4m3m2m1 Population Moyenne m connue. Ecart-type s connu. { m Atténuation de la dispersion par le processus d'échantillonnage.
  • 2. Statistiques inférentielles - BTS 2ème année - Page 2 G. COSTANTINI http://bacamaths.net/ Démonstration : Notons E = {x1 ; x2 ; ... ; xn} un échantillon de n éléments prélevés au hasard dans la population. Pour tout i compris entre 1 et n, notons Xi la variable aléatoire correspondant à la valeur du i-ème élément xi de l'échantillon. Nous savons, par hypothèse, que : E(Xi) = m et s(Xi) = s La moyenne X des n valeurs de l'échantillon est : X = 1 2 ... nX X X n + + + D'après les propriétés de la loi normale, nous savons qu'une combinaison linéraire de variables aléatoire qui suivent la loi normale est encore une variable aléatoire qui suit la loi normale. Comme chaque variable aléatoire Xi suit ici la loi normale N(m, s), la variable aléatoire moyenne X suit donc également une loi normale. Calculons ses paramètres. D'après la propriété de linéarité de l'espérance : E ( )X = 1 2( ) ( ) ... ( )nE X E X E X n + + + = n n m = m D'après les propriétés de la variance : V( )X = 1 2 2 ( ) ( ) ... ( )nV X V X V X n + + + = 2 2 n n s = 2 n s D'où : s( )X = n s Théorème Central Limite - Version 2 - (Version forte) Contexte : variable aléatoire X qui suit une loi quelconque sur la population avec E(X) = m et s(X) = s. On prélève, au hasard, un échantillon (tirages avec remise ou assimilés) de taille n, avec n  30, de moyenne X . Alors la variable aléatoire X suit approximativement une loi normale : X Ê N ; n sæ ö mç ÷ è ø Ce théorème dû aux mathématiciens De Moivre et Laplace est de démonstration très difficile. Il est admis ici. Remarque : il ne faut pas confondre l'écart-type n s de la variable aléatoire X (qui est définie sur l'ensemble des échantillons possibles de taille n) avec l'écart-type d'un échantillon prélevé. L'écart-type de l'échantillon prélevé n'interviendra pas dans nos calculs dans cette partie. Pour éviter cette confusion, la quantité n s sera parfois appelée "erreur type". Exemple : Les statistiques des notes obtenues en mathématiques au BAC STI en France pour l'année 2006 sont : Moyenne nationale : m =10,44 Écart-type : s = 1,46 Une classe de BTS comporte 35 élèves en 2006/2007 issus d'un BAC STI en 2006.
  • 3. Statistiques inférentielles - BTS 2ème année - Page 3 G. COSTANTINI http://bacamaths.net/ Calculer la probabilité que la moyenne de cette classe soit supérieure à 10. Ici, nous ne connaissons pas la loi sur la population, mais l'effectif n de l'échantillon est supérieur à 30. Nous allons donc pouvoir utiliser le T.C.L. 2. Notons X la variable aléatoire qui, à tout échantillon de taille n = 35, fait correspondre sa moyenne. Alors : X Ê N ; n sæ ö mç ÷ è ø = N 1,46 10,44; 35 æ ö ç ÷ è ø Posons T = 10,44 1,46 35 X - ainsi T Ê N(0 ; 1). Nous obtenons alors par centrage et réduction : P( X  10) = P 10,44 10 10,44 1,46 1,46 35 35 X æ ö ç ÷- - ç ÷ ç ÷ ç ÷ è ø  = P(T  -1,78) = P(T  1,78) = Π(1,78) Et par lecture directe de la table de la loi normale centrée-réduite : Π(1,78) = 0,9625 Conclusion : il y a environ 96% de chance que, dans cette classe de BTS, la moyenne des notes au baccalauréat de Mathématiques soit supérieure à 10. A.2. Étude d'une proportion dans un échantillon Cette fois-ci, on dispose d'une population sur laquelle on étudie un caractère (ou attribut) A dont on connaît la proportion p dans la population. On s'intéresse aux échantillons de taille n. La proportion du caractère A dans les échantillons sera-t-elle toujours la même ? Evidemment non, cette proportion varie en fonction de l'échantillon choisi. Notons F la variable aléatoire qui, à chaque échantillon de taille n, associe sa proportion du caractère A (F s'appelle distribution des fréquence des échantillons). Que peut-on dire de cette variable aléatoire F ? 1-Π(t)Π(-t) t-t Remarque : P(T  t) = P(T  -t) En effet : P(T  t) = 1 - P(T  t) = 1 - Π(t) = Π(-t) = P(T  -t) Echantillons de taille n ... pip5p4p3p2p1 Population Proportion p connue du caractère A { A 1 - pp AA
  • 4. Statistiques inférentielles - BTS 2ème année - Page 4 G. COSTANTINI http://bacamaths.net/ Théorème Contexte : une population sur laquelle on étudie un caractère A répandu avec une fréquence p. On prélève, au hasard, un échantillon (tirages avec remise ou assimilés) de taille n avec n  30. On note F la fréquence du caractère A dans l'échantillon. Alors la variable aléatoire F suit approximativement une loi normale : F Ê N (1 ) ; p p p n æ ö- ç ÷ç ÷ è ø Démonstration : Nous allons avoir ici un modèle binomial ou apparenté dont on sait qu'il converge vers la loi normale. Pour tout i compris entre 1 et n, notons Xi la variable aléatoire définie par : Xi = 1 si le -ème élément de l'échantillon possède l'attribut 0 sinon i Aì í î La variable aléatoire Xi suit une loi de Bernoulli de paramètre p. La variable aléatoire X = X1 + X2 + ... + Xn est donc binomiale de paramètres n et p : X Ê B(n, p) En conséquence : E(X) = np et s(X) = (1 )np p- La variable aléatoire F = X n correpond ainsi à la fréquence de l'attribut A dans l'échantillon. D'après les propriétés de l'espérance et de l'écart-type : E(F) = ( )E X n = p et s(F) = ( )X n s = (1 )p p n - Exemple : Une élection a eu lieu et un candidat a eu 40 % des voix. On prélève un échantillon de 100 bulletins de vote. Quelle est la probabilité que, dans l'échantillon, le candidat ait entre 35 % et 45 % des voix ? Ici, nous avons n = 100 et p = 0,4. La variable aléatoire F correspondant à la fréquence des votes pour le candidat dans l'échantillon vérifie donc : F Ê N 0,4 0,6 0,4; 100 æ ö´ ç ÷ç ÷ è ø = N 0,24 0,4; 10 æ ö ç ÷ç ÷ è ø Posons T = 0,4 0,24 10 F - ainsi T Ê N(0 ; 1). Nous obtenons alors par centrage et réduction : P(0,35  F  0,45) = P(-1,02  T  1,02) = 2Π(1,02) - 1 Et par lecture directe de la table de la loi normale centrée-réduite Π(1,02) = 0,8461. D'où : P(0,35  F  0,45) = 0,6922 Il y a donc environ 69 % de chance que, dans un échantillon de taille n = 100, le candidat ait entre 35 % et 45 % des voix.
  • 5. Statistiques inférentielles - BTS 2ème année - Page 5 G. COSTANTINI http://bacamaths.net/ En analysant l'exercice ci-dessus, on constate que l'on dispose des informations sur la population (ici, l'ensemble des votes) parce que l'élection a déjà eu lieu. On en déduit des informations sur l'échantillon. Mais, dans la pratique, c'est souvent le phénomène réciproque que nous étudierons : les élections n'ont pas encore eu lieu et on voudrait retrouver les informations sur la population grâce un sondage réalisé sur un échantillon. D'où la deuxième partie de ce document consacrée à l'estimation. - Partie B - Estimation - L'objectif de cette partie est de répondre à la problématique suivante : comment, à partir d'informations (couple moyenne/écart-type ou proportion) calculées sur un échantillon, retrouver ou plutôt estimer celles d'une population entière ? L'estimation est le problème réciproque de l'échantillonnage. (Mais nous aurons besoin des résultats établis sur la théorie de l'échantillonnage pour passer à la phase estimative). Nous distinguerons deux cas : celui où l'on cherche à estimer la moyenne m d'une variable aléatoire définie sur une population et celui où l'on cherche à estimer la proportion d'individus p ayant tel caractère dans la population. B.1. Estimation d'une moyenne B.1.1. Estimation ponctuelle Contexte : on considère une variable aléatoire X sur une population de moyenne (ou espérance) m inconnue et d'écart-type s inconnu (ou connu). On suppose que l'on a prélevé un échantillon de taille n (tirage avec remise ou assimilé) sur lequel on a calculé la moyenne me et l'écart-type se. Une estimation ponctuelle μ« de la moyenne m de la population est : μ« = me Une estimation ponctuelle s« de l'écart-type se de la population est : s« = 1 n n - se Proportion : p inconnueMoyenne : m inconnue Ecart-type : s connu ou inconnu Echantillon de taille nEchantillon de taille n PopulationPopulation pe connue me connue se connu ESTIMATION d'une PROPORTIONESTIMATION d'une MOYENNE
  • 6. Statistiques inférentielles - BTS 2ème année - Page 6 G. COSTANTINI http://bacamaths.net/ Le coefficient 1 n n - s'appelle correction de biais. Lorsque la taille n de l'échantillon est assez grand (en pratique n  30), ce coefficient est très voisin de 1, si bien que, dans ce cas, on peut estimer s«  se. Exemple : Une université comporte 1500 étudiants. On mesure la taille de 20 d'entre eux. La moyenne me et l'écart-type se calculés à partir de cet échantillon sont : me = 176 cm et se = 6 cm Nous pouvons donc estimer les paramètres de la population : μ« = 176 cm et s« = 20 19 ´ 6  6,16 cm Remarque : Nous n'avons fait qu'une estimation, il est bien sûr impossible de retrouver les vraies caractéristiques m et s de la population. L'estimation ponctuelle permet surtout de disposer d'une valeur de référence pour poursuivre/affiner les calculs. On souhaiterait notamment pouvoir faire une estimation par intervalle, en contrôlant le risque pris. B.1.2. Estimation par intervalle de confiance Le contexte est le même que le précédent, sauf que nous allons raisonner en deux temps, une phase a priori (ou prévisionnelle) dans lequelle on suppose que l'échantillon n'est pas encore prélevé et une phase a posteriori dans laquelle on suppose connue la moyenne me et l'écart-type se de l'échantillon et donc la moyenne estimée μ« et l'écart-type estimé s« de la population. - PHASE A PRIORI - Mise en place du modèle prévisionnel - Nous avons vu, dans la théorie sur l'échantillonnage, que si X est la variable aléatoire correspondant à la moyenne d'un échantillon de taille n pris au hasard, alors le Théorème Central Limite permet d'affirmer que X suit approximativement une loi normale : X Ê N ; n sæ ö mç ÷ è ø Nous allons chercher un intervalle qui contient m avec une confiance arbitraire de 95% (cela pourrait aussi être 99% ou un autre coefficient de confiance). Nous cherchons donc un rayon r tel que : P( X - r  m  X + r) = 0,95 Probabilité que la moyenne m de la population tombe dans un intervalle du type [ X - r ; X + r] X + rX - r Xm
  • 7. Statistiques inférentielles - BTS 2ème année - Page 7 G. COSTANTINI http://bacamaths.net/ Cette disposition des inégalités n'est pas pratique mais il y a une correspondance remarquable entre deux événements qui va nous faciliter les calculs : X - r  m  X + r Retranchons X et m dans chaque membre : - m - r  - X  r - m Multiplions par -1 : r + m  X  m - r Remettons les inégalités dans l'ordre croissant : m - r  X  r + m Nous sommes ainsi ramenés à calculer : P(m - r  X  m + r) = 0,95 On sait que la variable aléatoire T = X n -m s = ( ) n X -m s suit la loi normale centrée-réduite N(0 ; 1). Nous obtenons donc, par centrage et réduction : P r X r n n n æ ö ç ÷m - -m -m m + -m ç ÷ s s sç ÷ ç ÷ è ø   = 0,95 P r n r n T æ ö -ç ÷ç ÷s sè ø   = 0,95 P r n r n T æ ö -ç ÷ç ÷s sè ø   = 0,95 2Π r næ ö ç ÷ç ÷sè ø - 1 = 0,95 Π r næ ö ç ÷ç ÷sè ø = 0,975 Π(t) = 0,975 où t = r n s Nous cherchons donc, par lecture inverse de la table de la loi normale centrée réduite une borne t telle que : Π(t) = 0,975 La borne t = 1,96 convient. La borne t dépend du coefficient de confiance choisi. Avec un coefficient de confiance de 99%, nous aurions obtenu : 2Π r næ ö ç ÷ç ÷sè ø - 1 = 0,99 Dans la pratique, nous partirons de cette écriture pour déterminer un intervalle de confiance. Probabilité que la moyenne X de l'échantillon tombe dans un intervalle centré en m. m Cette propriété découle de la symétrie de la valeur absolue : |X - Y|  r Cela signifie que l'écart entre X et Y est inférieur à r, ce qui s'écrit indifféremment : -r  X - Y  r Y - r  X  Y + r Ou encore : -r  Y - X  r X - r  Y  X + r On constate ici que le fait de ne pas connaître m n'est pas gênant, à ce stade. Rappel : si T Ê N(0 ; 1) alors : P(-a  T  a) = 2Π(a) -1 En effet : P(-a  T  a) = Π(a) - Π(-a) = Π(a) - (1 - Π(a)) = 2Π(a) -1 m + rm- r X m
  • 8. Statistiques inférentielles - BTS 2ème année - Page 8 G. COSTANTINI http://bacamaths.net/ Π(t) = 0,995 t = 2,575 Par la suite, nous noterons t le réel tel que 2Π(t) - 1 = C où C est le degré de confiance choisi. Ainsi, notre réel r recherché est tel que : r n s = t Le rayon r de l'intervalle cherché est : r t n s = - PHASE A POSTERIORI - Utilisation des valeurs estimées ponctuellement - Nous supposons maintenant que l'échantillon a été tiré, nous obtenons donc une représentation me de la variable aléatoire X : Nous pouvons affirmer que l'intervalle obtenu pour cet échantillon e e;t t n n s sé ù m - m +ê ú ë û fait partie d'une famille dans laquelle 95 % contiennent la vraie moyenne m de la population. On l'appelle intervalle de confiance à 95 % (ou autre selon le coefficient de confiance décidé préalablement). Pour calculer les bornes de cet intervalle, deux cas de figure se présentent selon que nous connaissons ou pas l'écart-type s de la population. S'il est connu, il n'y a rien à faire : IC = e e;t t n n s sé ù m - m +ê ú ë û Si l'écart-type s de la population n'est pas connu, on le remplace par son estimation ponctuelle s« = 1 n n - se. Dans ce cas, nous obtenons : r = e 1 n t n n s - = e 1 t n s - Nous pouvons donc estimer avec une confiance de 95 % (ou 99 % selon le cas) que la moyenne m de la population appartient à l'intervalle : IC = e e e e; 1 1 t t n n s sé ù m - m +ê ú - -ë û Remarques : · L'intervalle de confiance est centré en la valeur me car c'est la seule valeur de référence que nous disposons. · Le centre de l'intervalle de confiance (à savoir me) dépend de l'échantillon choisi (puisque me en dépend). Son rayon en dépend aussi lorsqu'on ne connaît pas l'écart-type de la population. · La vraie valeur m de la moyenne de la population peut ne pas appartenir à l'intervalle de confiance. · Le rayon de l'intervalle de confiance (à savoir la quantité r =t n s ) dépend du degré de confiance C choisi. Plus le degré de confiance C est proche de 100%, et plus la borne t sera élevée et donc le rayon grand. On ne retiendra pas cette formule. Dans la pratique, on refait les calculs. me + rme - r mem
  • 9. Statistiques inférentielles - BTS 2ème année - Page 9 G. COSTANTINI http://bacamaths.net/ Illustration : Exemple : Une université comporte 1500 étudiants. On mesure la taille de 20 d'entre eux. La moyenne me et l'écart-type se calculés à partir de cet échantillon sont : me = 176 cm et se = 6 cm Nous avons déjà estimé ponctuellement les paramètres de la population : μ« = 176 cm et s« = 20 19 ´ 6  6,16 cm Déterminons maintenant une estimation de m par intervalle de confiance à 95% (ou au risque de 5 %). Notons X la variable aléatoire correspondant à la moyenne d'un échantillon de taille 20 pris au hasard. Nous savons que : X Ê N ; n sæ ö mç ÷ è ø = N ; 20 sæ ö mç ÷ è ø On calcule un rayon r tel que : P(m - r  X  m + r) = 0,95 On pose T = 20 X r- s , ainsi T suit la loi normale centrée-réduite N(0 ; 1). Nous avons donc : P 20 20r r T æ ö -ç ÷ç ÷s sè ø   = 0,95 2Π 20ræ ö ç ÷ç ÷sè ø - 1 = 0,95 Π 20ræ ö ç ÷ç ÷sè ø = 0,975 Π(t) = 0,975 où t = 20r s Nous cherchons donc, par lecture inverse de la table de la loi normale centrée réduite une borne t telle que : Π(t) = 0,975 La borne t = 1,96 convient. Ainsi, notre réel r recherché est tel que : 20r s = 1,96 m μ« = me 99% 99% 95% μ« = me μ« = me XPopulation Echantillon 1 Echantillon 2 Echantillon 3 Un intervalle de confiance ne contient pas forcément la moyenne m de la population. Un intervalle de confiance à 95 % est plus petit qu'un intervalle de confiance à 99%. Il risque moins de contenir la valeur moyenne m.
  • 10. Statistiques inférentielles - BTS 2ème année - Page 10 G. COSTANTINI http://bacamaths.net/ r = 1,96 20 ´s Mais une fois l'échantillon tiré, nous avons obtenu un écart-type estimé s«  6,16 cm. D'où : r  2,7 La réalisation de l'intervalle de confiance à 95% sur cet échantillon est : IC = [176 - 2,7 ; 176 + 2,7] IC = [173,3 ; 178,7] Nous pouvons donc estimer, avec une confiance de 95 % que la taille moyenne de la population est comprise entre 173,3 cm et 178,7 cm. B.2. Estimation d'une proportion B.2.1. Estimation ponctuelle Contexte : on considère un caractère (ou attribut) A sur une population dont la proportion p est inconnue. On suppose que l'on a prélevé un échantillon de taille n (tirage avec remise ou assimilé) sur lequel on a calculé la proportion pe d'individus ayant le caractère A. Notons F la variable aléatoire correspondant à la proportion du caractère A dans un échantillon de taille n pris au hasard. On rappelle qu'alors F suit approximativement une loi normale : F Ê N( ); pp s où sp = (1 )p p n - Une estimation ponctuelle p« de la proportion p de l'attribut A dans la population est : p« = pe Une estimation ponctuelle sp« de l'écart-type sp est selon le cas : 1 n n - e e(1 )p p n - = e e(1 ) 1 p p n - - si n  30 e e(1 )p p n - si n > 30 1 4n si statisticien pessimiste Exemple : À quelques jours d'une élection, un candidat fait effectuer un sondage. Sur les 150 personnes interrogées, 45 se disent prêtes à voter pour lui aux prochaines élections. La proportion d'individus prête à voter pour ce candidat dans l'échantillon est ici de pe = 45 150 = 0,3. On estime donc qu'il en est de même dans la population (comment pourrait-on faire autrement ?) : p« = pe = 0,3 Quand à l'indication sp, on peut ici l'estimer par : sp« = e e(1 )p p n - = 0,3 0,7 150 ´  0,037 Ces estimations ponctuelles de l'écart-type ne sont pas utiles dans l'immédiat. Elle serviront pour la détermination d'un intervalle de confiance de la proportion. Correction de biais.
  • 11. Statistiques inférentielles - BTS 2ème année - Page 11 G. COSTANTINI http://bacamaths.net/ On voudrait aller plus loin et, au lieu d'une simple proportion, calculer un intervalle contenant, avec une confiance arbitraire fixée au départ, la proportion p d'individus prêts à voter pour ce candidat. B.2.2. Estimation par intervalle de confiance Le contexte est le même que le précédent. Nous avons vu, dans la théorie sur l'échantillonnage, que si F est la variable aléatoire correspondant à la proportion d'un caractère dans un échantillon de taille n pris au hasard, alors F suit approximativement une loi normale : F Ê N( ); pp s où sp = (1 )p p n - Nous avons déjà remarqué que le fait que p soit inconnu n'est pas gênant dans les calculs a priori. Le problème ici, c'est que nous ne connaissons pas l'écart-type (1 )p p n - . Nous le remplaçerons, dans la phase a posteriori, par son estimation ponctuelle (qui est e e(1 ) 1 p p n - - en général ou e e(1 )p p n - si la correction de biais n'est pas proposée ou encore 1 4n si nous voulons une hypothèse pessimiste). Cherchons un intervalle qui contient p avec une confiance arbitraire de 90 % (cela pourrait être un autre coefficient de confiance). Nous cherchons donc un rayon r tel que : P(F - r  p  F + r) = 0,90 Nous avons déjà vu que cette probabilité pouvait s'écrire de manière plus pratique : P(p - r  F  p + r) = 0,90 On sait que la variable aléatoire T = p F p- s suit la loi normale centrée réduite N(0 ; 1). Nous obtenons donc, par centrage et réduction : P p p p p r p F p p r pæ ö- - - + - ç ÷ ç ÷s s sè ø   = 0,90 P p p r r T æ ö- ç ÷ ç ÷s sè ø   = 0,90 2Π p ræ ö ç ÷ ç ÷sè ø - 1 = 0,90 Π p ræ ö ç ÷ ç ÷sè ø = 0,95 On cherche une borne t telle que : Π(t) = 0,95 avec t = p r s Par lecture inverse de la table de la loi normale centrée réduite N(0 ; 1) : t = 1,645 Ce qui nous permet de calculer r : r = t sp Supposons maintenant l'échantillon prélevé. Nous avons donc une estimation pontuelle de p et sp. Ainsi, la réalisation de l'intervalle de confiance dans l'échantillon est :
  • 12. Statistiques inférentielles - BTS 2ème année - Page 12 G. COSTANTINI http://bacamaths.net/ IC = e e e e e e (1 ) (1 ) ; 1 1 p p p p p t p t n n é ù- - - +ê ú - -ê úë û Remarques : · Si on n'effectue pas la correction de biais, l'intervalle de confiance est : IC = e e e e e e (1 ) (1 ) ; p p p p p t p t n n é ù- - - +ê ú ê úë û · On peut également se placer dans une hypothèse pessimiste en choisissant un écart-type maximal. Nous savons que la parabole d'équation y = x(1 - x) admet un maximum égal à 1 4 en 1 2 . Ainsi l'écart-type maximal est 1 4n . Il a, de plus, l'avantage d'être indépendant de p. Dans ce cas, la réalisation de l'intervalle de confiance dans l'échantillon est : IC = e e 1 1 ; 4 4 p t p t n n é ù - +ê ú ë û Exemple : A quelques jours d'une élection, un candidat fait faire un sondage. Sur les 150 personnes interrogées, 45 se disent prêtes à voter pour lui aux prochaines élections. La proportion d'individus prête à voter pour ce candidat dans l'échantillon est ici de pe = 45 150 = 0,3. On a déjà estimé ponctuellement : p« = pe = 0,3 et sp«  0,037 Déterminons maintenant une estimation de p par intervalle de confiance à 80%. Notons F la variable aléatoire correspondant à la proportion d'individus prêts à voter pour ce candidat dans un échantillon de taille 150 pris au hasard. Nous avons vu qu'approximativement : F Ê N( ); pp s où sp = (1 )p p n - On cherche un rayon r tel que : P(p - r  F  p + r) = 0,8 2Π p ræ ö ç ÷ ç ÷sè ø - 1 = 0,8 Π p ræ ö ç ÷ ç ÷sè ø = 0,9 Par lecture inverse de la table de la loi normale centrée-réduite, on cherche une borne t telle que : Π(t) = 0,9 avec t = p r s La valeur t  1,28 convient donc : r = 1,28 sp Supposons maintenant l'échantillon prélevé. Une estimation ponctuelle de sp est sp«  0,037. D'où : r  0,047 On ne retiendra pas cette formule. Dans la pratique, on refait les calculs.
  • 13. Statistiques inférentielles - BTS 2ème année - Page 13 G. COSTANTINI http://bacamaths.net/ La réalisation de l'intervalle de confiance dans cet échantillon est alors IC = [0,3 - 0,047 ; 0,3 + 0,047] IC = [0,253 ; 0,347] IC% = [25,3 ; 34,7] Nous pouvons estimer, avec une confiance de 80 %, que la proportion d'individus dans la population prêts à voter pour le candidat en question est comprise entre 25,3 % et 34,7 %. Exercice : Une usine fabrique des câbles. Un câble est considéré comme conforme si sa résistance à la rupture X est supérieure à 3 tonnes. L'ingénieur responsable de la production voudrait connaître, en moyenne, la résistance à la rupture des câbles fabriqués. Il n'est, bien sûr, pas question de faire le test sur toute la production (l'usine perdrait toute sa production !). Un technicien prélève donc un échantillon de 100 câbles dans la production. Notons X la variable aléatoire correspondant à la force à exercer sur le câble pour le rompre. Le technicien obtient les résultats suivants : E( X ) = 3,5 tonnes s( X ) = 0,4 tonne Proportion de câbles dont la résistance est supérieure à 3 tonnes : pe = 0,85 1. a. Donner une estimation ponctuelle de la moyenne m et de l'écart-type s de la variable aléatoire X dans la production. b. Déterminer une estimation par intervalle de confiance à 95 % de la moyenne m de X. 2. a. Donner une estimation ponctuelle de la proportion p de câbles conformes dans la production. b. Déterminer une estimation par intervalle de confiance à 90 % de cette proportion.
  • 14. Statistiques inférentielles - BTS 2ème année - Page 14 G. COSTANTINI http://bacamaths.net/ - RÉSUMÉ - - Echantillonnage - - Estimation - Echantillons de taille n de moyenne X X Ê N ; n sæ ö mç ÷ è ø où m et s sont la moyenne et l'écart-type dans la population. Echantillons de taille n avec une fréquence F F Ê N (1 ) ; p p p n æ ö- ç ÷ç ÷ è ø où p est la proportion dans la population. PROPORTIONMOYENNE Proportion inconnue p dans une population. Echantillon de taille n connu avec une proportion pe. F Une estimation ponctuelle de p est pe. F Une estimation ponctuelle de sp est e e(1 ) 1 p p n - - si n  30 ou e e(1 )p p n - sinon (n > 30). F Pour estimer p par intervalle avec une confiance C (par ex 95%), on cherche un rayon r tel que : P(p - r  F  p + r) = C où F Ê N( ); pp s avec sp = (1 )p p n - On exprime r en fonction de sp et on remplace sp par son estimation ponctuelle. IC = [pe - r ; pe + r] Population de moyenne m inconnue et d'écart-type s. Echantillon de taille n connu de moyenne me et d'écart-type se. F Une estimation ponctuelle de m est me. F Une estimation ponctuelle de s est 1 n n - se si n  30 ou tout simplement se sinon (n > 30). F Pour estimer m par intervalle avec une confiance C (par ex 95%), on cherche un rayon r tel que : P(m - r  X  m + r) = C où X Ê N ; n sæ ö mç ÷ è ø On exprime r en fonction de s et on remplace s par sa valeur connue ou son estimation ponctuelle. IC = [me - r ; me + r] PROPORTIONMOYENNE Coefficient de confiance 80 % 90 % 95 % 99 % Valeur de P(t) 0,9 0,95 0,975 0,995 Borne t 1,28 1,645 1,96 2,575