SlideShare une entreprise Scribd logo
Les sondages aléatoires simples
Mahamadou HARO
Ingénieur Statisticien Économiste
Séminaire de sondage
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 1 / 21
Plan de la présentation
1 Principe
2 Estimation d’une moyenne
3 Estimation d’un total
4 Estimation d’une proportion
5 Estimation d’un ratio
6 Méthodes de tirage
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 2 / 21
Principe
Plan
1 Principe
2 Estimation d’une moyenne
3 Estimation d’un total
4 Estimation d’une proportion
5 Estimation d’un ratio
6 Méthodes de tirage
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 3 / 21
Principe
Introduction
De l’univers on extrait un échantillon de taille n, en accordant à chaque
unité statistique la même probabilité d’être tirée. L’échantillon peut être
tiré :
avec remise : une unité ayant été sélectionnée à un des tirages
est "remise dans l’urne de tirage" et participe aux tirages
suivants ; elle peut donc être tirée deux fois, ou plus ;
sans remise : une fois une unité tirée, elle n’est plus prise en
compte pour les tirages suivants (c’est le mode de tirage qui
semble le plus "naturel").
Le sondage aléatoire simple est la base de la méthode des sondages,
à partir de laquelle sont développées les autres méthodes présentées
dans ce manuel.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 4 / 21
Principe
Introduction
De l’univers on extrait un échantillon de taille n, en accordant à chaque
unité statistique la même probabilité d’être tirée. L’échantillon peut être
tiré :
avec remise : une unité ayant été sélectionnée à un des tirages
est "remise dans l’urne de tirage" et participe aux tirages
suivants ; elle peut donc être tirée deux fois, ou plus ;
sans remise : une fois une unité tirée, elle n’est plus prise en
compte pour les tirages suivants (c’est le mode de tirage qui
semble le plus "naturel").
Le sondage aléatoire simple est la base de la méthode des sondages,
à partir de laquelle sont développées les autres méthodes présentées
dans ce manuel.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 4 / 21
Estimation d’une moyenne
Plan
1 Principe
2 Estimation d’une moyenne
3 Estimation d’un total
4 Estimation d’une proportion
5 Estimation d’un ratio
6 Méthodes de tirage
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 5 / 21
Estimation d’une moyenne
Estimation d’une moyenne
Pour estimer la moyenne Y d’une variable Y sur l’univers (Y est bien
sûr inconnue) il semble naturel d’utiliser l’estimateur :
¯y =
1
n
n
i=1
yi (1)
moyenne calculée sur les unités de l’échantillon. y est un estimateur
sans biais la moyenne de l’universY. Cette propriété peut s’écrire :
E(¯y) = ¯Y
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 6 / 21
Estimation d’une moyenne
Variance de y
Dans le cas avec remise :
V(¯y) =
V(Y)
n
(2)
Dans le cas sans remise :
V(¯y) = (
N − n
N − 1
)
V(Y)
n
(3)
Ceci veut dire que la variance de l’estimateur sera d’autant plus
faible que :
a)V(Y) sera faible ;
b)la taille de l’échantillon sera importante.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 7 / 21
Estimation d’une moyenne
Variance de y
Dans le cas avec remise :
V(¯y) =
V(Y)
n
(2)
Dans le cas sans remise :
V(¯y) = (
N − n
N − 1
)
V(Y)
n
(3)
Ceci veut dire que la variance de l’estimateur sera d’autant plus
faible que :
a)V(Y) sera faible ;
b)la taille de l’échantillon sera importante.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 7 / 21
Estimation d’une moyenne
Pour un échantillon suffisamment grand, y suit une loi
normale
À partir d’une certaine taille d’échantillon (disons au moins 30), la
distribution de la variable aléatoire y (c’est-à-dire l’ensemble des
estimations fournies par tous les échantillons obtenus avec le
tirage équiprobable de taille n) s’ajuste sur une loi normale
(courbe "en cloche" de Gauss) dont les caractéristiques sont liées
aux valeurs E(y) et V(y) étudiées ci-dessus.
On sait que la distribution d’une loi normale de moyenne m et
d’écart-type σ comprend 95% des valeurs dans l’intervalle
[m − 1, 96σ; m + 1, 96σ].
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 8 / 21
Estimation d’une moyenne
Pour un échantillon suffisamment grand, y suit une loi
normale
À partir d’une certaine taille d’échantillon (disons au moins 30), la
distribution de la variable aléatoire y (c’est-à-dire l’ensemble des
estimations fournies par tous les échantillons obtenus avec le
tirage équiprobable de taille n) s’ajuste sur une loi normale
(courbe "en cloche" de Gauss) dont les caractéristiques sont liées
aux valeurs E(y) et V(y) étudiées ci-dessus.
On sait que la distribution d’une loi normale de moyenne m et
d’écart-type σ comprend 95% des valeurs dans l’intervalle
[m − 1, 96σ; m + 1, 96σ].
Ici on peut dire que 95% des valeurs de y sont situées dans
l’intervalle de [Y − 1, 96 V(y); Y + 1, 96 V(y)], où V(y) est
donnée par les formules (2) ou (3) ci-dessus.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 8 / 21
Estimation d’une moyenne
Pour un échantillon suffisamment grand, y suit une loi
normale
À partir d’une certaine taille d’échantillon (disons au moins 30), la
distribution de la variable aléatoire y (c’est-à-dire l’ensemble des
estimations fournies par tous les échantillons obtenus avec le
tirage équiprobable de taille n) s’ajuste sur une loi normale
(courbe "en cloche" de Gauss) dont les caractéristiques sont liées
aux valeurs E(y) et V(y) étudiées ci-dessus.
On sait que la distribution d’une loi normale de moyenne m et
d’écart-type σ comprend 95% des valeurs dans l’intervalle
[m − 1, 96σ; m + 1, 96σ].
Ici on peut dire que 95% des valeurs de y sont situées dans
l’intervalle de [Y − 1, 96 V(y); Y + 1, 96 V(y)], où V(y) est
donnée par les formules (2) ou (3) ci-dessus.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 8 / 21
Estimation d’une moyenne
La variance V(y) peut être estimée à partir de
l’échantillon
Dans les formules (2) et (3) ci-dessus, la quantité V(Y) est
inconnue. Celle-ci va être estimée à partir des données
observées sur l’échantillon. Si l’on note s2 la grandeur calculée
sur l’échantillon :
s2
=
1
n − 1
n
i=1
(yi − ¯y)2
Alors on a le résultat suivant :
dans le cas sans remise, s2 est un estimateur sans biais de
N
N−1 V(Y)
Donc V(y) est estimée sans biais par :
ˆV(y) = s2
n dans le cas de tirage avec remise ;
ˆV(y) = (1 − n
N )s2
n dans le cas du tirage sans remise.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 9 / 21
Estimation d’une moyenne
La variance V(y) peut être estimée à partir de
l’échantillon
Dans les formules (2) et (3) ci-dessus, la quantité V(Y) est
inconnue. Celle-ci va être estimée à partir des données
observées sur l’échantillon. Si l’on note s2 la grandeur calculée
sur l’échantillon :
s2
=
1
n − 1
n
i=1
(yi − ¯y)2
Alors on a le résultat suivant :
dans le cas sans remise, s2 est un estimateur sans biais de
N
N−1 V(Y)
dans le cas avec remise, s2 est un estimateur sans biais de V(Y).
Donc V(y) est estimée sans biais par :
ˆV(y) = s2
n dans le cas de tirage avec remise ;
ˆV(y) = (1 − n
N )s2
n dans le cas du tirage sans remise.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 9 / 21
Estimation d’une moyenne
La variance V(y) peut être estimée à partir de
l’échantillon
Dans les formules (2) et (3) ci-dessus, la quantité V(Y) est
inconnue. Celle-ci va être estimée à partir des données
observées sur l’échantillon. Si l’on note s2 la grandeur calculée
sur l’échantillon :
s2
=
1
n − 1
n
i=1
(yi − ¯y)2
Alors on a le résultat suivant :
dans le cas sans remise, s2 est un estimateur sans biais de
N
N−1 V(Y)
dans le cas avec remise, s2 est un estimateur sans biais de V(Y).
Donc V(y) est estimée sans biais par :
ˆV(y) = s2
n dans le cas de tirage avec remise ;
ˆV(y) = (1 − n
N )s2
n dans le cas du tirage sans remise.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 9 / 21
Estimation d’une moyenne
Dans la pratique on n’a tiré qu’un échantillon
Ce qui vient d’être dit aux paragraphes précédents doit être
replacé dans cette perspective. Les résultats ci-dessus présentent
la manière dont l’ensemble des valeurs calculées sur tous les
échantillons possibles se répartissent par rapport à la grandeur
recherchée Y.
En pratique, le seul résultat dont on dispose est la moyenne y
calculée sur un échantillon, et Y est inconnue.
On tient un raisonnement analogue au précédent, mais à partir de
y, pour fournir un "intervalle de confiance" pour Y.
on dispose de la valeur y ;
on estime V(y) à partir de l’échantillon, on obtient donc une
estimation de ˆσ(y) (racine carrée de la variance estimée ˆV(y) ;
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 10 / 21
Estimation d’une moyenne
Dans la pratique on n’a tiré qu’un échantillon
Ce qui vient d’être dit aux paragraphes précédents doit être
replacé dans cette perspective. Les résultats ci-dessus présentent
la manière dont l’ensemble des valeurs calculées sur tous les
échantillons possibles se répartissent par rapport à la grandeur
recherchée Y.
En pratique, le seul résultat dont on dispose est la moyenne y
calculée sur un échantillon, et Y est inconnue.
On tient un raisonnement analogue au précédent, mais à partir de
y, pour fournir un "intervalle de confiance" pour Y.
on dispose de la valeur y ;
on estime V(y) à partir de l’échantillon, on obtient donc une
estimation de ˆσ(y) (racine carrée de la variance estimée ˆV(y) ;
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 10 / 21
Estimation d’une moyenne
Remarques
La précision, en termes de variance de y est essentiellement liée
au nombre d’unités enquêtées n, et relativement peu au taux de
sondage n
N (pas du tout dans le cas avec remise).
La variance est proportionnelle à 1
n ; l’écart-type, qui permet
d’établir l’intervalle de confiance, est proportionnel à 1√
n
.Ceci veut
dire que pour réduire de moitié l’intervalle de confiance, il faut
quatre fois plus de questionnaires.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 11 / 21
Estimation d’une moyenne
Remarques
La précision, en termes de variance de y est essentiellement liée
au nombre d’unités enquêtées n, et relativement peu au taux de
sondage n
N (pas du tout dans le cas avec remise).
La variance est proportionnelle à 1
n ; l’écart-type, qui permet
d’établir l’intervalle de confiance, est proportionnel à 1√
n
.Ceci veut
dire que pour réduire de moitié l’intervalle de confiance, il faut
quatre fois plus de questionnaires.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 11 / 21
Estimation d’une moyenne
Combien d’unités enquêter dans l’échantillon ?
On voit que la réponse à cette question se trouve dans les
formules (2) et (3) : si l’on fixe un niveau de précision (largeur de
l’intervalle de confiance, ou coefficient de variation, ce qui signifie
une valeur "maxi"" de la variance), on en déduit le nombre
d’unités minimum nécessaire.
Le problème est que la quantité V(Y) est inconnue avant
l’enquête, dans les formules (2) et (3) ; la seule solution est de
l’estimer, soit de manière intuitive, soit à partir de données
observées sur le passé
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 12 / 21
Estimation d’une moyenne
Combien d’unités enquêter dans l’échantillon ?
On voit que la réponse à cette question se trouve dans les
formules (2) et (3) : si l’on fixe un niveau de précision (largeur de
l’intervalle de confiance, ou coefficient de variation, ce qui signifie
une valeur "maxi"" de la variance), on en déduit le nombre
d’unités minimum nécessaire.
Le problème est que la quantité V(Y) est inconnue avant
l’enquête, dans les formules (2) et (3) ; la seule solution est de
l’estimer, soit de manière intuitive, soit à partir de données
observées sur le passé
ici on se place dans une phase de réflexion en amont de la
réalisation sur le terrain).
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 12 / 21
Estimation d’une moyenne
Combien d’unités enquêter dans l’échantillon ?
On voit que la réponse à cette question se trouve dans les
formules (2) et (3) : si l’on fixe un niveau de précision (largeur de
l’intervalle de confiance, ou coefficient de variation, ce qui signifie
une valeur "maxi"" de la variance), on en déduit le nombre
d’unités minimum nécessaire.
Le problème est que la quantité V(Y) est inconnue avant
l’enquête, dans les formules (2) et (3) ; la seule solution est de
l’estimer, soit de manière intuitive, soit à partir de données
observées sur le passé
ici on se place dans une phase de réflexion en amont de la
réalisation sur le terrain).
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 12 / 21
Estimation d’un total
Plan
1 Principe
2 Estimation d’une moyenne
3 Estimation d’un total
4 Estimation d’une proportion
5 Estimation d’un ratio
6 Méthodes de tirage
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 13 / 21
Estimation d’un total
Estimation d’un total
Les estimations de totaux sont en général des estimations
d’inventaire (effectifs de migrants, de classes d’âges, ...). Le total
d’une variable Y est estimé, à partir de l’échantillon, par l’
estimateur de sa moyenne multiplié par l’effectif de l’univers :
ˆT(Y) = Ny (4)
En remplaçant y par son expression, on peut faire apparaître le
coefficient d’extrapolation ou la pondération N
n de chaque unité de
l’échantillon.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 14 / 21
Estimation d’un total
Estimation d’un total
Les estimations de totaux sont en général des estimations
d’inventaire (effectifs de migrants, de classes d’âges, ...). Le total
d’une variable Y est estimé, à partir de l’échantillon, par l’
estimateur de sa moyenne multiplié par l’effectif de l’univers :
ˆT(Y) = Ny (4)
En remplaçant y par son expression, on peut faire apparaître le
coefficient d’extrapolation ou la pondération N
n de chaque unité de
l’échantillon.
La variance de l’estimateur du total se déduit aisément de celle y
en appliquant les propriétés de la variance.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 14 / 21
Estimation d’un total
Estimation d’un total
Les estimations de totaux sont en général des estimations
d’inventaire (effectifs de migrants, de classes d’âges, ...). Le total
d’une variable Y est estimé, à partir de l’échantillon, par l’
estimateur de sa moyenne multiplié par l’effectif de l’univers :
ˆT(Y) = Ny (4)
En remplaçant y par son expression, on peut faire apparaître le
coefficient d’extrapolation ou la pondération N
n de chaque unité de
l’échantillon.
La variance de l’estimateur du total se déduit aisément de celle y
en appliquant les propriétés de la variance.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 14 / 21
Estimation d’une proportion
Plan
1 Principe
2 Estimation d’une moyenne
3 Estimation d’un total
4 Estimation d’une proportion
5 Estimation d’un ratio
6 Méthodes de tirage
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 15 / 21
Estimation d’une proportion
Principe
Une proportion sur l’univers (par exemple le pourcentage de
femmes) est moyenne d’une variable indicatrice.
L’estimation dune proportion est donc l’estimation de la moyenne
de cette variable.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 16 / 21
Estimation d’une proportion
Principe
Une proportion sur l’univers (par exemple le pourcentage de
femmes) est moyenne d’une variable indicatrice.
L’estimation dune proportion est donc l’estimation de la moyenne
de cette variable.
Une des caractéristiques d’une telle variable est que sa variance
s’écrit de manière simple :V(Y) = P(1 − P)
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 16 / 21
Estimation d’une proportion
Principe
Une proportion sur l’univers (par exemple le pourcentage de
femmes) est moyenne d’une variable indicatrice.
L’estimation dune proportion est donc l’estimation de la moyenne
de cette variable.
Une des caractéristiques d’une telle variable est que sa variance
s’écrit de manière simple :V(Y) = P(1 − P)
Dans ce cas, si l’on a une idée de l’ordre de grandeur de P (mais
sa véritable valeur est inconnue et c’est l’enquête par sondage qui
cherche à l’estimer de manière précise), on pourra anticiper la
précision en fonction du nombre de questionnaires puisqu’on aura
apriori un ordre de grandeur de la variance de Y.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 16 / 21
Estimation d’une proportion
Principe
Une proportion sur l’univers (par exemple le pourcentage de
femmes) est moyenne d’une variable indicatrice.
L’estimation dune proportion est donc l’estimation de la moyenne
de cette variable.
Une des caractéristiques d’une telle variable est que sa variance
s’écrit de manière simple :V(Y) = P(1 − P)
Dans ce cas, si l’on a une idée de l’ordre de grandeur de P (mais
sa véritable valeur est inconnue et c’est l’enquête par sondage qui
cherche à l’estimer de manière précise), on pourra anticiper la
précision en fonction du nombre de questionnaires puisqu’on aura
apriori un ordre de grandeur de la variance de Y.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 16 / 21
Estimation d’un ratio
Plan
1 Principe
2 Estimation d’une moyenne
3 Estimation d’un total
4 Estimation d’une proportion
5 Estimation d’un ratio
6 Méthodes de tirage
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 17 / 21
Estimation d’un ratio
Estimation d’un ratio
L’estimation d’un ratio peut être délicate, et révéler des pièges.
Prenons un exemple : supposons que l’univers soit un univers de
ménages (la base de sondage est une liste de ménages), et que
certaines caractéristiques comme le nombre d’enfants de moins de
cinq ans ne soient pas connues.
Comment estimer le poids corporel moyen des enfants de moins de
cinq ans à partir d’un échantillon de ménages tiré de façon aléatoire
simple ? Remarquons que l’unité statistique utilisée pour le sondage
est le ménage et non l’individu. On procède ainsi :
on estime le nombre total d’enfants de moins de cinq ans ;
on estime ensuite le poids corporel total des enfants de moins de
cinq ans
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 18 / 21
Estimation d’un ratio
Estimation d’un ratio
L’estimation d’un ratio peut être délicate, et révéler des pièges.
Prenons un exemple : supposons que l’univers soit un univers de
ménages (la base de sondage est une liste de ménages), et que
certaines caractéristiques comme le nombre d’enfants de moins de
cinq ans ne soient pas connues.
Comment estimer le poids corporel moyen des enfants de moins de
cinq ans à partir d’un échantillon de ménages tiré de façon aléatoire
simple ? Remarquons que l’unité statistique utilisée pour le sondage
est le ménage et non l’individu. On procède ainsi :
on estime le nombre total d’enfants de moins de cinq ans ;
on estime ensuite le poids corporel total des enfants de moins de
cinq ans
le ratio (ou quotient) de ces deux masses est l’estimation du poids
moyen de l’univers ; des enfants de moins de cinq ans.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 18 / 21
Estimation d’un ratio
Estimation d’un ratio
L’estimation d’un ratio peut être délicate, et révéler des pièges.
Prenons un exemple : supposons que l’univers soit un univers de
ménages (la base de sondage est une liste de ménages), et que
certaines caractéristiques comme le nombre d’enfants de moins de
cinq ans ne soient pas connues.
Comment estimer le poids corporel moyen des enfants de moins de
cinq ans à partir d’un échantillon de ménages tiré de façon aléatoire
simple ? Remarquons que l’unité statistique utilisée pour le sondage
est le ménage et non l’individu. On procède ainsi :
on estime le nombre total d’enfants de moins de cinq ans ;
on estime ensuite le poids corporel total des enfants de moins de
cinq ans
le ratio (ou quotient) de ces deux masses est l’estimation du poids
moyen de l’univers ; des enfants de moins de cinq ans.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 18 / 21
Méthodes de tirage
Plan
1 Principe
2 Estimation d’une moyenne
3 Estimation d’un total
4 Estimation d’une proportion
5 Estimation d’un ratio
6 Méthodes de tirage
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 19 / 21
Méthodes de tirage
Méthode simple
L’idée est de numéroter les unités statistiques, et de procéder à un
tirage au hasard de numéros entre 1 et N. Pour ce faire, on peut
utiliser :
une table de nombre au hasard,qu’on parcourt dans le sens bien
défini au départ, par exemple ligne par ligne ;
Un algorithme informatique de tirage, par exemple par génération
au hasard d’un nombre réel entre 1 et N
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 20 / 21
Méthodes de tirage
Méthode simple
L’idée est de numéroter les unités statistiques, et de procéder à un
tirage au hasard de numéros entre 1 et N. Pour ce faire, on peut
utiliser :
une table de nombre au hasard,qu’on parcourt dans le sens bien
défini au départ, par exemple ligne par ligne ;
Un algorithme informatique de tirage, par exemple par génération
au hasard d’un nombre réel entre 1 et N
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 20 / 21
Méthodes de tirage
Tirage systématique
Une autre méthode est celle du tirage systématique : on procède
par "sauts" dans la liste des unités statistiques.
Cette méthode équivaut à la méthode élémentaire si les unités de
la base de sondage sont réparties absolument au hasard ; elle est
plus avantageuse que la méthode élémentaire si les unités ont été
classées suivant un critère (variable auxiliaire) en corrélation avec
les caractères à estimer et si l’on suppose qu’il existe un "effet"
dans l’ordre de classement qui va donner plus de
"représentativité" à l’échantillon tiré.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 21 / 21
Méthodes de tirage
Tirage systématique
Une autre méthode est celle du tirage systématique : on procède
par "sauts" dans la liste des unités statistiques.
Cette méthode équivaut à la méthode élémentaire si les unités de
la base de sondage sont réparties absolument au hasard ; elle est
plus avantageuse que la méthode élémentaire si les unités ont été
classées suivant un critère (variable auxiliaire) en corrélation avec
les caractères à estimer et si l’on suppose qu’il existe un "effet"
dans l’ordre de classement qui va donner plus de
"représentativité" à l’échantillon tiré.
Par exemple, si on a classé des ménages selon leur taille, on sera
assuré par ce mode de tirage d’avoir à la fois des ménages de
faible taille et des ménages de taille importante dans l’échantillon.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 21 / 21
Méthodes de tirage
Tirage systématique
Une autre méthode est celle du tirage systématique : on procède
par "sauts" dans la liste des unités statistiques.
Cette méthode équivaut à la méthode élémentaire si les unités de
la base de sondage sont réparties absolument au hasard ; elle est
plus avantageuse que la méthode élémentaire si les unités ont été
classées suivant un critère (variable auxiliaire) en corrélation avec
les caractères à estimer et si l’on suppose qu’il existe un "effet"
dans l’ordre de classement qui va donner plus de
"représentativité" à l’échantillon tiré.
Par exemple, si on a classé des ménages selon leur taille, on sera
assuré par ce mode de tirage d’avoir à la fois des ménages de
faible taille et des ménages de taille importante dans l’échantillon.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 21 / 21

Contenu connexe

Tendances

Introduction aux statistiques descriptives et tests d'hypothèses
Introduction aux statistiques descriptives et tests d'hypothèsesIntroduction aux statistiques descriptives et tests d'hypothèses
Introduction aux statistiques descriptives et tests d'hypothèses
Clément Dussarps
 
exercices corrigés échantillonnage et estimation
exercices corrigés échantillonnage et estimationexercices corrigés échantillonnage et estimation
exercices corrigés échantillonnage et estimation
cours fsjes
 
Echantillonnage
EchantillonnageEchantillonnage
Echantillonnage
André Michel Bimbai
 
Les méthodes de sondage-cours (1).doc
Les méthodes de sondage-cours (1).docLes méthodes de sondage-cours (1).doc
Les méthodes de sondage-cours (1).doc
HichamBr
 
Analyse de régression linéaire
Analyse de régression linéaire Analyse de régression linéaire
Analyse de régression linéaire
Adad Med Chérif
 
Choix de l’analyse statistique appropriée
 Choix de l’analyse statistique appropriée  Choix de l’analyse statistique appropriée
Choix de l’analyse statistique appropriée
Adad Med Chérif
 
Stat4 Principes Des Tests Statistiques
Stat4  Principes Des Tests StatistiquesStat4  Principes Des Tests Statistiques
Stat4 Principes Des Tests Statistiques
Jean-Louis ESTRADE
 
methode echantillonnage
methode echantillonnagemethode echantillonnage
methode echantillonnage
Mouhcine Rabi
 
Echantillonnage
EchantillonnageEchantillonnage
Echantillonnage
Abdelaaziz BENAHMIDA
 
Analyse de données avec spss,
Analyse de données avec spss,Analyse de données avec spss,
Analyse de données avec spss,
Mohamed Amine Sansar
 
S3.echantillonnage estimation-s3
S3.echantillonnage estimation-s3S3.echantillonnage estimation-s3
S3.echantillonnage estimation-s3
Jamal Yasser
 
ANOVA à 1 facteur, Analyse de variance, (One-way ANOVA)
ANOVA  à 1 facteur, Analyse de variance, (One-way ANOVA)ANOVA  à 1 facteur, Analyse de variance, (One-way ANOVA)
ANOVA à 1 facteur, Analyse de variance, (One-way ANOVA)
Adad Med Chérif
 
Stat3 Intervalle De Confiance
Stat3  Intervalle De ConfianceStat3  Intervalle De Confiance
Stat3 Intervalle De Confiance
Jean-Louis ESTRADE
 
Moyenne mobile
Moyenne mobile Moyenne mobile
Moyenne mobile
yossra arfaoui
 
Analyses des données par SPSS et R
Analyses  des données par  SPSS et RAnalyses  des données par  SPSS et R
Analyses des données par SPSS et R
AB IR
 
Analyse Factorielle des Correspondances
Analyse Factorielle des CorrespondancesAnalyse Factorielle des Correspondances
Analyse Factorielle des Correspondances
Jaouad Dabounou
 
Chapitre Introductif
Chapitre IntroductifChapitre Introductif
Chapitre Introductif
Ibtissam medarhri
 
chapitre 1 régression simple.pdf
chapitre 1 régression simple.pdfchapitre 1 régression simple.pdf
chapitre 1 régression simple.pdf
AnassFarkadi
 

Tendances (20)

Introduction aux statistiques descriptives et tests d'hypothèses
Introduction aux statistiques descriptives et tests d'hypothèsesIntroduction aux statistiques descriptives et tests d'hypothèses
Introduction aux statistiques descriptives et tests d'hypothèses
 
exercices corrigés échantillonnage et estimation
exercices corrigés échantillonnage et estimationexercices corrigés échantillonnage et estimation
exercices corrigés échantillonnage et estimation
 
Echantillonnage
EchantillonnageEchantillonnage
Echantillonnage
 
Les méthodes de sondage-cours (1).doc
Les méthodes de sondage-cours (1).docLes méthodes de sondage-cours (1).doc
Les méthodes de sondage-cours (1).doc
 
Analyse de régression linéaire
Analyse de régression linéaire Analyse de régression linéaire
Analyse de régression linéaire
 
Choix de l’analyse statistique appropriée
 Choix de l’analyse statistique appropriée  Choix de l’analyse statistique appropriée
Choix de l’analyse statistique appropriée
 
Stat4 Principes Des Tests Statistiques
Stat4  Principes Des Tests StatistiquesStat4  Principes Des Tests Statistiques
Stat4 Principes Des Tests Statistiques
 
methode echantillonnage
methode echantillonnagemethode echantillonnage
methode echantillonnage
 
Echantillonnage
EchantillonnageEchantillonnage
Echantillonnage
 
Analyse de données avec spss,
Analyse de données avec spss,Analyse de données avec spss,
Analyse de données avec spss,
 
S3.echantillonnage estimation-s3
S3.echantillonnage estimation-s3S3.echantillonnage estimation-s3
S3.echantillonnage estimation-s3
 
ANOVA à 1 facteur, Analyse de variance, (One-way ANOVA)
ANOVA  à 1 facteur, Analyse de variance, (One-way ANOVA)ANOVA  à 1 facteur, Analyse de variance, (One-way ANOVA)
ANOVA à 1 facteur, Analyse de variance, (One-way ANOVA)
 
Statistique Descriptive s1
Statistique Descriptive s1Statistique Descriptive s1
Statistique Descriptive s1
 
Stat3 Intervalle De Confiance
Stat3  Intervalle De ConfianceStat3  Intervalle De Confiance
Stat3 Intervalle De Confiance
 
Biostatistique
BiostatistiqueBiostatistique
Biostatistique
 
Moyenne mobile
Moyenne mobile Moyenne mobile
Moyenne mobile
 
Analyses des données par SPSS et R
Analyses  des données par  SPSS et RAnalyses  des données par  SPSS et R
Analyses des données par SPSS et R
 
Analyse Factorielle des Correspondances
Analyse Factorielle des CorrespondancesAnalyse Factorielle des Correspondances
Analyse Factorielle des Correspondances
 
Chapitre Introductif
Chapitre IntroductifChapitre Introductif
Chapitre Introductif
 
chapitre 1 régression simple.pdf
chapitre 1 régression simple.pdfchapitre 1 régression simple.pdf
chapitre 1 régression simple.pdf
 

En vedette

Sondage aléatoire simple ou a probabilité égal
Sondage aléatoire simple ou a probabilité égal Sondage aléatoire simple ou a probabilité égal
Sondage aléatoire simple ou a probabilité égal
hammamiahlem1
 
Chapitre3: Les sondages stratifiés
Chapitre3: Les sondages stratifiésChapitre3: Les sondages stratifiés
Chapitre3: Les sondages stratifiés
Mahamadou Haro
 
Enredados socialmente
Enredados socialmenteEnredados socialmente
Enredados socialmente
Alexander Jurado Osorio
 
Aguanta el tipo
Aguanta el tipoAguanta el tipo
Aguanta el tipo
Salmerón Lucas
 
Maths1 as n1livsol6
Maths1 as n1livsol6Maths1 as n1livsol6
Maths1 as n1livsol6Naima K k
 
Habilidades Básicas 1
Habilidades Básicas 1Habilidades Básicas 1
Habilidades Básicas 1
cristinaruizberbel
 
Construction de logements : Résultats à fin juillet 2014 (France entière)
Construction de logements : Résultats à fin juillet 2014 (France entière)Construction de logements : Résultats à fin juillet 2014 (France entière)
Construction de logements : Résultats à fin juillet 2014 (France entière)
FactaMedia
 
Blanca navidad
Blanca navidadBlanca navidad
Blanca navidad
dorisbernal
 
otros servicios de internet
otros servicios de internetotros servicios de internet
otros servicios de internet
yaalirio
 
Historia cine
Historia cineHistoria cine
Historia cine
cangasblog
 
Présentation safety tab fr
Présentation safety tab frPrésentation safety tab fr
Présentation safety tab frBenjamin FURLAN
 
Computraining replay
Computraining replayComputraining replay
Computraining replay
Tns Akblt
 
Autora margaret mahy pptx
Autora margaret mahy pptxAutora margaret mahy pptx
Autora margaret mahy pptx
Ceip Aragon
 
Jd
JdJd
Le commerce équitable en Europe de l'Est
Le commerce équitable en Europe de l'EstLe commerce équitable en Europe de l'Est
Le commerce équitable en Europe de l'Est
TradeForDevelopment Centre
 
Enquête d'opinion quantitative sur le tourisme responsable (Nov 13_ version ...
Enquête d'opinion quantitative sur le tourisme responsable  (Nov 13_ version ...Enquête d'opinion quantitative sur le tourisme responsable  (Nov 13_ version ...
Enquête d'opinion quantitative sur le tourisme responsable (Nov 13_ version ...
TradeForDevelopment Centre
 
Lesson plan
Lesson planLesson plan
Plateforme & Réseau b2b d'organisation d'événements
Plateforme & Réseau b2b d'organisation d'événementsPlateforme & Réseau b2b d'organisation d'événements
Plateforme & Réseau b2b d'organisation d'événements
DAVID JAMES
 
Los juegos del hambre
Los juegos del hambreLos juegos del hambre
Los juegos del hambre
bibliobaralla
 
Antonio
AntonioAntonio
Antonio
wazon09
 

En vedette (20)

Sondage aléatoire simple ou a probabilité égal
Sondage aléatoire simple ou a probabilité égal Sondage aléatoire simple ou a probabilité égal
Sondage aléatoire simple ou a probabilité égal
 
Chapitre3: Les sondages stratifiés
Chapitre3: Les sondages stratifiésChapitre3: Les sondages stratifiés
Chapitre3: Les sondages stratifiés
 
Enredados socialmente
Enredados socialmenteEnredados socialmente
Enredados socialmente
 
Aguanta el tipo
Aguanta el tipoAguanta el tipo
Aguanta el tipo
 
Maths1 as n1livsol6
Maths1 as n1livsol6Maths1 as n1livsol6
Maths1 as n1livsol6
 
Habilidades Básicas 1
Habilidades Básicas 1Habilidades Básicas 1
Habilidades Básicas 1
 
Construction de logements : Résultats à fin juillet 2014 (France entière)
Construction de logements : Résultats à fin juillet 2014 (France entière)Construction de logements : Résultats à fin juillet 2014 (France entière)
Construction de logements : Résultats à fin juillet 2014 (France entière)
 
Blanca navidad
Blanca navidadBlanca navidad
Blanca navidad
 
otros servicios de internet
otros servicios de internetotros servicios de internet
otros servicios de internet
 
Historia cine
Historia cineHistoria cine
Historia cine
 
Présentation safety tab fr
Présentation safety tab frPrésentation safety tab fr
Présentation safety tab fr
 
Computraining replay
Computraining replayComputraining replay
Computraining replay
 
Autora margaret mahy pptx
Autora margaret mahy pptxAutora margaret mahy pptx
Autora margaret mahy pptx
 
Jd
JdJd
Jd
 
Le commerce équitable en Europe de l'Est
Le commerce équitable en Europe de l'EstLe commerce équitable en Europe de l'Est
Le commerce équitable en Europe de l'Est
 
Enquête d'opinion quantitative sur le tourisme responsable (Nov 13_ version ...
Enquête d'opinion quantitative sur le tourisme responsable  (Nov 13_ version ...Enquête d'opinion quantitative sur le tourisme responsable  (Nov 13_ version ...
Enquête d'opinion quantitative sur le tourisme responsable (Nov 13_ version ...
 
Lesson plan
Lesson planLesson plan
Lesson plan
 
Plateforme & Réseau b2b d'organisation d'événements
Plateforme & Réseau b2b d'organisation d'événementsPlateforme & Réseau b2b d'organisation d'événements
Plateforme & Réseau b2b d'organisation d'événements
 
Los juegos del hambre
Los juegos del hambreLos juegos del hambre
Los juegos del hambre
 
Antonio
AntonioAntonio
Antonio
 

Similaire à Chapitre2: Sondage aléatoire simple

Test de wilcoxon mann-whitney (SPSS), Test non-paramétrique
Test de wilcoxon mann-whitney (SPSS), Test non-paramétrique Test de wilcoxon mann-whitney (SPSS), Test non-paramétrique
Test de wilcoxon mann-whitney (SPSS), Test non-paramétrique
Adad Med Chérif
 
Metrologie
MetrologieMetrologie
Metrologie
taktakghazi
 
Metrologie
MetrologieMetrologie
Metrologie
abdelkhalek26
 
Stat6 Chideux
Stat6   ChideuxStat6   Chideux
Stat6 Chideux
Jean-Louis ESTRADE
 
Test d'hypothèses en statistique Chapitre 7.pdf
Test d'hypothèses en statistique Chapitre 7.pdfTest d'hypothèses en statistique Chapitre 7.pdf
Test d'hypothèses en statistique Chapitre 7.pdf
KOUADIOPATRICE1
 
Spss les premieres notions 1
Spss les premieres notions 1Spss les premieres notions 1
Spss les premieres notions 1
Adad Med Chérif
 
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-unM1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-unmohamedchaouche
 
Cours acp mehdi_aman
Cours acp mehdi_amanCours acp mehdi_aman
Cours acp mehdi_aman
Mehdi Aman
 
T test sur des échantillons appariés avec test de normalité
T test sur des  échantillons appariés  avec  test de normalité T test sur des  échantillons appariés  avec  test de normalité
T test sur des échantillons appariés avec test de normalité
Adad Med Chérif
 
Test de corrélation simple et test de Normalité
Test de corrélation simple  et  test de Normalité  Test de corrélation simple  et  test de Normalité
Test de corrélation simple et test de Normalité
Adad Med Chérif
 
Mettre obligatoirement le titre de la leçon ici
Mettre obligatoirement le titre de la leçon iciMettre obligatoirement le titre de la leçon ici
Mettre obligatoirement le titre de la leçon ici
wospro-academy
 
Les relations statistiques échantillon-population.pdf
Les relations statistiques échantillon-population.pdfLes relations statistiques échantillon-population.pdf
Les relations statistiques échantillon-population.pdf
isen4Comptabilite
 
Chapitre I - Développements introductifs.pptx
Chapitre I - Développements introductifs.pptxChapitre I - Développements introductifs.pptx
Chapitre I - Développements introductifs.pptx
melianikholoud
 
9b567ad91347677ab6736e76a4115c80 statistique
9b567ad91347677ab6736e76a4115c80 statistique9b567ad91347677ab6736e76a4115c80 statistique
9b567ad91347677ab6736e76a4115c80 statistique
Samad Oulasri
 
Metrologie termilnal
Metrologie termilnalMetrologie termilnal
Metrologie termilnalm.a bensaaoud
 
Loic sarton (2)
Loic sarton (2)Loic sarton (2)
Loic sarton (2)
Loic Sarton
 
Regression simple
Regression simpleRegression simple
Regression simple
LearningMahout
 
FINAL.pptx
FINAL.pptxFINAL.pptx
FINAL.pptx
sara6496
 
Régression de variation des structures sociales
Régression de variation des structures socialesRégression de variation des structures sociales
Régression de variation des structures sociales
aniss25
 

Similaire à Chapitre2: Sondage aléatoire simple (20)

Test de wilcoxon mann-whitney (SPSS), Test non-paramétrique
Test de wilcoxon mann-whitney (SPSS), Test non-paramétrique Test de wilcoxon mann-whitney (SPSS), Test non-paramétrique
Test de wilcoxon mann-whitney (SPSS), Test non-paramétrique
 
Metrologie
MetrologieMetrologie
Metrologie
 
Metrologie
MetrologieMetrologie
Metrologie
 
Stat6 Chideux
Stat6   ChideuxStat6   Chideux
Stat6 Chideux
 
Test d'hypothèses en statistique Chapitre 7.pdf
Test d'hypothèses en statistique Chapitre 7.pdfTest d'hypothèses en statistique Chapitre 7.pdf
Test d'hypothèses en statistique Chapitre 7.pdf
 
Spss les premieres notions 1
Spss les premieres notions 1Spss les premieres notions 1
Spss les premieres notions 1
 
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-unM1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
M1 l3-econom etrie-serie-corrigee-n-1-modeles-econometriques-a-un
 
Cours acp mehdi_aman
Cours acp mehdi_amanCours acp mehdi_aman
Cours acp mehdi_aman
 
T test sur des échantillons appariés avec test de normalité
T test sur des  échantillons appariés  avec  test de normalité T test sur des  échantillons appariés  avec  test de normalité
T test sur des échantillons appariés avec test de normalité
 
Test de corrélation simple et test de Normalité
Test de corrélation simple  et  test de Normalité  Test de corrélation simple  et  test de Normalité
Test de corrélation simple et test de Normalité
 
Cours regression 4
Cours regression 4Cours regression 4
Cours regression 4
 
Mettre obligatoirement le titre de la leçon ici
Mettre obligatoirement le titre de la leçon iciMettre obligatoirement le titre de la leçon ici
Mettre obligatoirement le titre de la leçon ici
 
Les relations statistiques échantillon-population.pdf
Les relations statistiques échantillon-population.pdfLes relations statistiques échantillon-population.pdf
Les relations statistiques échantillon-population.pdf
 
Chapitre I - Développements introductifs.pptx
Chapitre I - Développements introductifs.pptxChapitre I - Développements introductifs.pptx
Chapitre I - Développements introductifs.pptx
 
9b567ad91347677ab6736e76a4115c80 statistique
9b567ad91347677ab6736e76a4115c80 statistique9b567ad91347677ab6736e76a4115c80 statistique
9b567ad91347677ab6736e76a4115c80 statistique
 
Metrologie termilnal
Metrologie termilnalMetrologie termilnal
Metrologie termilnal
 
Loic sarton (2)
Loic sarton (2)Loic sarton (2)
Loic sarton (2)
 
Regression simple
Regression simpleRegression simple
Regression simple
 
FINAL.pptx
FINAL.pptxFINAL.pptx
FINAL.pptx
 
Régression de variation des structures sociales
Régression de variation des structures socialesRégression de variation des structures sociales
Régression de variation des structures sociales
 

Chapitre2: Sondage aléatoire simple

  • 1. Les sondages aléatoires simples Mahamadou HARO Ingénieur Statisticien Économiste Séminaire de sondage Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 1 / 21
  • 2. Plan de la présentation 1 Principe 2 Estimation d’une moyenne 3 Estimation d’un total 4 Estimation d’une proportion 5 Estimation d’un ratio 6 Méthodes de tirage Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 2 / 21
  • 3. Principe Plan 1 Principe 2 Estimation d’une moyenne 3 Estimation d’un total 4 Estimation d’une proportion 5 Estimation d’un ratio 6 Méthodes de tirage Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 3 / 21
  • 4. Principe Introduction De l’univers on extrait un échantillon de taille n, en accordant à chaque unité statistique la même probabilité d’être tirée. L’échantillon peut être tiré : avec remise : une unité ayant été sélectionnée à un des tirages est "remise dans l’urne de tirage" et participe aux tirages suivants ; elle peut donc être tirée deux fois, ou plus ; sans remise : une fois une unité tirée, elle n’est plus prise en compte pour les tirages suivants (c’est le mode de tirage qui semble le plus "naturel"). Le sondage aléatoire simple est la base de la méthode des sondages, à partir de laquelle sont développées les autres méthodes présentées dans ce manuel. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 4 / 21
  • 5. Principe Introduction De l’univers on extrait un échantillon de taille n, en accordant à chaque unité statistique la même probabilité d’être tirée. L’échantillon peut être tiré : avec remise : une unité ayant été sélectionnée à un des tirages est "remise dans l’urne de tirage" et participe aux tirages suivants ; elle peut donc être tirée deux fois, ou plus ; sans remise : une fois une unité tirée, elle n’est plus prise en compte pour les tirages suivants (c’est le mode de tirage qui semble le plus "naturel"). Le sondage aléatoire simple est la base de la méthode des sondages, à partir de laquelle sont développées les autres méthodes présentées dans ce manuel. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 4 / 21
  • 6. Estimation d’une moyenne Plan 1 Principe 2 Estimation d’une moyenne 3 Estimation d’un total 4 Estimation d’une proportion 5 Estimation d’un ratio 6 Méthodes de tirage Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 5 / 21
  • 7. Estimation d’une moyenne Estimation d’une moyenne Pour estimer la moyenne Y d’une variable Y sur l’univers (Y est bien sûr inconnue) il semble naturel d’utiliser l’estimateur : ¯y = 1 n n i=1 yi (1) moyenne calculée sur les unités de l’échantillon. y est un estimateur sans biais la moyenne de l’universY. Cette propriété peut s’écrire : E(¯y) = ¯Y Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 6 / 21
  • 8. Estimation d’une moyenne Variance de y Dans le cas avec remise : V(¯y) = V(Y) n (2) Dans le cas sans remise : V(¯y) = ( N − n N − 1 ) V(Y) n (3) Ceci veut dire que la variance de l’estimateur sera d’autant plus faible que : a)V(Y) sera faible ; b)la taille de l’échantillon sera importante. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 7 / 21
  • 9. Estimation d’une moyenne Variance de y Dans le cas avec remise : V(¯y) = V(Y) n (2) Dans le cas sans remise : V(¯y) = ( N − n N − 1 ) V(Y) n (3) Ceci veut dire que la variance de l’estimateur sera d’autant plus faible que : a)V(Y) sera faible ; b)la taille de l’échantillon sera importante. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 7 / 21
  • 10. Estimation d’une moyenne Pour un échantillon suffisamment grand, y suit une loi normale À partir d’une certaine taille d’échantillon (disons au moins 30), la distribution de la variable aléatoire y (c’est-à-dire l’ensemble des estimations fournies par tous les échantillons obtenus avec le tirage équiprobable de taille n) s’ajuste sur une loi normale (courbe "en cloche" de Gauss) dont les caractéristiques sont liées aux valeurs E(y) et V(y) étudiées ci-dessus. On sait que la distribution d’une loi normale de moyenne m et d’écart-type σ comprend 95% des valeurs dans l’intervalle [m − 1, 96σ; m + 1, 96σ]. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 8 / 21
  • 11. Estimation d’une moyenne Pour un échantillon suffisamment grand, y suit une loi normale À partir d’une certaine taille d’échantillon (disons au moins 30), la distribution de la variable aléatoire y (c’est-à-dire l’ensemble des estimations fournies par tous les échantillons obtenus avec le tirage équiprobable de taille n) s’ajuste sur une loi normale (courbe "en cloche" de Gauss) dont les caractéristiques sont liées aux valeurs E(y) et V(y) étudiées ci-dessus. On sait que la distribution d’une loi normale de moyenne m et d’écart-type σ comprend 95% des valeurs dans l’intervalle [m − 1, 96σ; m + 1, 96σ]. Ici on peut dire que 95% des valeurs de y sont situées dans l’intervalle de [Y − 1, 96 V(y); Y + 1, 96 V(y)], où V(y) est donnée par les formules (2) ou (3) ci-dessus. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 8 / 21
  • 12. Estimation d’une moyenne Pour un échantillon suffisamment grand, y suit une loi normale À partir d’une certaine taille d’échantillon (disons au moins 30), la distribution de la variable aléatoire y (c’est-à-dire l’ensemble des estimations fournies par tous les échantillons obtenus avec le tirage équiprobable de taille n) s’ajuste sur une loi normale (courbe "en cloche" de Gauss) dont les caractéristiques sont liées aux valeurs E(y) et V(y) étudiées ci-dessus. On sait que la distribution d’une loi normale de moyenne m et d’écart-type σ comprend 95% des valeurs dans l’intervalle [m − 1, 96σ; m + 1, 96σ]. Ici on peut dire que 95% des valeurs de y sont situées dans l’intervalle de [Y − 1, 96 V(y); Y + 1, 96 V(y)], où V(y) est donnée par les formules (2) ou (3) ci-dessus. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 8 / 21
  • 13. Estimation d’une moyenne La variance V(y) peut être estimée à partir de l’échantillon Dans les formules (2) et (3) ci-dessus, la quantité V(Y) est inconnue. Celle-ci va être estimée à partir des données observées sur l’échantillon. Si l’on note s2 la grandeur calculée sur l’échantillon : s2 = 1 n − 1 n i=1 (yi − ¯y)2 Alors on a le résultat suivant : dans le cas sans remise, s2 est un estimateur sans biais de N N−1 V(Y) Donc V(y) est estimée sans biais par : ˆV(y) = s2 n dans le cas de tirage avec remise ; ˆV(y) = (1 − n N )s2 n dans le cas du tirage sans remise. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 9 / 21
  • 14. Estimation d’une moyenne La variance V(y) peut être estimée à partir de l’échantillon Dans les formules (2) et (3) ci-dessus, la quantité V(Y) est inconnue. Celle-ci va être estimée à partir des données observées sur l’échantillon. Si l’on note s2 la grandeur calculée sur l’échantillon : s2 = 1 n − 1 n i=1 (yi − ¯y)2 Alors on a le résultat suivant : dans le cas sans remise, s2 est un estimateur sans biais de N N−1 V(Y) dans le cas avec remise, s2 est un estimateur sans biais de V(Y). Donc V(y) est estimée sans biais par : ˆV(y) = s2 n dans le cas de tirage avec remise ; ˆV(y) = (1 − n N )s2 n dans le cas du tirage sans remise. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 9 / 21
  • 15. Estimation d’une moyenne La variance V(y) peut être estimée à partir de l’échantillon Dans les formules (2) et (3) ci-dessus, la quantité V(Y) est inconnue. Celle-ci va être estimée à partir des données observées sur l’échantillon. Si l’on note s2 la grandeur calculée sur l’échantillon : s2 = 1 n − 1 n i=1 (yi − ¯y)2 Alors on a le résultat suivant : dans le cas sans remise, s2 est un estimateur sans biais de N N−1 V(Y) dans le cas avec remise, s2 est un estimateur sans biais de V(Y). Donc V(y) est estimée sans biais par : ˆV(y) = s2 n dans le cas de tirage avec remise ; ˆV(y) = (1 − n N )s2 n dans le cas du tirage sans remise. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 9 / 21
  • 16. Estimation d’une moyenne Dans la pratique on n’a tiré qu’un échantillon Ce qui vient d’être dit aux paragraphes précédents doit être replacé dans cette perspective. Les résultats ci-dessus présentent la manière dont l’ensemble des valeurs calculées sur tous les échantillons possibles se répartissent par rapport à la grandeur recherchée Y. En pratique, le seul résultat dont on dispose est la moyenne y calculée sur un échantillon, et Y est inconnue. On tient un raisonnement analogue au précédent, mais à partir de y, pour fournir un "intervalle de confiance" pour Y. on dispose de la valeur y ; on estime V(y) à partir de l’échantillon, on obtient donc une estimation de ˆσ(y) (racine carrée de la variance estimée ˆV(y) ; Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 10 / 21
  • 17. Estimation d’une moyenne Dans la pratique on n’a tiré qu’un échantillon Ce qui vient d’être dit aux paragraphes précédents doit être replacé dans cette perspective. Les résultats ci-dessus présentent la manière dont l’ensemble des valeurs calculées sur tous les échantillons possibles se répartissent par rapport à la grandeur recherchée Y. En pratique, le seul résultat dont on dispose est la moyenne y calculée sur un échantillon, et Y est inconnue. On tient un raisonnement analogue au précédent, mais à partir de y, pour fournir un "intervalle de confiance" pour Y. on dispose de la valeur y ; on estime V(y) à partir de l’échantillon, on obtient donc une estimation de ˆσ(y) (racine carrée de la variance estimée ˆV(y) ; Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 10 / 21
  • 18. Estimation d’une moyenne Remarques La précision, en termes de variance de y est essentiellement liée au nombre d’unités enquêtées n, et relativement peu au taux de sondage n N (pas du tout dans le cas avec remise). La variance est proportionnelle à 1 n ; l’écart-type, qui permet d’établir l’intervalle de confiance, est proportionnel à 1√ n .Ceci veut dire que pour réduire de moitié l’intervalle de confiance, il faut quatre fois plus de questionnaires. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 11 / 21
  • 19. Estimation d’une moyenne Remarques La précision, en termes de variance de y est essentiellement liée au nombre d’unités enquêtées n, et relativement peu au taux de sondage n N (pas du tout dans le cas avec remise). La variance est proportionnelle à 1 n ; l’écart-type, qui permet d’établir l’intervalle de confiance, est proportionnel à 1√ n .Ceci veut dire que pour réduire de moitié l’intervalle de confiance, il faut quatre fois plus de questionnaires. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 11 / 21
  • 20. Estimation d’une moyenne Combien d’unités enquêter dans l’échantillon ? On voit que la réponse à cette question se trouve dans les formules (2) et (3) : si l’on fixe un niveau de précision (largeur de l’intervalle de confiance, ou coefficient de variation, ce qui signifie une valeur "maxi"" de la variance), on en déduit le nombre d’unités minimum nécessaire. Le problème est que la quantité V(Y) est inconnue avant l’enquête, dans les formules (2) et (3) ; la seule solution est de l’estimer, soit de manière intuitive, soit à partir de données observées sur le passé Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 12 / 21
  • 21. Estimation d’une moyenne Combien d’unités enquêter dans l’échantillon ? On voit que la réponse à cette question se trouve dans les formules (2) et (3) : si l’on fixe un niveau de précision (largeur de l’intervalle de confiance, ou coefficient de variation, ce qui signifie une valeur "maxi"" de la variance), on en déduit le nombre d’unités minimum nécessaire. Le problème est que la quantité V(Y) est inconnue avant l’enquête, dans les formules (2) et (3) ; la seule solution est de l’estimer, soit de manière intuitive, soit à partir de données observées sur le passé ici on se place dans une phase de réflexion en amont de la réalisation sur le terrain). Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 12 / 21
  • 22. Estimation d’une moyenne Combien d’unités enquêter dans l’échantillon ? On voit que la réponse à cette question se trouve dans les formules (2) et (3) : si l’on fixe un niveau de précision (largeur de l’intervalle de confiance, ou coefficient de variation, ce qui signifie une valeur "maxi"" de la variance), on en déduit le nombre d’unités minimum nécessaire. Le problème est que la quantité V(Y) est inconnue avant l’enquête, dans les formules (2) et (3) ; la seule solution est de l’estimer, soit de manière intuitive, soit à partir de données observées sur le passé ici on se place dans une phase de réflexion en amont de la réalisation sur le terrain). Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 12 / 21
  • 23. Estimation d’un total Plan 1 Principe 2 Estimation d’une moyenne 3 Estimation d’un total 4 Estimation d’une proportion 5 Estimation d’un ratio 6 Méthodes de tirage Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 13 / 21
  • 24. Estimation d’un total Estimation d’un total Les estimations de totaux sont en général des estimations d’inventaire (effectifs de migrants, de classes d’âges, ...). Le total d’une variable Y est estimé, à partir de l’échantillon, par l’ estimateur de sa moyenne multiplié par l’effectif de l’univers : ˆT(Y) = Ny (4) En remplaçant y par son expression, on peut faire apparaître le coefficient d’extrapolation ou la pondération N n de chaque unité de l’échantillon. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 14 / 21
  • 25. Estimation d’un total Estimation d’un total Les estimations de totaux sont en général des estimations d’inventaire (effectifs de migrants, de classes d’âges, ...). Le total d’une variable Y est estimé, à partir de l’échantillon, par l’ estimateur de sa moyenne multiplié par l’effectif de l’univers : ˆT(Y) = Ny (4) En remplaçant y par son expression, on peut faire apparaître le coefficient d’extrapolation ou la pondération N n de chaque unité de l’échantillon. La variance de l’estimateur du total se déduit aisément de celle y en appliquant les propriétés de la variance. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 14 / 21
  • 26. Estimation d’un total Estimation d’un total Les estimations de totaux sont en général des estimations d’inventaire (effectifs de migrants, de classes d’âges, ...). Le total d’une variable Y est estimé, à partir de l’échantillon, par l’ estimateur de sa moyenne multiplié par l’effectif de l’univers : ˆT(Y) = Ny (4) En remplaçant y par son expression, on peut faire apparaître le coefficient d’extrapolation ou la pondération N n de chaque unité de l’échantillon. La variance de l’estimateur du total se déduit aisément de celle y en appliquant les propriétés de la variance. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 14 / 21
  • 27. Estimation d’une proportion Plan 1 Principe 2 Estimation d’une moyenne 3 Estimation d’un total 4 Estimation d’une proportion 5 Estimation d’un ratio 6 Méthodes de tirage Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 15 / 21
  • 28. Estimation d’une proportion Principe Une proportion sur l’univers (par exemple le pourcentage de femmes) est moyenne d’une variable indicatrice. L’estimation dune proportion est donc l’estimation de la moyenne de cette variable. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 16 / 21
  • 29. Estimation d’une proportion Principe Une proportion sur l’univers (par exemple le pourcentage de femmes) est moyenne d’une variable indicatrice. L’estimation dune proportion est donc l’estimation de la moyenne de cette variable. Une des caractéristiques d’une telle variable est que sa variance s’écrit de manière simple :V(Y) = P(1 − P) Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 16 / 21
  • 30. Estimation d’une proportion Principe Une proportion sur l’univers (par exemple le pourcentage de femmes) est moyenne d’une variable indicatrice. L’estimation dune proportion est donc l’estimation de la moyenne de cette variable. Une des caractéristiques d’une telle variable est que sa variance s’écrit de manière simple :V(Y) = P(1 − P) Dans ce cas, si l’on a une idée de l’ordre de grandeur de P (mais sa véritable valeur est inconnue et c’est l’enquête par sondage qui cherche à l’estimer de manière précise), on pourra anticiper la précision en fonction du nombre de questionnaires puisqu’on aura apriori un ordre de grandeur de la variance de Y. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 16 / 21
  • 31. Estimation d’une proportion Principe Une proportion sur l’univers (par exemple le pourcentage de femmes) est moyenne d’une variable indicatrice. L’estimation dune proportion est donc l’estimation de la moyenne de cette variable. Une des caractéristiques d’une telle variable est que sa variance s’écrit de manière simple :V(Y) = P(1 − P) Dans ce cas, si l’on a une idée de l’ordre de grandeur de P (mais sa véritable valeur est inconnue et c’est l’enquête par sondage qui cherche à l’estimer de manière précise), on pourra anticiper la précision en fonction du nombre de questionnaires puisqu’on aura apriori un ordre de grandeur de la variance de Y. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 16 / 21
  • 32. Estimation d’un ratio Plan 1 Principe 2 Estimation d’une moyenne 3 Estimation d’un total 4 Estimation d’une proportion 5 Estimation d’un ratio 6 Méthodes de tirage Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 17 / 21
  • 33. Estimation d’un ratio Estimation d’un ratio L’estimation d’un ratio peut être délicate, et révéler des pièges. Prenons un exemple : supposons que l’univers soit un univers de ménages (la base de sondage est une liste de ménages), et que certaines caractéristiques comme le nombre d’enfants de moins de cinq ans ne soient pas connues. Comment estimer le poids corporel moyen des enfants de moins de cinq ans à partir d’un échantillon de ménages tiré de façon aléatoire simple ? Remarquons que l’unité statistique utilisée pour le sondage est le ménage et non l’individu. On procède ainsi : on estime le nombre total d’enfants de moins de cinq ans ; on estime ensuite le poids corporel total des enfants de moins de cinq ans Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 18 / 21
  • 34. Estimation d’un ratio Estimation d’un ratio L’estimation d’un ratio peut être délicate, et révéler des pièges. Prenons un exemple : supposons que l’univers soit un univers de ménages (la base de sondage est une liste de ménages), et que certaines caractéristiques comme le nombre d’enfants de moins de cinq ans ne soient pas connues. Comment estimer le poids corporel moyen des enfants de moins de cinq ans à partir d’un échantillon de ménages tiré de façon aléatoire simple ? Remarquons que l’unité statistique utilisée pour le sondage est le ménage et non l’individu. On procède ainsi : on estime le nombre total d’enfants de moins de cinq ans ; on estime ensuite le poids corporel total des enfants de moins de cinq ans le ratio (ou quotient) de ces deux masses est l’estimation du poids moyen de l’univers ; des enfants de moins de cinq ans. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 18 / 21
  • 35. Estimation d’un ratio Estimation d’un ratio L’estimation d’un ratio peut être délicate, et révéler des pièges. Prenons un exemple : supposons que l’univers soit un univers de ménages (la base de sondage est une liste de ménages), et que certaines caractéristiques comme le nombre d’enfants de moins de cinq ans ne soient pas connues. Comment estimer le poids corporel moyen des enfants de moins de cinq ans à partir d’un échantillon de ménages tiré de façon aléatoire simple ? Remarquons que l’unité statistique utilisée pour le sondage est le ménage et non l’individu. On procède ainsi : on estime le nombre total d’enfants de moins de cinq ans ; on estime ensuite le poids corporel total des enfants de moins de cinq ans le ratio (ou quotient) de ces deux masses est l’estimation du poids moyen de l’univers ; des enfants de moins de cinq ans. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 18 / 21
  • 36. Méthodes de tirage Plan 1 Principe 2 Estimation d’une moyenne 3 Estimation d’un total 4 Estimation d’une proportion 5 Estimation d’un ratio 6 Méthodes de tirage Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 19 / 21
  • 37. Méthodes de tirage Méthode simple L’idée est de numéroter les unités statistiques, et de procéder à un tirage au hasard de numéros entre 1 et N. Pour ce faire, on peut utiliser : une table de nombre au hasard,qu’on parcourt dans le sens bien défini au départ, par exemple ligne par ligne ; Un algorithme informatique de tirage, par exemple par génération au hasard d’un nombre réel entre 1 et N Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 20 / 21
  • 38. Méthodes de tirage Méthode simple L’idée est de numéroter les unités statistiques, et de procéder à un tirage au hasard de numéros entre 1 et N. Pour ce faire, on peut utiliser : une table de nombre au hasard,qu’on parcourt dans le sens bien défini au départ, par exemple ligne par ligne ; Un algorithme informatique de tirage, par exemple par génération au hasard d’un nombre réel entre 1 et N Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 20 / 21
  • 39. Méthodes de tirage Tirage systématique Une autre méthode est celle du tirage systématique : on procède par "sauts" dans la liste des unités statistiques. Cette méthode équivaut à la méthode élémentaire si les unités de la base de sondage sont réparties absolument au hasard ; elle est plus avantageuse que la méthode élémentaire si les unités ont été classées suivant un critère (variable auxiliaire) en corrélation avec les caractères à estimer et si l’on suppose qu’il existe un "effet" dans l’ordre de classement qui va donner plus de "représentativité" à l’échantillon tiré. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 21 / 21
  • 40. Méthodes de tirage Tirage systématique Une autre méthode est celle du tirage systématique : on procède par "sauts" dans la liste des unités statistiques. Cette méthode équivaut à la méthode élémentaire si les unités de la base de sondage sont réparties absolument au hasard ; elle est plus avantageuse que la méthode élémentaire si les unités ont été classées suivant un critère (variable auxiliaire) en corrélation avec les caractères à estimer et si l’on suppose qu’il existe un "effet" dans l’ordre de classement qui va donner plus de "représentativité" à l’échantillon tiré. Par exemple, si on a classé des ménages selon leur taille, on sera assuré par ce mode de tirage d’avoir à la fois des ménages de faible taille et des ménages de taille importante dans l’échantillon. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 21 / 21
  • 41. Méthodes de tirage Tirage systématique Une autre méthode est celle du tirage systématique : on procède par "sauts" dans la liste des unités statistiques. Cette méthode équivaut à la méthode élémentaire si les unités de la base de sondage sont réparties absolument au hasard ; elle est plus avantageuse que la méthode élémentaire si les unités ont été classées suivant un critère (variable auxiliaire) en corrélation avec les caractères à estimer et si l’on suppose qu’il existe un "effet" dans l’ordre de classement qui va donner plus de "représentativité" à l’échantillon tiré. Par exemple, si on a classé des ménages selon leur taille, on sera assuré par ce mode de tirage d’avoir à la fois des ménages de faible taille et des ménages de taille importante dans l’échantillon. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages aléatoires simples 11 Avril 2012 21 / 21