2. Quelques définitions
• Population : ensemble complet des éléments auxquels on souhaite
extrapoler les résultats de l’enquête
• Une enquête épidémiologique est impossible à réaliser sur l’entièreté de la
population ...
• Échantillon: formé d ’éléments sélectionnés de la population
• Base de sondage : liste d’éléments à partir de laquelle on sélectionne
l’échantillon
• Etapes de sondage : à une étape ; à 2 étapes ; ...
• exemple : 1ère étape/base = liste des communes, 2ème étape/base = liste
des habitants par commune sélectionnée
3. Quelques définitions
Sondage probabiliste : chaque personne de l’échantillon a une probabilité connue
d’être sélectionnée dans l ’échantillon
Sondage non probabiliste : sondage basé sur le jugement (telle personne est
incluse dans l’échantillon si elle est représentative = méthode des QUOTA). On ne
peut définir une probabilité de sélection pour chaque élément de la population.
Estimations : à partir des résultats obtenus dans l’échantillon, les conclusions
seront tirées pour la population grâce aux calculs des estimations
4. Méthode de sélection des échantillons
• Schémas d’échantillonnage pour sélectionner un échantillon probabiliste :
• Echantillonnage aléatoire simple
• Echantillonnage systématique
• Echantillonnage aléatoire stratifié
• Echantillonnage en grappes
5. Méthode d’échantillonnage :
Echantillonnage aléatoire simple
• Chaque échantillon de taille n a
la même probabilité d’être
sélectionné qui est égal à n / N
• Comment sélectionner un
échantillon aléatoire simple ?
• Construire une liste de
sondage de N unités de la
population et attribuer un
nombre de 1 à N à chacune
des unités
• Utiliser un processus
aléatoire pour générer n
nombres entre 1 et N afin
d’identifier les n individus
de l’échantillon
6. Méthode d’échantillonnage : Echantillonnage
systématique
• Consiste à choisir les éléments de l’échantillon en parcourant la base de sondage progressivement
et en sélectionnant les éléments régulièrement, à intervalle fixe (le pas), le premier élément étant
choisi aléatoirement
• pas : k=N/n
1 N
i i+k i+2k i+(n-1)k
nombre
aléatoire
n
7. Méthode d’échantillonnage :
Echantillonnage systématique
• Comment réaliser un échantillonnage
systématique ?
• On définit un pas d’échantillonnage : k =
N/n
• Point de départ “i” : aléatoire entre “1”
et “k”
• Inclure dans l ’échantillon tous les
éléments identifiés en ajoutant
successivement la constante k au
nombre de départ i.
Si pas non entier, on arrondit vers le haut pour
le point de départ ;
on ajoute le pas non entier et on arrondit vers le
haut à chaque pas
8. Méthode d’échantillonnage : Echantillonnage
aléatoire stratifié
On divise la population en strates (sous-
groupes) mutuellement
exclusives (un sujet appartient à un seul
groupe) et
exhaustive (la population se trouve
dans l’ensemble des strates)
Pourquoi stratifier ?
Si population composée de sous-
groupes qui devraient être représentés
dans l’échantillon
9. Méthode d’échantillonnage :
Echantillonnage en grappes
(clusters)
• consiste à diviser la population
en groupes ou grappes
mutuellement exclusives et
exhaustives et
• à faire une sélection d’un
nombre réduit de grappes.
• Les éléments de l’échantillon
sont ensuite extraits des grappes
sélectionnées.
Biais de la méthode = Effet de grappe
Individus d’une même grappe ont
une probabilité d’avoir des
caractéristiques communes (dont le
statut nutritionnel ou la
couverture vaccinale)
Solution : accroître la taille de
l’échantillon
10. Résumé des qualités des principales
techniques d’échantillonnage
Qualité Caractéristiques idéales
Facilité Coût Précision Hétérogénéité
Méthodes Intra Inter
Aléatoire
simple
- ++ +
Aléatoire
stratifié
-/+ + ++ Faible Forte
Grappes ++ - - Forte Faible
11. Calcul de la
taille des
échantillons
• On se sert d’une table d’estimation de la taille d’un
échantillon ou d’un logiciel
• La taille de l’échantillon dépend de :
• -La plus petite différence que l’on veut détecter
• -La précision souhaitée
• -La puissance souhaitée
• -La variabilité des données.
• Du type d’étude
12. Calcul de la taille des échantillons
• Pour des études descriptives (estimations de proportions/ enquête de prévalence) avec
échantillonnage aléatoire simple et systématique :
Je voudrais un échantillon avec un degré de précision de 5% et un
degré de confiance de 95% (c’est-à-dire que les résultats de
l’échantillon comparés à ceux de la population mère seront précis à
+/- 5%, dans 95% des cas).
13. Calcul de la
taille des
échantillons
• Pour des études de cohorte et
transversale : deux types de
données à préciser :
• I. Données statistiques
• Test α = 0,05
• La puissance (1-β) = 80 %
• La proportion de Non-
malades / Malades : 1 : 1
• II. Données épidémiologiques et
médicales
• La fréquence de l’exposition
• L’OR minimum à mettre en
évidence
Moins de sujets
pour étude cas-
contrôles que
cohorte
14. Calcul de la
taille des
échantillons
• Pour des études cas-contrôles: deux types de données à
préciser :
• I. Données statistiques
• Test α = 0,05 (le programme demande 1- α)
• La puissance (1-β) = 80 % en général (on se donne 8
chance sur 10 de mettre en évidence une différence significative
si elle existe)
• La proportion d’Exposés et de Non-exposés : le schéma
le plus efficient est 1E+ / 1E- car permet des échantillons de
petites tailles
• II. Données épidémiologiques et médicales
• La fréquence attendue de la maladie dans le groupe E- (ou
incidence pour cohorte).
• L’effet minimum que l’on estime mettre en évidence sous forme
de pourcentage, risque, … (un RR de minimum 2 est déjà
intéressant)