Echantillonnage
Taille d’échantillon
Quelques définitions
• Population : ensemble complet des éléments auxquels on souhaite
extrapoler les résultats de l’enquête
• Une enquête épidémiologique est impossible à réaliser sur l’entièreté de la
population ...
• Échantillon: formé d ’éléments sélectionnés de la population
• Base de sondage : liste d’éléments à partir de laquelle on sélectionne
l’échantillon
• Etapes de sondage : à une étape ; à 2 étapes ; ...
• exemple : 1ère étape/base = liste des communes, 2ème étape/base = liste
des habitants par commune sélectionnée
Quelques définitions
Sondage probabiliste : chaque personne de l’échantillon a une probabilité connue
d’être sélectionnée dans l ’échantillon
Sondage non probabiliste : sondage basé sur le jugement (telle personne est
incluse dans l’échantillon si elle est représentative = méthode des QUOTA). On ne
peut définir une probabilité de sélection pour chaque élément de la population.
Estimations : à partir des résultats obtenus dans l’échantillon, les conclusions
seront tirées pour la population grâce aux calculs des estimations
Méthode de sélection des échantillons
• Schémas d’échantillonnage pour sélectionner un échantillon probabiliste :
• Echantillonnage aléatoire simple
• Echantillonnage systématique
• Echantillonnage aléatoire stratifié
• Echantillonnage en grappes
Méthode d’échantillonnage :
Echantillonnage aléatoire simple
• Chaque échantillon de taille n a
la même probabilité d’être
sélectionné qui est égal à n / N
• Comment sélectionner un
échantillon aléatoire simple ?
• Construire une liste de
sondage de N unités de la
population et attribuer un
nombre de 1 à N à chacune
des unités
• Utiliser un processus
aléatoire pour générer n
nombres entre 1 et N afin
d’identifier les n individus
de l’échantillon
Méthode d’échantillonnage : Echantillonnage
systématique
• Consiste à choisir les éléments de l’échantillon en parcourant la base de sondage progressivement
et en sélectionnant les éléments régulièrement, à intervalle fixe (le pas), le premier élément étant
choisi aléatoirement
• pas : k=N/n
1 N
i i+k i+2k i+(n-1)k
nombre
aléatoire
n
Méthode d’échantillonnage :
Echantillonnage systématique
• Comment réaliser un échantillonnage
systématique ?
• On définit un pas d’échantillonnage : k =
N/n
• Point de départ “i” : aléatoire entre “1”
et “k”
• Inclure dans l ’échantillon tous les
éléments identifiés en ajoutant
successivement la constante k au
nombre de départ i.
Si pas non entier, on arrondit vers le haut pour
le point de départ ;
on ajoute le pas non entier et on arrondit vers le
haut à chaque pas
Méthode d’échantillonnage : Echantillonnage
aléatoire stratifié
On divise la population en strates (sous-
groupes) mutuellement
exclusives (un sujet appartient à un seul
groupe) et
exhaustive (la population se trouve
dans l’ensemble des strates)
Pourquoi stratifier ?
Si population composée de sous-
groupes qui devraient être représentés
dans l’échantillon
Méthode d’échantillonnage :
Echantillonnage en grappes
(clusters)
• consiste à diviser la population
en groupes ou grappes
mutuellement exclusives et
exhaustives et
• à faire une sélection d’un
nombre réduit de grappes.
• Les éléments de l’échantillon
sont ensuite extraits des grappes
sélectionnées.
Biais de la méthode = Effet de grappe
Individus d’une même grappe ont
une probabilité d’avoir des
caractéristiques communes (dont le
statut nutritionnel ou la
couverture vaccinale)
Solution : accroître la taille de
l’échantillon
Résumé des qualités des principales
techniques d’échantillonnage
Qualité Caractéristiques idéales
Facilité Coût Précision Hétérogénéité
Méthodes Intra Inter
Aléatoire
simple
- ++ +
Aléatoire
stratifié
-/+ + ++ Faible Forte
Grappes ++ - - Forte Faible
Calcul de la
taille des
échantillons
• On se sert d’une table d’estimation de la taille d’un
échantillon ou d’un logiciel
• La taille de l’échantillon dépend de :
• -La plus petite différence que l’on veut détecter
• -La précision souhaitée
• -La puissance souhaitée
• -La variabilité des données.
• Du type d’étude
Calcul de la taille des échantillons
• Pour des études descriptives (estimations de proportions/ enquête de prévalence) avec
échantillonnage aléatoire simple et systématique :
Je voudrais un échantillon avec un degré de précision de 5% et un
degré de confiance de 95% (c’est-à-dire que les résultats de
l’échantillon comparés à ceux de la population mère seront précis à
+/- 5%, dans 95% des cas).
Calcul de la
taille des
échantillons
• Pour des études de cohorte et
transversale : deux types de
données à préciser :
• I. Données statistiques
• Test α = 0,05
• La puissance (1-β) = 80 %
• La proportion de Non-
malades / Malades : 1 : 1
• II. Données épidémiologiques et
médicales
• La fréquence de l’exposition
• L’OR minimum à mettre en
évidence
Moins de sujets
pour étude cas-
contrôles que
cohorte
Calcul de la
taille des
échantillons
• Pour des études cas-contrôles: deux types de données à
préciser :
• I. Données statistiques
•  Test α = 0,05 (le programme demande 1- α)
•  La puissance (1-β) = 80 % en général (on se donne 8
chance sur 10 de mettre en évidence une différence significative
si elle existe)
•  La proportion d’Exposés et de Non-exposés : le schéma
le plus efficient est 1E+ / 1E- car permet des échantillons de
petites tailles
• II. Données épidémiologiques et médicales
• La fréquence attendue de la maladie dans le groupe E- (ou
incidence pour cohorte).
• L’effet minimum que l’on estime mettre en évidence sous forme
de pourcentage, risque, … (un RR de minimum 2 est déjà
intéressant)
Pratique sur votre protocole
Merci

Echantillonnage.pptx

  • 1.
  • 2.
    Quelques définitions • Population: ensemble complet des éléments auxquels on souhaite extrapoler les résultats de l’enquête • Une enquête épidémiologique est impossible à réaliser sur l’entièreté de la population ... • Échantillon: formé d ’éléments sélectionnés de la population • Base de sondage : liste d’éléments à partir de laquelle on sélectionne l’échantillon • Etapes de sondage : à une étape ; à 2 étapes ; ... • exemple : 1ère étape/base = liste des communes, 2ème étape/base = liste des habitants par commune sélectionnée
  • 3.
    Quelques définitions Sondage probabiliste: chaque personne de l’échantillon a une probabilité connue d’être sélectionnée dans l ’échantillon Sondage non probabiliste : sondage basé sur le jugement (telle personne est incluse dans l’échantillon si elle est représentative = méthode des QUOTA). On ne peut définir une probabilité de sélection pour chaque élément de la population. Estimations : à partir des résultats obtenus dans l’échantillon, les conclusions seront tirées pour la population grâce aux calculs des estimations
  • 4.
    Méthode de sélectiondes échantillons • Schémas d’échantillonnage pour sélectionner un échantillon probabiliste : • Echantillonnage aléatoire simple • Echantillonnage systématique • Echantillonnage aléatoire stratifié • Echantillonnage en grappes
  • 5.
    Méthode d’échantillonnage : Echantillonnagealéatoire simple • Chaque échantillon de taille n a la même probabilité d’être sélectionné qui est égal à n / N • Comment sélectionner un échantillon aléatoire simple ? • Construire une liste de sondage de N unités de la population et attribuer un nombre de 1 à N à chacune des unités • Utiliser un processus aléatoire pour générer n nombres entre 1 et N afin d’identifier les n individus de l’échantillon
  • 6.
    Méthode d’échantillonnage :Echantillonnage systématique • Consiste à choisir les éléments de l’échantillon en parcourant la base de sondage progressivement et en sélectionnant les éléments régulièrement, à intervalle fixe (le pas), le premier élément étant choisi aléatoirement • pas : k=N/n 1 N i i+k i+2k i+(n-1)k nombre aléatoire n
  • 7.
    Méthode d’échantillonnage : Echantillonnagesystématique • Comment réaliser un échantillonnage systématique ? • On définit un pas d’échantillonnage : k = N/n • Point de départ “i” : aléatoire entre “1” et “k” • Inclure dans l ’échantillon tous les éléments identifiés en ajoutant successivement la constante k au nombre de départ i. Si pas non entier, on arrondit vers le haut pour le point de départ ; on ajoute le pas non entier et on arrondit vers le haut à chaque pas
  • 8.
    Méthode d’échantillonnage :Echantillonnage aléatoire stratifié On divise la population en strates (sous- groupes) mutuellement exclusives (un sujet appartient à un seul groupe) et exhaustive (la population se trouve dans l’ensemble des strates) Pourquoi stratifier ? Si population composée de sous- groupes qui devraient être représentés dans l’échantillon
  • 9.
    Méthode d’échantillonnage : Echantillonnageen grappes (clusters) • consiste à diviser la population en groupes ou grappes mutuellement exclusives et exhaustives et • à faire une sélection d’un nombre réduit de grappes. • Les éléments de l’échantillon sont ensuite extraits des grappes sélectionnées. Biais de la méthode = Effet de grappe Individus d’une même grappe ont une probabilité d’avoir des caractéristiques communes (dont le statut nutritionnel ou la couverture vaccinale) Solution : accroître la taille de l’échantillon
  • 10.
    Résumé des qualitésdes principales techniques d’échantillonnage Qualité Caractéristiques idéales Facilité Coût Précision Hétérogénéité Méthodes Intra Inter Aléatoire simple - ++ + Aléatoire stratifié -/+ + ++ Faible Forte Grappes ++ - - Forte Faible
  • 11.
    Calcul de la tailledes échantillons • On se sert d’une table d’estimation de la taille d’un échantillon ou d’un logiciel • La taille de l’échantillon dépend de : • -La plus petite différence que l’on veut détecter • -La précision souhaitée • -La puissance souhaitée • -La variabilité des données. • Du type d’étude
  • 12.
    Calcul de lataille des échantillons • Pour des études descriptives (estimations de proportions/ enquête de prévalence) avec échantillonnage aléatoire simple et systématique : Je voudrais un échantillon avec un degré de précision de 5% et un degré de confiance de 95% (c’est-à-dire que les résultats de l’échantillon comparés à ceux de la population mère seront précis à +/- 5%, dans 95% des cas).
  • 13.
    Calcul de la tailledes échantillons • Pour des études de cohorte et transversale : deux types de données à préciser : • I. Données statistiques • Test α = 0,05 • La puissance (1-β) = 80 % • La proportion de Non- malades / Malades : 1 : 1 • II. Données épidémiologiques et médicales • La fréquence de l’exposition • L’OR minimum à mettre en évidence Moins de sujets pour étude cas- contrôles que cohorte
  • 14.
    Calcul de la tailledes échantillons • Pour des études cas-contrôles: deux types de données à préciser : • I. Données statistiques •  Test α = 0,05 (le programme demande 1- α) •  La puissance (1-β) = 80 % en général (on se donne 8 chance sur 10 de mettre en évidence une différence significative si elle existe) •  La proportion d’Exposés et de Non-exposés : le schéma le plus efficient est 1E+ / 1E- car permet des échantillons de petites tailles • II. Données épidémiologiques et médicales • La fréquence attendue de la maladie dans le groupe E- (ou incidence pour cohorte). • L’effet minimum que l’on estime mettre en évidence sous forme de pourcentage, risque, … (un RR de minimum 2 est déjà intéressant)
  • 15.
  • 16.