SlideShare une entreprise Scribd logo
1  sur  21
Télécharger pour lire hors ligne
La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion
Le choix de l'échantillon
Statistiques, logiciels et enquête
Benoît Le Maux
- Produire et préparer les variables -
Statistiques, logiciels et enquête Le choix de l'échantillon
La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion
Pourquoi un échantillon ?
Pourquoi un échantillon ?
Pour des raisons de coûts ou de délais. L'objectif est alors de construire un
échantillon tel que les observations pourront être généralisées à l'ensemble de la
population.
Deux méthodes pour constituer un échantillon.
Méthode probabiliste : sélection de l'échantillon par tirage aléatoire dans
la population-mère. Chaque individu statistique doit avoir exactement la
même chance que les autres de participer à l'enquête.
Méthode non-probabiliste : identier dans la population-mère, quelques
critères de répartition signicatifs puis d'essayer de respecter cette
répartition dans l'échantillon d'individus interrogés.
Statistiques, logiciels et enquête Le choix de l'échantillon
La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion
La bonne question
1. Est-ce qu'un échantillon de taille 500 sut pour une population de 10 000 ?
2. Quelle est la taille de l'échantillon qui assure tel degré précision ?
Il est impossible de répondre par oui ou par non à la première
question. Un échantillon doit fournir une estimation aussi précise
que possible d'une variable, et la précision s'améliore indéniment
lorsque la taille de l'échantillon augmente.
Statistiques, logiciels et enquête Le choix de l'échantillon
La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion
La notion de précision
La notion de précision (ou abilité d'échantillonnage) est
matérialisée par un seuil de conance et une marge d'erreur.
Dans le cas de l'estimation d'une proportion :
Un échantillon déni à un seuil de conance de 95% et avec une
marge d'erreur de e = 3% vous permettra d'extrapoler chaque
résultat issu de votre enquête, avec 5% de risques de vous tromper
de + ou - 3%.
Statistiques, logiciels et enquête Le choix de l'échantillon
La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion
Dans le cas de l'estimation d'une proportion (1)
Pour calculer la taille de l'échantillon dans le cas de l'estimation
d'une proportion, vous pouvez appliquer la formule suivante :
n =
z2p(1 − p)
e2
où n est la taille de l'échantillon, t est une constante issue de la loi
normale selon un certain seuil de conance (en général 95% et
z=1,96), p : est le pourcentage de gens qui présentent le caractère
observé, e est la marge d'erreur d'échantillonnage choisie.
Statistiques, logiciels et enquête Le choix de l'échantillon
La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion
Dans le cas de l'estimation d'une proportion (2)
Répartition des réponses Erreur d'échantillonnage
p 1 − p 1 % 5 % 10 % 15 % 20 %
50 % 50 % 9604 385 97 43 25
60 % 40 % 9220 369 93 41 24
70 % 30 % 8068 323 81 36 21
80 % 20 % 6147 246 62 28 16
90 % 10 % 3458 139 35 16 9
Table: Taille de l'échantillon dans le cas d'une proportion
Statistiques, logiciels et enquête Le choix de l'échantillon
La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion
Quelques remarques (1)
La généralisation aux méthodes non-probabilistes :
En théorie, les méthodes de calcul scientique de la taille
d'échantillon ne s'applique que sur les échantillons obtenus par la
méthode probabiliste. En pratique, ces méthodes de calcul sont
quand même utilisées.
Un échantillon de grande taille mais pas trop
Plus votre échantillon est important, plus la généralisation sera
able. Mais, les gains de abilité ne sont pas proportionnels à
l'augmentation de la taille de l'échantillon.
Statistiques, logiciels et enquête Le choix de l'échantillon
La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion
Quelques remarques (2)
La taille de la population-mère
c'est un facteur seulement lorsqu'elle est en deçà de 100 000 ou à
peu près. En deçà, il faut utiliser, pour déterminer la taille de
l'échantillon, un élément appelé  facteur de correction  :
Dans le cas d'une proportion : n = n
1+n+1
N
≈ n
1+ n
N
N représente la population mère.
Statistiques, logiciels et enquête Le choix de l'échantillon
La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion
Quelques remarques (3)
Population Echantillon
N n
50 45
100 80
200 132
1 000 278
2 000 323
5 000 357
10 000 371
100 000 384
200 000 385
Table: Population et échantillon dans le cas d'une proportion
Statistiques, logiciels et enquête Le choix de l'échantillon
La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion
Quelques remarques (4)
Un faux problème
En général, pour déterminer la taille d'un l'échantillon, une étude
quantitative se base généralement sur les chires obtenus dans le
tableau ci-dessus. Un échantillon de 200-300 individus fournit donc
de bon résultats. On choisit ensuite un seuil de conance (en
général 95%). La marge d'erreur, et par conséquent l'intervalle de
conance, sont ensuite déduits via la formule suivante :
Pour une proportion : e = z × p×(1−p)
n .
Statistiques, logiciels et enquête Le choix de l'échantillon
La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion
Résumé
La précision dépend de deux éléments principaux :
1 La taille n de l'échantillon : plus l'échantillon est grand plus
l'estimation est précise.
2 Le seuil de conance : plus celui-ci sera grand, plus z
grandira et plus l'intervalle de conance sera large.
Statistiques, logiciels et enquête Le choix de l'échantillon
La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion
Méthode d'échantillonnage probabiliste
Dénition
Les échantillons probabilistes ou aléatoires sont constitués par
tirage au sort dans la population mère pour laquelle on dispose de
la liste complète de toutes les unités de sondage qui la composent
(individus, familles, entreprises, etc.). On distingue 4 méthodes :
Echantillonnage aléatoire simple
Echantillonnage aléatoire systématique
Echantillonnage stratié
Echantillonnage en grappes et à plusieurs degrés
Statistiques, logiciels et enquête Le choix de l'échantillon
La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion
Echantillonnage aléatoire simple
Principe
Chaque membre d'une population a une chance égale d'être inclus à
l'intérieur de l'échantillon.
Chaque combinaison de membres de la population a aussi une chance
égale de composer l'échantillon.
Mode d'administration
Vous devez dresser une liste de toutes les unités incluses dans la population
observée pour sélectionner un échantillon aléatoire simple. Un échantillonnage
aléatoire simple peut s'eectuer avec ou sans remise.
Avantages : facile à mettre en ÷uvre.
Inconvénients : La non-représentativité, le coût.
Statistiques, logiciels et enquête Le choix de l'échantillon
La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion
Echantillonnage systématique
Principe
Il existe un écart, ou un intervalle, entre chaque unité sélectionnée qui est
incluse dans l'échantillon.
Mode d'administration
1 Numéroter de 1 à N les unités incluses dans votre base de sondage (où N
est la taille de la population totale).
2 Déterminer l'intervalle d'échantillonnage ou pas de sondage (K) en
divisant la population N par la taille de l'échantillon que vous désirez
obtenir.
3 Sélectionner au hasard un nombre entre 1 et K. Ce nombre s'appelle
l'origine choisie au hasard.
4 Sélectionner chaque Kème unité après ce premier nombre.
Avantages : La probabilité d'être sélectionnée = celle d'un EAS.
Inconvénients : Le coût, problème si la population est ordonnée.
Statistiques, logiciels et enquête Le choix de l'échantillon
La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion
Echantillonnage stratié
Principe
Découper la population en sous ensembles appelés strates et réaliser un
sondage dans chacune d'elles.
Mode d'administration
1 On divise la population en groupes homogènes (appelés strates), qui sont
mutuellement exclusifs (selon l'âge, le sexe, la province de résidence, le
revenu, etc.)
2 On sélectionne à partir de chaque strate des échantillons indépendants.
On peut utiliser n'importe quelle des méthodes d'échantillonnage
3 La méthode d'échantillonnage peut varier d'une strate à une autre.
Avantages : La probabilité d'être sélectionnée = celle d'un EAS.
Echantillon plus représentatif.
Inconvénients : Le coût.
Statistiques, logiciels et enquête Le choix de l'échantillon
La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion
Echantillonnage en grappes et à plusieurs degrés
Principe
Limiter les zones géographiques qui font l'objet de l'enquête
Mode d'administration
Si la population est répartie sur M grappes (usines, établissements
d'enseignement, subdivisions électorales) :
1 1er degré : choisir un échantillon de m grappes.
2 2ème degré : réaliser une enquête dans chacune des m grappes :
soit auprès de tous les éléments (dits aussi unités secondaires) :
sondage par grappes.
soit en désignant des échantillons d'unités secondaires : sondage à
deux degrés.
Avantages : réduire les coûts
Inconvénients : Eet de grappe (variance intra qui est faible) dû à
l'existence de similarite entre individus d'une même grappe.
Statistiques, logiciels et enquête Le choix de l'échantillon
La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion
Méthode d'échantillonnage non-probabiliste
Dénition
La méthode d'échantillonnage non-probabiliste est utilisée
lorsqu'il n'est pas possible de constituer une liste exhaustive de
toutes les unités du sondage.
Dans le cas de l'échantillonnage probabiliste, chaque unité a
une chance d'être sélectionnée.
Ce n'est plus vrai dans le cas de l'échantillonnage probabiliste.
On se xe alors comme règle que l'échantillon retenu doit avoir
la même composition que la population mère par rapport à
une ou plusieurs caractéristiques.
Statistiques, logiciels et enquête Le choix de l'échantillon
La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion
Echantillonnage par quotas
Principe
Il s'eectue jusqu'à ce qu'un nombre précis d'unités (de quotas) pour diverses
sous-populations ait été sélectionné.
Mode d'administration
Les quotas peuvent être fondés sur des proportions de la population. (par
exemple 50% d'hommes et 50% de femmes)
Ne retenir qu'un nombre restreint de quotas. Au delà de 2 ou 3 quotas,
on complique la tâche des enquêteurs.
Avantages : L'échantillonnage par quotas est généralement moins
coûteux que l'échantillonnage aléatoire. Il est également facile à
administrer.
Inconvénients : Certaines unités peuvent n'avoir aucune chance d'être
sélectionnées.
Statistiques, logiciels et enquête Le choix de l'échantillon
La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion
Les autres méthodes non-probabilistes (1)
Le volontariat
On prélève l'échantillon à partir d'un groupe de volontaires.
⇒ Inconvénients : échantillon biaisé
La méthode des itinéraires
On impose à l'enquêteur :
Un point de départ dans une commune.
Un itinéraire à suivre avec tirage systématique des logements dans
lesquels eectuer les interviews
⇒ Objectif: reproduire un certain tirage aléatoire des enquêtés, sans
donner explicitement des noms et adresses à l'enquêteur.
Statistiques, logiciels et enquête Le choix de l'échantillon
La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion
Les autres méthodes non-probabilistes (2)
Technique de  boule de neige 
Utilisation de personnes comme source d'identication d'unités additionnelles.
Échantillonnage de convenance ou au jugé
On prélève un échantillon en se fondant sur certains jugements au sujet de
l'ensemble de la population.
Échantillonnage sur place
L'échantillon étudié est dénie par un lieu. Cette méthode est utilisé dans
l'échantillonnage de populations mobiles, rares ou spéciques. Avec cette
méthode, il faut faire attention à :
ne pas sur-représenter les individus passant + de temps sur place
les périodes d'enquête
les pondérations a posteriori pour tenir compte de la probabilité de
présence
Statistiques, logiciels et enquête Le choix de l'échantillon
La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion
Conclusion
Pourquoi un échantillon ? ⇒ La population cible est généralement trop
nombreuse et pour des raisons de coûts, de délais, il est pratiquement
impossible d'étudier tous les individus d'une population c'est-à-dire
d'eectuer un recensement.
Quelle taille d'échantillon ? En général, on utilise la formule n = 385
1+ 385
N
pour trouver la taille nécessaire (pour que la marge d'erreur dans
l'estimation de la proportion soit inférieur à 5 % et ce, pour un seuil de
conance de 95%).
Objectif : Construire un échantillon tel que les observations pourront être
généralisées à l'ensemble de la population (méthode probabiliste ou
non-probabiliste).
Condition : Il faut que l'échantillon présente les mêmes caractéristiques
que la population cible. En d'autres termes, qu'il soit représentatif. Si ce
n'est pas le cas, l'échantillon est biaisé.
Statistiques, logiciels et enquête Le choix de l'échantillon

Contenu connexe

Tendances

Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...
Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...
Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...Adad Med Chérif
 
Intelligence Économique et Veille Stratégique: Rôle dans le processus d’inno...
Intelligence Économique et  Veille Stratégique: Rôle dans le processus d’inno...Intelligence Économique et  Veille Stratégique: Rôle dans le processus d’inno...
Intelligence Économique et Veille Stratégique: Rôle dans le processus d’inno...Khadija MENGUIT
 
GP Chapitre 2 : Les méthodes de prévision
GP Chapitre 2 : Les méthodes de prévision GP Chapitre 2 : Les méthodes de prévision
GP Chapitre 2 : Les méthodes de prévision ibtissam el hassani
 
Les QCM : les réponses à toutes vos questions
Les QCM : les réponses à toutes vos questionsLes QCM : les réponses à toutes vos questions
Les QCM : les réponses à toutes vos questionsMarcel Lebrun
 
Chapitre1:Introduction aux méthodes de sondage
Chapitre1:Introduction aux méthodes de sondageChapitre1:Introduction aux méthodes de sondage
Chapitre1:Introduction aux méthodes de sondageMahamadou Haro
 
ECONOMIE-DE-SANTE-COURS-2017 (1).pdf
ECONOMIE-DE-SANTE-COURS-2017 (1).pdfECONOMIE-DE-SANTE-COURS-2017 (1).pdf
ECONOMIE-DE-SANTE-COURS-2017 (1).pdfelmontaserimane
 
Planification strategique
 Planification strategique Planification strategique
Planification strategiqueRACHID MABROUKI
 
Spss les premieres notions 1
Spss les premieres notions 1Spss les premieres notions 1
Spss les premieres notions 1Adad Med Chérif
 
Définitions Intelligence Territoriale
Définitions Intelligence TerritorialeDéfinitions Intelligence Territoriale
Définitions Intelligence TerritorialeAurelien Gaucherand
 
étude de marché ppt
étude de marché pptétude de marché ppt
étude de marché pptMî Rã
 
Data mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes PrincipalesData mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes PrincipalesMohamed Heny SELMI
 
Présentation intelligence artificielle et domaines d'applications - #DigitalT...
Présentation intelligence artificielle et domaines d'applications - #DigitalT...Présentation intelligence artificielle et domaines d'applications - #DigitalT...
Présentation intelligence artificielle et domaines d'applications - #DigitalT...Digital Thursday
 
Cours Statistique descriptive pr Falloul
Cours Statistique descriptive pr FalloulCours Statistique descriptive pr Falloul
Cours Statistique descriptive pr FalloulProfesseur Falloul
 

Tendances (20)

Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...
Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...
Analyse en composantes principales, ACP, sous SPSS (Principal Component Analy...
 
Intelligence Économique et Veille Stratégique: Rôle dans le processus d’inno...
Intelligence Économique et  Veille Stratégique: Rôle dans le processus d’inno...Intelligence Économique et  Veille Stratégique: Rôle dans le processus d’inno...
Intelligence Économique et Veille Stratégique: Rôle dans le processus d’inno...
 
GP Chapitre 2 : Les méthodes de prévision
GP Chapitre 2 : Les méthodes de prévision GP Chapitre 2 : Les méthodes de prévision
GP Chapitre 2 : Les méthodes de prévision
 
Les QCM : les réponses à toutes vos questions
Les QCM : les réponses à toutes vos questionsLes QCM : les réponses à toutes vos questions
Les QCM : les réponses à toutes vos questions
 
Chapitre1:Introduction aux méthodes de sondage
Chapitre1:Introduction aux méthodes de sondageChapitre1:Introduction aux méthodes de sondage
Chapitre1:Introduction aux méthodes de sondage
 
Épidémiologie
Épidémiologie Épidémiologie
Épidémiologie
 
Echantillonnage.pptx
Echantillonnage.pptxEchantillonnage.pptx
Echantillonnage.pptx
 
Entretiens semi-directifs
Entretiens semi-directifsEntretiens semi-directifs
Entretiens semi-directifs
 
ECONOMIE-DE-SANTE-COURS-2017 (1).pdf
ECONOMIE-DE-SANTE-COURS-2017 (1).pdfECONOMIE-DE-SANTE-COURS-2017 (1).pdf
ECONOMIE-DE-SANTE-COURS-2017 (1).pdf
 
Planification strategique
 Planification strategique Planification strategique
Planification strategique
 
Spss les premieres notions 1
Spss les premieres notions 1Spss les premieres notions 1
Spss les premieres notions 1
 
Définitions Intelligence Territoriale
Définitions Intelligence TerritorialeDéfinitions Intelligence Territoriale
Définitions Intelligence Territoriale
 
étude de marché ppt
étude de marché pptétude de marché ppt
étude de marché ppt
 
Business plan 1
Business plan 1Business plan 1
Business plan 1
 
IEC (Information, Education et Communication)
IEC (Information, Education et Communication)IEC (Information, Education et Communication)
IEC (Information, Education et Communication)
 
Data mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes PrincipalesData mining - ACP Analyse en Composantes Principales
Data mining - ACP Analyse en Composantes Principales
 
Etude de Marche
Etude de MarcheEtude de Marche
Etude de Marche
 
Présentation intelligence artificielle et domaines d'applications - #DigitalT...
Présentation intelligence artificielle et domaines d'applications - #DigitalT...Présentation intelligence artificielle et domaines d'applications - #DigitalT...
Présentation intelligence artificielle et domaines d'applications - #DigitalT...
 
Etude de marché
Etude de marchéEtude de marché
Etude de marché
 
Cours Statistique descriptive pr Falloul
Cours Statistique descriptive pr FalloulCours Statistique descriptive pr Falloul
Cours Statistique descriptive pr Falloul
 

En vedette

SCoT_Lorient_projections démographiques
SCoT_Lorient_projections démographiquesSCoT_Lorient_projections démographiques
SCoT_Lorient_projections démographiquesAudéLor
 
Olivier Féron's talk at BigMC March 2011
Olivier Féron's talk at BigMC March 2011Olivier Féron's talk at BigMC March 2011
Olivier Féron's talk at BigMC March 2011BigMC
 
schéma regional de l'offre de soins
schéma regional de l'offre de soins schéma regional de l'offre de soins
schéma regional de l'offre de soins mohamed elmarnissi
 
Methodologie conception et_administration_de_questionnaires
Methodologie conception et_administration_de_questionnairesMethodologie conception et_administration_de_questionnaires
Methodologie conception et_administration_de_questionnairesRémi Bachelet
 
Méthodologie de l'enquête
Méthodologie de l'enquêteMéthodologie de l'enquête
Méthodologie de l'enquêtepaullyonnaz
 
20141128 demogr bxl_06_mv
20141128 demogr bxl_06_mv20141128 demogr bxl_06_mv
20141128 demogr bxl_06_mvSocDemoFB
 

En vedette (9)

SCoT_Lorient_projections démographiques
SCoT_Lorient_projections démographiquesSCoT_Lorient_projections démographiques
SCoT_Lorient_projections démographiques
 
1s prob
1s prob1s prob
1s prob
 
Olivier Féron's talk at BigMC March 2011
Olivier Féron's talk at BigMC March 2011Olivier Féron's talk at BigMC March 2011
Olivier Féron's talk at BigMC March 2011
 
schéma regional de l'offre de soins
schéma regional de l'offre de soins schéma regional de l'offre de soins
schéma regional de l'offre de soins
 
Methodologie conception et_administration_de_questionnaires
Methodologie conception et_administration_de_questionnairesMethodologie conception et_administration_de_questionnaires
Methodologie conception et_administration_de_questionnaires
 
integration
integrationintegration
integration
 
Méthodologie de l'enquête
Méthodologie de l'enquêteMéthodologie de l'enquête
Méthodologie de l'enquête
 
20141128 demogr bxl_06_mv
20141128 demogr bxl_06_mv20141128 demogr bxl_06_mv
20141128 demogr bxl_06_mv
 
échantillonnage
échantillonnageéchantillonnage
échantillonnage
 

Similaire à Echantillon

02_Echantillonnage.pdf
02_Echantillonnage.pdf02_Echantillonnage.pdf
02_Echantillonnage.pdfSmartTv74
 
Cours echantillonnage et estimations
Cours echantillonnage et estimationsCours echantillonnage et estimations
Cours echantillonnage et estimationsL'auditeur Junior
 
Echantillonage.pdf
Echantillonage.pdfEchantillonage.pdf
Echantillonage.pdfnajwa2053
 
Le bilan d'Emmanuel Macron un an après son élection
Le bilan d'Emmanuel Macron un an après son électionLe bilan d'Emmanuel Macron un an après son élection
Le bilan d'Emmanuel Macron un an après son électionKantar
 
Ecart type experimental : quelle formule choisir ?
Ecart type experimental : quelle formule choisir ?Ecart type experimental : quelle formule choisir ?
Ecart type experimental : quelle formule choisir ?Jean-Michel POU
 
etude de marché
etude de marché etude de marché
etude de marché 781220
 
Les méthodes de sondage-cours (1).doc
Les méthodes de sondage-cours (1).docLes méthodes de sondage-cours (1).doc
Les méthodes de sondage-cours (1).docHichamBr
 
Présentation S6 Info Gest (1).pdf
Présentation S6 Info Gest (1).pdfPrésentation S6 Info Gest (1).pdf
Présentation S6 Info Gest (1).pdfannaraf
 
Comment déterminer le critère de jugement et le nombre de sujets nécessaires
Comment déterminer le critère de jugement et le nombre de sujets nécessairesComment déterminer le critère de jugement et le nombre de sujets nécessaires
Comment déterminer le critère de jugement et le nombre de sujets nécessairesHubert Maisonneuve
 
Nsg 5592 module 1
Nsg 5592 module 1Nsg 5592 module 1
Nsg 5592 module 1aduboi4
 
Métrologie : Jusqu'où ne pas aller trop loin ?
Métrologie : Jusqu'où ne pas aller trop loin ?Métrologie : Jusqu'où ne pas aller trop loin ?
Métrologie : Jusqu'où ne pas aller trop loin ?Jean-Michel POU
 
Conférence: Catalyseurs de l'Intelligence Artificielle et Écosystème des Fram...
Conférence: Catalyseurs de l'Intelligence Artificielle et Écosystème des Fram...Conférence: Catalyseurs de l'Intelligence Artificielle et Écosystème des Fram...
Conférence: Catalyseurs de l'Intelligence Artificielle et Écosystème des Fram...ENSET, Université Hassan II Casablanca
 

Similaire à Echantillon (20)

02_Echantillonnage.pdf
02_Echantillonnage.pdf02_Echantillonnage.pdf
02_Echantillonnage.pdf
 
Cours echantillonnage et estimations
Cours echantillonnage et estimationsCours echantillonnage et estimations
Cours echantillonnage et estimations
 
Marhoum
MarhoumMarhoum
Marhoum
 
Les statistiques
Les statistiquesLes statistiques
Les statistiques
 
Echantillonage.pdf
Echantillonage.pdfEchantillonage.pdf
Echantillonage.pdf
 
Chapitre Introductif
Chapitre IntroductifChapitre Introductif
Chapitre Introductif
 
Les statistiques
Les statistiquesLes statistiques
Les statistiques
 
Le bilan d'Emmanuel Macron un an après son élection
Le bilan d'Emmanuel Macron un an après son électionLe bilan d'Emmanuel Macron un an après son élection
Le bilan d'Emmanuel Macron un an après son élection
 
Le bilan d'Emmanuel Macron un an après son élection
Le bilan d'Emmanuel Macron un an après son électionLe bilan d'Emmanuel Macron un an après son élection
Le bilan d'Emmanuel Macron un an après son élection
 
Ecart type experimental : quelle formule choisir ?
Ecart type experimental : quelle formule choisir ?Ecart type experimental : quelle formule choisir ?
Ecart type experimental : quelle formule choisir ?
 
etude de marché
etude de marché etude de marché
etude de marché
 
Les méthodes de sondage-cours (1).doc
Les méthodes de sondage-cours (1).docLes méthodes de sondage-cours (1).doc
Les méthodes de sondage-cours (1).doc
 
Le bilan d'Emmanuel Macron 2 ans après son élection
Le bilan d'Emmanuel Macron 2 ans après son électionLe bilan d'Emmanuel Macron 2 ans après son élection
Le bilan d'Emmanuel Macron 2 ans après son élection
 
Présentation S6 Info Gest (1).pdf
Présentation S6 Info Gest (1).pdfPrésentation S6 Info Gest (1).pdf
Présentation S6 Info Gest (1).pdf
 
Comment déterminer le critère de jugement et le nombre de sujets nécessaires
Comment déterminer le critère de jugement et le nombre de sujets nécessairesComment déterminer le critère de jugement et le nombre de sujets nécessaires
Comment déterminer le critère de jugement et le nombre de sujets nécessaires
 
Stat3 Intervalle De Confiance
Stat3  Intervalle De ConfianceStat3  Intervalle De Confiance
Stat3 Intervalle De Confiance
 
Nsg 5592 module 1
Nsg 5592 module 1Nsg 5592 module 1
Nsg 5592 module 1
 
Métrologie : Jusqu'où ne pas aller trop loin ?
Métrologie : Jusqu'où ne pas aller trop loin ?Métrologie : Jusqu'où ne pas aller trop loin ?
Métrologie : Jusqu'où ne pas aller trop loin ?
 
LIPADE_Presentation
LIPADE_PresentationLIPADE_Presentation
LIPADE_Presentation
 
Conférence: Catalyseurs de l'Intelligence Artificielle et Écosystème des Fram...
Conférence: Catalyseurs de l'Intelligence Artificielle et Écosystème des Fram...Conférence: Catalyseurs de l'Intelligence Artificielle et Écosystème des Fram...
Conférence: Catalyseurs de l'Intelligence Artificielle et Écosystème des Fram...
 

Dernier

analyse husseindey AMIROUCHE Abdeslem.pptx
analyse husseindey AMIROUCHE Abdeslem.pptxanalyse husseindey AMIROUCHE Abdeslem.pptx
analyse husseindey AMIROUCHE Abdeslem.pptxHadJer61
 
To_understand_transformers_together presentation
To_understand_transformers_together presentationTo_understand_transformers_together presentation
To_understand_transformers_together presentationbahija babzine
 
Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023France Travail
 
Bidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from TransformersBidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from Transformersbahija babzine
 
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...France Travail
 
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel AttalELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attalcontact Elabe
 

Dernier (6)

analyse husseindey AMIROUCHE Abdeslem.pptx
analyse husseindey AMIROUCHE Abdeslem.pptxanalyse husseindey AMIROUCHE Abdeslem.pptx
analyse husseindey AMIROUCHE Abdeslem.pptx
 
To_understand_transformers_together presentation
To_understand_transformers_together presentationTo_understand_transformers_together presentation
To_understand_transformers_together presentation
 
Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023
 
Bidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from TransformersBidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from Transformers
 
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
 
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel AttalELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
 

Echantillon

  • 1. La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion Le choix de l'échantillon Statistiques, logiciels et enquête Benoît Le Maux - Produire et préparer les variables - Statistiques, logiciels et enquête Le choix de l'échantillon
  • 2. La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion Pourquoi un échantillon ? Pourquoi un échantillon ? Pour des raisons de coûts ou de délais. L'objectif est alors de construire un échantillon tel que les observations pourront être généralisées à l'ensemble de la population. Deux méthodes pour constituer un échantillon. Méthode probabiliste : sélection de l'échantillon par tirage aléatoire dans la population-mère. Chaque individu statistique doit avoir exactement la même chance que les autres de participer à l'enquête. Méthode non-probabiliste : identier dans la population-mère, quelques critères de répartition signicatifs puis d'essayer de respecter cette répartition dans l'échantillon d'individus interrogés. Statistiques, logiciels et enquête Le choix de l'échantillon
  • 3. La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion La bonne question 1. Est-ce qu'un échantillon de taille 500 sut pour une population de 10 000 ? 2. Quelle est la taille de l'échantillon qui assure tel degré précision ? Il est impossible de répondre par oui ou par non à la première question. Un échantillon doit fournir une estimation aussi précise que possible d'une variable, et la précision s'améliore indéniment lorsque la taille de l'échantillon augmente. Statistiques, logiciels et enquête Le choix de l'échantillon
  • 4. La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion La notion de précision La notion de précision (ou abilité d'échantillonnage) est matérialisée par un seuil de conance et une marge d'erreur. Dans le cas de l'estimation d'une proportion : Un échantillon déni à un seuil de conance de 95% et avec une marge d'erreur de e = 3% vous permettra d'extrapoler chaque résultat issu de votre enquête, avec 5% de risques de vous tromper de + ou - 3%. Statistiques, logiciels et enquête Le choix de l'échantillon
  • 5. La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion Dans le cas de l'estimation d'une proportion (1) Pour calculer la taille de l'échantillon dans le cas de l'estimation d'une proportion, vous pouvez appliquer la formule suivante : n = z2p(1 − p) e2 où n est la taille de l'échantillon, t est une constante issue de la loi normale selon un certain seuil de conance (en général 95% et z=1,96), p : est le pourcentage de gens qui présentent le caractère observé, e est la marge d'erreur d'échantillonnage choisie. Statistiques, logiciels et enquête Le choix de l'échantillon
  • 6. La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion Dans le cas de l'estimation d'une proportion (2) Répartition des réponses Erreur d'échantillonnage p 1 − p 1 % 5 % 10 % 15 % 20 % 50 % 50 % 9604 385 97 43 25 60 % 40 % 9220 369 93 41 24 70 % 30 % 8068 323 81 36 21 80 % 20 % 6147 246 62 28 16 90 % 10 % 3458 139 35 16 9 Table: Taille de l'échantillon dans le cas d'une proportion Statistiques, logiciels et enquête Le choix de l'échantillon
  • 7. La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion Quelques remarques (1) La généralisation aux méthodes non-probabilistes : En théorie, les méthodes de calcul scientique de la taille d'échantillon ne s'applique que sur les échantillons obtenus par la méthode probabiliste. En pratique, ces méthodes de calcul sont quand même utilisées. Un échantillon de grande taille mais pas trop Plus votre échantillon est important, plus la généralisation sera able. Mais, les gains de abilité ne sont pas proportionnels à l'augmentation de la taille de l'échantillon. Statistiques, logiciels et enquête Le choix de l'échantillon
  • 8. La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion Quelques remarques (2) La taille de la population-mère c'est un facteur seulement lorsqu'elle est en deçà de 100 000 ou à peu près. En deçà, il faut utiliser, pour déterminer la taille de l'échantillon, un élément appelé facteur de correction : Dans le cas d'une proportion : n = n 1+n+1 N ≈ n 1+ n N N représente la population mère. Statistiques, logiciels et enquête Le choix de l'échantillon
  • 9. La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion Quelques remarques (3) Population Echantillon N n 50 45 100 80 200 132 1 000 278 2 000 323 5 000 357 10 000 371 100 000 384 200 000 385 Table: Population et échantillon dans le cas d'une proportion Statistiques, logiciels et enquête Le choix de l'échantillon
  • 10. La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion Quelques remarques (4) Un faux problème En général, pour déterminer la taille d'un l'échantillon, une étude quantitative se base généralement sur les chires obtenus dans le tableau ci-dessus. Un échantillon de 200-300 individus fournit donc de bon résultats. On choisit ensuite un seuil de conance (en général 95%). La marge d'erreur, et par conséquent l'intervalle de conance, sont ensuite déduits via la formule suivante : Pour une proportion : e = z × p×(1−p) n . Statistiques, logiciels et enquête Le choix de l'échantillon
  • 11. La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion Résumé La précision dépend de deux éléments principaux : 1 La taille n de l'échantillon : plus l'échantillon est grand plus l'estimation est précise. 2 Le seuil de conance : plus celui-ci sera grand, plus z grandira et plus l'intervalle de conance sera large. Statistiques, logiciels et enquête Le choix de l'échantillon
  • 12. La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion Méthode d'échantillonnage probabiliste Dénition Les échantillons probabilistes ou aléatoires sont constitués par tirage au sort dans la population mère pour laquelle on dispose de la liste complète de toutes les unités de sondage qui la composent (individus, familles, entreprises, etc.). On distingue 4 méthodes : Echantillonnage aléatoire simple Echantillonnage aléatoire systématique Echantillonnage stratié Echantillonnage en grappes et à plusieurs degrés Statistiques, logiciels et enquête Le choix de l'échantillon
  • 13. La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion Echantillonnage aléatoire simple Principe Chaque membre d'une population a une chance égale d'être inclus à l'intérieur de l'échantillon. Chaque combinaison de membres de la population a aussi une chance égale de composer l'échantillon. Mode d'administration Vous devez dresser une liste de toutes les unités incluses dans la population observée pour sélectionner un échantillon aléatoire simple. Un échantillonnage aléatoire simple peut s'eectuer avec ou sans remise. Avantages : facile à mettre en ÷uvre. Inconvénients : La non-représentativité, le coût. Statistiques, logiciels et enquête Le choix de l'échantillon
  • 14. La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion Echantillonnage systématique Principe Il existe un écart, ou un intervalle, entre chaque unité sélectionnée qui est incluse dans l'échantillon. Mode d'administration 1 Numéroter de 1 à N les unités incluses dans votre base de sondage (où N est la taille de la population totale). 2 Déterminer l'intervalle d'échantillonnage ou pas de sondage (K) en divisant la population N par la taille de l'échantillon que vous désirez obtenir. 3 Sélectionner au hasard un nombre entre 1 et K. Ce nombre s'appelle l'origine choisie au hasard. 4 Sélectionner chaque Kème unité après ce premier nombre. Avantages : La probabilité d'être sélectionnée = celle d'un EAS. Inconvénients : Le coût, problème si la population est ordonnée. Statistiques, logiciels et enquête Le choix de l'échantillon
  • 15. La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion Echantillonnage stratié Principe Découper la population en sous ensembles appelés strates et réaliser un sondage dans chacune d'elles. Mode d'administration 1 On divise la population en groupes homogènes (appelés strates), qui sont mutuellement exclusifs (selon l'âge, le sexe, la province de résidence, le revenu, etc.) 2 On sélectionne à partir de chaque strate des échantillons indépendants. On peut utiliser n'importe quelle des méthodes d'échantillonnage 3 La méthode d'échantillonnage peut varier d'une strate à une autre. Avantages : La probabilité d'être sélectionnée = celle d'un EAS. Echantillon plus représentatif. Inconvénients : Le coût. Statistiques, logiciels et enquête Le choix de l'échantillon
  • 16. La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion Echantillonnage en grappes et à plusieurs degrés Principe Limiter les zones géographiques qui font l'objet de l'enquête Mode d'administration Si la population est répartie sur M grappes (usines, établissements d'enseignement, subdivisions électorales) : 1 1er degré : choisir un échantillon de m grappes. 2 2ème degré : réaliser une enquête dans chacune des m grappes : soit auprès de tous les éléments (dits aussi unités secondaires) : sondage par grappes. soit en désignant des échantillons d'unités secondaires : sondage à deux degrés. Avantages : réduire les coûts Inconvénients : Eet de grappe (variance intra qui est faible) dû à l'existence de similarite entre individus d'une même grappe. Statistiques, logiciels et enquête Le choix de l'échantillon
  • 17. La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion Méthode d'échantillonnage non-probabiliste Dénition La méthode d'échantillonnage non-probabiliste est utilisée lorsqu'il n'est pas possible de constituer une liste exhaustive de toutes les unités du sondage. Dans le cas de l'échantillonnage probabiliste, chaque unité a une chance d'être sélectionnée. Ce n'est plus vrai dans le cas de l'échantillonnage probabiliste. On se xe alors comme règle que l'échantillon retenu doit avoir la même composition que la population mère par rapport à une ou plusieurs caractéristiques. Statistiques, logiciels et enquête Le choix de l'échantillon
  • 18. La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion Echantillonnage par quotas Principe Il s'eectue jusqu'à ce qu'un nombre précis d'unités (de quotas) pour diverses sous-populations ait été sélectionné. Mode d'administration Les quotas peuvent être fondés sur des proportions de la population. (par exemple 50% d'hommes et 50% de femmes) Ne retenir qu'un nombre restreint de quotas. Au delà de 2 ou 3 quotas, on complique la tâche des enquêteurs. Avantages : L'échantillonnage par quotas est généralement moins coûteux que l'échantillonnage aléatoire. Il est également facile à administrer. Inconvénients : Certaines unités peuvent n'avoir aucune chance d'être sélectionnées. Statistiques, logiciels et enquête Le choix de l'échantillon
  • 19. La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion Les autres méthodes non-probabilistes (1) Le volontariat On prélève l'échantillon à partir d'un groupe de volontaires. ⇒ Inconvénients : échantillon biaisé La méthode des itinéraires On impose à l'enquêteur : Un point de départ dans une commune. Un itinéraire à suivre avec tirage systématique des logements dans lesquels eectuer les interviews ⇒ Objectif: reproduire un certain tirage aléatoire des enquêtés, sans donner explicitement des noms et adresses à l'enquêteur. Statistiques, logiciels et enquête Le choix de l'échantillon
  • 20. La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion Les autres méthodes non-probabilistes (2) Technique de boule de neige Utilisation de personnes comme source d'identication d'unités additionnelles. Échantillonnage de convenance ou au jugé On prélève un échantillon en se fondant sur certains jugements au sujet de l'ensemble de la population. Échantillonnage sur place L'échantillon étudié est dénie par un lieu. Cette méthode est utilisé dans l'échantillonnage de populations mobiles, rares ou spéciques. Avec cette méthode, il faut faire attention à : ne pas sur-représenter les individus passant + de temps sur place les périodes d'enquête les pondérations a posteriori pour tenir compte de la probabilité de présence Statistiques, logiciels et enquête Le choix de l'échantillon
  • 21. La taille de l'échantillon Méthode d'échantillonnage probabiliste Méthode d'échantillonnage non-probabiliste Conclusion Conclusion Pourquoi un échantillon ? ⇒ La population cible est généralement trop nombreuse et pour des raisons de coûts, de délais, il est pratiquement impossible d'étudier tous les individus d'une population c'est-à-dire d'eectuer un recensement. Quelle taille d'échantillon ? En général, on utilise la formule n = 385 1+ 385 N pour trouver la taille nécessaire (pour que la marge d'erreur dans l'estimation de la proportion soit inférieur à 5 % et ce, pour un seuil de conance de 95%). Objectif : Construire un échantillon tel que les observations pourront être généralisées à l'ensemble de la population (méthode probabiliste ou non-probabiliste). Condition : Il faut que l'échantillon présente les mêmes caractéristiques que la population cible. En d'autres termes, qu'il soit représentatif. Si ce n'est pas le cas, l'échantillon est biaisé. Statistiques, logiciels et enquête Le choix de l'échantillon