Techniques
des Enquêtes Statistiques
1ère année, EST
M. Slimane Loukili
A.U. 2013-2014
Plan de cours
Chapitre 1. Introduction/Généralités
 Terminologie, concepts de base et définitions
 Types d’enquêtes
 Ph...
Chapitre 3. Généralités sur les techniques d’échantillonnage
 Sondages aléatoires (simple, systématique, stratifié, par g...
Chapitre 5. Traitement des données
 Le codage
 Le traitement des non-réponses
 La présentation des résultats/tabulation...
Chapitre 1. Introduction/cadre général
Les principales et méthodes de recueil d’information
Terminologie, concept de base ...
Information
quantifiée:RGPH2004
Réalité (floue, inconnue, incomplète,…) :
Quel est le taux de chômage en 2004 au Maroc?
Ré...
11626470
15379259
20419555
26073717
29891708
0
5000000
10000000
15000000
20000000
25000000
30000000
35000000
1960 1971 198...
Les principales méthodes de recueil d’information
ENQUETE
Consultation
de personnes
1. Étudier l’évolution du PIB par régi...
Exhaustive
« la population entière
est enquêtée »
Par sondage (par échantillonnage)
« Une partie seulement de la
populatio...
Terminologie, concepts et définitions
P i i i i i i i
i
i i i i
i i i i i i
i i i
i
i i i
i i i i i i i
i
E
i i i
i i i i ...
Terminologie, concepts et définitions
Population
 Il s’agit d’un ensemble d’individus séparés et bien déterminés qui ont
...
Terminologie, concepts et définitions
Population des
étudiants de l’EST en
2013
Caractéristiques
communes/d’appartenance
I...
Unité statistique
 La population objet de l’étude est composée d’individus (unité de base à
laquelle on s’intéresse) appe...
Caractéristiques d’intérêt
Les individus sont soumis
à l’observation du chercheur
à propos d’un certain nombre de caractér...
Typologie des caractéristiques d’intérêt
 Ces caractéristiques peuvent être :
1. Quantitatives : note, nombre d’années d’...
Typologie des caractéristiques d’intérêt
1. Economiques : consommation/dépenses, emploi, niveau de vie,
comportement des i...
Typologie des caractéristiques d’intérêt
• Des données personnelles : taille, poids, état de santé, parcours
éducatif…
• d...
Types d’enquêtes statistiques
Enquête exhaustive
+
Photographie de la population (t)
Mesure de la valeur vraie de Y
Créati...
Définition
Conception
Recueil
Traitement
Conclusions
Rapport/
Diffusion/
Communication
Les phases d’une enquête statistique
Phase de conception
d’une enquête statistique
Définir une
enquête
statistique
Phase de réflexion
Quoi ?
Que cherche-t-on
à savoir ?
Ébauche de l’objet,
du thème de l’en...
Définir une
enquête
statistique
Quel type
d’enquête ?
Où et quand?
Comment ?
Enquête exhaustive ?
par échantillonnage?
Lie...
Insertion
professionnelle
des diplômés
Pourquoi ?
Définition d’une enquête sur l’insertion
professionnelle des diplômés
Qu...
Insertion
professionnelle
des diplômés
Quel type
d’enquête ?
Où et quand?
Comment ?
L’enquête étant portée sur les 2 ou 3
...
Concevoir
l’enquête
statistique
Construction de l’objet :
• Définir un objet d’intérêt
• Définir les objectifs
• Détermine...
1. Thème de recherche
• Un thème est un sujet de préoccupation générale.
• Un thème se choisit selon ses lectures, ses pro...
2. Problématique
• La construction de la problématique consiste à situer ce que
l’on veut faire par rapport à l’état de la...
Hypothèses
Une hypothèse est une
proposition ou une explication
que l'on se contente d'énoncer
sans prendre position sur s...
Exemples d’hypothèses à vérifier sur le travail des enfants
H1 : « l’effectif des enfants
travailleurs s’est réduit
depuis...
Méthodes probabilistes :
Tirage aléatoire simple
• Le sondage probabiliste simple est la base de tout sondage
probabiliste
• Le TAS consiste à choisir « n » individus (ou ...
• Le TAS a l’avantage :
1. D’être simple à réaliser
2. De permettre des analyses statistiques simples
TAS
P i i i i i i i
...
• Le TAS admet deux inconvénients majeurs :
1. Le TAS nécessite une base de sondage « brute » où le choix
des unités stati...
TAS
1
• On numérote les individus de la liste avec des nombres comportant
un même nombre de chiffres (de 1 jusqu’à N)
2
• ...
1. Soit une population composé de 500 personnes
2. On veut choisir 10 personnes pour mener une enquête par un TAS
3. On re...
Méthodes probabilistes :
Tirage aléatoire systématique
(ou pas à pas)
• On dispose d’une liste exhaustive des unités statistiques ordonnées
• La première unité est choisie de manière aléatoire...
TASys
3
• On prend la partie entière de « N/n » notée « r » et appelée
raison ou pas de sondage
2
• On opte pour un point ...
i Itération
1
Itération
2
…
1 … ….
…. d’
d ….
… d’+r
d+r ….
… d’+2r
d+2r
…
d+3r
…
d+4r
…
… …
N
Illustration du TASys
• On dispose de la liste de présence des 240 étudiants de l’EST (2ème
année)
• On veut choisir 9 étudiants par un TASys
• ...
Le TASys, comme le TAS,
est simple à réaliser
Le TASys exige moins de
manipulations que le TAS
Le TASys permet des
analyse...
Méthodes probabilistes :
Tirage aléatoire stratifié
• Les TAS et TASys recourent à l’hypothèse de l’homogénéité de la
population par rapport à Y
• Dans la réalité, cette hypo...
• Dans le cas où la population est hétérogène de point de vue
caractéristique d’intérêt « Y », l’idée serait de former des...
• Exemple d’une population composée de 4 strates
P E
Schéma simplifié du TASt
S1
S4
S3
S2
n
1. Sondage stratifié à allocation proportionnelle : on reproduit le poids de la
strate au niveau de la population dans l’é...
2. Allocation optimale au sens de Neyman : tient compte de l’hétérogénéité de
chaque strate par rapport à la variable d’in...
• L’homogénéisation de la population pose donc la question du choix de la
variable de stratification.
• En général, on cho...
TASt : exemples de variables de stratification
Enquête auprès des
Ménages
Sexe
Niveau d’instruction
Type d’habitat
Revenu
...
Méthodes probabilistes :
Tirage aléatoire par grappes
• On partitionne la population en sous ensembles appelés grappes et notés
Gh (h=1,…H)
• On sélectionne un échantillon de g...
• Les grappes doivent être les plus hétérogènes possibles.
• Dans le cas contraire, on peut rencontrer une perte de précis...
• Exemple 1 : variable d’intérêt = avoir un travail
1. Grappe d’individus = ménage
2. Unité statistique : personnes en âge...
Méthodes probabilistes :
Tirage aléatoire à plusieurs degrés
• C’est un tirage où l’échantillon final est constitué après plusieurs tirages au
sort, imbriqués les uns dans les autres....
• Tirage à 2 degrés : sélection de certaines villes, puis des logements à
l’intérieur des villes choisies
• Tirage à 4 deg...
Méthodes non probabilistes
Méthodes empiriques
• Les sondages empiriques se sont opposés aux sondages probabilistes :
1. Méthode des quotas
2. Méthode des itinéraires
3....
• Les sondages empiriques sont souvent utilisés :
1. Pour pallier à l’absence d’une base de sondage en raison de
l’absence...
• La méthode des quotas est la forme la plus fréquente.
• On l’utilise notamment dans les enquêtes d’opinion (plus
particu...
Méthode des quotas : procédures
Etude de la
population
• Collecte d’informations statistiques sur le thème étudié
• Choix ...
• La feuille de quotas est un document qui fixe pour chaque lieu d’enquête les
caractéristiques que l’enquêteur doit respe...
Caractéristiques Effectifs de
la
population
N = 2000
Structure
de la
population
Echantillon
n=12
Sexe
Homme
Femme
1020
980...
Caractéristiques Echantillon
12 personnes
1 2 3 4 5 6 7 8 9 10 11 12
Sexe Homme
Femme
6
6
1 2 3 4 5 6
1 2 3 4 5 6
Age 18-3...
Méthode des quotas : quelques précisions
+
Sondés «interchangeables »
Relative liberté
Rapidité de réalisation de
l’enquêt...
• Elle consiste à imposer à l’enquêteur un itinéraire en lui indiquant exactement les points
du circuit où il doit procéde...
• Méthode souvent utilisée dans les enquêtes qualitatives, par exemple les
enquêtes sociologiques
• Elle est guidée par de...
• Exemple 1 : un visiteur veut s’informer sur la formationà l’EST. Il
choisit un étudiant‐type de l’EST (2ème année).
• Ex...
• Exemple 1 : un visiteur veut s’informer sur la formationà l’EST. Il
choisit 3 étudiants‐types de l’EST (1ère année) prés...
• On lance un appel
• Les individus eux-mêmes se portent volontaires pour répondre aux
questions.
• Exemples : enquêtes ré...
• Les individus son choisis sur le terrain au hasard des rencontres pour
généralement répondre à un nombre de questions ré...
• Dans n’importe quelle recherche, la taille des échantillons revêt un rôle très
important.
• D’abord, elle détermine la v...
technique d'enquete
technique d'enquete
technique d'enquete
technique d'enquete
technique d'enquete
technique d'enquete
technique d'enquete
technique d'enquete
technique d'enquete
technique d'enquete
Prochain SlideShare
Chargement dans…5
×

technique d'enquete

5 543 vues

Publié le

Publié dans : Économie & finance

technique d'enquete

  1. 1. Techniques des Enquêtes Statistiques 1ère année, EST M. Slimane Loukili A.U. 2013-2014
  2. 2. Plan de cours Chapitre 1. Introduction/Généralités  Terminologie, concepts de base et définitions  Types d’enquêtes  Phases d’une enquête statistique Chapitre 2. Conception d’une enquête  Contexte, objectifs et hypothèses de l’enquête  Concepts, définitions et indicateurs
  3. 3. Chapitre 3. Généralités sur les techniques d’échantillonnage  Sondages aléatoires (simple, systématique, stratifié, par grappes,…)  Sondages empiriques: méthode des quotas, méthode des itinéraires,…  Erreurs d’échantillonnage Chapitre 4. Elaboration d’un questionnaire  Principes et guide d’élaboration d’un questionnaire  Formulation, ordre, présentation et codage des questions  Test du questionnaire, enquête pilote  Règles de passation
  4. 4. Chapitre 5. Traitement des données  Le codage  Le traitement des non-réponses  La présentation des résultats/tabulation des données Chapitre 6. Analyse et interprétation des résultats  La réduction de la masse de données collectées en caractéristiques essentielles et leur signification statistique  Les conclusions et les explications
  5. 5. Chapitre 1. Introduction/cadre général Les principales et méthodes de recueil d’information Terminologie, concept de base et définitions Types d’enquêtes statistiques : recensement versus enquête par échantillonnage
  6. 6. Information quantifiée:RGPH2004 Réalité (floue, inconnue, incomplète,…) : Quel est le taux de chômage en 2004 au Maroc? Réalité : plus claire, plus précise, plus complète,… Le taux de chômage au Maroc en 2004 : 10,9% Importance de l’information statistique dans le monde d’aujourd’hui
  7. 7. 11626470 15379259 20419555 26073717 29891708 0 5000000 10000000 15000000 20000000 25000000 30000000 35000000 1960 1971 1982 1994 2004 urbain rural Evolution de la population légale marocaine d’après les données des recensements 1960, 1971, 1982, 1994 et 2004 (chiffres arrondis)
  8. 8. Les principales méthodes de recueil d’information ENQUETE Consultation de personnes 1. Étudier l’évolution du PIB par région à travers les statistiques annuelles de DS 2. Etudier l’évolution des exportations marocaines sur les 20 dernières années à travers les bilans du Ministère de l’Industrie et du Commerce 3. Étudier la situation socioéconomique des ménages à travers les rapports d’enquêtes auprès des ménages 1. Étudier l’effet d’un médicament sur des personnes diabétiques 2. Étudier l’effet d’un type d’entraînement sportif sur la performance de l’athlète Quantitative (statistique) 1. Mesurer le niveau de vie des ménages 2. Mesurer les niveaux de connaissances, les attitudes et les pratiques des jeunes en matière d’IST-SIDA Qualitative 1. Cerner les perceptions de la population à l’égard des inégalités sociales 2. Comprendre les représentations des jeunes diplômés relatives à la migration des cerveaux EXPERIMENTATION Réalisations d’expériences ETUDE DOCUMENTAIRE Consultation de monographies, revues, livres, banques de données,…
  9. 9. Exhaustive « la population entière est enquêtée » Par sondage (par échantillonnage) « Une partie seulement de la population est enquêtée » •Recensement Général de la Population et de l’Habitat • Recensement des Entreprises •Recensement de la Population Etudiante •Une partie des ménages •Une partie des entreprises •Un groupe d’étudiants Terminologie, concepts et définitions
  10. 10. Terminologie, concepts et définitions P i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i E i i i i i i i i i • La population « P » est de taille « N » • L’échantillon « E » est de taille « n »
  11. 11. Terminologie, concepts et définitions Population  Il s’agit d’un ensemble d’individus séparés et bien déterminés qui ont des caractéristiques, des propriétés communes.  La propriété d’appartenance est très importante  Les individus gardent toutefois des caractéristiques qui font leurs spécificités.
  12. 12. Terminologie, concepts et définitions Population des étudiants de l’EST en 2013 Caractéristiques communes/d’appartenance Inscriptions à l’EST en 2012 Caractéristiques spécifiques Age Sexe Année d’études Notes
  13. 13. Unité statistique  La population objet de l’étude est composée d’individus (unité de base à laquelle on s’intéresse) appelés aussi, entités, observations ou unités statistiques.  Chaque individu est supposé “ se démarquer ” sans ambiguïté des autres par une information claire et précise (identifiant “ i ”).  L’unité statistique peut être simple (personne ) ou complexe (ménage, entreprise,…) Terminologie, concepts et définitions
  14. 14. Caractéristiques d’intérêt Les individus sont soumis à l’observation du chercheur à propos d’un certain nombre de caractéristiques d’intérêt Des variables « Y » Opération exhaustive : Y1, Y2, …, Yi, …, YN Opération par sondage : Y1, Y2, …, Yi, …, Yn Terminologie, concepts et définitions
  15. 15. Typologie des caractéristiques d’intérêt  Ces caractéristiques peuvent être : 1. Quantitatives : note, nombre d’années d’études, chiffre d’affaire, revenu,… Ou 2. qualitatives : opinions, comportements, biens consommés, filières fréquentées,… Terminologie, concepts et définitions
  16. 16. Typologie des caractéristiques d’intérêt 1. Economiques : consommation/dépenses, emploi, niveau de vie, comportement des investisseurs,… 2. Démographiques : migration, fécondité,… 3. Sociales : loisirs, utilisation d’internet, éducation, santé, conditions de vie,… 4. Politiques : intentions de vote, opinions sur l’action gouvernementale,… Terminologie, concepts et définitions
  17. 17. Typologie des caractéristiques d’intérêt • Des données personnelles : taille, poids, état de santé, parcours éducatif… • des données sur les comportements, les opinions, les motivations, les attentes,… • des données environnementales : conditions d’habitat, accès au réseau d’eau potable, disponibilité d’une pharmacie,…; Terminologie, concepts et définitions
  18. 18. Types d’enquêtes statistiques Enquête exhaustive + Photographie de la population (t) Mesure de la valeur vraie de Y Création d’une base de sondage - Opération coûteuse Longue Fastidieuse Enquête par échantillonnage + Coût réduit Temps réduit Ressources humaines réduites Facilité d’exécution - Choix des unités Choix de l’estimateur
  19. 19. Définition Conception Recueil Traitement Conclusions Rapport/ Diffusion/ Communication Les phases d’une enquête statistique
  20. 20. Phase de conception d’une enquête statistique
  21. 21. Définir une enquête statistique Phase de réflexion Quoi ? Que cherche-t-on à savoir ? Ébauche de l’objet, du thème de l’enquête Pourquoi ? Objectif
  22. 22. Définir une enquête statistique Quel type d’enquête ? Où et quand? Comment ? Enquête exhaustive ? par échantillonnage? Lieu (rue, domicile, lieu de travail, …) et date (météo, vacances, week-end, événement particulier …) Mode d’administration du questionnaire (face à face, téléphone, correspondance,… Phase de réflexion
  23. 23. Insertion professionnelle des diplômés Pourquoi ? Définition d’une enquête sur l’insertion professionnelle des diplômés Quoi ? Que cherche-t-on à savoir ? La formation conduit-elle à l’emploi (durée de recherche, difficultés)? L’activité professionnelle a-t-elle un lien direct avec la formation reçue? L’activité correspond-elle aux attentes (stabilité, rémunération, lieu,…) Etude de la pertinence et adéquation entre la formation reçue et l’insertion professionnelle chez les diplômés de l’EST, création d’un outil d’aide à la décision pour une meilleure insertion
  24. 24. Insertion professionnelle des diplômés Quel type d’enquête ? Où et quand? Comment ? L’enquête étant portée sur les 2 ou 3 dernières promotions (petits effectifs), une enquête exhaustive est plus appropriée Niveau : National Lieu de contact des enquêtés : domicile (annuaire des anciens, adresses, é-mails) (entreprise : pour ceux qui travaillent) et date (14 février-1 mars 2013) Mode d’administration du questionnaire (face à face, mail) Définition d’une enquête sur l’insertion professionnelle des diplômés
  25. 25. Concevoir l’enquête statistique Construction de l’objet : • Définir un objet d’intérêt • Définir les objectifs • Déterminer une question qui explicite ce qu’on veut faire (ou plusieurs questions) • Définir les concepts • Formuler des hypothèses • Déterminer la population ciblée Phase de conception
  26. 26. 1. Thème de recherche • Un thème est un sujet de préoccupation générale. • Un thème se choisit selon ses lectures, ses propres intérêts et l’intérêt du thème par rapport à la recherche/études/politique/… 2. Exemples • Le travail des enfants • L’insertion professionnelle des diplômés • Le niveau de satisfaction des clients de la banque « B » • Les opinions des habitant de Meknes sur l’action des conseils des communes de Meknes • Utilisation des nouvelles techniques de communication par les lyciens
  27. 27. 2. Problématique • La construction de la problématique consiste à situer ce que l’on veut faire par rapport à l’état de la question et au contexte étudié : ce que l’on sait déjà (concepts, théories, modèles, causes, conséquences, explications,…) Formuler la question de recherche : ce que l’on veut savoir
  28. 28. Hypothèses Une hypothèse est une proposition ou une explication que l'on se contente d'énoncer sans prendre position sur sa véracité, c'est-à-dire sans l'affirmer ou la nier Une fois énoncée, une hypothèse peut être étudiée, confrontée, utilisée, discutée ou traitée de toute autre façon jugée nécessaire
  29. 29. Exemples d’hypothèses à vérifier sur le travail des enfants H1 : « l’effectif des enfants travailleurs s’est réduit depuis la refonte du code du travail en 2004» H2 : « le travail des enfants est très précoce » H3 : « les garçons sont plus concernés que les filles » H4 : « L’échec scolaire est un facteur explicatif du travail des enfants »
  30. 30. Méthodes probabilistes : Tirage aléatoire simple
  31. 31. • Le sondage probabiliste simple est la base de tout sondage probabiliste • Le TAS consiste à choisir « n » individus (ou unités statistiques) parmi une population de taille « N ». = fraction de sondage • Dans ce type de tirage, chaque individu de la population de référence est choisi au hasard. • Chaque individu a la même probabilité de faire partie de l’échantillon sans aucune manipulation au préalable dans la population  pi= 1/N ∀ i=1, 2,…, N TAS
  32. 32. • Le TAS a l’avantage : 1. D’être simple à réaliser 2. De permettre des analyses statistiques simples TAS P i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i E i i i i i i i i i
  33. 33. • Le TAS admet deux inconvénients majeurs : 1. Le TAS nécessite une base de sondage « brute » où le choix des unités statistiques s’effectue à partir des seuls identifiants. 2. Le TAS s’applique dans le cas de populations homogènes au regard de la variable étudiée Y :  Les unités statistiques Ui sont proches (semblables) de point de vue les valeurs Yi  La variable Y présente une faible dispersion TAS
  34. 34. TAS 1 • On numérote les individus de la liste avec des nombres comportant un même nombre de chiffres (de 1 jusqu’à N) 2 • On compte le nombre « j » de chiffres composant le nombre « N » : 1, 2, 3,…. 3 • On utilise une table de nombres aléatoires 4 • On opte pour un nombre de départ « d » : • On se déplace à partir de « d »: • du haut en bas, de gauche à droite • De bas vers le, de droite à gauche • En diagonale, vers le bas, de gauche à droite • ….. 5 • On identifie les nombres aléatoires comportant « j » chiffres 6 • On rejette les nombres qui ne se trouvent pas dans la liste ou qui se répètent, puis on recommence jusqu’à atteindre « n »
  35. 35. 1. Soit une population composé de 500 personnes 2. On veut choisir 10 personnes pour mener une enquête par un TAS 3. On recourt au fragment de la table des nombres aléatoires suivante : (Table de Kendall et Smith, 1939) 79409 67790 10353 36885 34317 44264 62994 23179 86523 40624 97378 15645 87183 08818 44776 41489 47740 49996 90997 40690 73062 99417 84362 36977 76062 24841 77021 90894 16615 13830 • E = U156, U103, U368, U88, U369, U343, U442, U477, U231, U138 Exemple de TAS
  36. 36. Méthodes probabilistes : Tirage aléatoire systématique (ou pas à pas)
  37. 37. • On dispose d’une liste exhaustive des unités statistiques ordonnées • La première unité est choisie de manière aléatoire • Le TASys consiste à choisir des unités statistiques sur la liste à partir de la première unité statistique selon un intervalle fixe jusqu’à parvenir à la taille de l’échantillon désirée Préalables du TASys
  38. 38. TASys 3 • On prend la partie entière de « N/n » notée « r » et appelée raison ou pas de sondage 2 • On opte pour un point de départ « d » entre 1 et N • Le choix de « d » est arbitraire 1 • La constitution de l’échantillon comprendra en premier lieu l’individu « d » suivi des individus : • d + r ; d + 2 r ; d + 3 r ; ……. 4 • Lorsque la liste est épuisée et que la taille finale de l’échantillon n’est pas encore atteinte, on reprend dès le début.
  39. 39. i Itération 1 Itération 2 … 1 … …. …. d’ d …. … d’+r d+r …. … d’+2r d+2r … d+3r … d+4r … … … N Illustration du TASys
  40. 40. • On dispose de la liste de présence des 240 étudiants de l’EST (2ème année) • On veut choisir 9 étudiants par un TASys • N/n =240/9 = 23,78  [N/n] = 23  le pas est r=23 • Le point de départ « d » = 105  l’échantillon est composé des Ui tels que : • D= 105 i= 105, 105+23 , 105+ 23*2, 105+23*3, 105+ 23*4, 105+ 23*5 d = 60 i= 60, 60+23 , 60+ 23*2 • E = U105, U128, U174, U197, U220, U60, U83, U106, U129 Exemple du TASys
  41. 41. Le TASys, comme le TAS, est simple à réaliser Le TASys exige moins de manipulations que le TAS Le TASys permet des analyses statistiques simples + Les procédures du TASys signifient l’existence d’une base de sondage Le TASys suppose l’homogénéité de la population étudiée de point de vue de la variable d’intérêt Y - TASys
  42. 42. Méthodes probabilistes : Tirage aléatoire stratifié
  43. 43. • Les TAS et TASys recourent à l’hypothèse de l’homogénéité de la population par rapport à Y • Dans la réalité, cette hypothèse est difficilement réalisable : les populations humaines étudiées sont souvent hétérogènes • L’hétérogénéité : la Population est composée d’individus dissemblables pour la variable d’intérêt « Y »  Y présente un certain niveau de dispersion  Le TASt permet de résoudre le problème de l’hétérogénéité de la population Préalables du TASt
  44. 44. • Dans le cas où la population est hétérogène de point de vue caractéristique d’intérêt « Y », l’idée serait de former des groupes relativement homogènes, appelés strates et notés « Sh » (h=1,2,…H) • La Strate Sh : Sous-ensemble homogène de la population possédant une ou plusieurs caractéristiques communes et mutuellement exclusives • Les strates sont collectivement exhaustives • Les strates Sh sont de taille « Nh » tel que ∑ Nh= N • Ensuite, on effectue au niveau de chaque strate « h » un TAS ou un TASys d’un échantillon de taille « nh » individus parmi « Nh » et ∑ nh= n • Remarque : toutes les strates composant la population sont représentées dans l’échantillon Procédures du TASt
  45. 45. • Exemple d’une population composée de 4 strates P E Schéma simplifié du TASt S1 S4 S3 S2 n
  46. 46. 1. Sondage stratifié à allocation proportionnelle : on reproduit le poids de la strate au niveau de la population dans l’échantillon = = constante • Dans l’exemple suivant : le poids de chaque strate dans la population est respecté dans la construction de l’échantillon Procédures du TASt S1 S4 S3 S2
  47. 47. 2. Allocation optimale au sens de Neyman : tient compte de l’hétérogénéité de chaque strate par rapport à la variable d’intérêt « Y »  plus la strate est hétérogène par rapport au phénomène étudié et plus le taux de sondage appliqué est élevé • Dans l’exemple suivant, la strate S1 a moins de poids dans l’échantillon que dans la population et inversement pour la strate S4, car la variabilité dans la strate S4 est plus élevée que dans la strate S1 Procédures du TASt S1 S4 S3 S2
  48. 48. • L’homogénéisation de la population pose donc la question du choix de la variable de stratification. • En général, on choisit la caractéristique « X » la plus discriminante : qui réalise des groupes homogènes en « intra » et hétérogènes en « extra ». • Le but est d’obtenir un échantillon qui possède les mêmes caractéristiques que la population dont il est extrait (représentativité). • Le choix reposera en général sur les connaissances préalables de la problématique (études et enquêtes antérieures, avis des experts,…) ou sur des hypothèses. • Important : on peut procéder à la stratification selon plusieurs variables TASt : choix de la variable de stratification
  49. 49. TASt : exemples de variables de stratification Enquête auprès des Ménages Sexe Niveau d’instruction Type d’habitat Revenu Âge Milieu/régionde résidence Enquête auprès des Entreprises Taille de l’entreprise Région économique Secteur d’activité Ancienneté
  50. 50. Méthodes probabilistes : Tirage aléatoire par grappes
  51. 51. • On partitionne la population en sous ensembles appelés grappes et notés Gh (h=1,…H) • On sélectionne un échantillon de grappes • On procède à l’enquête de TOUS les individus constituant l’unité (la grappe)sélectionnée , c’est-à-dire exhaustivement  nh=Nh pour toute grappe Gh sélectionnée  nh=0 pour toute grappe non sélectionnée Principes du TAG G1 G4 G3 G2 G4 G2
  52. 52. • Les grappes doivent être les plus hétérogènes possibles. • Dans le cas contraire, on peut rencontrer une perte de précision. • Le TAG est indiqué lorsque : 1. La base de sondage des individus est inexistante ou de mauvaise qualité mais on doit disposer d’une base de sondage des grappes  il est plus facile de constituer une liste de logements ou d’entreprises qu’une liste d’individus ou d’employés (annuaires des entreprises/associations) 2. On veut limiter les coûts de déplacement et de supervision et le temps  Les individus d’une grappe sont généralement voisins  Pour questionner un échantillon de 1000 personnes, il suffit de contacter 250 ménages et enquêter 4 personnes par ménage au lieu de 1000 lieux d’enquête (une personne par lieu) Conditions et indications du TAG
  53. 53. • Exemple 1 : variable d’intérêt = avoir un travail 1. Grappe d’individus = ménage 2. Unité statistique : personnes en âge d’activités • Exemple 2 : variable d’intérêt = dépenses alimentaires 1. Grappe de logements = immeuble/pâté de maisons 2. Unité statistique : ménages et donc les individus composant le ménage • Exemple 3 : conditions de travail 1. Grappe d’employés/membres = entreprise/association 2. Unité statistique : employés/membres de l’association • Exemple 4 : conditions de logement dans les écoles 1. Grappe d’étudiants : école 2. Unité statistique : étudiants Exemple de grappes
  54. 54. Méthodes probabilistes : Tirage aléatoire à plusieurs degrés
  55. 55. • C’est un tirage où l’échantillon final est constitué après plusieurs tirages au sort, imbriqués les uns dans les autres. • Il peut être un mélange des tirages précédents pour éviter des coûts trop importants ou des conditions qui ne se prêtent pas à l’application de ces méthodes. • Le principal avantage de ce type de tirage est : 1. de réduire le coût de l'enquête, notamment celui des déplacements. 2. de permettre dans certaines situations de pallier à l'inexistence d'une base de sondage. TAD
  56. 56. • Tirage à 2 degrés : sélection de certaines villes, puis des logements à l’intérieur des villes choisies • Tirage à 4 degrés 1. dans un premier temps, on stratifie le pays selon 3 variables : régions, provinces, milieu de résidence (urbain, rural) 2. Au niveau de chaque strate, on sélectionne un nombre limité de quartiers (ville) et douars (campagne) par un TAS 3. Au sein des quartiers sélectionnés, on choisit des écoles primaires (TAS) 4. A l’intérieur des écoles, on choisit des classes (grappes) et on enquête toute la classe (unités statistiques = écoliers) Exemples de TAD
  57. 57. Méthodes non probabilistes Méthodes empiriques
  58. 58. • Les sondages empiriques se sont opposés aux sondages probabilistes : 1. Méthode des quotas 2. Méthode des itinéraires 3. Méthode boule de neige 4. Méthode des unités-types 5. Méthode des volontaires 6. Méthode à l’aveuglette Méthodes Empiriques
  59. 59. • Les sondages empiriques sont souvent utilisés : 1. Pour pallier à l’absence d’une base de sondage en raison de l’absence du recours au « hasard ». 2. Parce qu’ils présentent l’avantage aussi d’être plus rapides et moins coûteux et plus faciles à réaliser qu’un échantillonnage aléatoire. • Ces méthodes nécessitent cependant des renseignements précis et récents de l’univers étudié. Pourquoi des ME?
  60. 60. • La méthode des quotas est la forme la plus fréquente. • On l’utilise notamment dans les enquêtes d’opinion (plus particulièrement les sondages politiques) et dans les études de marché. • La méthode des quotas consiste à construire un échantillon qui soit une maquette, un modèle réduit de la population étudiée sans passer par des méthodes/calculs probabilistes mais selon un choix raisonné • Un quota est un nombre d’individus à interroger correspondant à un critère que l’on a retenu pour répartir la population étudiée.  Le réalisateur de l’enquête doit d’abord étudier la structure de la population suivant des critères choisis. Méthode des quotas
  61. 61. Méthode des quotas : procédures Etude de la population • Collecte d’informations statistiques sur le thème étudié • Choix des variables clés (les plus discriminantes par rapport à Y) • Etude la structure de la population selon ces variables Choix de l’échantillo n • L’échantillon doit respecter la structure prédéfinie de la population Collecte de l’informati on • Collecte de l’information selon la feuille de quotas • Liberté de l’enquêteur dans le choix des individus • Les individus sont interchangeables
  62. 62. • La feuille de quotas est un document qui fixe pour chaque lieu d’enquête les caractéristiques que l’enquêteur doit respecter. • L’enquêteur devra cocher sur cette feuille les caractéristiques de la personne interrogée ou entourer un nombre pour chaque personne interrogée.  La feuille des quotas permet de vérifier que les personnes interrogées correspondent aux critères sélectionnés. Méthode des quotas : quelques précisions
  63. 63. Caractéristiques Effectifs de la population N = 2000 Structure de la population Echantillon n=12 Sexe Homme Femme 1020 980 51% 49% 6 6 Age 18-34 ans 35-49 ans 50-64 ans + de 65 ans 600 700 500 200 30% 35% 25% 10% 4 4 3 1 Catégorie Socioprofessionnelles Agriculteurs Ouvriers Employés Cadres-prof. Lib. Inactifs 200 600 800 200 200 10% 30% 40% 10% 10% 1 4 4 1 1 Méthode des quotas
  64. 64. Caractéristiques Echantillon 12 personnes 1 2 3 4 5 6 7 8 9 10 11 12 Sexe Homme Femme 6 6 1 2 3 4 5 6 1 2 3 4 5 6 Age 18-34 ans 35-49 ans 50-64 ans + de 65 ans 4 4 3 1 1 2 3 4 1 2 3 4 1 2 3 1 CSP Agriculteurs Ouvriers Employés Cadres-prof. Lib. Inactifs 1 4 5 1 1 1 1 2 3 4 1 2 3 4 5 1 1 feuille des quotas
  65. 65. Méthode des quotas : quelques précisions + Sondés «interchangeables » Relative liberté Rapidité de réalisation de l’enquête et de publication des résultats Réduction du temps et des coûts - Disponibilité d’informations poussées sur la population à étudier (Si population humaine, il faut disposer des résultats d’un recensement) Préparation minutieuse de l’information statistique Risque de vieillissement de l’information (structure) Formation et consignes rigoureuses aux enquêteurs Marge d’erreur non calculable
  66. 66. • Elle consiste à imposer à l’enquêteur un itinéraire en lui indiquant exactement les points du circuit où il doit procéder à une interview (parfois, l’itinéraire est indiquée sur une carte). • On lui indique : 1. Un point de départ dans une commune. 2. Un itinéraire à suivre avec tirage systématique des logements dans lesquels effectuer les interviews. 3. Objectif : reproduire un certain tirage aléatoire des enquêtés, sans donner explicitement des noms et adresses à l’enquêteur. • L’itinéraire peut être aléatoire comme il peut être défini selon un certain objectif. • Cette méthode est utilisée pour obtenir des échantillons de ménages ou de logements quand on dispose uniquement d’une base de sondage non détaillée (aréolaire) il faut disposer d’une carte détaillée • Cette méthode est utile dans le sondage par quotas réduire l’initiative de l’enquêteur Méthode des itinéraires
  67. 67. • Méthode souvent utilisée dans les enquêtes qualitatives, par exemple les enquêtes sociologiques • Elle est guidée par des réflexions théoriques • Coût réduit • Mais elle est source de : 1. L’effet « d’être informé » et donc de risque d’absence de spontanéité des enquêtés 2. L’effet de sélection : les répondants versus les non‐répondants • Exemple: On distribue des questionnaires à des membres de la population qui nous intéresse puis, on demande aux sujets de diffuser eux‐mêmes ce questionnaire à d’autres sujets, qui seraient susceptibles de se prêter à l’étude. Méthode boules de neige (snow ball sampling)
  68. 68. • Exemple 1 : un visiteur veut s’informer sur la formationà l’EST. Il choisit un étudiant‐type de l’EST (2ème année). • Exemple 2 : on veut connaitre le processus de production de l’huile d’olive dans une « maasra ». On choisit une unité de production quelconque et on interroge son gérant. • Exemple 3 : on veut connaître la gestion de l’eau dans un douar par les ménages. On choisit l’élu du douar ou un responsable administratif. Méthode des unités-types
  69. 69. • Exemple 1 : un visiteur veut s’informer sur la formationà l’EST. Il choisit 3 étudiants‐types de l’EST (1ère année) présentant chacun une des options. • Exemple 2 : on veut connaitre le processus de production de l’huile d’olive dans une « maasra ». On choisit plusieurs unités traditionnelles de production selon leur taille (petite, moyenne, grande) et on interroge les gérants. • Exemple 3 : on veut connaître la gestion de l’eau dans un douar par les ménages. On stratifie les douars selon la pluviométrie régionale et on choisit l’élu de chaque douar ou un responsable administratif. Méthode des unités-types
  70. 70. • On lance un appel • Les individus eux-mêmes se portent volontaires pour répondre aux questions. • Exemples : enquêtes réalisées auprès de lecteurs d’un journal, d’adhérents d’associations acceptant de répondre à un questionnaire, de téléspectateurs acceptant de répondre au téléphone ou par internet à des questions posées lors d’une émission. • Les unités d’échantillonnage s’auto sélectionnent. • Cette méthode est très économique. • Mais statistiquement, elle n ’est pas défendable • Effet de sélection : Se pose alors le problème de l’homogénéité entre « volontaires » et « non volontaires ». Méthode des volontaires
  71. 71. • Les individus son choisis sur le terrain au hasard des rencontres pour généralement répondre à un nombre de questions réduits • Exemples : micro-trottoir sur les événements en Syrie • Les unités d’échantillonnage s’auto sélectionnent. • Cette méthode est très économique. • Mais statistiquement, elle n ’est pas défendable • Effet de sélection : Se pose alors le problème de l’homogénéité entre « volontaires » et « non volontaires ». Méthode à l’aveuglette
  72. 72. • Dans n’importe quelle recherche, la taille des échantillons revêt un rôle très important. • D’abord, elle détermine la validité de la recherche. L'échantillon est dit "valide" lorsqu'il est représentatif de la population ‐mère, c'est‐à‐dire lorsqu'il possède les caractéristiques correspondantes à la population. • Ensuite, elle conditionne l'importance du travail, du temps et des coûts qu'implique l'échantillonnage. Détermination de la taille de l’échantillon

×