SlideShare une entreprise Scribd logo
Les sondages à probabilités inégales
Mahamadou HARO
Ingénieur Statisticien Économiste
Séminaire de sondage
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 1 / 14
Plan de la présentation
1 Principe
2 Formules d’estimation dans le cas avec remise
3 Méthodes de tirage
4 Aperçu sur le sondage à probabilités inégales sans remise
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 2 / 14
Principe
Plan
1 Principe
2 Formules d’estimation dans le cas avec remise
3 Méthodes de tirage
4 Aperçu sur le sondage à probabilités inégales sans remise
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 3 / 14
Principe
Principe
On peut, dans certains cas, décider d’accorder à certaines unités une
probabilité plus forte d’être sélectionnées qu’à d’autres. Par exemple :
Les sondages à probabilités inégales se justifient par le fait que
dans certains cas et pour certains domaines d’étude, il est
intéressant de donner à certaines unités à échantillonner une
probabilité plus forte d’être tirée.
lorsque les unités n’ont pas la même importance, en particulier
lorsqu’elles ont des tailles très différentes, il peut être intéressant
voire avantageux, d’attribuer aux différentes unités de chances de
sortie inégales, les "grosses" unités ayant plus de chances
d’appartenir l’échantillon.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 4 / 14
Principe
Principe
On peut, dans certains cas, décider d’accorder à certaines unités une
probabilité plus forte d’être sélectionnées qu’à d’autres. Par exemple :
Les sondages à probabilités inégales se justifient par le fait que
dans certains cas et pour certains domaines d’étude, il est
intéressant de donner à certaines unités à échantillonner une
probabilité plus forte d’être tirée.
lorsque les unités n’ont pas la même importance, en particulier
lorsqu’elles ont des tailles très différentes, il peut être intéressant
voire avantageux, d’attribuer aux différentes unités de chances de
sortie inégales, les "grosses" unités ayant plus de chances
d’appartenir l’échantillon.
A l’intérieur d’un sondage à probabilités inégales on peut
distinguer deux cas selon le mode de tirage des unités. Dans le
cas d’un tirage avec remise, la probabilité de tirage est souvent
proportionnelle à une mesure de taille et il est possible de calculer
les estimations ainsi que les précisions. Par contre le mode de
tirage sans remise par l’approche de Horvitz-Thompson rendMahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 4 / 14
Principe
Principe
On peut, dans certains cas, décider d’accorder à certaines unités une
probabilité plus forte d’être sélectionnées qu’à d’autres. Par exemple :
Les sondages à probabilités inégales se justifient par le fait que
dans certains cas et pour certains domaines d’étude, il est
intéressant de donner à certaines unités à échantillonner une
probabilité plus forte d’être tirée.
lorsque les unités n’ont pas la même importance, en particulier
lorsqu’elles ont des tailles très différentes, il peut être intéressant
voire avantageux, d’attribuer aux différentes unités de chances de
sortie inégales, les "grosses" unités ayant plus de chances
d’appartenir l’échantillon.
A l’intérieur d’un sondage à probabilités inégales on peut
distinguer deux cas selon le mode de tirage des unités. Dans le
cas d’un tirage avec remise, la probabilité de tirage est souvent
proportionnelle à une mesure de taille et il est possible de calculer
les estimations ainsi que les précisions. Par contre le mode de
tirage sans remise par l’approche de Horvitz-Thompson rendMahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 4 / 14
Formules d’estimation dans le cas avec remise
Plan
1 Principe
2 Formules d’estimation dans le cas avec remise
3 Méthodes de tirage
4 Aperçu sur le sondage à probabilités inégales sans remise
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 5 / 14
Formules d’estimation dans le cas avec remise
Formules d’estimation dans le cas avec remise
Chaque unité α de l’univers a la probabilité Aα d’être tirée à chacun
des tirages et on tire un échantillon de taille n. On a N
α=1 Aα = 1
(donc chaque Aα , est inférieur à 1 et souvent de valeur très faible).
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 6 / 14
Formules d’estimation dans le cas avec remise
Estimation d’un total
L’estimateur du total de la variable Y (sur l’univers) proposé à partir de
l’échantillon tiré est :
ˆT(Y) =
1
n
n
i=1
yi
Ai
(1)
Où yi est la valeur de la variable Y pour l’unité sélectionnée au ième
tirage et Ai sa probabilité d’être sélectionnée à chaque tirage : on tient
donc compte des probabilités de tirage différentes pour produire
l’estimation du total. Cet estimateur est sans biais :
E(ˆT(Y)) =
N
α=1
Yα
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 7 / 14
Formules d’estimation dans le cas avec remise
Estimation d’une moyenne, d’un ratio
Pour estimer la moyenne Y on utilise l’estimateur
ˆT(Y)
N
Sa variance est :
V
ˆT(Y)
N
=
1
N2
V(ˆT(Y))
Un ratio est estimé comme le rapport de l’estimation de deux masses.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 8 / 14
Méthodes de tirage
Plan
1 Principe
2 Formules d’estimation dans le cas avec remise
3 Méthodes de tirage
4 Aperçu sur le sondage à probabilités inégales sans remise
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 9 / 14
Méthodes de tirage
Méthodes de tirage
Méthode des chiffres cumulés ;
Méthodes aréolaires utilisant des grilles de points.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 10 / 14
Méthodes de tirage
Méthodes de tirage
Méthode des chiffres cumulés ;
Méthodes aréolaires utilisant des grilles de points.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 10 / 14
Aperçu sur le sondage à probabilités inégales sans remise
Plan
1 Principe
2 Formules d’estimation dans le cas avec remise
3 Méthodes de tirage
4 Aperçu sur le sondage à probabilités inégales sans remise
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 11 / 14
Aperçu sur le sondage à probabilités inégales sans remise
Aperçu sur le sondage à probabilités inégales sans
remise
Le modèle qui a été appliqué précédemment pour produire un
estimateur est beaucoup plus difficile à utiliser : en effet, les
probabilités de tirage se déforment au fur et à mesure qu’on réalise les
tirages.
Au premier tirage A1
i = Ai ;
Au deuxième tirage A2
j =
A1
j
1−A1
i
sachant que c’est i qui a été tiré au
premier tirage ; etc.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 12 / 14
Aperçu sur le sondage à probabilités inégales sans remise
L’estimateur de Howitz-Thompson
On fait donc appel à une autre approche, que nous présenterons
rapidement : celle de Horvitz-Thompson. Le point de départ de cette
approche développée pour les tirages sans remise est la probabilité
d’inclusion :
Πi probabilité que i appartienne à l’échantillon,
Πij probabilité que i et j) soient simultanément dans l’échantillon.
Remarquons que si l’échantillon s est de taille fixe n, alors :
N
α=1
Πα = n
L’estimateur de Horvitz-Thompson du total est
ˆT(Y) =
i∈s
yi
Πi
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 13 / 14
Aperçu sur le sondage à probabilités inégales sans remise
L’estimateur de Howitz-Thompson
On fait donc appel à une autre approche, que nous présenterons
rapidement : celle de Horvitz-Thompson. Le point de départ de cette
approche développée pour les tirages sans remise est la probabilité
d’inclusion :
Πi probabilité que i appartienne à l’échantillon,
Πij probabilité que i et j) soient simultanément dans l’échantillon.
Remarquons que si l’échantillon s est de taille fixe n, alors :
N
α=1
Πα = n
L’estimateur de Horvitz-Thompson du total est
ˆT(Y) =
i∈s
yi
Πi
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 13 / 14
Aperçu sur le sondage à probabilités inégales sans remise
Dans la pratique...
Dans la pratique d’un tel sondage à probabilités inégales sans
remise, on se fixe un "jeu" de Πi, et un algorithme respectant ce
jeu de probabilités (Ardilly, 1994, chapitre II.4.3.).
Alors on calcule les Πij (ou on les détermine de manière
approximative car, dans certains cas, le calcul rigoureux est
impossible) et on peut ainsi calculer la précision (par la variance)
de l’estimateur de Horvitz-Thompson (qui, lui, ne fait appel qu’aux
Πi ).
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 14 / 14
Aperçu sur le sondage à probabilités inégales sans remise
Dans la pratique...
Dans la pratique d’un tel sondage à probabilités inégales sans
remise, on se fixe un "jeu" de Πi, et un algorithme respectant ce
jeu de probabilités (Ardilly, 1994, chapitre II.4.3.).
Alors on calcule les Πij (ou on les détermine de manière
approximative car, dans certains cas, le calcul rigoureux est
impossible) et on peut ainsi calculer la précision (par la variance)
de l’estimateur de Horvitz-Thompson (qui, lui, ne fait appel qu’aux
Πi ).
Certains auteurs ont, par ailleurs, proposé des formules
d’approximation de la variance de l’estimateur de
Horvitz-Thompson ne faisant intervenir que les Πi. Cette approche
est une approche générale, pas seulement limitée aux sondages
à probabilités inégales ; elle est présentée dans ce chapitre car
étant la seule utilisable quand on tire à probabilités inégales sans
remise.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 14 / 14
Aperçu sur le sondage à probabilités inégales sans remise
Dans la pratique...
Dans la pratique d’un tel sondage à probabilités inégales sans
remise, on se fixe un "jeu" de Πi, et un algorithme respectant ce
jeu de probabilités (Ardilly, 1994, chapitre II.4.3.).
Alors on calcule les Πij (ou on les détermine de manière
approximative car, dans certains cas, le calcul rigoureux est
impossible) et on peut ainsi calculer la précision (par la variance)
de l’estimateur de Horvitz-Thompson (qui, lui, ne fait appel qu’aux
Πi ).
Certains auteurs ont, par ailleurs, proposé des formules
d’approximation de la variance de l’estimateur de
Horvitz-Thompson ne faisant intervenir que les Πi. Cette approche
est une approche générale, pas seulement limitée aux sondages
à probabilités inégales ; elle est présentée dans ce chapitre car
étant la seule utilisable quand on tire à probabilités inégales sans
remise.
Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 14 / 14

Contenu connexe

Tendances

Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
Lilia Sfaxi
 
exercices corrigés échantillonnage et estimation
exercices corrigés échantillonnage et estimationexercices corrigés échantillonnage et estimation
exercices corrigés échantillonnage et estimation
cours fsjes
 
Spss les premieres notions 1
Spss les premieres notions 1Spss les premieres notions 1
Spss les premieres notions 1
Adad Med Chérif
 
chapitre 1 régression simple.pdf
chapitre 1 régression simple.pdfchapitre 1 régression simple.pdf
chapitre 1 régression simple.pdf
AnassFarkadi
 
Fiche de TP 3 sur les bases de données avec les SGBD(Système de Gestion des B...
Fiche de TP 3 sur les bases de données avec les SGBD(Système de Gestion des B...Fiche de TP 3 sur les bases de données avec les SGBD(Système de Gestion des B...
Fiche de TP 3 sur les bases de données avec les SGBD(Système de Gestion des B...
ATPENSC-Group
 
Méthodologie D’Intelligence D’Affaires
Méthodologie D’Intelligence D’AffairesMéthodologie D’Intelligence D’Affaires
Méthodologie D’Intelligence D’Affaires
Alain Charpentier
 
Formation Introductive sur XLSForm - Webinar
Formation Introductive sur XLSForm - WebinarFormation Introductive sur XLSForm - Webinar
Formation Introductive sur XLSForm - Webinar
Major Luvale
 
Data Analyse pas à pas avec R
Data Analyse pas à pas avec RData Analyse pas à pas avec R
Data Analyse pas à pas avec R
Amar LAKEL, PhD
 
Cours acp mehdi_aman
Cours acp mehdi_amanCours acp mehdi_aman
Cours acp mehdi_aman
Mehdi Aman
 
Statistique descriptive
Statistique descriptiveStatistique descriptive
Statistique descriptiveeninioo
 
Introduction aux statistiques descriptives et tests d'hypothèses
Introduction aux statistiques descriptives et tests d'hypothèsesIntroduction aux statistiques descriptives et tests d'hypothèses
Introduction aux statistiques descriptives et tests d'hypothèses
Clément Dussarps
 
Protocole de recherche
Protocole de rechercheProtocole de recherche
Protocole de recherche
Faculté de médecine de Tizi-Ouzou
 
7 exercices corriges sur la loi normale
7 exercices corriges sur la loi normale7 exercices corriges sur la loi normale
7 exercices corriges sur la loi normale
cours fsjes
 
Fiche de TP 1 sur les Feuilles de calculs avec les Tableurs
Fiche de TP 1 sur les Feuilles de calculs avec les Tableurs Fiche de TP 1 sur les Feuilles de calculs avec les Tableurs
Fiche de TP 1 sur les Feuilles de calculs avec les Tableurs
ATPENSC-Group
 
TP Informatique 1 excel
TP Informatique 1 excelTP Informatique 1 excel
TP Informatique 1 excelZhour Add
 
La complexité des algorithmes récursives Géométrie algorithmique
La complexité des algorithmes récursivesGéométrie algorithmiqueLa complexité des algorithmes récursivesGéométrie algorithmique
La complexité des algorithmes récursives Géométrie algorithmique
Hajer Trabelsi
 
Les arbres de décisions
Les arbres de décisionsLes arbres de décisions
Les arbres de décisions
Mariem Chaaben
 

Tendances (20)

Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
 
exercices corrigés échantillonnage et estimation
exercices corrigés échantillonnage et estimationexercices corrigés échantillonnage et estimation
exercices corrigés échantillonnage et estimation
 
Spss les premieres notions 1
Spss les premieres notions 1Spss les premieres notions 1
Spss les premieres notions 1
 
chapitre 1 régression simple.pdf
chapitre 1 régression simple.pdfchapitre 1 régression simple.pdf
chapitre 1 régression simple.pdf
 
Cours de probabilites
Cours de probabilitesCours de probabilites
Cours de probabilites
 
Fiche de TP 3 sur les bases de données avec les SGBD(Système de Gestion des B...
Fiche de TP 3 sur les bases de données avec les SGBD(Système de Gestion des B...Fiche de TP 3 sur les bases de données avec les SGBD(Système de Gestion des B...
Fiche de TP 3 sur les bases de données avec les SGBD(Système de Gestion des B...
 
Methodologie des enquete
Methodologie des enqueteMethodologie des enquete
Methodologie des enquete
 
Méthodologie D’Intelligence D’Affaires
Méthodologie D’Intelligence D’AffairesMéthodologie D’Intelligence D’Affaires
Méthodologie D’Intelligence D’Affaires
 
Formation Introductive sur XLSForm - Webinar
Formation Introductive sur XLSForm - WebinarFormation Introductive sur XLSForm - Webinar
Formation Introductive sur XLSForm - Webinar
 
(Cours régression)
(Cours régression)(Cours régression)
(Cours régression)
 
Data Analyse pas à pas avec R
Data Analyse pas à pas avec RData Analyse pas à pas avec R
Data Analyse pas à pas avec R
 
Cours acp mehdi_aman
Cours acp mehdi_amanCours acp mehdi_aman
Cours acp mehdi_aman
 
Statistique descriptive
Statistique descriptiveStatistique descriptive
Statistique descriptive
 
Introduction aux statistiques descriptives et tests d'hypothèses
Introduction aux statistiques descriptives et tests d'hypothèsesIntroduction aux statistiques descriptives et tests d'hypothèses
Introduction aux statistiques descriptives et tests d'hypothèses
 
Protocole de recherche
Protocole de rechercheProtocole de recherche
Protocole de recherche
 
7 exercices corriges sur la loi normale
7 exercices corriges sur la loi normale7 exercices corriges sur la loi normale
7 exercices corriges sur la loi normale
 
Fiche de TP 1 sur les Feuilles de calculs avec les Tableurs
Fiche de TP 1 sur les Feuilles de calculs avec les Tableurs Fiche de TP 1 sur les Feuilles de calculs avec les Tableurs
Fiche de TP 1 sur les Feuilles de calculs avec les Tableurs
 
TP Informatique 1 excel
TP Informatique 1 excelTP Informatique 1 excel
TP Informatique 1 excel
 
La complexité des algorithmes récursives Géométrie algorithmique
La complexité des algorithmes récursivesGéométrie algorithmiqueLa complexité des algorithmes récursivesGéométrie algorithmique
La complexité des algorithmes récursives Géométrie algorithmique
 
Les arbres de décisions
Les arbres de décisionsLes arbres de décisions
Les arbres de décisions
 

En vedette

Sondage aléatoire simple ou a probabilité égal
Sondage aléatoire simple ou a probabilité égal Sondage aléatoire simple ou a probabilité égal
Sondage aléatoire simple ou a probabilité égal
hammamiahlem1
 
Scikit-learn: apprentissage statistique en Python. Créer des machines intelli...
Scikit-learn: apprentissage statistique en Python. Créer des machines intelli...Scikit-learn: apprentissage statistique en Python. Créer des machines intelli...
Scikit-learn: apprentissage statistique en Python. Créer des machines intelli...
Gael Varoquaux
 
Cartographie statistique décisionnelle--Rendez-vous Ritme du 6 mars 2014
Cartographie statistique décisionnelle--Rendez-vous Ritme du 6 mars 2014Cartographie statistique décisionnelle--Rendez-vous Ritme du 6 mars 2014
Cartographie statistique décisionnelle--Rendez-vous Ritme du 6 mars 2014
Nicolas SORHAITZ
 
Aiguille dans botte de foin: scikit-learn et joblib
Aiguille dans botte de foin: scikit-learn et joblibAiguille dans botte de foin: scikit-learn et joblib
Aiguille dans botte de foin: scikit-learn et joblib
Gael Varoquaux
 
Je configure mes serveurs avec fabric et fabtools
Je configure mes serveurs avec fabric et fabtoolsJe configure mes serveurs avec fabric et fabtools
Je configure mes serveurs avec fabric et fabtoolsRonan Amicel
 
Scikit learn: apprentissage statistique en Python
Scikit learn: apprentissage statistique en PythonScikit learn: apprentissage statistique en Python
Scikit learn: apprentissage statistique en Python
Gael Varoquaux
 
Scikit-learn: the state of the union 2016
Scikit-learn: the state of the union 2016Scikit-learn: the state of the union 2016
Scikit-learn: the state of the union 2016
Gael Varoquaux
 
Python packaging
Python packagingPython packaging
Python packaging
Axel Haustant
 
SeSQL : un moteur de recherche en Python et PostgreSQL
SeSQL : un moteur de recherche en Python et PostgreSQLSeSQL : un moteur de recherche en Python et PostgreSQL
SeSQL : un moteur de recherche en Python et PostgreSQLParis, France
 
Presentation r markdown
Presentation r markdown Presentation r markdown
Presentation r markdown
Cdiscount
 
Algorithmique_et_programmation_part2
Algorithmique_et_programmation_part2Algorithmique_et_programmation_part2
Algorithmique_et_programmation_part2Emeric Tapachès
 
Python et les bases de données non sql
Python et les bases de données non sqlPython et les bases de données non sql
Python et les bases de données non sql
bchesneau
 
Data Entry in CSpro
Data Entry in CSproData Entry in CSpro
Data Entry in CSpro
prabhustat
 
pandas: a Foundational Python Library for Data Analysis and Statistics
pandas: a Foundational Python Library for Data Analysis and Statisticspandas: a Foundational Python Library for Data Analysis and Statistics
pandas: a Foundational Python Library for Data Analysis and Statistics
Wes McKinney
 
pandas: Powerful data analysis tools for Python
pandas: Powerful data analysis tools for Pythonpandas: Powerful data analysis tools for Python
pandas: Powerful data analysis tools for Python
Wes McKinney
 
Simple big data, in Python
Simple big data, in PythonSimple big data, in Python
Simple big data, in Python
Gael Varoquaux
 
Chap XIII : calcul scientifique avec python
Chap XIII : calcul scientifique avec pythonChap XIII : calcul scientifique avec python
Chap XIII : calcul scientifique avec python
Mohammed TAMALI
 

En vedette (20)

Sondage aléatoire simple ou a probabilité égal
Sondage aléatoire simple ou a probabilité égal Sondage aléatoire simple ou a probabilité égal
Sondage aléatoire simple ou a probabilité égal
 
Scikit-learn: apprentissage statistique en Python. Créer des machines intelli...
Scikit-learn: apprentissage statistique en Python. Créer des machines intelli...Scikit-learn: apprentissage statistique en Python. Créer des machines intelli...
Scikit-learn: apprentissage statistique en Python. Créer des machines intelli...
 
Cartographie statistique décisionnelle--Rendez-vous Ritme du 6 mars 2014
Cartographie statistique décisionnelle--Rendez-vous Ritme du 6 mars 2014Cartographie statistique décisionnelle--Rendez-vous Ritme du 6 mars 2014
Cartographie statistique décisionnelle--Rendez-vous Ritme du 6 mars 2014
 
Aiguille dans botte de foin: scikit-learn et joblib
Aiguille dans botte de foin: scikit-learn et joblibAiguille dans botte de foin: scikit-learn et joblib
Aiguille dans botte de foin: scikit-learn et joblib
 
Je configure mes serveurs avec fabric et fabtools
Je configure mes serveurs avec fabric et fabtoolsJe configure mes serveurs avec fabric et fabtools
Je configure mes serveurs avec fabric et fabtools
 
Python et NoSQL
Python et NoSQLPython et NoSQL
Python et NoSQL
 
Scikit learn: apprentissage statistique en Python
Scikit learn: apprentissage statistique en PythonScikit learn: apprentissage statistique en Python
Scikit learn: apprentissage statistique en Python
 
Scikit-learn: the state of the union 2016
Scikit-learn: the state of the union 2016Scikit-learn: the state of the union 2016
Scikit-learn: the state of the union 2016
 
Python packaging
Python packagingPython packaging
Python packaging
 
SeSQL : un moteur de recherche en Python et PostgreSQL
SeSQL : un moteur de recherche en Python et PostgreSQLSeSQL : un moteur de recherche en Python et PostgreSQL
SeSQL : un moteur de recherche en Python et PostgreSQL
 
Presentation r markdown
Presentation r markdown Presentation r markdown
Presentation r markdown
 
Algorithmique_et_programmation_part2
Algorithmique_et_programmation_part2Algorithmique_et_programmation_part2
Algorithmique_et_programmation_part2
 
Python et les bases de données non sql
Python et les bases de données non sqlPython et les bases de données non sql
Python et les bases de données non sql
 
R versur Python
R versur PythonR versur Python
R versur Python
 
Data Entry in CSpro
Data Entry in CSproData Entry in CSpro
Data Entry in CSpro
 
pandas: a Foundational Python Library for Data Analysis and Statistics
pandas: a Foundational Python Library for Data Analysis and Statisticspandas: a Foundational Python Library for Data Analysis and Statistics
pandas: a Foundational Python Library for Data Analysis and Statistics
 
pandas: Powerful data analysis tools for Python
pandas: Powerful data analysis tools for Pythonpandas: Powerful data analysis tools for Python
pandas: Powerful data analysis tools for Python
 
Simple big data, in Python
Simple big data, in PythonSimple big data, in Python
Simple big data, in Python
 
Slides udm-080910
Slides udm-080910Slides udm-080910
Slides udm-080910
 
Chap XIII : calcul scientifique avec python
Chap XIII : calcul scientifique avec pythonChap XIII : calcul scientifique avec python
Chap XIII : calcul scientifique avec python
 

Dernier

Actualisation estimation élections européennes 2024
Actualisation estimation élections européennes 2024Actualisation estimation élections européennes 2024
Actualisation estimation élections européennes 2024
contact Elabe
 
Estimation élections européennes 2024 ELABE
Estimation élections européennes 2024 ELABEEstimation élections européennes 2024 ELABE
Estimation élections européennes 2024 ELABE
contact Elabe
 
Les Français et les élections européennes - 9ème vague
Les Français et les élections européennes - 9ème vagueLes Français et les élections européennes - 9ème vague
Les Français et les élections européennes - 9ème vague
contact Elabe
 
Estimations ELABE BFMTV ABSTENTION élections européennes 2024
Estimations ELABE BFMTV ABSTENTION élections européennes 2024Estimations ELABE BFMTV ABSTENTION élections européennes 2024
Estimations ELABE BFMTV ABSTENTION élections européennes 2024
contact Elabe
 
Webinaire Qui sont les jeunes installés avec un bac +5 ?
Webinaire Qui sont les jeunes installés avec un bac +5 ?Webinaire Qui sont les jeunes installés avec un bac +5 ?
Webinaire Qui sont les jeunes installés avec un bac +5 ?
Institut de l'Elevage - Idele
 
Comprendre le vote aux élections européennes du 9 juin 2024
Comprendre le vote aux élections européennes du 9 juin 2024Comprendre le vote aux élections européennes du 9 juin 2024
Comprendre le vote aux élections européennes du 9 juin 2024
contact Elabe
 
Barometre_de_l_Economie_S1_2024_-_BAT__1_.pdf
Barometre_de_l_Economie_S1_2024_-_BAT__1_.pdfBarometre_de_l_Economie_S1_2024_-_BAT__1_.pdf
Barometre_de_l_Economie_S1_2024_-_BAT__1_.pdf
Paperjam_redaction
 
Deuxième actualisation estimation élections européennes 2024
Deuxième actualisation estimation élections européennes 2024Deuxième actualisation estimation élections européennes 2024
Deuxième actualisation estimation élections européennes 2024
contact Elabe
 

Dernier (8)

Actualisation estimation élections européennes 2024
Actualisation estimation élections européennes 2024Actualisation estimation élections européennes 2024
Actualisation estimation élections européennes 2024
 
Estimation élections européennes 2024 ELABE
Estimation élections européennes 2024 ELABEEstimation élections européennes 2024 ELABE
Estimation élections européennes 2024 ELABE
 
Les Français et les élections européennes - 9ème vague
Les Français et les élections européennes - 9ème vagueLes Français et les élections européennes - 9ème vague
Les Français et les élections européennes - 9ème vague
 
Estimations ELABE BFMTV ABSTENTION élections européennes 2024
Estimations ELABE BFMTV ABSTENTION élections européennes 2024Estimations ELABE BFMTV ABSTENTION élections européennes 2024
Estimations ELABE BFMTV ABSTENTION élections européennes 2024
 
Webinaire Qui sont les jeunes installés avec un bac +5 ?
Webinaire Qui sont les jeunes installés avec un bac +5 ?Webinaire Qui sont les jeunes installés avec un bac +5 ?
Webinaire Qui sont les jeunes installés avec un bac +5 ?
 
Comprendre le vote aux élections européennes du 9 juin 2024
Comprendre le vote aux élections européennes du 9 juin 2024Comprendre le vote aux élections européennes du 9 juin 2024
Comprendre le vote aux élections européennes du 9 juin 2024
 
Barometre_de_l_Economie_S1_2024_-_BAT__1_.pdf
Barometre_de_l_Economie_S1_2024_-_BAT__1_.pdfBarometre_de_l_Economie_S1_2024_-_BAT__1_.pdf
Barometre_de_l_Economie_S1_2024_-_BAT__1_.pdf
 
Deuxième actualisation estimation élections européennes 2024
Deuxième actualisation estimation élections européennes 2024Deuxième actualisation estimation élections européennes 2024
Deuxième actualisation estimation élections européennes 2024
 

Chapitre4 Les sondages à probabilité inégales

  • 1. Les sondages à probabilités inégales Mahamadou HARO Ingénieur Statisticien Économiste Séminaire de sondage Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 1 / 14
  • 2. Plan de la présentation 1 Principe 2 Formules d’estimation dans le cas avec remise 3 Méthodes de tirage 4 Aperçu sur le sondage à probabilités inégales sans remise Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 2 / 14
  • 3. Principe Plan 1 Principe 2 Formules d’estimation dans le cas avec remise 3 Méthodes de tirage 4 Aperçu sur le sondage à probabilités inégales sans remise Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 3 / 14
  • 4. Principe Principe On peut, dans certains cas, décider d’accorder à certaines unités une probabilité plus forte d’être sélectionnées qu’à d’autres. Par exemple : Les sondages à probabilités inégales se justifient par le fait que dans certains cas et pour certains domaines d’étude, il est intéressant de donner à certaines unités à échantillonner une probabilité plus forte d’être tirée. lorsque les unités n’ont pas la même importance, en particulier lorsqu’elles ont des tailles très différentes, il peut être intéressant voire avantageux, d’attribuer aux différentes unités de chances de sortie inégales, les "grosses" unités ayant plus de chances d’appartenir l’échantillon. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 4 / 14
  • 5. Principe Principe On peut, dans certains cas, décider d’accorder à certaines unités une probabilité plus forte d’être sélectionnées qu’à d’autres. Par exemple : Les sondages à probabilités inégales se justifient par le fait que dans certains cas et pour certains domaines d’étude, il est intéressant de donner à certaines unités à échantillonner une probabilité plus forte d’être tirée. lorsque les unités n’ont pas la même importance, en particulier lorsqu’elles ont des tailles très différentes, il peut être intéressant voire avantageux, d’attribuer aux différentes unités de chances de sortie inégales, les "grosses" unités ayant plus de chances d’appartenir l’échantillon. A l’intérieur d’un sondage à probabilités inégales on peut distinguer deux cas selon le mode de tirage des unités. Dans le cas d’un tirage avec remise, la probabilité de tirage est souvent proportionnelle à une mesure de taille et il est possible de calculer les estimations ainsi que les précisions. Par contre le mode de tirage sans remise par l’approche de Horvitz-Thompson rendMahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 4 / 14
  • 6. Principe Principe On peut, dans certains cas, décider d’accorder à certaines unités une probabilité plus forte d’être sélectionnées qu’à d’autres. Par exemple : Les sondages à probabilités inégales se justifient par le fait que dans certains cas et pour certains domaines d’étude, il est intéressant de donner à certaines unités à échantillonner une probabilité plus forte d’être tirée. lorsque les unités n’ont pas la même importance, en particulier lorsqu’elles ont des tailles très différentes, il peut être intéressant voire avantageux, d’attribuer aux différentes unités de chances de sortie inégales, les "grosses" unités ayant plus de chances d’appartenir l’échantillon. A l’intérieur d’un sondage à probabilités inégales on peut distinguer deux cas selon le mode de tirage des unités. Dans le cas d’un tirage avec remise, la probabilité de tirage est souvent proportionnelle à une mesure de taille et il est possible de calculer les estimations ainsi que les précisions. Par contre le mode de tirage sans remise par l’approche de Horvitz-Thompson rendMahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 4 / 14
  • 7. Formules d’estimation dans le cas avec remise Plan 1 Principe 2 Formules d’estimation dans le cas avec remise 3 Méthodes de tirage 4 Aperçu sur le sondage à probabilités inégales sans remise Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 5 / 14
  • 8. Formules d’estimation dans le cas avec remise Formules d’estimation dans le cas avec remise Chaque unité α de l’univers a la probabilité Aα d’être tirée à chacun des tirages et on tire un échantillon de taille n. On a N α=1 Aα = 1 (donc chaque Aα , est inférieur à 1 et souvent de valeur très faible). Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 6 / 14
  • 9. Formules d’estimation dans le cas avec remise Estimation d’un total L’estimateur du total de la variable Y (sur l’univers) proposé à partir de l’échantillon tiré est : ˆT(Y) = 1 n n i=1 yi Ai (1) Où yi est la valeur de la variable Y pour l’unité sélectionnée au ième tirage et Ai sa probabilité d’être sélectionnée à chaque tirage : on tient donc compte des probabilités de tirage différentes pour produire l’estimation du total. Cet estimateur est sans biais : E(ˆT(Y)) = N α=1 Yα Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 7 / 14
  • 10. Formules d’estimation dans le cas avec remise Estimation d’une moyenne, d’un ratio Pour estimer la moyenne Y on utilise l’estimateur ˆT(Y) N Sa variance est : V ˆT(Y) N = 1 N2 V(ˆT(Y)) Un ratio est estimé comme le rapport de l’estimation de deux masses. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 8 / 14
  • 11. Méthodes de tirage Plan 1 Principe 2 Formules d’estimation dans le cas avec remise 3 Méthodes de tirage 4 Aperçu sur le sondage à probabilités inégales sans remise Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 9 / 14
  • 12. Méthodes de tirage Méthodes de tirage Méthode des chiffres cumulés ; Méthodes aréolaires utilisant des grilles de points. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 10 / 14
  • 13. Méthodes de tirage Méthodes de tirage Méthode des chiffres cumulés ; Méthodes aréolaires utilisant des grilles de points. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 10 / 14
  • 14. Aperçu sur le sondage à probabilités inégales sans remise Plan 1 Principe 2 Formules d’estimation dans le cas avec remise 3 Méthodes de tirage 4 Aperçu sur le sondage à probabilités inégales sans remise Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 11 / 14
  • 15. Aperçu sur le sondage à probabilités inégales sans remise Aperçu sur le sondage à probabilités inégales sans remise Le modèle qui a été appliqué précédemment pour produire un estimateur est beaucoup plus difficile à utiliser : en effet, les probabilités de tirage se déforment au fur et à mesure qu’on réalise les tirages. Au premier tirage A1 i = Ai ; Au deuxième tirage A2 j = A1 j 1−A1 i sachant que c’est i qui a été tiré au premier tirage ; etc. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 12 / 14
  • 16. Aperçu sur le sondage à probabilités inégales sans remise L’estimateur de Howitz-Thompson On fait donc appel à une autre approche, que nous présenterons rapidement : celle de Horvitz-Thompson. Le point de départ de cette approche développée pour les tirages sans remise est la probabilité d’inclusion : Πi probabilité que i appartienne à l’échantillon, Πij probabilité que i et j) soient simultanément dans l’échantillon. Remarquons que si l’échantillon s est de taille fixe n, alors : N α=1 Πα = n L’estimateur de Horvitz-Thompson du total est ˆT(Y) = i∈s yi Πi Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 13 / 14
  • 17. Aperçu sur le sondage à probabilités inégales sans remise L’estimateur de Howitz-Thompson On fait donc appel à une autre approche, que nous présenterons rapidement : celle de Horvitz-Thompson. Le point de départ de cette approche développée pour les tirages sans remise est la probabilité d’inclusion : Πi probabilité que i appartienne à l’échantillon, Πij probabilité que i et j) soient simultanément dans l’échantillon. Remarquons que si l’échantillon s est de taille fixe n, alors : N α=1 Πα = n L’estimateur de Horvitz-Thompson du total est ˆT(Y) = i∈s yi Πi Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 13 / 14
  • 18. Aperçu sur le sondage à probabilités inégales sans remise Dans la pratique... Dans la pratique d’un tel sondage à probabilités inégales sans remise, on se fixe un "jeu" de Πi, et un algorithme respectant ce jeu de probabilités (Ardilly, 1994, chapitre II.4.3.). Alors on calcule les Πij (ou on les détermine de manière approximative car, dans certains cas, le calcul rigoureux est impossible) et on peut ainsi calculer la précision (par la variance) de l’estimateur de Horvitz-Thompson (qui, lui, ne fait appel qu’aux Πi ). Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 14 / 14
  • 19. Aperçu sur le sondage à probabilités inégales sans remise Dans la pratique... Dans la pratique d’un tel sondage à probabilités inégales sans remise, on se fixe un "jeu" de Πi, et un algorithme respectant ce jeu de probabilités (Ardilly, 1994, chapitre II.4.3.). Alors on calcule les Πij (ou on les détermine de manière approximative car, dans certains cas, le calcul rigoureux est impossible) et on peut ainsi calculer la précision (par la variance) de l’estimateur de Horvitz-Thompson (qui, lui, ne fait appel qu’aux Πi ). Certains auteurs ont, par ailleurs, proposé des formules d’approximation de la variance de l’estimateur de Horvitz-Thompson ne faisant intervenir que les Πi. Cette approche est une approche générale, pas seulement limitée aux sondages à probabilités inégales ; elle est présentée dans ce chapitre car étant la seule utilisable quand on tire à probabilités inégales sans remise. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 14 / 14
  • 20. Aperçu sur le sondage à probabilités inégales sans remise Dans la pratique... Dans la pratique d’un tel sondage à probabilités inégales sans remise, on se fixe un "jeu" de Πi, et un algorithme respectant ce jeu de probabilités (Ardilly, 1994, chapitre II.4.3.). Alors on calcule les Πij (ou on les détermine de manière approximative car, dans certains cas, le calcul rigoureux est impossible) et on peut ainsi calculer la précision (par la variance) de l’estimateur de Horvitz-Thompson (qui, lui, ne fait appel qu’aux Πi ). Certains auteurs ont, par ailleurs, proposé des formules d’approximation de la variance de l’estimateur de Horvitz-Thompson ne faisant intervenir que les Πi. Cette approche est une approche générale, pas seulement limitée aux sondages à probabilités inégales ; elle est présentée dans ce chapitre car étant la seule utilisable quand on tire à probabilités inégales sans remise. Mahamadou HARO (Ingénieur Statisticien Économiste)Les sondages à probabilité inégales 11 Avril 2012 14 / 14