Automatisation de la cartographie et de l'analyse des données de comptage de ...
Nautile Symposium StatCan
1. 08/11/2018
1Symposium 2018 - Statistiques Canada - Séance 7B
Passer du recensement aux sources fiscales : un
changement de base de sondage pour une meilleure
coordination des échantillons de l’Insee
Thomas Merly-Alpa
Direction de la Méthodologie et la
Coordination Statistique et Internationale
Insee – France
Symposium international de 2018 sur les questions de
méthodologie de Statistiques Canada
Séance 7B – Utilisation de sources de données
administratives ou alternatives I
2. 08/11/2018
2Symposium 2018 - Statistiques Canada - Séance 7B
Plan de la présentation
1 – Utiliser les sources fiscales comme base
de sondage
2 – Quels gains sont attendus ?
3 – Étude de cas : la coordination des
enquêtes ménages
3. 08/11/2018
3Symposium 2018 - Statistiques Canada - Séance 7B
Les enquêtes ménages de l'Insee
●
Enquêtes ménages de l'Insee :
– Revenus et Conditions de Vie
– Conditions de Travail
– Mobilité des Personnes…
●
Mode de collecte :
– Principal : face-à-face
– Échantillon-Maître : premier degré de zones de collecte
fixes et pérennes pour dix ans
– Évolution vers le multimode sur certaines enquêtes
4. 08/11/2018
4Symposium 2018 - Statistiques Canada - Séance 7B
Plan de la présentation
1 – Utiliser les sources fiscales comme base
de sondage
2 – Quels gains sont attendus ?
3 – Étude de cas : la coordination des
enquêtes ménages
5. 08/11/2018
5Symposium 2018 - Statistiques Canada - Séance 7B
Le recensement comme base de sondage
●
Système d'échantillonnage actuel à l'Insee :
– Basé sur le Recensement rénové de la Population
– Principe du recensement français :
●
Annuel : garantit une bonne fraîcheur
●
Mais partiel : chaque année,
– Recensement exhaustif d'1/5 des petites communes
– Recensement par sondage de 8 % des grandes villes
→ Une première étape de sondage difficile à
intégrer, tant pour l'échantillonnage que pour
l'estimation
6. 08/11/2018
6Symposium 2018 - Statistiques Canada - Séance 7B
Les sources fiscales comme base de
sondage
●
Base administrative alimentée par :
– Taxe foncière : impôt pour le propriétaire d'un
logement
– Taxe d'habitation : impôt pour l'occupant d'un
logement
– Impôts sur le revenu
7. 08/11/2018
7Symposium 2018 - Statistiques Canada - Séance 7B
Les sources fiscales comme base de
sondage
●
Caractéristiques :
– Annuel : garantit une bonne fraîcheur
– Exhaustif
– Beaucoup d'information auxiliaire
– Mais règles administratives (domiciliation, enfants
toujours rattachés…)
●
Déjà utilisé pour certaines enquêtes
(Patrimoine), mais difficile à généraliser
8. 08/11/2018
8Symposium 2018 - Statistiques Canada - Séance 7B
Fidéli : Fichier Démographique sur les
Logements et les Individus
●
Le projet Fidéli :
– Nettoyage des bases fiscales (doublons, etc.)
– Rajout d'informations
●
Géolocalisation et géocodage
●
Données sociales (allocations, etc.)
→ Décision stratégique de l'Insee d'utiliser
cette nouvelle source comme base de
sondage unique
9. 08/11/2018
9Symposium 2018 - Statistiques Canada - Séance 7B
Plan de la présentation
1 – Utiliser les sources fiscales comme base
de sondage
2 – Quels gains sont attendus ?
3 – Étude de cas : la coordination des
enquêtes ménages
10. 08/11/2018
10Symposium 2018 - Statistiques Canada - Séance 7B
De nouvelles variables
●
Pour la stratification et les post-traitements :
– Revenus totaux du ménage ou l'individu
– Type de revenus : salaires, pensions, revenus d'activités
spécifiques (agriculteurs, indépendants, etc.)
●
Pour la collecte :
– Mails et numéros de téléphones fournis à
l'administration fiscale
– Informations en cas de déménagement (dernière
adresse connue)
11. 08/11/2018
11Symposium 2018 - Statistiques Canada - Séance 7B
Un nouvel Échantillon-Maître
●
Des unités primaires plus compactes
– Moins de contraintes sur les communes (avant : au moins
une ville recensée par an)
– Amélioration de la méthode de constitution : algorithmes de
minimisation des temps de parcours par la route (données
de temps de trajet)
●
Amélioration de la méthode de tirage
– Utilisation du tirage spatialement équilibré (Grafström et Tillé,
2008)
– Introduction de variables fiscales dans l’équilibrage
12. 08/11/2018
12Symposium 2018 - Statistiques Canada - Séance 7B
Risques
●
Le concept de résidence principale
– Important pour éviter les doubles comptes (biais)
– Travaux dans Fideli pour uniformiser ce concept avec
le Recensement
●
Perte de variables
– Variables sociales : diplôme, catégorie sociale…
– Variables de repérage : informations remplies par
l'agent recenseur (mais de plus en plus de
recensement par Internet)
13. 08/11/2018
13Symposium 2018 - Statistiques Canada - Séance 7B
Plan de la présentation
1 – Utiliser les sources fiscales comme base
de sondage
2 – Quels gains sont attendus ?
3 – Étude de cas : la coordination des
enquêtes ménages
14. 08/11/2018
14Symposium 2018 - Statistiques Canada - Séance 7B
L'Enquête Emploi en Continu
●
Enquête visant à mesurer l'activité et le chômage
– Suivant les concepts du BIT
– Pendant français de la Labour Force Survey (LFS)
●
Échantillon atypique :
– Tiré une fois tous les 9 ans (2010 → 2019)
– Hors de l'échantillon-maître
– Échantillon aréolaire : on enquête des grappes de 20 logements
sur une période de 2 semaines
– Taille de l'échantillon très importante, car on souhaite une bonne
précision (diffusion régionale)
15. 08/11/2018
15Symposium 2018 - Statistiques Canada - Séance 7B
Une collecte complexe
●
Organisation de la collecte difficile :
– Beaucoup de logements à enquêter en un temps limité
– En face-à-face pour les premières interrogations
– Certaines grappes sont géographiquement éloignées
– Gestion des enquêteurs isolés
→ Idée : profiter du renouvellement de l'Échantillon-
Maître pour le coordonner avec l'échantillon de
l'enquête Emploi
16. 08/11/2018
16Symposium 2018 - Statistiques Canada - Séance 7B
Comment coordonner les deux
échantillons ?
●
Première piste : tirer l'EEC dans l'Échantillon-
Maître
– Épuisement des zones…
– Perte de précision très marquée pour estimer
l'emploi
→ Solution non retenue !
●
Alternative : tirer l'EEC autour des zones de
l'Échantillon-Maître
17. 08/11/2018
17Symposium 2018 - Statistiques Canada - Séance 7B
Méthodologie de coordination
●
Introduction d'unités de coordination (UC) :
– Regroupement de plusieurs unités primaires
– Unités géographiquement compactes
●
Tirage indirect des UC par leurs unités primaires
●
Tirage des grappes EEC dans les UC
●
Pour assurer la qualité de l'enquête Emploi,
introduction de variables transformées pour
l'équilibrage des UC
22. 08/11/2018
22Symposium 2018 - Statistiques Canada - Séance 7B
Conclusion
●
Une nouvelle base de sondage pour les enquêtes
ménages de l'Insee :
– Pour améliorer la qualité
– Pour faciliter la collecte
●
Ce changement s'est accompagné de la mise en
œuvre de la coordination du tirage de l'enquête Emploi
●
Organisation cible à l'Insee pour 2019 et au-delà
– Demande un suivi des évolutions administratives : fin de la
taxe d'habitation, prélèvement à la source…
23. 08/11/2018
23Symposium 2018 - Statistiques Canada - Séance 7B
Passer du recensement aux sources fiscales : un
changement de base de sondage pour une meilleure
coordination des échantillons de l’Insee
Insee
www.insee.fr
Thomas Merly-Alpa
Insee – France
thomas.merly-alpa@insee.fr
Merci de votre attention
Avez-vous des questions ?