Infolab : les prénoms, une donnée populaire

2 106 vues

Publié le

Extrait de l'infolab consacré aux prénoms, une donnée (ouverte) populaire par Simon Chignard (présentation du 11/04/2013 lors de la réunion du groupe national Infolab avec la Fing)

0 commentaire
3 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
2 106
Sur SlideShare
0
Issues des intégrations
0
Intégrations
1 201
Actions
Partages
0
Téléchargements
10
Commentaires
0
J’aime
3
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Infolab : les prénoms, une donnée populaire

  1. 1. Les prénoms, une donnée populaireSimon Chignard - @schignardsimonchignard@mac.comwww.donneesouvertes.info1
  2. 2. Atelier «Prénoms»SommaireDécouverte du sujet1/ Dans la presse quotidienne régionale : les 1ers bébés de l’année2/ En vidéos : la Saint Méthode (1964), Attention aux prénoms farfelus (2003)3/ Les premières perceptions : un bien de mode, la recherche de l’extravaganceLes données disponibles1/ Sur les portails Open Data des collectivités2/ Le fichier Insee3/ Les prénoms des candidats au bacLecture critique des données disponibles1/ Périmètre et constitution du fichier2/ N = ?3/ Où êtes-vous vraiment nés ?Des réutilisations possibles1/ La diversité des prénoms et l’évolution dans le temps2/ Les effets de mode et l’influence d’évènements extérieurs3/ Le prénom un indicateur social ?4/ Les prénoms et la criseLe lien entre matière première disponible et réutilisations possibles123452
  3. 3. Découverte du sujet13
  4. 4. Presse Océan2/01/20134
  5. 5. Le Telegramme2/01/20135
  6. 6. Le Pays Malouin3/01/136
  7. 7. Découverte du sujetLes prénoms comme un bien demodeLe Top des prénoms : Emma etMatthis«Le retour de Lola, face àl’indétronable Enzo»L’influence d’évènementsextérieurs : les stars de cinéma, leschanteurs, etc...Les prénoms farfelusAttention aux prénoms farfelus !Loréal, Ikea, Tartempion, MJ, ...les premières perceptions du phénomène7
  8. 8. Les donnéesdisponibles28
  9. 9. Les jeux de données disponiblesSur les portails Open Data descollectivités ou data.gouv.frBordeauxCoulommiersLa RochelleNantesRennesMontpellierParisSarlat-la-CanédaDigne-les-BainsToulouse...Le fichier prénoms de l’INSEESoumis à redevance mais disponible enligne sur nosdonnees.frSur demande auprès de l’état-civilen application de la loi CADAPoitiersLe fichier des candidats au bac 2011 et 2012compilé par Baptiste Coulmont à partir du siteweb de l’Education nationaleUn recensement rapide9
  10. 10. Lecture critiquedes données310
  11. 11. Lecture critique des donnéesQui figure dans le fichier ?Comment est-il constitué ?Le fichier représente-t-il l’ensembledes naissances ?Les premières questions11
  12. 12. Lecture critique des donnéesN=?Le fichier prénoms de l’INSEEN = naissances enregistrées (bulletin denaissance) sur le territoire y comprisDOM de 1900 à 2009, à l’exception desenfants portant un prénom donné moinsde 3 fois au cours d’une année (prénoms«rares».Le fichier de Paris en Open DataN = naissances à la dated’enregistrement à l’état-civil sur leterritoire de Paris, à l’exception desenfants portant un prénom donné moinsde 5 fois au cours de l’annéeLe fichier des candidats au bac en2012N = candidats au bac 2012 ayant acceptéla publication de leurs résultats12
  13. 13. Des réutilisationspossibles413
  14. 14. Relativiser la part des prénomsfigurant dans le TopComment illustrer la courbe dedistribution de type longue traîne ?(Loi de Zipf)Montrer la diversité dans letempsIndicateur : nombre de prénomsnécessaires pour nommer la moitiéd’une classe d’âgeIndicateur : pourcentage desenfants qui portent un prénom duTop 50 (les plus donnés)Indicateur : pourcentage desenfants recevants un prénomunique dans une villea - Montrer la diversité des prénomsDes réutilisations possibles«scoring prénoms»en marketing14
  15. 15. La mode des prénoms courtsEnrichissement du fichier : nombrede lettres dans le prénomAttention : Tom et Léa, 3 lettreschacun !Les terminaisons à la modeEnrichissement du fichier : prénomsayant une terminaison en -a ou -ah(Léa, Sarah, Emma, ...)vs.prénoms ayant une terminaison en-ette (Bernadette)b - Le prénom, un bien de modeDes réutilisations possiblesL’influence d’un évènementexterneUn fait diversUne chanteuse à la mode...La recherche d’éventuellesspécificités localesEst-on plus originaux à Paris, LaRochelle ou Nantes ?15
  16. 16. b - Le prénom, un bien de modeL’influence d’un évènement externe : un fait divers%desnaissances(garçons)portantleprénom5700220016
  17. 17. b - Le prénom, un bien de modeL’influence d’un évènement externe : une chanteuse%desnaissances(filles)portantleprénom120055017
  18. 18. Les mentions au bac en fonctiondu prénom (Baptiste Coulmont)c - Le prénom, un indicateur socialDes réutilisations possibles18
  19. 19. Le carnet du FigaroEnrichissement du fichier : prénomsfigurant dans le carnet du FigaroAttention : Justin !(Parenthèse juridique)Selon la licence choisie pour le jeude données initial, on devrarepublier ces enrichissements selonles mêmes conditions... (ODbL)Ilustration concrète du partage àl’identique (share-alike).c - Le prénom, un indicateur socialDes réutilisations possibles19
  20. 20. d - Le prénom enpériode de criseDes réutilisations possibles20
  21. 21. Le lien entre la matière premièredisponible et les réutilisations possibles521
  22. 22. Une très grande hétérogénéitédes jeux disponiblesAnalyse de Charles Népote sur lesjeux disponibles : contenu dufichier, plage temporelle, licence, letroncage réaliséLa comparaison entre territoires esttrès difficile.Un troncage lié à leur ouvertureLes prénoms rares ne figurent pasdans les fichiers. Or ils sontindispensables pour répondre àcertaines questions :«Je veux donner à mon enfant unprénom qui n’a jamais été donnédans cette ville»La matière disponible détermine lesréutilisations possiblesCertains phénomènes relèventdu temps longUn prénom revient à la modesuivant un cycle de 80 à 120 ans.Les fichiers publiés couvrent despériodes temporelles beaucoupplus limitées...22

×