Cours EMI CFD - Mars 2012

382 vues

Publié le

Publié dans : Formation
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
382
Sur SlideShare
0
Issues des intégrations
0
Intégrations
4
Actions
Partages
0
Téléchargements
2
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Cours EMI CFD - Mars 2012

  1. 1. Data PublicaOpendata & visualisations EMI - CFD Mercredi 28 mars 2012 Thomas Dudouet thomas.dudouet@data-publica.com @tdudouet
  2. 2. Open data Définition● Open data = Donnée ouverte● On parle douverture des données● Mise à disposition des données publiques pour accès et réutilisation par les citoyens et les entreprises
  3. 3. Open data Donnée publiqueLa notion de « donnée publique » couvre lensembledes données qui sont ou devraient être (légalementou volontairement) publiées ou tenues à dispositiondu public, et qui sont produites ou collectées par unÉtat, une collectivité territoriale, un organeparapublic, dans le cadre de leurs activités deservice public. http://fr.wikipedia.org/wiki/Donnée_publique
  4. 4. Open data Motivations Modernisation ● Enrichissement des données ● Développement du collaboratif ● Intégration du décisionnel de données
  5. 5. Open data Motivations Économiques ● Développement de linnovation ● Croisement des compétences ● Création demploi, de structures ● Valorisation du territoire
  6. 6. Open data Motivations Démocratiques ● Lisibilité et transparence de laction publique ● Dialogue et participation citoyenne
  7. 7. Open data Un mouvement mondial● États-Unis Initiative data.gov (administration Obama - 2009)● Royaume-Uni Initiative data.gov.uk (2010)● UE Directive Européenne sur la réutilisation des données publiques (2003)● Finlande, Australie, Nouvelle-Zélande, Irlande,...● France Mission Etalab (data.gouv.fr)
  8. 8. Open data Données publiques● Des formes variées Statistiques, horaires, cartographies, mesures,...● Des thématiques diverses Transport, culture, tourisme, environnement, démoghraphie, finances,...● Des formats préconisés ○ Formats "libres" (non propriétaires) ○ Formats lisibles par les machines CSV, ODF, XML,... XLS, PDF, DOC,...
  9. 9. Open data Données publiques● Exemples : ○ Liste des arbres dans la ville ○ Liste de jardins et parcs publics ○ Localisation des vélos en libre accès ○ Circulation et places de parking en temps réel ○ Localisation des toilettes publiques ○ Statistiques de prêt dans les bibliothèques ○ Résultats aux élections
  10. 10. Open data État du mouvement en France
  11. 11. Open data Petit exercice dintroduction... Recherche de jeu de données Pour chaque jeu de données, noter : ● LURL du site ● Le format de fichier http://www.pratique.fr/sites/default/files/articles/referencer-site.jpg
  12. 12. Open data Producteurs de données MINISTÈRE DES SPORTS MINISTÈRE DE LINTÉRIEUR MINISTÈRE DU BUDGET MINISTÈRE DE LECOLOGIE MINISTÈRE DE LÉDUCATION NATIONALE MINISTÈRE DE LA CULTURE MINISTÈRE DU TRAVAIL PRÉFECTURE DILE DE FRANCE & DE PARISPRÉFECTURE DU JURA PRÉFECTURE DU NORD PRÉFECTURE DE LA SOMME PRÉFECTURE DELA MARNE PRÉFECTURE DE LAIN PRÉFECTURE DU VAR PRÉFECTURE DU PAS DE CALAIS
  13. 13. Open data Producteurs de données VILLE DE PARIS VILLE DE NANTES VILLE DE RENNES VILLE DE MONTPELLIER VILLE DE TOULOUSE VILLE DE BROCAS CONSEILGÉNÉRAL DU LOIR ET CHER CONSEIL GÉNÉRALDE GIRONDE CONSEIL GÉNÉRAL DE SAÔNE ET LOIRE CONSEIL GÉNÉRAL DE LOIREATLANTIQUE CONSEIL GÉNÉRAL DU MAINE ETLOIRE AGENCE DE LEAU ARTOIS PICARDIE ...INSEE EUROSTAT OCDE BANQUE MONDIALE ...
  14. 14. Open data Formats de données PDF XLS CSV DOC XML RDF RTF TXT SHP GTFS ESRI KML HTML ODS JPG ...
  15. 15. Open data Data delugeMINISTÈRE DES SPORTS MINISTÈRE DE LINTÉRIEUR MINISTÈRE DU BUDGET MINISTÈRE DE LECOLOGIE MINISTÈRE DELÉDUCATION NATIONALE MINISTÈRE DE LA CULTURE MINISTÈRE DU TRAVAIL PRÉFECTURE DU JURA PRÉFECTURE DU NORD G E PRÉFECTURE DE LA SOMME PRÉFECTURE DE LA MARNE U PRÉFECTURE DE LAIN PRÉFECTURE DU PAS DE CALAIS VILLE DE L D E PARIS VILLE DE NANTES VILLE DE RENNES VILLE DE MONTPELLIER VILLE DE TOULOUSE VILLE DE BROCAS CONSEIL T A GÉNÉRAL DU LOIR ET CHER CONSEIL GÉNÉRAL DE GIRONDE CONSEIL GÉNÉRAL DE SAÔNE ET LOIRE CONSEIL GÉNÉRAL DE D A LOIRE ATLANTIQUE CONSEIL GÉNÉRAL DU MAINE ET LOIRE AGENCE DE LEAU ARTOIS PICARDIE AGENCE DE LEAU ADOUR GARONNE AGENCE DE LEAU LOIRE BRETAGNE PDF XLS CSV DOC XML RDF RTF TXT SHP GTFS ESRI KML HTML ODS JPG
  16. 16. Open data Data deluge The data deluge refers to the situation where the sheer volume of new data being generated is overwhelming the capacity of institutions to manage it and researchers to make use of it. http://itlaw.wikia.com/wiki/Data_deluge
  17. 17. Open data Solutions (nécessaires mais pas suffisantes)● Utilisation dannuaires● Segmentation des données existantes : ○ Par éditeur : portée géographique (national, continental, mondial) ○ Par catégorie : portée sémantique ○ Par format : niveau de réutilisation, dautomatisation
  18. 18. Open data Solutions ((presque ?) suffisantes)● Structurer les données● Les rendre librement accessibles via des services web (Exemple de Google Maps)● Assurer leur mise à jour automatique● Garantir la rétro-compatibilité des systèmes http://maps.googleapis.com/maps/api/geocode/json?sensor=false&address=7,%20rue%20des%20Petites%20Ecuries% 20Paris
  19. 19. Open data Data Publica - Histoire● Origine Projet de R&D financé par le Secrétariat dÉtat à l’Économie numérique (2010)● Septembre 2010 : Lancement du premier annuaire Français de données électroniques● Mars 2011 : Lancement de la société Data Publica● Octobre 2011 : Lancement de la place de marché● Janvier 2012 : Outil de visualisation générique● Mars 2012 : Lancement de lAPI
  20. 20. Open data Data Publica - Points forts● Excellente connaissance des données françaises● Maitrise des technologies de recueil de données ○ Crawling, scraping ○ Text mining, web mining ○ ETL, data cleansing● Flexibilité et réactivité● Collaboration avec le monde de la recherche
  21. 21. Open data Data Publica - Lannuaire● Libre, gratuit, ouvert● Plus de 13000 jeux de données, 200 éditeurs● Données & méta-données combinées dans un moteur de recherche à facettes● Moteur de visualisation générique
  22. 22. Open data Data Publica - Recherche● Un résultat du moteur = un jeu de données● Classement par pertinence ou par date de parution● Nombreuses facettes : ○ Prix (99% gratuit) ○ 24 catégories (multi-catégories) ○ Type de publication (groupements de formats) ○ Annuaire (site dorigine) ○ Éditeur ○ License
  23. 23. Open data Data Publica - Recherche Démo La poule pondeuse, témoin de la puissance du moteur de recherche Data Publica. http://www.zanimag.fr/files/2011/03/poule-pondeuse.jpg
  24. 24. Open data Data Publica - Visualisateur● Un outil simple dutilisation qui permet de visualiser des données de manière claire : ○ Cartographies ○ Graphiques ○ Courbes● Un moyen facile dexporter une visualisation dans un article
  25. 25. Open data Data Publica - Visualisateur Première étape : Trouver sa visualisation
  26. 26. Open data Data Publica - VisualisateurDeuxième étape : Choisir un type de visualisation
  27. 27. Open data Data Publica - Visualisateur Troisième étape : Paramétrer ses données
  28. 28. Open data Data Publica - Visualisateur Last but not least : Partager ses données
  29. 29. Open data Data Publica - Visualisateur Démo Délinquance : des chiffres qui donnent la chair de poule (pondeuse) http://www.monversailles.com/wp-content/uploads/2009/11/menottes.jpg
  30. 30. Open data Visualisateur : prenez la main !Quel est le pays Européen dont le montant de ladette publique était le plus important en 2010 ?
  31. 31. Open data Visualisateur : prenez la main !Quel est le pays Européen dont le montant de ladette publique était le plus important en 2010 ? LAllemagne, avec 2062 milliards deuros. La Grèce à quant à elle la part la plus elevée par rapport à son PIB avec 145%.
  32. 32. Open data Visualisateur : prenez la main !Quel est le pays Européen qui détient le plusdélevages de poules pondeuses ? Le plus de poules pondeuses ?
  33. 33. Open data Visualisateur : prenez la main !Quel est le pays Européen qui détenait le plus délevages de poules pondeuses en 2007 ? Le plus de poules pondeuses ? La Roumanie avec 2 951 970 élevages. La France avec 73 670 000 poules pondeuses. Varier le paramètre "Nombre de têtes".
  34. 34. Open data Visualisateur : prenez la main !Quel est le domaine dactivité en France le plus sujet à des accidents du travail ?
  35. 35. Open data Visualisateur : prenez la main !Quel est le domaine dactivité en France le plus sujet à des accidents du travail ? La construction. Nette amélioration dans lagriculture en 2007. Observer également avec la dimensions Pays.
  36. 36. Open data Data Publica, cest aussi... Un blog sur lactualité des données http://www.data-publica.com/content/blog/data-news/● Des articles danalyse de jeu de données : Analyse des résultats des primaires socialistes, Analyse des données sur la délinquance,...● Des entretiens avec des acteurs du domaine
  37. 37. Open data Data Publica, cest aussi... Le "labs" et ses expériences http://observatoire.data-publica.com/Outil de mesure de limpact des 10 candidats à laprésidentielle sur Twitter : ● Nombre de followers ● Analyse sémantique (text-mining) ● Bruit (nombre de tweets associés)
  38. 38. Open data Data Publica, cest aussi... Le "labs" et ses expériences http://www.data-publica.com/content/2012/03/voyage-dans-le-patrimoine-immobilier-de-letat/Analyse et cartographie sur les biens immobiliersdétenus par lÉtat Français dans le monde.
  39. 39. Des questions ? EMI - CFD Mercredi 28 mars 2012 Thomas Dudouet thomas.dudouet@data-publica.com @tdudouet

×