Publier et interconnecterles données publiques :Le projet Datalift                  13 Mars 2012, COEPIA, Paris           ...
Au sommaireØ ProblématiquesØ Le web sémantique comme solutionØ Le projet DataliftØ Processus de publications des donnéesØ ...
ProblématiquesØ Redondance des identifiantsØ Hétérogénéité des formats de donnéesØ Diversité des formats de métadonnéesØ H...
Le Web sémantique comme solutionØ Un système didentifiants global: les URIsØ Un format unique: RDFØ Un langage de représen...
DataliftPlateforme logicielle pour assister la publication de donnéesPublication de jeux de donnéesR&D pour automatiser le...
but de datalift De données brutes ouvertes à des données sémantiques       interconnectées
Un ascenseur pour les données                                    Données publiées et                                interc...
Le processus de publication       DBPedia     IGN                          INSEE                             SPARQL       ...
sélectionØ Qu’est-ce qu’un (bon) vocabulaire pour des données liées?    § Critères d’utilisabilité    § Simplicité, visibi...
conversionØ Guide des bonnes pratiques pour les données liées:   § La ressource: http://dbpedia.org/resource/Paris   § Le ...
publication §      Utiliser le format RDF §      Utiliser des URI pour nommer les choses §      Utiliser des URI HTTP (URL...
Interconnexion§    Comment identifier les jeux    de données à lier ?§    Comment trouver les resources    équivalentes ?
Élévation de données        expérimentations en cours ou prévuesØ IGN, INSEE, DILAØ Regards Citoyens (nosdeputes.fr)Ø Etal...
Education         Dev. DurableNuage de                                                         Industrie                  ...
DATALIFT En route vers le web de données
Datalift Platform
Quelques exemples de requêtes●   Quels sont les services publics disponibles à    Melun classés par type de service ?●   Q...
CreditsThis presentation was realized thanks to the work of the Datalift team.It can be freely distributed under Creative ...
Prochain SlideShare
Chargement dans…5
×

20120313 coepia-mise-à-disposition-et-valorisation-des-données-publiques

971 vues

Publié le

Publié dans : Mode de vie
0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
971
Sur SlideShare
0
Issues des intégrations
0
Intégrations
7
Actions
Partages
0
Téléchargements
13
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

20120313 coepia-mise-à-disposition-et-valorisation-des-données-publiques

  1. 1. Publier et interconnecterles données publiques :Le projet Datalift 13 Mars 2012, COEPIA, Paris Formation spécialisée « Mise à disposition et valorisation des données publiques » François Scharffe Francois.scharffe@lirmm.fr @lechatpito Présentation réalisée avec léquipe du projet Datalift Et le soutien de lAgence Nationale pour la Recherche 1
  2. 2. Au sommaireØ ProblématiquesØ Le web sémantique comme solutionØ Le projet DataliftØ Processus de publications des donnéesØ Exemple avec les données de lannuaire du service publicØ Vocabulaires, identifiants et interconnexionØ Vers un écosystème de jeux de données de référence
  3. 3. ProblématiquesØ Redondance des identifiantsØ Hétérogénéité des formats de donnéesØ Diversité des formats de métadonnéesØ Hétérogénéité des protocoles daccès aux données
  4. 4. Le Web sémantique comme solutionØ Un système didentifiants global: les URIsØ Un format unique: RDFØ Un langage de représentation de vocabulaires de métadonnées: RDFS+OWL, SKOSØ Un protocole dacccès uniforme: HTTP, SPARQL
  5. 5. DataliftPlateforme logicielle pour assister la publication de donnéesPublication de jeux de donnéesR&D pour automatiser le processus de publicationFormations, tutoriels, camps de publication de données
  6. 6. but de datalift De données brutes ouvertes à des données sémantiques interconnectées
  7. 7. Un ascenseur pour les données Données publiées et interconnectées sur le Web Applications InterconnexionInfrastructure de publication Conversion des données Sélection de vocabulaires Données brutes
  8. 8. Le processus de publication DBPedia IGN INSEE SPARQL Négociation de contenu Dé-référencement des URIs Ontologie du service public Conversion RDF → RDF Ontologie géographique Conversion XML → RDF
  9. 9. sélectionØ Qu’est-ce qu’un (bon) vocabulaire pour des données liées? § Critères d’utilisabilité § Simplicité, visibilité, pérennité, intégration, cohérence …Ø Différents types de vocabulaires § De métadonnées, de référence, de domaine, généraliste … § Les piliers du Linked Data : Dublin Core, FOAF, SKOSØ Bonnes et moins bonnes pratiques § Ex : Programmes BBC vs legislation.gov.uk § Vocabulary of a Friend : les vocabulaires en réseauØ Problèmes linguistiques § Les vocabulaires existants sont en anglais à 99% § Approche terminologique : quels vocabulaires pour « Evénement » « Organisation »
  10. 10. conversionØ Guide des bonnes pratiques pour les données liées: § La ressource: http://dbpedia.org/resource/Paris § Le document: http://dbpedia.org/page/Paris § Les données: http://dbpedia.org/data/ParisØ Cas d’étude: legislation.gov.uk § L’identifiant: http://www.legislation.gov.uk/id/ukpga/1985/67 § Le document: http://www.legislation.gov.uk/ukpga/1985/67 § La représentation (en XML plutôt que HTML): http://www.legislation.gov.uk/ukpga/1985/67/data.xml
  11. 11. publication § Utiliser le format RDF § Utiliser des URI pour nommer les choses § Utiliser des URI HTTP (URL) pour pouvoir leur demander des informations § Donner des informations (HTML, RDF) quand les liens sont dé- référencés § Inclure dans ces infos les URIs pointant vers dautres données pour permettre la découverte Tim Berners Lee, http://www.w3.org/DesignIssues/LinkedData.html
  12. 12. Interconnexion§ Comment identifier les jeux de données à lier ?§ Comment trouver les resources équivalentes ?
  13. 13. Élévation de données expérimentations en cours ou prévuesØ IGN, INSEE, DILAØ Regards Citoyens (nosdeputes.fr)Ø Etalab – data.gouv.frØ Version Française de DBPedia (INRIA, ministère de la culture)Ø Office national des transports (CETE Méditerranée)Ø Ville de MontpellierØ EU projects LOD2, LATC, PlanetDataØ SharePSI.eu, W3C Linked Open Government Data, CKAN
  14. 14. Education Dev. DurableNuage de Industrie Culturedonnées Annuaire du Service Public Reférentiel DILA des communes INSEE Finances.fr BDAdresse IGN DBPedia.fr Intérieur Min.Culture Recensement INSEE BDTopo Recherche IGN Offres des servicesAdministrations locales De transport (villes, agglos, data.BNF.fr CETEdépartements, régions) Santé Associations Médias
  15. 15. DATALIFT En route vers le web de données
  16. 16. Datalift Platform
  17. 17. Quelques exemples de requêtes● Quels sont les services publics disponibles à Melun classés par type de service ?● Quels sont les horaires douverture des services publics en Île de France ?● Dans quelles villes y a til des instances préfectorales ? Quel est leur numéro de téléphone ? Quel est le nom de ces communes en Japonais ?
  18. 18. CreditsThis presentation was realized thanks to the work of the Datalift team.It can be freely distributed under Creative Commons licence BY-NC-SA 3.0 18

×