SlideShare une entreprise Scribd logo
1  sur  27
Télécharger pour lire hors ligne
Publication et intégration de
données ouvertes
François Scharffe
LIRMM, UM2

Gazouillez #lechatpito #datalift

Matinée Open Data, Montpellier, 28 Nov 2013

1
Qu’est-ce qu’une donnée ouverte ?
• Une donnée accessible sur le web sous une licence
ouverte.
• Notre contexte est plus large:
–

Données accessibles sous condition

–

Licences de différents types

Matinée Open Data, Montpellier, 28 Nov 2013

2
Données Ouvertes
•

Un sujet très à la mode …

●

Motion du G8 pour l’ouverture et la transparence des données

●

Directives de l’UE (Open Data, Inspire)

●

Etalab et data.gouv.fr

●

Open Data France

•

… qui amène de nouvelles problématiques

●

Sous quel(s) format(s) publier les données ?

●

De quelle façon y accéder ?

●

Différents niveaux d’ouverture ?

Matinée Open Data, Montpellier, 28 Nov 2013

●

respect de la vie privée, etc

3
Partons en voyage...

Matinée Open Data, Montpellier, 28 Nov 2013

4
Problème de planning

Matinée Open Data, Montpellier, 28 Nov 2013

5
Problème de planning

Matinée Open Data, Montpellier, 28 Nov 2013

6
Une situation insuffisamment satisfaisante pour
la valorisation de vos données
Oblige les développeurs à :
Ø Analyser à chaque fois la sémantique de vos données : qu'est-ce
que veut dire ce champ “nom” ? signifie-t-il la même chose que
dans cet autre jeu de données ?
Ø Découvrir par eux-mêmes les relations entre vos données et
d'autres données
Ø Gérer des formats hétérogènes pour croiser des données : CSV
pour tel jeu de données, XLS pour tel autre, SHP pour ce dernier
Ø Gérer des méthodes d'accès hétérogènes pour accéder aux
données : APIs propriétaires différentes
De votre côté :
Ø Temps passé à développer des APIs
Ø Difficulté à faire adapter des applications existantes à vos données
Matinée Open Data, Montpellier, 28 Nov 2013

7
Le Web sémantique comme solution
Ø Un système d'identifiants global : les URIs
●

chaque donnée ou métadonnée est identifiée de manière non
ambigue : http://dbpedia.org/resource/Paris est la ville de

Paris en France ; pas de risque de confusion avec Paris
au Texas ou avec les paris sportifs
Ø Un format unique, RDF : un modèle de données simple pour
décrire vos données, extensif à l'infini
Ø La standardisation de la sémantique de vos données, à travers
des propriétés et des “vocabulaires” réutilisables : par ex. vous
n'avez pas à réinventer pas la propriété “auteur” qui est déjà définie
ailleurs
Ø Un protocole d'acccès uniforme : HTTP, SPARQL
●

SPARQL est l'API unique, normalisée, du web sémantique
(ressemble à SQL) Open Data, Montpellier, 28 Nov 2013
Matinée

8
Datalif
De données brutes ouvertes
à des données sémantiques
interconnectées
Matinée Open Data, Montpellier, 28 Nov 2013

9
Datalift
Plateforme logicielle pour assister la publication de données
Publication de jeux de données
R&D pour automatiser le processus de publication
Formations, tutoriels, camps de publication de données

Matinée Open Data, Montpellier, 28 Nov 2013

10
Le processus
d'élévation

Matinée Open Data, Montpellier, 28 Nov 2013

11
Le processus de publication
DBPedia

IGN
INSEE

Accès HTTP
Interrogation en SPARQL
Ontologie du
service public
Ontologie
géographique

Conversion RDF → RDF
Conversion XML → RDF

Matinée Open Data, Montpellier, 28 Nov 2013

12
sélection
Ø Qu’est-ce qu’un (bon) vocabulaire pour des données liées?
§ Critères d’utilisabilité
§ Simplicité, visibilité, pérennité, intégration, cohérence …

Ø Différents types de vocabulaires
§ De métadonnées, de référence, de domaine, généraliste …
§ Les piliers du Linked Data : Dublin Core, FOAF, SKOS

Ø Bonnes et moins bonnes pratiques
§ Ex : Programmes BBC vs legislation.gov.uk
§ Vocabulary of a Friend : les vocabulaires en réseau

Ø Problèmes linguistiques
§ Les vocabulaires existants sont en anglais à 99%
§ Approche terminologique : quels vocabulaires pour « Evénement » « Organisation »
Matinée Open Data, Montpellier, 28 Nov 2013

13
conversion
Ø Guide des bonnes pratiques pour les données liées:
§ La ressource: http://id.insee.fr/geo/commune/75056
–

Le document: http://www.insee.fr/geo/commune/75056

–

Les données: http://rdf.insee.fr/geo/commune/75056

Matinée Open Data, Montpellier, 28 Nov 2013

14
conversion
Ø Guide des bonnes pratiques pour les données liées:
§ La ressource: http://id.insee.fr/geo/commune/75056
–

Le document: http://www.insee.fr/geo/commune/75056

–

Les données: http://rdf.insee.fr/geo/commune/75056

Matinée Open Data, Montpellier, 28 Nov 2013

15
Managing licenses and access
rights on published data

Matinée Open Data, Montpellier, 28 Nov 2013

16
publication
§

Utiliser le format RDF

§

Utiliser des URI pour nommer les choses

§

Utiliser des URI HTTP (URL) pour pouvoir leur demander des informations

§

Donner des informations (HTML, RDF) quand les liens sont dé-référencés

§

Inclure dans ces infos les URIs pointant vers d'autres données pour
permettre la découverte
Tim Berners Lee,
SemWebPro 18/01/2011
17
http://www.w3.org/DesignIssues/LinkedData.html
Interconnexion
Dépasser
l'hétérogénéité
des données
§

§

Comment identifier les jeux
de données à lier ?
Comment trouver les resources
équivalentes ?

SemWebPro 18/01/2011

18
Et plus ...
●

Gestion des droits d'accès aux données à
échelle variable

●

Gestion des licences, licences composites

●

Une API web de données pour Androïd

●

●

Des patrons configuration pour visualiser les
données
...

Matinée Open Data, Montpellier, 28 Nov 2013

19
La plateforme Datalift
●

Architecture modulaire

●

Supporte le processus de publication

●

Documentée : installation, utilisation,
développement

●

Sécurisée

●

Open-source

●

Exécutables pour Windows, OSX, Linux

Matinée Open Data, Montpellier, 28 Nov 2013

20
La plateforme Datalift

Matinée Open Data, Montpellier, 28 Nov 2013

21
Quelques jeux de données

Matinée Open Data, Montpellier, 28 Nov 2013

22
Datalift Platform

Matinée Open Data, Montpellier, 28 Nov 2013

23
Matinée Open Data, Montpellier, 28 Nov 2013

24
Matinée Open Data, Montpellier, 28 Nov 2013

25
Matinée Open Data, Montpellier, 28 Nov 2013

26
DATALIFT
En route vers le web de données
Matinée Open Data, Montpellier, 28 Nov 2013

27

Contenu connexe

Tendances

Datalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériencesDatalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériencesSemWebPro
 
Les bases pour utiliser SPARQL
Les bases pour utiliser SPARQLLes bases pour utiliser SPARQL
Les bases pour utiliser SPARQLBorderCloud
 
Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...
Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...
Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...Antidot
 
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...Gautier Poupeau
 
Introduction au web sémantique
Introduction au web sémantiqueIntroduction au web sémantique
Introduction au web sémantiqueStéphane Traumat
 
Échange et interopérabilité des données structurées sur le Web
Échange et interopérabilité des données structurées sur le WebÉchange et interopérabilité des données structurées sur le Web
Échange et interopérabilité des données structurées sur le WebAntidot
 
A la découverte du Web sémantique
A la découverte du Web sémantiqueA la découverte du Web sémantique
A la découverte du Web sémantiqueGautier Poupeau
 
Conférence Open Data par où commencer ? Intervention K.Rafes BorderCloud
Conférence Open Data par où commencer ? Intervention K.Rafes BorderCloudConférence Open Data par où commencer ? Intervention K.Rafes BorderCloud
Conférence Open Data par où commencer ? Intervention K.Rafes BorderCloudAline Custodio
 
Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)Y. Nicolas
 
Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens. Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens. Fabien Gandon
 
Introduction au Web sémantique
Introduction au Web sémantiqueIntroduction au Web sémantique
Introduction au Web sémantiqueSpyderwoman
 
Metadonnees Introduction
Metadonnees IntroductionMetadonnees Introduction
Metadonnees Introductionjbcomte
 
le web sémantique : un web de métadonnées
le web sémantique : un web de métadonnéesle web sémantique : un web de métadonnées
le web sémantique : un web de métadonnéesABES
 
Web sémantique et référentiels : l'avenir de l'image sur le Web
Web sémantique et référentiels : l'avenir de l'image sur le WebWeb sémantique et référentiels : l'avenir de l'image sur le Web
Web sémantique et référentiels : l'avenir de l'image sur le WebAntidot
 
20121009 10-datalift-camp-paris
20121009 10-datalift-camp-paris20121009 10-datalift-camp-paris
20121009 10-datalift-camp-parisDatalift
 
Introduction aux RDF & SPARQL
Introduction aux RDF & SPARQLIntroduction aux RDF & SPARQL
Introduction aux RDF & SPARQLOpen Data Support
 

Tendances (20)

Datalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériencesDatalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériences
 
Les bases pour utiliser SPARQL
Les bases pour utiliser SPARQLLes bases pour utiliser SPARQL
Les bases pour utiliser SPARQL
 
Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...
Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...
Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...
 
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
 
Rmll opendata-2013
Rmll opendata-2013Rmll opendata-2013
Rmll opendata-2013
 
Introduction au web sémantique
Introduction au web sémantiqueIntroduction au web sémantique
Introduction au web sémantique
 
Échange et interopérabilité des données structurées sur le Web
Échange et interopérabilité des données structurées sur le WebÉchange et interopérabilité des données structurées sur le Web
Échange et interopérabilité des données structurées sur le Web
 
Web sémantique
Web sémantique Web sémantique
Web sémantique
 
Metadonnees -- une typologie
Metadonnees -- une typologieMetadonnees -- une typologie
Metadonnees -- une typologie
 
A la découverte du Web sémantique
A la découverte du Web sémantiqueA la découverte du Web sémantique
A la découverte du Web sémantique
 
Conférence Open Data par où commencer ? Intervention K.Rafes BorderCloud
Conférence Open Data par où commencer ? Intervention K.Rafes BorderCloudConférence Open Data par où commencer ? Intervention K.Rafes BorderCloud
Conférence Open Data par où commencer ? Intervention K.Rafes BorderCloud
 
Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)
 
Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens. Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens.
 
Introduction au Web sémantique
Introduction au Web sémantiqueIntroduction au Web sémantique
Introduction au Web sémantique
 
Metadonnees Introduction
Metadonnees IntroductionMetadonnees Introduction
Metadonnees Introduction
 
le web sémantique : un web de métadonnées
le web sémantique : un web de métadonnéesle web sémantique : un web de métadonnées
le web sémantique : un web de métadonnées
 
Web sémantique et référentiels : l'avenir de l'image sur le Web
Web sémantique et référentiels : l'avenir de l'image sur le WebWeb sémantique et référentiels : l'avenir de l'image sur le Web
Web sémantique et référentiels : l'avenir de l'image sur le Web
 
20121009 10-datalift-camp-paris
20121009 10-datalift-camp-paris20121009 10-datalift-camp-paris
20121009 10-datalift-camp-paris
 
Introduction aux RDF & SPARQL
Introduction aux RDF & SPARQLIntroduction aux RDF & SPARQL
Introduction aux RDF & SPARQL
 
RDF en quelques slides
RDF en quelques slidesRDF en quelques slides
RDF en quelques slides
 

Similaire à Publication et intégration de données ouvertes

Aaf archivistes these
Aaf archivistes   theseAaf archivistes   these
Aaf archivistes theseAssociationAF
 
IODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data ScienceIODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data ScienceBorderCloud
 
Introduction aux données liées
Introduction aux données liéesIntroduction aux données liées
Introduction aux données liéesOpen Data Support
 
Séance 02, Le paysage de la publication des données en 2015, dans la formatio...
Séance 02, Le paysage de la publication des données en 2015, dans la formatio...Séance 02, Le paysage de la publication des données en 2015, dans la formatio...
Séance 02, Le paysage de la publication des données en 2015, dans la formatio...Alberto González-Talaván
 
Open data - Comité de direction de l'OCSTAT
Open data - Comité de direction de l'OCSTATOpen data - Comité de direction de l'OCSTAT
Open data - Comité de direction de l'OCSTATPatrick Genoud
 
Normandy JUG - Elasticsearch
Normandy JUG - ElasticsearchNormandy JUG - Elasticsearch
Normandy JUG - ElasticsearchDavid Pilato
 
Présentation à l'Unistra des enjeux de l'Open Access et du projet angevin
Présentation à l'Unistra des enjeux de l'Open Access et du projet angevinPrésentation à l'Unistra des enjeux de l'Open Access et du projet angevin
Présentation à l'Unistra des enjeux de l'Open Access et du projet angevinNathalie Clot
 
ResearchGate et les réseaux sociaux en recherche
ResearchGate et les réseaux sociaux en rechercheResearchGate et les réseaux sociaux en recherche
ResearchGate et les réseaux sociaux en recherchepascal aventurier
 
Pierre vilain cirb open data
Pierre vilain cirb open dataPierre vilain cirb open data
Pierre vilain cirb open dataAgoria
 
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-RéponsesFiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-RéponsesAgropolis International
 
Open data et gouvernance des organisations par www.opendatasoft.com
Open data et gouvernance des organisations par www.opendatasoft.comOpen data et gouvernance des organisations par www.opendatasoft.com
Open data et gouvernance des organisations par www.opendatasoft.comOpenDataSoft
 
Open Data en France : Acteurs - Projets - Tendances
Open Data en France : Acteurs - Projets - TendancesOpen Data en France : Acteurs - Projets - Tendances
Open Data en France : Acteurs - Projets - TendancesGroupe Serda
 
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...Paris Open Source Summit
 
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Gautier Poupeau
 
Gérer l’information d’une démarche scientifique
Gérer l’information d’une démarche scientifiqueGérer l’information d’une démarche scientifique
Gérer l’information d’une démarche scientifiqueJean-Marie Monget
 

Similaire à Publication et intégration de données ouvertes (20)

Aaf archivistes these
Aaf archivistes   theseAaf archivistes   these
Aaf archivistes these
 
Entrepôt de données ouvertes IRD. Un service en ligne pour l’ouverture et le ...
Entrepôt de données ouvertes IRD. Un service en ligne pour l’ouverture et le ...Entrepôt de données ouvertes IRD. Un service en ligne pour l’ouverture et le ...
Entrepôt de données ouvertes IRD. Un service en ligne pour l’ouverture et le ...
 
Presentation entrepot polescience-v73-ssbonus
Presentation entrepot polescience-v73-ssbonusPresentation entrepot polescience-v73-ssbonus
Presentation entrepot polescience-v73-ssbonus
 
Stage pgd 2021-04-07
Stage pgd 2021-04-07Stage pgd 2021-04-07
Stage pgd 2021-04-07
 
IODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data ScienceIODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data Science
 
Entreposer ses donnees-JeudIST IRD 20181213
Entreposer ses donnees-JeudIST IRD 20181213Entreposer ses donnees-JeudIST IRD 20181213
Entreposer ses donnees-JeudIST IRD 20181213
 
Presentation jeudistv2
Presentation jeudistv2Presentation jeudistv2
Presentation jeudistv2
 
Introduction aux données liées
Introduction aux données liéesIntroduction aux données liées
Introduction aux données liées
 
Séance 02, Le paysage de la publication des données en 2015, dans la formatio...
Séance 02, Le paysage de la publication des données en 2015, dans la formatio...Séance 02, Le paysage de la publication des données en 2015, dans la formatio...
Séance 02, Le paysage de la publication des données en 2015, dans la formatio...
 
Open data - Comité de direction de l'OCSTAT
Open data - Comité de direction de l'OCSTATOpen data - Comité de direction de l'OCSTAT
Open data - Comité de direction de l'OCSTAT
 
Normandy JUG - Elasticsearch
Normandy JUG - ElasticsearchNormandy JUG - Elasticsearch
Normandy JUG - Elasticsearch
 
Présentation à l'Unistra des enjeux de l'Open Access et du projet angevin
Présentation à l'Unistra des enjeux de l'Open Access et du projet angevinPrésentation à l'Unistra des enjeux de l'Open Access et du projet angevin
Présentation à l'Unistra des enjeux de l'Open Access et du projet angevin
 
ResearchGate et les réseaux sociaux en recherche
ResearchGate et les réseaux sociaux en rechercheResearchGate et les réseaux sociaux en recherche
ResearchGate et les réseaux sociaux en recherche
 
Pierre vilain cirb open data
Pierre vilain cirb open dataPierre vilain cirb open data
Pierre vilain cirb open data
 
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-RéponsesFiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
Fiche pratique IST Agropolis : Les Données de la Recherche : Questions-Réponses
 
Open data et gouvernance des organisations par www.opendatasoft.com
Open data et gouvernance des organisations par www.opendatasoft.comOpen data et gouvernance des organisations par www.opendatasoft.com
Open data et gouvernance des organisations par www.opendatasoft.com
 
Open Data en France : Acteurs - Projets - Tendances
Open Data en France : Acteurs - Projets - TendancesOpen Data en France : Acteurs - Projets - Tendances
Open Data en France : Acteurs - Projets - Tendances
 
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
 
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
 
Gérer l’information d’une démarche scientifique
Gérer l’information d’une démarche scientifiqueGérer l’information d’une démarche scientifique
Gérer l’information d’une démarche scientifique
 

Plus de François Scharffe

Word embeddings as a service - PyData NYC 2015
Word embeddings as a service -  PyData NYC 2015Word embeddings as a service -  PyData NYC 2015
Word embeddings as a service - PyData NYC 2015François Scharffe
 
The Open Data Walk of Fame - from raw open data to five stars interlinked dat...
The Open Data Walk of Fame - from raw open data to five stars interlinked dat...The Open Data Walk of Fame - from raw open data to five stars interlinked dat...
The Open Data Walk of Fame - from raw open data to five stars interlinked dat...François Scharffe
 
20120313 coepia-mise-à-disposition-et-valorisation-des-données-publiques
20120313 coepia-mise-à-disposition-et-valorisation-des-données-publiques20120313 coepia-mise-à-disposition-et-valorisation-des-données-publiques
20120313 coepia-mise-à-disposition-et-valorisation-des-données-publiquesFrançois Scharffe
 
Datalift a-catalyser-for-the-web-of-data-fosdem-05-02-2011
Datalift a-catalyser-for-the-web-of-data-fosdem-05-02-2011Datalift a-catalyser-for-the-web-of-data-fosdem-05-02-2011
Datalift a-catalyser-for-the-web-of-data-fosdem-05-02-2011François Scharffe
 
Melinda: Methods and tools for Web Data Interlinking
Melinda: Methods and tools for Web Data InterlinkingMelinda: Methods and tools for Web Data Interlinking
Melinda: Methods and tools for Web Data InterlinkingFrançois Scharffe
 
Méthodes et outils pour interrelier le web des données
Méthodes et outils pour interrelier le web des donnéesMéthodes et outils pour interrelier le web des données
Méthodes et outils pour interrelier le web des donnéesFrançois Scharffe
 
Ontology alignment representation
Ontology alignment representationOntology alignment representation
Ontology alignment representationFrançois Scharffe
 

Plus de François Scharffe (10)

Word embeddings as a service - PyData NYC 2015
Word embeddings as a service -  PyData NYC 2015Word embeddings as a service -  PyData NYC 2015
Word embeddings as a service - PyData NYC 2015
 
The Open Data Walk of Fame - from raw open data to five stars interlinked dat...
The Open Data Walk of Fame - from raw open data to five stars interlinked dat...The Open Data Walk of Fame - from raw open data to five stars interlinked dat...
The Open Data Walk of Fame - from raw open data to five stars interlinked dat...
 
20120313 coepia-mise-à-disposition-et-valorisation-des-données-publiques
20120313 coepia-mise-à-disposition-et-valorisation-des-données-publiques20120313 coepia-mise-à-disposition-et-valorisation-des-données-publiques
20120313 coepia-mise-à-disposition-et-valorisation-des-données-publiques
 
20110728 datalift-rpi-troy
20110728 datalift-rpi-troy20110728 datalift-rpi-troy
20110728 datalift-rpi-troy
 
Datalift a-catalyser-for-the-web-of-data-fosdem-05-02-2011
Datalift a-catalyser-for-the-web-of-data-fosdem-05-02-2011Datalift a-catalyser-for-the-web-of-data-fosdem-05-02-2011
Datalift a-catalyser-for-the-web-of-data-fosdem-05-02-2011
 
Cemagref
CemagrefCemagref
Cemagref
 
Melinda: Methods and tools for Web Data Interlinking
Melinda: Methods and tools for Web Data InterlinkingMelinda: Methods and tools for Web Data Interlinking
Melinda: Methods and tools for Web Data Interlinking
 
Méthodes et outils pour interrelier le web des données
Méthodes et outils pour interrelier le web des donnéesMéthodes et outils pour interrelier le web des données
Méthodes et outils pour interrelier le web des données
 
Linked Data Integration
Linked Data IntegrationLinked Data Integration
Linked Data Integration
 
Ontology alignment representation
Ontology alignment representationOntology alignment representation
Ontology alignment representation
 

Publication et intégration de données ouvertes

  • 1. Publication et intégration de données ouvertes François Scharffe LIRMM, UM2 Gazouillez #lechatpito #datalift Matinée Open Data, Montpellier, 28 Nov 2013 1
  • 2. Qu’est-ce qu’une donnée ouverte ? • Une donnée accessible sur le web sous une licence ouverte. • Notre contexte est plus large: – Données accessibles sous condition – Licences de différents types Matinée Open Data, Montpellier, 28 Nov 2013 2
  • 3. Données Ouvertes • Un sujet très à la mode … ● Motion du G8 pour l’ouverture et la transparence des données ● Directives de l’UE (Open Data, Inspire) ● Etalab et data.gouv.fr ● Open Data France • … qui amène de nouvelles problématiques ● Sous quel(s) format(s) publier les données ? ● De quelle façon y accéder ? ● Différents niveaux d’ouverture ? Matinée Open Data, Montpellier, 28 Nov 2013 ● respect de la vie privée, etc 3
  • 4. Partons en voyage... Matinée Open Data, Montpellier, 28 Nov 2013 4
  • 5. Problème de planning Matinée Open Data, Montpellier, 28 Nov 2013 5
  • 6. Problème de planning Matinée Open Data, Montpellier, 28 Nov 2013 6
  • 7. Une situation insuffisamment satisfaisante pour la valorisation de vos données Oblige les développeurs à : Ø Analyser à chaque fois la sémantique de vos données : qu'est-ce que veut dire ce champ “nom” ? signifie-t-il la même chose que dans cet autre jeu de données ? Ø Découvrir par eux-mêmes les relations entre vos données et d'autres données Ø Gérer des formats hétérogènes pour croiser des données : CSV pour tel jeu de données, XLS pour tel autre, SHP pour ce dernier Ø Gérer des méthodes d'accès hétérogènes pour accéder aux données : APIs propriétaires différentes De votre côté : Ø Temps passé à développer des APIs Ø Difficulté à faire adapter des applications existantes à vos données Matinée Open Data, Montpellier, 28 Nov 2013 7
  • 8. Le Web sémantique comme solution Ø Un système d'identifiants global : les URIs ● chaque donnée ou métadonnée est identifiée de manière non ambigue : http://dbpedia.org/resource/Paris est la ville de Paris en France ; pas de risque de confusion avec Paris au Texas ou avec les paris sportifs Ø Un format unique, RDF : un modèle de données simple pour décrire vos données, extensif à l'infini Ø La standardisation de la sémantique de vos données, à travers des propriétés et des “vocabulaires” réutilisables : par ex. vous n'avez pas à réinventer pas la propriété “auteur” qui est déjà définie ailleurs Ø Un protocole d'acccès uniforme : HTTP, SPARQL ● SPARQL est l'API unique, normalisée, du web sémantique (ressemble à SQL) Open Data, Montpellier, 28 Nov 2013 Matinée 8
  • 9. Datalif De données brutes ouvertes à des données sémantiques interconnectées Matinée Open Data, Montpellier, 28 Nov 2013 9
  • 10. Datalift Plateforme logicielle pour assister la publication de données Publication de jeux de données R&D pour automatiser le processus de publication Formations, tutoriels, camps de publication de données Matinée Open Data, Montpellier, 28 Nov 2013 10
  • 11. Le processus d'élévation Matinée Open Data, Montpellier, 28 Nov 2013 11
  • 12. Le processus de publication DBPedia IGN INSEE Accès HTTP Interrogation en SPARQL Ontologie du service public Ontologie géographique Conversion RDF → RDF Conversion XML → RDF Matinée Open Data, Montpellier, 28 Nov 2013 12
  • 13. sélection Ø Qu’est-ce qu’un (bon) vocabulaire pour des données liées? § Critères d’utilisabilité § Simplicité, visibilité, pérennité, intégration, cohérence … Ø Différents types de vocabulaires § De métadonnées, de référence, de domaine, généraliste … § Les piliers du Linked Data : Dublin Core, FOAF, SKOS Ø Bonnes et moins bonnes pratiques § Ex : Programmes BBC vs legislation.gov.uk § Vocabulary of a Friend : les vocabulaires en réseau Ø Problèmes linguistiques § Les vocabulaires existants sont en anglais à 99% § Approche terminologique : quels vocabulaires pour « Evénement » « Organisation » Matinée Open Data, Montpellier, 28 Nov 2013 13
  • 14. conversion Ø Guide des bonnes pratiques pour les données liées: § La ressource: http://id.insee.fr/geo/commune/75056 – Le document: http://www.insee.fr/geo/commune/75056 – Les données: http://rdf.insee.fr/geo/commune/75056 Matinée Open Data, Montpellier, 28 Nov 2013 14
  • 15. conversion Ø Guide des bonnes pratiques pour les données liées: § La ressource: http://id.insee.fr/geo/commune/75056 – Le document: http://www.insee.fr/geo/commune/75056 – Les données: http://rdf.insee.fr/geo/commune/75056 Matinée Open Data, Montpellier, 28 Nov 2013 15
  • 16. Managing licenses and access rights on published data Matinée Open Data, Montpellier, 28 Nov 2013 16
  • 17. publication § Utiliser le format RDF § Utiliser des URI pour nommer les choses § Utiliser des URI HTTP (URL) pour pouvoir leur demander des informations § Donner des informations (HTML, RDF) quand les liens sont dé-référencés § Inclure dans ces infos les URIs pointant vers d'autres données pour permettre la découverte Tim Berners Lee, SemWebPro 18/01/2011 17 http://www.w3.org/DesignIssues/LinkedData.html
  • 18. Interconnexion Dépasser l'hétérogénéité des données § § Comment identifier les jeux de données à lier ? Comment trouver les resources équivalentes ? SemWebPro 18/01/2011 18
  • 19. Et plus ... ● Gestion des droits d'accès aux données à échelle variable ● Gestion des licences, licences composites ● Une API web de données pour Androïd ● ● Des patrons configuration pour visualiser les données ... Matinée Open Data, Montpellier, 28 Nov 2013 19
  • 20. La plateforme Datalift ● Architecture modulaire ● Supporte le processus de publication ● Documentée : installation, utilisation, développement ● Sécurisée ● Open-source ● Exécutables pour Windows, OSX, Linux Matinée Open Data, Montpellier, 28 Nov 2013 20
  • 21. La plateforme Datalift Matinée Open Data, Montpellier, 28 Nov 2013 21
  • 22. Quelques jeux de données Matinée Open Data, Montpellier, 28 Nov 2013 22
  • 23. Datalift Platform Matinée Open Data, Montpellier, 28 Nov 2013 23
  • 24. Matinée Open Data, Montpellier, 28 Nov 2013 24
  • 25. Matinée Open Data, Montpellier, 28 Nov 2013 25
  • 26. Matinée Open Data, Montpellier, 28 Nov 2013 26
  • 27. DATALIFT En route vers le web de données Matinée Open Data, Montpellier, 28 Nov 2013 27