Comment sélectionner, qualifier puis exploiter les données ouvertes
Le Web de données ou comment gérer l'interopérabilité ?
1. Le Web de données
ou comment gérer l’interopérabilité ?
Séminaire Club Capital
De la révolution numérique à la civilisation numérique
13 décembre 2012, docForum, Lyon
Gautier Poupeau
gpoupeau@antidot.net
@lespetitescases
http://www.lespetitescases.net
1
2. L’enjeu
« Pour exister en ligne, une œuvre […] doit aussi être pourvue de
métadonnées fiables et complètes. Or, les bases gérées
par les sociétés de perception et de répartition des droits souffrent
d’un triple manque de fiabilité, d’interopérabilité et
d’ouverture aux développeurs. »
2
3. L’enjeu
« Pour exister en ligne, une œuvre […] doit aussi être pourvue de
métadonnées fiables et complètes. Or, les bases gérées
par les sociétés de perception et de répartition des droits souffrent
d’un triple manque de fiabilité, d’interopérabilité et
d’ouverture aux développeurs. »
Bilan d’étape Mission Culture-acte 2
Paru le 6 décembre 2012
3
4. L’enjeu
« Pour exister en ligne, une œuvre […] doit aussi être pourvue de
métadonnées fiables et complètes. Or, les bases gérées
par les sociétés de perception et de répartition des droits souffrent
d’un triple manque de fiabilité, d’interopérabilité et
d’ouverture aux développeurs. »
Bilan d’étape Mission Culture-acte 2
Paru le 6 décembre 2012
Ou plus connu sous la dénomination « Mission Lescure »
4
5. Le Web de documents
Un dispositif technologique pour mettre à disposition, lier et partager
des documents sur un réseau de machines connectées.
Un mécanisme Un mécanisme
de communication d'identification
HTTP URI
Encoder le message
Interpréter le code Relier les documents
HTML Le navigateur Web Le lien hypertexte
5
6. Les limites du Web de documents
Pas de structuration du message
Pas de requêtes structurées
Exploitation complexe par les machines
du message de la page Web
Liens non typés entre les pages
6
7. A la recherche d’une solution
Le formulaire de recherche
ou la « webification » à marche forcée des bases de données
Ce que vous voyez
7
8. A la recherche d’une solution
Le formulaire de recherche
ou la « webification » à marche forcée des bases de données
Ce que vous voyez Ce que voient les machines
web invisible/profond
8
9. A la recherche d’une solution
Le protocole OAI-PMH
ou comment mettre en place une rustine pour échanger des
données
Le plus grand dénominateur commun
9
10. A la recherche d’une solution
Les APIs Web
ou comment contrôler les données sous le couvert de l’ouverture
10
11. A la recherche d’une solution
Les APIs Web
ou comment contrôler les données sous le couvert de l’ouverture
Les données restent dans les silos
Les APIs sont propriétaires 11
12. A la recherche d’une solution
La folksonomie
ou comment penser que la masse fait la sémantique
12
13. A la recherche d’une solution
La folksonomie
ou comment penser que la masse fait la sémantique
Pas de référentiel, Pas de structure, pas de sens
juste des chaînes de caractères 13
14. Un nouveau paradigme
Casser la logique des silos de données
http://www.flickr.com/photos/library_of_congress/2178285893/ 14
15. Un nouveau paradigme
Placer les données dans le Web
Rendre le Web invisible visible
15
16. Un nouveau paradigme
Construire un Web de données
Lier des « choses » avec des standards ouverts
dans un espace unifié
16
17. Un nouveau paradigme
Créer une langage pour les machines
HTTP URI
Des règles
Une grammaire Des vocabulaires
d’écriture Des moyens
de communication
RDF RDFS/OWL RDF/XML, N3
SPARQL
Turtle, RDFa 17
18. Des identifiants
Attribuer des URIs aux choses
http://www.mied.org/personne/Eugene_Delacroix
http://www.mied.org/oeuvre/Liberte_guidant_le_peuple
http://www.mied.org/institution/Louvre
http://www.mied.org/lieu/Paris
http://www.mied.org/concept/Romantisme
http://www.mied.org/concept/Tableau
18
19. Une grammaire
Exprimer des faits sur les choses sous la forme
d’une phrase simple ou triplets
sujet objet
prédicat
http://www.mied.org/personne/Eugene_Delacroix
http://www.mied.org/ontologie/auteur
http://www.mied.org/oeuvre/Liberte_guidant_le_peuple
19
20. Dépasser la chaîne de caractères
Disposer d’une URI pour désambigüiser
les chaînes de caractères
est mort à
“Paris”
?
20
21. Dépasser la chaîne de caractères
et pour produire de nouvelles assertions
sur cette chose
est mort à
http://www.mied.org/lieu/Paris
est un
fait partie de
label label
“Paris”@fr “Parigi”@it
21
22. Le graphe
L'ensemble des triplets, reliés les uns aux autres par
les URI qu’ils ont en commun, constitue un graphe.
est contemporain de
est un
est l'auteur de
est mort à est un
est mort à est conservé au
se trouve à
est un
est conservé au
22
23. Les principes du Web de données
http://dbpedia.org/resource/
Smoking_pipe_%28tobacco%29
Utiliser des URIs
Source : http://www.w3.org/2009/Talks/0204-ted-tbl/#%281%29
23
24. Les principes du Web de données
http://dbpedia.org/resource/
Smoking_pipe_%28tobacco%29
Utiliser des URIs Utiliser des URIs
accessibles via HTTP
Source : http://www.w3.org/2009/Talks/0204-ted-tbl/#%281%29
24
25. Les principes du Web de données
http://dbpedia.org/resource/
Smoking_pipe_%28tobacco%29
Utiliser des URIs Utiliser des URIs
accessibles via HTTP
Exprimer
Source : http://www.w3.org/2009/Talks/0204-ted-tbl/#%281%29 l’URI des objets liés
25
26. Les principes du Web de données
http://dbpedia.org/resource/
Smoking_pipe_%28tobacco%29
Utiliser des URIs Utiliser des URIs
accessibles via HTTP
Donner l’accès aux
données utiles en utilisant Exprimer
les standards SPARQL et Source : http://www.w3.org/2009/Talks/0204-ted-tbl/#%281%29 l’URI des objets liés
RDF
26