LES TECHNOLOGIES DU WEB APPLIQUÉES      AUX DONNÉES STRUCTURÉES                    2e partie : relier, réutiliser, partage...
SOMMAIRE1. Une interopérabilité basée sur les liens2. Les différents types de données du Linked Data3. Exemple de réutilis...
Dun Web de documents...Principes du Web 1.0»   Les documents (HTML)    contiennent des liens entre eux»   Le contenu nest ...
...à un Web dapplications...Principes du Web 2.0»   Les APIs permettent dexposer    les données structurées»   ... donc de...
... à un Web de données                                                        Principes du Linked Data»   Comme le Web, l...
Le problème de la diversité des modèles  Bibliothèques             Archives                  Musées Objets multiples    De...
Comment mélanger les données tout en préservant la saveur             unique de chaque domaine ?
Construire linteropérabilitéInteropérabilité par conversion et copie   Le plus petit dénominateur commun                MA...
Construire linteropérabilité                Modèle “hub and spoke”Plusieurs bases de données partagent le même référentiel
Construire linteropérabilité             “follow your nose”     Interopérabilité basée sur les liens
LES 4 PRINCIPES DU WEB DE DONNÉEShttp://dbpedia.org/resource/Smoking_pipe_%28tobacco%29 (1) Utiliser des URIs             ...
LES 4 PRINCIPES DU WEB DE DONNÉEShttp://dbpedia.org/resource/Smoking_pipe_%28tobacco%29    (1) Utiliser des URIs          ...
LES 4 PRINCIPES DU WEB DE DONNÉES                                            (2) Utiliser des URIs                        ...
LES 4 PRINCIPES DU WEB DE DONNÉEShttp://dbpedia.org/resource/Smoking_pipe_%28tobacco%29    (1) Utiliser des URIs          ...
2007Le « Linked Data » ou Web de données
2008Le « Linked Data » ou Web de données
2009Le « Linked Data » ou Web de données
Le « Linked Data » ou Web de données                     2011
SOMMAIRE1. Une interopérabilité basée sur les liens2. Les différents types de données du Linked  Data3. Exemple de réutili...
Linked data cloud en détail : ressources d’intérêt général                                                             20
Le projet DBPedia                    DBpedia est une initiative visant à extraire de l’information                    stru...
Linked data cloud en détail : ressources « sociales »                                                        22
Linked data cloud en détail : ressources géographiques                                                         23
Geonames et LinkedGeoData         Geonames est un système d’information géographique dont les         informations sont li...
Linked data cloud en détail : Les donnéesgouvernementales                                            25
Data.gov et Data.gov.ukA la suite de l’annonce de Barack Obama de mettre à disposition les données publiquesaméricaines, l...
Linked data cloud en détail : ressources multimédia                                                      27
Linked data cloud en détail : ressources biologiqueset médicales                                                       28
Linked data cloud en détail : ressourcesbibliographiques                                           29
Data.bnf.fr                         http://data.bnf.fr/11919216/charles_perrault/Fédérer les données des différentes bases...
SOMMAIRE1. Une interopérabilité basée sur les liens2. Les différents types de données du Linked Data3. Exemple de réutilis...
Réutiliser les données du LOD un exemple : “Monuments” (Antidot)   http://labs.antidot.net/demo/monuments/
Lexemple de “Monuments” • Travail sur des données publiques • Consolider des données éparses,     individuellement faibles...
Lexemple de “Monuments”• Maillage et enrichissement avec 6 sources   complémentaires : stations de métro, de   trains, bas...
Lexemple de “Monuments”  • Mailler les données
Lexemple de “Monuments”• Le moteur de recherche sémantique pour    créer simplement des applications riches    et faciles ...
Lexemple de “Monuments”
SOMMAIRE1. Une interopérabilité basée sur les liens2. Les différents types de données du Linked Data3. Exemple de réutilis...
Réutiliser les technologies du LOD  un exemple : le Centre Pompidou Virtuel                 http://beta2.centrepompidou.fr...
Le Centre Pompidou VirtuelLa production des ressources (numérisation, indexation, libérationdes droits) alimente des bases...
Le Centre Pompidou VirtuelLe Centre Pompidou Virtuel est une interface de publication, quiagrège les contenus produits par...
Le Centre Pompidou VirtuelModèle de données                         Œuvre                                                 ...
Le Centre Pompidou VirtuelModèle de données                                                                           A ét...
Le Centre Pompidou VirtuelModèle de données                                                          A été présentée à l’o...
LE LED – LINKED ENTERPRISE DATALe LED correspond à l’application des principes ettechnologies du Web sémantique à l’entrep...
Le LED dAntidot
Le LED dAntidot
Principes du LED  Faire émerger l’implicite
Le LED dAntidot• Pas de macro ontologie• Réutiliser les vocabulaires existants      – Foaf, Organization,      – Dublin Co...
Le LED dAntidot• Utilisation des référentiels et vocabulaires• Exploitation des données structurées• Pour les documents : ...
Le LED dAntidot
Principes du LEDDes applications métier
CONCLUSION       (POUR VOUS METTRE EN APPÉTIT)Data                                   Usages
Prochain SlideShare
Chargement dans…5
×

Les technologies du Web appliquées aux données structurées (2ème partie : Relier, réutiliser, partager, l'apport du Web de données)

4 368 vues

Publié le

Diaporama de la présentation effectuée au séminaire INRIA IST "Le document à l'heure du Web de données" (Carnac 1er-5 octobre 2012) en compagnie d'Emmanuelle Bermès (aka figoblog)

Publié dans : Technologie

Les technologies du Web appliquées aux données structurées (2ème partie : Relier, réutiliser, partager, l'apport du Web de données)

  1. 1. LES TECHNOLOGIES DU WEB APPLIQUÉES AUX DONNÉES STRUCTURÉES 2e partie : relier, réutiliser, partager Lapport du Web de données Gautier Poupeau Emmanuelle Bermès Antidot Centre Pompidou http://www.lespetitescases.net http://www.figoblog.org Twitter @lespetitescases Twitter @figoblog Séminaire INRIA – 1-5 octobre 2012
  2. 2. SOMMAIRE1. Une interopérabilité basée sur les liens2. Les différents types de données du Linked Data3. Exemple de réutilisation des données du LOD4. Exemple de réutilisation des technologies du LOD dans le contexte de lorganisation
  3. 3. Dun Web de documents...Principes du Web 1.0» Les documents (HTML) contiennent des liens entre eux» Le contenu nest pas structuré» On ne peut pas faire de requêtes» On ne sait pas lexploiter avec des machines
  4. 4. ...à un Web dapplications...Principes du Web 2.0» Les APIs permettent dexposer les données structurées» ... donc de créer de nouvelles applications» Mais chaque API est propriétaire» Chaque API nest valable que pour un « silo » de données» On ne peut pas faire de liens entre les données dun silo à lautre
  5. 5. ... à un Web de données Principes du Linked Data» Comme le Web, le Linked Data est un espace documentaire unifié, global, commun» On peut faire des liens dune donnée à une autre» Les données ne sont plus isolées dans des silos» Les APIs propriétaires sont remplacées par des standards ouverts (RDF, SPARQL, HTTP...)‫‏‬
  6. 6. Le problème de la diversité des modèles Bibliothèques Archives Musées Objets multiples Description hiérarchique Objets uniquesCatalogage partagé Contexte Description orientée Respect des fonds événement
  7. 7. Comment mélanger les données tout en préservant la saveur unique de chaque domaine ?
  8. 8. Construire linteropérabilitéInteropérabilité par conversion et copie Le plus petit dénominateur commun MARC OAI-PMH Z. 39 50 Dublin Core Simple SRU/SRW...
  9. 9. Construire linteropérabilité Modèle “hub and spoke”Plusieurs bases de données partagent le même référentiel
  10. 10. Construire linteropérabilité “follow your nose” Interopérabilité basée sur les liens
  11. 11. LES 4 PRINCIPES DU WEB DE DONNÉEShttp://dbpedia.org/resource/Smoking_pipe_%28tobacco%29 (1) Utiliser des URIs 11
  12. 12. LES 4 PRINCIPES DU WEB DE DONNÉEShttp://dbpedia.org/resource/Smoking_pipe_%28tobacco%29 (1) Utiliser des URIs (2) Utiliser des URIs accessibles via HTTP 12
  13. 13. LES 4 PRINCIPES DU WEB DE DONNÉES (2) Utiliser des URIs accessibles via HTTP (1) Utiliser des URIs(3) Donner l’accès aux données utiles enutilisant les standards SPARQL et RDF 13
  14. 14. LES 4 PRINCIPES DU WEB DE DONNÉEShttp://dbpedia.org/resource/Smoking_pipe_%28tobacco%29 (1) Utiliser des URIs (2) Utiliser des URIs accessibles via HTTP(3) Donner l’accès auxdonnées utiles enutilisant les standardsSPARQL et RDF (4) Exprimer l’URI des objets liés 14
  15. 15. 2007Le « Linked Data » ou Web de données
  16. 16. 2008Le « Linked Data » ou Web de données
  17. 17. 2009Le « Linked Data » ou Web de données
  18. 18. Le « Linked Data » ou Web de données 2011
  19. 19. SOMMAIRE1. Une interopérabilité basée sur les liens2. Les différents types de données du Linked Data3. Exemple de réutilisation des données du LOD4. Exemple de réutilisation des technologies du LOD dans le contexte de lorganisation
  20. 20. Linked data cloud en détail : ressources d’intérêt général 20
  21. 21. Le projet DBPedia DBpedia est une initiative visant à extraire de l’information structurée à partir de Wikipedia et à rendre cette information disponible sur le Web. DBPedia permet de faire des requêtes complexes sur les données de Wikipedia, et de relier d’autres ensembles de données du Web à Wikipedia. 3,64 millions de chose dont : 416,000 personnes, 526,000 lieux, 106,000 albums musicaux, 60,000 films, etc. http://dbpedia.org 1 milliard de triplets RDF‫‏‬ Mis au point et maintenu par Universität Leipzig, Freie Universität Berlin et la société OpenLink Software dans le cadre du projet 21
  22. 22. Linked data cloud en détail : ressources « sociales » 22
  23. 23. Linked data cloud en détail : ressources géographiques 23
  24. 24. Geonames et LinkedGeoData Geonames est un système d’information géographique dont les informations sont libres (CC BY). 8 millions d’emplacements géographiques(villes, monuments, montagnes…) dans le monde sont référencés et géotaggués ce quien fait un des référentiels géographiques les plus complets.En complément de Web services, les données sont accessibles selon les principes du Linked Data. HTML http://sws.geonames.org/6487834/ pour les humains RDF pour les machines LinkedGeoData est à OpenStreetMap ce que Dbpedia est à Wikipedia 320 millions de points géoréférencéshttp://linkedgeodata.org 25 millions d’itinéraires 24
  25. 25. Linked data cloud en détail : Les donnéesgouvernementales 25
  26. 26. Data.gov et Data.gov.ukA la suite de l’annonce de Barack Obama de mettre à disposition les données publiquesaméricaines, les initiatives dans le domaine se multiplient. Les principes du Linked Data sont aucœur de la réflexion, mais pas forcément utilisés. Data.gov.uk Data.govSous la direction de Nigel Shadbolt Initiative de Barack Obamaet Tim Berners-Lee 3500 ensembles de données7 500 ensembles de données Utilisation des technos du Web sémantiqueUtilisation des technos du Web sémantique 26
  27. 27. Linked data cloud en détail : ressources multimédia 27
  28. 28. Linked data cloud en détail : ressources biologiqueset médicales 28
  29. 29. Linked data cloud en détail : ressourcesbibliographiques 29
  30. 30. Data.bnf.fr http://data.bnf.fr/11919216/charles_perrault/Fédérer les données des différentes bases pour faciliter l’accès aux ressources 30
  31. 31. SOMMAIRE1. Une interopérabilité basée sur les liens2. Les différents types de données du Linked Data3. Exemple de réutilisation des données du LOD4. Exemple de réutilisation des technologies du LOD dans le contexte de lorganisation
  32. 32. Réutiliser les données du LOD un exemple : “Monuments” (Antidot) http://labs.antidot.net/demo/monuments/
  33. 33. Lexemple de “Monuments” • Travail sur des données publiques • Consolider des données éparses, individuellement faibles, pour créer une application riche. – La base : la source des monuments historiques français (fichier CSV contenant 43 720 lignes sur data.gouv.fr)
  34. 34. Lexemple de “Monuments”• Maillage et enrichissement avec 6 sources complémentaires : stations de métro, de trains, bases de photos et description de Wikipedia…
  35. 35. Lexemple de “Monuments” • Mailler les données
  36. 36. Lexemple de “Monuments”• Le moteur de recherche sémantique pour créer simplement des applications riches et faciles d’accès
  37. 37. Lexemple de “Monuments”
  38. 38. SOMMAIRE1. Une interopérabilité basée sur les liens2. Les différents types de données du Linked Data3. Exemple de réutilisation des données du LOD4. Exemple de réutilisation des technologies du LOD dans le contexte de lorganisation
  39. 39. Réutiliser les technologies du LOD un exemple : le Centre Pompidou Virtuel http://beta2.centrepompidou.fr Et à partir du 4/10/12 : http://www.centrepompidou.fr
  40. 40. Le Centre Pompidou VirtuelLa production des ressources (numérisation, indexation, libérationdes droits) alimente des bases sources, ou bases métier. Lesressources sont ensuites transformées pour publication dans leCentre Pompidou Virtuel. Libération des droits Transformation des ressources Ressources numériques Bases sources Publication dans Indexation le Centre Pompidou Virtuel 40
  41. 41. Le Centre Pompidou VirtuelLe Centre Pompidou Virtuel est une interface de publication, quiagrège les contenus produits par différentes sources. Celles-ci sontalimentées en fonction de l’activité de chaque secteur.Musée Bibliothèque Archives Dpu (dossiers Ircam (bases Agenda SAV (films Boutique Bpi(reproductions Kandinsky (documents pédagogiques) de données, (événements) DACA, (produits) (archivesdes œuvres) (documents numérisés) archives captations) Sonores, numérisés) sonores) ouvrages) Service Multimédia, DSIT : Analyse des besoins au regard des contenus nouveaux, mise en place de nouveaux outils. 41
  42. 42. Le Centre Pompidou VirtuelModèle de données Œuvre A été présentée à l’occasion de A créé Principalement, œuvres du musée Mais aussi : œuvre musicale (Ircam) Est reproduction de Evénement Conférence, exposition… A pour sujet Ressource Is about Quelque chose qui existe sous forme numérique (image, audio, vidéo, texte) Est enregistrement de Est reproduction de / Est enregistrement de concerne Personne Artistes, auteurs, collectifs d’artistes… Document Livres, Archives Collection e.g. Cabinet des Arts graphiques, Donation Nina Kandinsky… Lieu E.g. « Centre Pompidou » concerne 42
  43. 43. Le Centre Pompidou VirtuelModèle de données A été présentée à l’occasion de A créé Œuvre Est reproduction de Evénement A pour sujet Ressource Is about Is recording of Is reproduction of / Is recording of Is about Personne Fait partie de Document Est localisé dans Collection Is about Lieu 43
  44. 44. Le Centre Pompidou VirtuelModèle de données A été présentée à l’occasion de created Œuvre Is reproduction of Evénement Is about A pour sujet Ressource Concerne Est enregistrement de Is reproduction of / Is recording of Is about Personne Document Collection Lieu Is about Se déroule à 44
  45. 45. LE LED – LINKED ENTERPRISE DATALe LED correspond à l’application des principes ettechnologies du Web sémantique à l’entreprise
  46. 46. Le LED dAntidot
  47. 47. Le LED dAntidot
  48. 48. Principes du LED Faire émerger l’implicite
  49. 49. Le LED dAntidot• Pas de macro ontologie• Réutiliser les vocabulaires existants – Foaf, Organization, – Dublin Core, ORE, – Beatle (pour les issues)
  50. 50. Le LED dAntidot• Utilisation des référentiels et vocabulaires• Exploitation des données structurées• Pour les documents : text mining pour repérer les personnes, produits, projets …
  51. 51. Le LED dAntidot
  52. 52. Principes du LEDDes applications métier
  53. 53. CONCLUSION (POUR VOUS METTRE EN APPÉTIT)Data Usages

×