SlideShare une entreprise Scribd logo
1  sur  21
Echange et interopérabilité des données structurées (métadonnées) sur le Web Gautier Poupeau @lespetitescases http://www.lespetitescases.net
Niveau 1 : Interopérabilité de transport HTTP, le protocole ou langage de communication du Web
Niveau 2 : Interopérabilité syntaxique Information encodée Machine connectée Conversion Machine connectée Information encodée Information encodée Machine connectée Machine connectée Information encodée Une conversion est nécessaire si deux syntaxes d’encodage sont utilisées. Si tout le monde utilise une syntaxe standard et normalisée, pas de conversion. XML, une syntaxe standard et normalisée
Niveau 3 : Interopérabilité structurelle Chien Animal Une série de signes reliés forme une donnée Machine doit comprendre la donnée
Niveau 3 : Interopérabilité structurelle Chien Animal Une série de signes reliés forme une donnée La donnée est encodée  dans le cadre d’un document Machine doit comprendre la donnée Ne comprend pas la donnée mais qu’il s’agit d’un  paragraphe De plus, la donnée    est toujours vraie même en dehors de ce document. <html>  <head>   <title>Le chien</title>   </head>   <body>   <p>   le chien est un animal   </p>  </body> </html>
Niveau 3 : Interopérabilité structurelle Chien Animal Une série de signes reliés forme une donnée La donnée est encodée  dans le cadre d’un document Machine doit comprendre la donnée Ne comprend pas la donnée mais qu’il s’agit d’un  paragraphe De plus, la donnée    est toujours vraie même en dehors de ce document. La donnée elle-même est encodée sous la forme d’un triplet. La machine peut traiter et analyser la donnée car elle est encodée selon une logique formelle. <html>  <head>   <title>Le chien</title>   </head>   <body>   <p>   le chien est un animal   </p>  </body> </html> Sujet prédicat Objet chien animal est
Niveau 3 : Interopérabilité structurelle Chien Animal Une série de signes reliés forme une donnée La donnée est encodée  dans le cadre d’un document Machine doit comprendre la donnée Ne comprend pas la donnée mais qu’il s’agit d’un  paragraphe De plus, la donnée    est toujours vraie même en dehors de ce document. La donnée elle-même est encodée sous la forme d’un triplet. La machine peut traiter et analyser la donnée car elle est encodée selon une logique formelle. <html>  <head>   <title>Le chien</title>   </head>   <body>   <p>   le chien est un animal   </p>  </body> </html> Sujet prédicat Objet Sujet prédicat prédicat chien animal est RDF, un modèle pour encoder les données structurées
Niveau 4 : Interopérabilité sémantique Personne Person πρόσωπο persona
Niveau 4 : Interopérabilité sémantique Imaginez le problème pour les machines…
Niveau 4 : Interopérabilité sémantique RDFS/OWL, un moyen normalisé de décrire le vocabulaire pour les machines Imaginez le problème pour les machines… http://xmlns.com/foaf/0.1/Person
Le Web de données aujourd’hui
Wikipedia, Dbpedia et le Web de données 213,000 personnes, 328,000 lieux, 57,000 albums musicaux, 36,000 films, etc.  274 millions d’informations (triplets   RDF) ‏ DBpedia est une initiative visant à extraire de l’information structurée à partir de Wikipedia et à rendre cette information disponible sur le Web. DBPedia permet de faire des requêtes complexes sur les données de Wikipedia, et de relier d’autres ensembles de données du Web à Wikipedia. http://dbpedia.org Mis au point et maintenu par Universität Leipzig, Freie Universität Berlin et la société OpenLink Software dans le cadre du projet
Dbpedia et le problème de la qualité des données Mais, Dbpedia de par son origine pose différents problèmes
Dbpedia et le problème de la qualité des données Mais, Dbpedia de par son origine pose différents problèmes Que représente une page de Wikipedia sur un livre ? Une œuvre, une édition ? A quelle édition fait référence la mention d’éditeur et date de publication ?
Dbpedia et le problème de la qualité des données Mais, Dbpedia de par son origine pose différents problèmes Les données ne sont pas homogènes d’un article à l’autre
Dbpedia et le problème de la qualité des données Mais, Dbpedia de par son origine pose différents problèmes Certaines données sont incomplètes
Dbpedia et le problème de la qualité des données Mais, Dbpedia de par son origine pose différents problèmes Certains articles évoluent pour compléter les informations et ajouter des informations pour faciliter la mise en place de liens
Dbpedia et le problème de la qualité des données Mais, Dbpedia de par son origine pose différents problèmes Niveau transverse d’interopérabilité : La qualité des données Il ne s’agit pas d’un problème informatique, mais d’un problème de production et d’attention aux données
Dbpedia et le problème de la qualité des données Mais, Dbpedia de par son origine pose différents problèmes Malgré les quelques défauts mis en lumière, Dbpedia (et donc wikipedia) reste un formidable outil pour créer de nouvelles applications à partir de milliers de données structurées interopérables cf.  http://www.lespetitescases.net/semweblabs/linkedbookmashup/
En résumé Les différentes niveaux/couches d’interopérabilité TRANSPORT SYNTAXE STRUCTURE SÉMANTIQUE QUALITÉ DES DONNÉES HTTP XML RDF OWL/RDFS
Merci pour votre attention ,[object Object],[object Object],[object Object],[object Object]

Contenu connexe

Tendances

Metadonnees Introduction
Metadonnees IntroductionMetadonnees Introduction
Metadonnees Introduction
jbcomte
 

Tendances (20)

Découvrir le web sémantique en 15 minutes (Decideo 2014)
Découvrir le web sémantique en 15 minutes (Decideo 2014)Découvrir le web sémantique en 15 minutes (Decideo 2014)
Découvrir le web sémantique en 15 minutes (Decideo 2014)
 
Initiation à SPARQL avec Wikidata
Initiation à SPARQL avec WikidataInitiation à SPARQL avec Wikidata
Initiation à SPARQL avec Wikidata
 
Les professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesLes professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de données
 
Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...
Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...
Web sémantique, Web de données, Web 3.0, Linked Data... Quelques repères pour...
 
Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens. Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens.
 
Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?
 
Les ontologies et les graphes RDF
Les ontologies et les graphes RDFLes ontologies et les graphes RDF
Les ontologies et les graphes RDF
 
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
 
Introduction au Web sémantique
Introduction au Web sémantiqueIntroduction au Web sémantique
Introduction au Web sémantique
 
Enrichissement de Données RDF Integrées à la Volée - EGC2019 - AWD Workshop
Enrichissement de Données RDF Integrées à la Volée - EGC2019 - AWD WorkshopEnrichissement de Données RDF Integrées à la Volée - EGC2019 - AWD Workshop
Enrichissement de Données RDF Integrées à la Volée - EGC2019 - AWD Workshop
 
A la découverte du Web sémantique
A la découverte du Web sémantiqueA la découverte du Web sémantique
A la découverte du Web sémantique
 
Antidot Information Factory - AIF
Antidot Information Factory - AIFAntidot Information Factory - AIF
Antidot Information Factory - AIF
 
RDF en quelques slides
RDF en quelques slidesRDF en quelques slides
RDF en quelques slides
 
Metadonnees -- une typologie
Metadonnees -- une typologieMetadonnees -- une typologie
Metadonnees -- une typologie
 
Metadonnees Introduction
Metadonnees IntroductionMetadonnees Introduction
Metadonnees Introduction
 
Semantic web introduction
Semantic web introductionSemantic web introduction
Semantic web introduction
 
Le Web de données et les bibliothèques
Le Web de données et les bibliothèquesLe Web de données et les bibliothèques
Le Web de données et les bibliothèques
 
Web sémantique
Web sémantiqueWeb sémantique
Web sémantique
 
Introduction au web sémantique : quand le lient fait sens
Introduction au web sémantique : quand le lient fait sensIntroduction au web sémantique : quand le lient fait sens
Introduction au web sémantique : quand le lient fait sens
 
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physiqueVisite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
 

Similaire à Échange et interopérabilité des données structurées sur le Web

03 Web Semantique
03  Web Semantique03  Web Semantique
03 Web Semantique
badirh
 
Asterid: Linked Data Asterisms
Asterid: Linked Data AsterismsAsterid: Linked Data Asterisms
Asterid: Linked Data Asterisms
Gregoire Burel
 
Presentation dublincore l3
Presentation dublincore l3Presentation dublincore l3
Presentation dublincore l3
DublinCore2b
 

Similaire à Échange et interopérabilité des données structurées sur le Web (20)

Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information Systems
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information Systems
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information Systems
 
Web sémantique
Web sémantiqueWeb sémantique
Web sémantique
 
03 Web Semantique
03  Web Semantique03  Web Semantique
03 Web Semantique
 
Sudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de donnéesSudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de données
 
Web 3.0
Web 3.0Web 3.0
Web 3.0
 
interopérabilité en informatique
interopérabilité en informatiqueinteropérabilité en informatique
interopérabilité en informatique
 
Jabes 2011 - Ateliers "Sudoc, Calames, thèses.fr et le web de données"
Jabes 2011 - Ateliers "Sudoc, Calames, thèses.fr et le web de données"Jabes 2011 - Ateliers "Sudoc, Calames, thèses.fr et le web de données"
Jabes 2011 - Ateliers "Sudoc, Calames, thèses.fr et le web de données"
 
Asterid: Linked Data Asterisms
Asterid: Linked Data AsterismsAsterid: Linked Data Asterisms
Asterid: Linked Data Asterisms
 
Medialille evolutions catalogage_avril2014_web-donnees
Medialille evolutions catalogage_avril2014_web-donneesMedialille evolutions catalogage_avril2014_web-donnees
Medialille evolutions catalogage_avril2014_web-donnees
 
Databases for Bioinformatics
Databases for BioinformaticsDatabases for Bioinformatics
Databases for Bioinformatics
 
Modèles de données et langages de description ouverts 5 - 2021-2022
Modèles de données et langages de description ouverts   5 - 2021-2022Modèles de données et langages de description ouverts   5 - 2021-2022
Modèles de données et langages de description ouverts 5 - 2021-2022
 
Métadonnées de thèse
Métadonnées de thèseMétadonnées de thèse
Métadonnées de thèse
 
Cours BDD.pptx
Cours BDD.pptxCours BDD.pptx
Cours BDD.pptx
 
Visite guidée au pays de la donnée - Traitement automatique des données
Visite guidée au pays de la donnée - Traitement automatique des donnéesVisite guidée au pays de la donnée - Traitement automatique des données
Visite guidée au pays de la donnée - Traitement automatique des données
 
Isidore à l'interface de la rencontre des SHS et du Web de données
Isidore à l'interface de la rencontre des SHS et du Web de donnéesIsidore à l'interface de la rencontre des SHS et du Web de données
Isidore à l'interface de la rencontre des SHS et du Web de données
 
Panorama des logiciels de gestion de références bibliographiques
Panorama des logiciels de gestion de références bibliographiquesPanorama des logiciels de gestion de références bibliographiques
Panorama des logiciels de gestion de références bibliographiques
 
Presentation dublincore l3
Presentation dublincore l3Presentation dublincore l3
Presentation dublincore l3
 
Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)
 

Plus de Antidot

Antidot Content Classifier
Antidot Content ClassifierAntidot Content Classifier
Antidot Content Classifier
Antidot
 
Cas client CAIJ
Cas client CAIJCas client CAIJ
Cas client CAIJ
Antidot
 
Do’s and don'ts : la recherche interne aux sites de ecommerce
Do’s and don'ts : la recherche interne aux sites de ecommerceDo’s and don'ts : la recherche interne aux sites de ecommerce
Do’s and don'ts : la recherche interne aux sites de ecommerce
Antidot
 
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
Antidot
 
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
Antidot
 

Plus de Antidot (20)

Comment l'intelligence artificielle améliore la recherche documentaire
Comment l'intelligence artificielle améliore la recherche documentaireComment l'intelligence artificielle améliore la recherche documentaire
Comment l'intelligence artificielle améliore la recherche documentaire
 
Antidot Content Classifier - Valorisez vos contenus
Antidot Content Classifier - Valorisez vos contenusAntidot Content Classifier - Valorisez vos contenus
Antidot Content Classifier - Valorisez vos contenus
 
Comment l’intelligence artificielle réinvente la fouille de texte
Comment l’intelligence artificielle réinvente la fouille de texteComment l’intelligence artificielle réinvente la fouille de texte
Comment l’intelligence artificielle réinvente la fouille de texte
 
Antidot Content Classifier
Antidot Content ClassifierAntidot Content Classifier
Antidot Content Classifier
 
Cas client CAIJ
Cas client CAIJCas client CAIJ
Cas client CAIJ
 
Du Big Data à la Smart Information : comment valoriser les actifs information...
Du Big Data à la Smart Information : comment valoriser les actifs information...Du Big Data à la Smart Information : comment valoriser les actifs information...
Du Big Data à la Smart Information : comment valoriser les actifs information...
 
Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"
Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"
Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"
 
Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...
 
Flyer AFS@Store 2015 FR
Flyer AFS@Store 2015 FRFlyer AFS@Store 2015 FR
Flyer AFS@Store 2015 FR
 
WISS 2015 - Machine Learning lecture by Ludovic Samper
WISS 2015 - Machine Learning lecture by Ludovic Samper WISS 2015 - Machine Learning lecture by Ludovic Samper
WISS 2015 - Machine Learning lecture by Ludovic Samper
 
Do’s and don'ts : la recherche interne aux sites de ecommerce
Do’s and don'ts : la recherche interne aux sites de ecommerceDo’s and don'ts : la recherche interne aux sites de ecommerce
Do’s and don'ts : la recherche interne aux sites de ecommerce
 
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
 
Synergie entre intranet collaboratif et recherche sémantique : le cas des hôp...
Synergie entre intranet collaboratif et recherche sémantique : le cas des hôp...Synergie entre intranet collaboratif et recherche sémantique : le cas des hôp...
Synergie entre intranet collaboratif et recherche sémantique : le cas des hôp...
 
En 2015, quelles sont les bonnes pratiques du searchandising ?
En 2015, quelles sont les bonnes pratiques du searchandising ?En 2015, quelles sont les bonnes pratiques du searchandising ?
En 2015, quelles sont les bonnes pratiques du searchandising ?
 
Comment tirer profit des données publiques ouvertes dans un mashup web grâce ...
Comment tirer profit des données publiques ouvertes dans un mashup web grâce ...Comment tirer profit des données publiques ouvertes dans un mashup web grâce ...
Comment tirer profit des données publiques ouvertes dans un mashup web grâce ...
 
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
 
Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...
Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...
Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...
 
Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...
Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...
Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...
 
Comment sélectionner, qualifier puis exploiter les données ouvertes
Comment sélectionner, qualifier puis exploiter les données ouvertesComment sélectionner, qualifier puis exploiter les données ouvertes
Comment sélectionner, qualifier puis exploiter les données ouvertes
 
Wikidata : quand Wikipédia s'intéresse aux données
Wikidata : quand Wikipédia s'intéresse aux donnéesWikidata : quand Wikipédia s'intéresse aux données
Wikidata : quand Wikipédia s'intéresse aux données
 

Échange et interopérabilité des données structurées sur le Web

  • 1. Echange et interopérabilité des données structurées (métadonnées) sur le Web Gautier Poupeau @lespetitescases http://www.lespetitescases.net
  • 2. Niveau 1 : Interopérabilité de transport HTTP, le protocole ou langage de communication du Web
  • 3. Niveau 2 : Interopérabilité syntaxique Information encodée Machine connectée Conversion Machine connectée Information encodée Information encodée Machine connectée Machine connectée Information encodée Une conversion est nécessaire si deux syntaxes d’encodage sont utilisées. Si tout le monde utilise une syntaxe standard et normalisée, pas de conversion. XML, une syntaxe standard et normalisée
  • 4. Niveau 3 : Interopérabilité structurelle Chien Animal Une série de signes reliés forme une donnée Machine doit comprendre la donnée
  • 5. Niveau 3 : Interopérabilité structurelle Chien Animal Une série de signes reliés forme une donnée La donnée est encodée dans le cadre d’un document Machine doit comprendre la donnée Ne comprend pas la donnée mais qu’il s’agit d’un paragraphe De plus, la donnée est toujours vraie même en dehors de ce document. <html> <head> <title>Le chien</title> </head> <body> <p> le chien est un animal </p> </body> </html>
  • 6. Niveau 3 : Interopérabilité structurelle Chien Animal Une série de signes reliés forme une donnée La donnée est encodée dans le cadre d’un document Machine doit comprendre la donnée Ne comprend pas la donnée mais qu’il s’agit d’un paragraphe De plus, la donnée est toujours vraie même en dehors de ce document. La donnée elle-même est encodée sous la forme d’un triplet. La machine peut traiter et analyser la donnée car elle est encodée selon une logique formelle. <html> <head> <title>Le chien</title> </head> <body> <p> le chien est un animal </p> </body> </html> Sujet prédicat Objet chien animal est
  • 7. Niveau 3 : Interopérabilité structurelle Chien Animal Une série de signes reliés forme une donnée La donnée est encodée dans le cadre d’un document Machine doit comprendre la donnée Ne comprend pas la donnée mais qu’il s’agit d’un paragraphe De plus, la donnée est toujours vraie même en dehors de ce document. La donnée elle-même est encodée sous la forme d’un triplet. La machine peut traiter et analyser la donnée car elle est encodée selon une logique formelle. <html> <head> <title>Le chien</title> </head> <body> <p> le chien est un animal </p> </body> </html> Sujet prédicat Objet Sujet prédicat prédicat chien animal est RDF, un modèle pour encoder les données structurées
  • 8. Niveau 4 : Interopérabilité sémantique Personne Person πρόσωπο persona
  • 9. Niveau 4 : Interopérabilité sémantique Imaginez le problème pour les machines…
  • 10. Niveau 4 : Interopérabilité sémantique RDFS/OWL, un moyen normalisé de décrire le vocabulaire pour les machines Imaginez le problème pour les machines… http://xmlns.com/foaf/0.1/Person
  • 11. Le Web de données aujourd’hui
  • 12. Wikipedia, Dbpedia et le Web de données 213,000 personnes, 328,000 lieux, 57,000 albums musicaux, 36,000 films, etc. 274 millions d’informations (triplets RDF) ‏ DBpedia est une initiative visant à extraire de l’information structurée à partir de Wikipedia et à rendre cette information disponible sur le Web. DBPedia permet de faire des requêtes complexes sur les données de Wikipedia, et de relier d’autres ensembles de données du Web à Wikipedia. http://dbpedia.org Mis au point et maintenu par Universität Leipzig, Freie Universität Berlin et la société OpenLink Software dans le cadre du projet
  • 13. Dbpedia et le problème de la qualité des données Mais, Dbpedia de par son origine pose différents problèmes
  • 14. Dbpedia et le problème de la qualité des données Mais, Dbpedia de par son origine pose différents problèmes Que représente une page de Wikipedia sur un livre ? Une œuvre, une édition ? A quelle édition fait référence la mention d’éditeur et date de publication ?
  • 15. Dbpedia et le problème de la qualité des données Mais, Dbpedia de par son origine pose différents problèmes Les données ne sont pas homogènes d’un article à l’autre
  • 16. Dbpedia et le problème de la qualité des données Mais, Dbpedia de par son origine pose différents problèmes Certaines données sont incomplètes
  • 17. Dbpedia et le problème de la qualité des données Mais, Dbpedia de par son origine pose différents problèmes Certains articles évoluent pour compléter les informations et ajouter des informations pour faciliter la mise en place de liens
  • 18. Dbpedia et le problème de la qualité des données Mais, Dbpedia de par son origine pose différents problèmes Niveau transverse d’interopérabilité : La qualité des données Il ne s’agit pas d’un problème informatique, mais d’un problème de production et d’attention aux données
  • 19. Dbpedia et le problème de la qualité des données Mais, Dbpedia de par son origine pose différents problèmes Malgré les quelques défauts mis en lumière, Dbpedia (et donc wikipedia) reste un formidable outil pour créer de nouvelles applications à partir de milliers de données structurées interopérables cf. http://www.lespetitescases.net/semweblabs/linkedbookmashup/
  • 20. En résumé Les différentes niveaux/couches d’interopérabilité TRANSPORT SYNTAXE STRUCTURE SÉMANTIQUE QUALITÉ DES DONNÉES HTTP XML RDF OWL/RDFS
  • 21.