Introduction au Web Sémantique
L’idée du web sémantique
L’idée du web sémantique <ul><li>  Tim Berners-Lee définie le  </li></ul><ul><li>Web Sémantique  </li></ul><ul><li>comme “...
L’idée du web sémantique <ul><li>Le web sémantique permet l’intégration de différents contenus, applications et systèmes. ...
<ul><li>CONTINUITÉS ET RUPTURES </li></ul><ul><li>DE QUOI EST CE COMPOSÉ ? </li></ul><ul><li>POUR QUOI FAIRE ? </li></ul>W...
Continuités et ruptures
Mise en perspective : continuités et ruptures
 
 
Organisation des contenus
Une continuité dans les besoins <ul><li>Les technologies du web sémantique sont d’abord adoptées par  les secteurs qui ont...
Une évolution de l’internet <ul><li>INTERNET (~1970) </li></ul><ul><ul><li>Réseau de  machines   identifiées, connectées e...
Rupture technologique <ul><li>Besoins: </li></ul><ul><ul><li>Se faire aider des machines pour organiser, filtrer, relier, ...
Rupture organisationnelle <ul><li>Rupture des processus de travail sur la connaissance </li></ul><ul><ul><li>Possibilité d...
<ul><li>UN CONCEPT </li></ul><ul><li>DES EXPERTISES ET MÉTIERS </li></ul><ul><li>DES STANDARDS </li></ul><ul><li>DES RESSO...
Un concept Date parution  «1874 »  Attributs Sujet Relation Livre « Quatrevingt-treize» Sujet livre  «la révolution fancai...
Des expertises et métiers <ul><li>Ingénierie des connaissances </li></ul><ul><li>Linguistique </li></ul><ul><li>Logique, R...
Des standards identity URI XML alphabet UNICODE data interchange RDF query SPARQL ontology OWL rule RIF
Des standards : URI URI identifiant la langue http://www.lingvoj.org/lang/gd URI identifiant la description RDF http://www...
Des standards : URI URI de la classe « Person » dans l’ontologie FOAF http://xmlns.com/foaf/0.1/Person et sa description s...
Des standards : RDF sur un exemple <ul><li>Un roman de Victor Hugo et ses métadonnées </li></ul><ul><ul><li>Titre :  Quatr...
Des standards : RDF Description de « Quatrevingt-treize » en RDF <ul><li>URI utilisée pour le référent </li></ul><ul><ul><...
Des standards  Le même exemple en syntaxe RDF-XML <ul><li><?xml version=&quot;1.0&quot; encoding=&quot;UTF-8&quot;?> </li>...
Des standards : SPARQL - Requêter RDF  <ul><li>SPARQL est un langage de requête adapté à RDF </li></ul><ul><ul><li>SPARQL ...
Des standards : OWL Vocabulaires de niveau 2 : langages d’ontologie <ul><li>RDF seul ne permet pas de raisonnement </li></...
Des standards : OWL  Vocabulaires de niveau 2 : langages d’ontologie <ul><li>Réutiliser des ontologies génériques  </li></...
Des ontologies réutilisables et réutilisées (cf voaf Linked open vocabulary)  http://labs.mondeca.com/dataset/lov/index.ht...
Des composants logiciels Base de données RDF Triple Store Raisonnement Inférence Editeur d’ontologie Editeur de taxonomies...
<ul><li>GÉRER, PUBLIER DES DONNÉES DE RÉFÉRENCE </li></ul><ul><li>GÉRER, PUBLIER DES BASES DE CONNAISSANCE </li></ul><ul><...
Gérer et Publier des données de référence <ul><li>Gérer et/ou publier des référentiels, taxonomies, thésaurus, représentat...
http://client2.mondeca.com/semanticportalRDF/
Gérer publier des bases de connaissances <ul><li>Des standards permettant de représenter des « connaissances »  </li></ul>...
 
<ul><li>Media, édition,  publicité,  </li></ul><ul><li>e-commerce, marketing, recherche… </li></ul><ul><li>Des contenus fi...
Gérer et publier du contenu intelligent  « smart content »
Publier des données ouvertes et reliées (LOD Linked Open Data)  <ul><li>Linked Open Data : des  méthodes  de publication d...
Linked open data
Publier des données ouvertes et reliées (LOD Linked Open Data)
 
<ul><li>2010 : 25 milliards de triplets RDF, 395 millions de liens RDF  </li></ul>2007 : 2 milliards de triplets RDF, 2 mi...
<ul><li>2010 : 25 milliards de triplets RDF, 395 millions de liens RDF  </li></ul>2007 : 2 milliards de triplets RDF, 2 mi...
Questions ? [email_address]
Prochain SlideShare
Chargement dans…5
×

Semantic web introduction

2 659 vues

Publié le

Publié dans : Technologie, Formation
0 commentaire
3 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
2 659
Sur SlideShare
0
Issues des intégrations
0
Intégrations
31
Actions
Partages
0
Téléchargements
0
Commentaires
0
J’aime
3
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive
  • Content managers in most market sectors exploit semantic technologies to derive more value from content. While initially these technologies were mainly used to improve integration, search, and interlinking, they are now increasingly leveraged in other aspects of content management and delivery, such as content contextualization, personalization, and discovery. This talk will explain why and how organizations should implement: semantic content annotation workflows automatic re-classification of content for a given context ontology based reasoning for user-centric content presentation semantics-driven faceted content navigation The talk will use real client examples for illustrations and will discuss cutting-edge technologies such as Microsoft Pivot.
  • Semantic web introduction

    1. 1. Introduction au Web Sémantique
    2. 2. L’idée du web sémantique
    3. 3. L’idée du web sémantique <ul><li>  Tim Berners-Lee définie le </li></ul><ul><li>Web Sémantique </li></ul><ul><li>comme “un web des données qui peut être directement utilisé par les machines “ </li></ul>
    4. 4. L’idée du web sémantique <ul><li>Le web sémantique permet l’intégration de différents contenus, applications et systèmes. </li></ul><ul><li>Il procure les mécanismes pour la réalisation de systèmes d’information d’entreprises. </li></ul>
    5. 5. <ul><li>CONTINUITÉS ET RUPTURES </li></ul><ul><li>DE QUOI EST CE COMPOSÉ ? </li></ul><ul><li>POUR QUOI FAIRE ? </li></ul>Web sémantique
    6. 6. Continuités et ruptures
    7. 7. Mise en perspective : continuités et ruptures
    8. 10. Organisation des contenus
    9. 11. Une continuité dans les besoins <ul><li>Les technologies du web sémantique sont d’abord adoptées par les secteurs qui ont une longue tradition de contenus organisés selon des référentiels métiers </li></ul>
    10. 12. Une évolution de l’internet <ul><li>INTERNET (~1970) </li></ul><ul><ul><li>Réseau de machines identifiées, connectées et adressables </li></ul></ul><ul><ul><ul><li>Correspond en gros à l’infrastructure des bibliothèques et rayons </li></ul></ul></ul><ul><li>WEB 1.0 (~1990) </li></ul><ul><ul><li>Réseau de ressources identifiées, connectées et adressables </li></ul></ul><ul><ul><ul><li>Correspond en gros au corpus documentaire </li></ul></ul></ul><ul><li>WEB sémantique (~ 2005) </li></ul><ul><ul><li>Réseau de concepts et entités identifiés, connectés, adressables </li></ul></ul><ul><ul><ul><li>Matérialisation du vocabulaire sous forme de ressources </li></ul></ul></ul>
    11. 13. Rupture technologique <ul><li>Besoins: </li></ul><ul><ul><li>Se faire aider des machines pour organiser, filtrer, relier, présenter, contextualiser…. les contenus </li></ul></ul><ul><ul><li>Se faire aider des machines pour modéliser, contrôler, publier, sélectionner… des connaissances </li></ul></ul><ul><li>-> Degré supérieur de formalisme pour pouvoir utiliser les machines dans le domaine de la connaissance </li></ul>
    12. 14. Rupture organisationnelle <ul><li>Rupture des processus de travail sur la connaissance </li></ul><ul><ul><li>Possibilité de travailler sur l’organisation de la connaissance en mode collaboratif, au niveau mondial, en faisant participer les organisations commerciales, services publiques, ong, particuliers WEB2.0 </li></ul></ul><ul><ul><li>Wikipedia -> dbpedia, Geonames, Astronomy… </li></ul></ul><ul><li>Possibilité de rapprocher, aligner, comparer, lier des connaissances distribuées, hétérogènes, complémentaires </li></ul><ul><ul><li>Europeana </li></ul></ul>
    13. 15. <ul><li>UN CONCEPT </li></ul><ul><li>DES EXPERTISES ET MÉTIERS </li></ul><ul><li>DES STANDARDS </li></ul><ul><li>DES RESSOURCES </li></ul><ul><li>DES COMPOSANTS LOGICIELS </li></ul>Le web sémantique de quoi est ce composé ?
    14. 16. Un concept Date parution «1874 »  Attributs Sujet Relation Livre « Quatrevingt-treize» Sujet livre «la révolution fancaise »  Auteur livre Personne « Victor Hugo» Sujet Attributs Titre livre «quatrevingt-treize»  Nom personne « Victor Hugo »
    15. 17. Des expertises et métiers <ul><li>Ingénierie des connaissances </li></ul><ul><li>Linguistique </li></ul><ul><li>Logique, Raisonnement </li></ul><ul><li>Base de données </li></ul><ul><li>Normes du web </li></ul><ul><li>Ingénierie informatique </li></ul><ul><li>Documentation </li></ul><ul><li>Bibliothéques </li></ul><ul><li>Archives </li></ul><ul><li>Passionnés, ONG… </li></ul><ul><ul><li>Wikipedia/dbpedia </li></ul></ul><ul><ul><li>Geonames </li></ul></ul><ul><ul><li>… </li></ul></ul>
    16. 18. Des standards identity URI XML alphabet UNICODE data interchange RDF query SPARQL ontology OWL rule RIF
    17. 19. Des standards : URI URI identifiant la langue http://www.lingvoj.org/lang/gd URI identifiant la description RDF http://www.lingvoj.org/lingvo/gd.rdf URI identifiant la description HTML http://www.lingvoj.org/lingvo/gd.html Redirection pour les navigateurs HTML Redirection pour les requêtes RDF
    18. 20. Des standards : URI URI de la classe « Person » dans l’ontologie FOAF http://xmlns.com/foaf/0.1/Person et sa description semi-formelle en RDF
    19. 21. Des standards : RDF sur un exemple <ul><li>Un roman de Victor Hugo et ses métadonnées </li></ul><ul><ul><li>Titre : Quatrevingt-treize </li></ul></ul><ul><ul><li>Année de parution : 1874 </li></ul></ul><ul><ul><li>Auteur : Victor Hugo </li></ul></ul><ul><ul><li>Sujet : La Révolution Française </li></ul></ul><ul><li>Ontologie implicite de ces métadonnées </li></ul><ul><ul><li>Un roman est un type de document </li></ul></ul><ul><ul><li>L’année de parution est une date </li></ul></ul><ul><ul><li>L’auteur est une personne </li></ul></ul><ul><li>Plusieurs niveaux de représentation possibles en RDF </li></ul><ul><ul><li>Représentation brute des triplets, sans référence à une ontologie </li></ul></ul><ul><ul><li>Déclaration explicite des classes et types utilisés </li></ul></ul><ul><ul><li>Définition de ces classes et types dans une ontologie, avec leurs contraintes </li></ul></ul>
    20. 22. Des standards : RDF Description de « Quatrevingt-treize » en RDF <ul><li>URI utilisée pour le référent </li></ul><ul><ul><li>Définie par la base de données DBpedia </li></ul></ul><ul><ul><li>http://dbpedia.org/resource/Ninety-Three </li></ul></ul><ul><ul><ul><li>Notation simplifiée : dbpedia:Ninety-Three </li></ul></ul></ul><ul><li>Schéma de métadonnées utilisé : Dublin Core </li></ul><ul><ul><li>Dublin Core “elements” pour les métadonnées de type “donnée” </li></ul></ul><ul><ul><li>Dublin Core “terms” pour les métadonnées de type “ressource” </li></ul></ul><ul><li>Triplets traduisant le titre et les métadonnées </li></ul><ul><li>dbpedia:Ninety-Three dc:title “Quatrevingt-treize” dbpedia:Ninety-Three dc:created “1874” </li></ul><ul><li>dbpedia:Ninety-Three dcterms:creator dbpedia:Victor_Hugo dbpedia:Ninety-Three dcterms:subject dbpedia:Category:French_Revolution </li></ul>
    21. 23. Des standards Le même exemple en syntaxe RDF-XML <ul><li><?xml version=&quot;1.0&quot; encoding=&quot;UTF-8&quot;?> </li></ul><ul><li><rdf:RDF </li></ul><ul><li>xmlns:rdf=&quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#&quot; </li></ul><ul><li>xmlns:dc=&quot;http://purl.org/dc/elements/1.1/&quot; </li></ul><ul><li>xmlns:dcterms=&quot;http://purl.org/dc/terms/” </li></ul><ul><li>xmlns:dbpedia=&quot;http://dbpedia.org/resource/&quot;> </li></ul><ul><li><rdf:Description rdf:about=&quot;http://dbpedia.org/resource/Ninety-Three&quot;> </li></ul><ul><li><dc:title xml:lang=&quot;fr&quot;>Quatrevingt-treize</dc:title> </li></ul><ul><li><dcterms:created>1874</dcterms:created> </li></ul><ul><li><dcterms:creator rdf:resource=&quot;http://dbpedia.org/resource/Victor_Hugo&quot;></ dcterms:creator> </li></ul><ul><li><dcterms:subject rdf:resource=&quot;http://dbpedia.org/resource/Category:French_Revolution&quot;/> </li></ul><ul><li></rdf:Description> </li></ul><ul><li></rdf:RDF> </li></ul>
    22. 24. Des standards : SPARQL - Requêter RDF <ul><li>SPARQL est un langage de requête adapté à RDF </li></ul><ul><ul><li>SPARQL est à RDF ce que SQL est aux bases de données relationnelles </li></ul></ul><ul><ul><li>C’est un langage adapté à la structure en graphe du RDF </li></ul></ul><ul><li>Exemples de requêtes SPARQL </li></ul><ul><ul><li>SELECT (ensemble de ressources correspondant à une définition sémantique) </li></ul></ul><ul><ul><ul><li>Ex 1 : Personnes employées par un organisme affilié au Ministère de l’Industrie? </li></ul></ul></ul><ul><ul><ul><li>Ex 2 : Documents dont un auteur est expert en sociologie de l’entreprise? </li></ul></ul></ul><ul><ul><li>CONSTRUCT (nouveau graphe à partir d’informations d’un graphe existant) </li></ul></ul><ul><ul><ul><li>Ex 1 : Attacher à la rubrique « Enseignement à distance » tous les documents dont l’éditeur est le CNED. </li></ul></ul></ul><ul><ul><ul><li>Ex 2 : Si un rapport a pour sujet X, créer un lien d’expertise entre l’auteur du rapport et ce sujet X. </li></ul></ul></ul><ul><li>SPARQL peut être utilisé sur le Web </li></ul><ul><ul><li>Via des interfaces de type « Web Service » appelés « SPARQL end points » </li></ul></ul><ul><ul><li>Voir http://esw.w3.org/topic/SparqlEndpoints </li></ul></ul>
    23. 25. Des standards : OWL Vocabulaires de niveau 2 : langages d’ontologie <ul><li>RDF seul ne permet pas de raisonnement </li></ul><ul><ul><li>Un ensemble de triplets est un ensemble de données brutes </li></ul></ul><ul><li>Les langages d’ontologie sont basés sur une logique formelle </li></ul><ul><ul><li>Ils introduisent la notion de cohérence logique </li></ul></ul><ul><li>Ils permettent de définir et contrôler des contraintes d’intégrité </li></ul><ul><ul><li>Est-ce que tous les triplets de ma base RDF sont cohérents entre eux ? </li></ul></ul><ul><ul><li>Est-ce que telle description est conforme à mon ontologie? </li></ul></ul><ul><li>Ils supportent des règles d’inférence </li></ul><ul><ul><li>Permettant de déduire de nouveaux triplets des triplets déclarés </li></ul></ul>
    24. 26. Des standards : OWL Vocabulaires de niveau 2 : langages d’ontologie <ul><li>Réutiliser des ontologies génériques </li></ul><ul><ul><ul><li>Dublin Core : métadonnées sur un document </li></ul></ul></ul><ul><ul><ul><li>FOAF : description des personnes, organisations et de leurs relations </li></ul></ul></ul><ul><ul><ul><li>SKOS : description de thésaurus, taxonomies, référentiels, listes contrôlées </li></ul></ul></ul><ul><ul><ul><li>… .. </li></ul></ul></ul><ul><li>Enrichir des ontologies génériques </li></ul><ul><ul><li>Ajouter une métadonnée supplémentaire à Dublin Core </li></ul></ul><ul><ul><li>Ajouter un attribut supplémentaire pour décrire les personnes dans FOAF </li></ul></ul><ul><li>Développer pour un métier, seul ou en collaboration avec d’autres utilisateurs potentiels, une ontologie spécialisée </li></ul>
    25. 27. Des ontologies réutilisables et réutilisées (cf voaf Linked open vocabulary) http://labs.mondeca.com/dataset/lov/index.html
    26. 28. Des composants logiciels Base de données RDF Triple Store Raisonnement Inférence Editeur d’ontologie Editeur de taxonomies, thésaurus référentiels, représentation des connaissances Editeur de règles Chaine d’annotation sémantique des contenus - Text mining Chaine de standardisation des données End point Sparql
    27. 29. <ul><li>GÉRER, PUBLIER DES DONNÉES DE RÉFÉRENCE </li></ul><ul><li>GÉRER, PUBLIER DES BASES DE CONNAISSANCE </li></ul><ul><li>GÉRER, PUBLIER DES CONTENUS INTELLIGENTS (SMART CONTENT) </li></ul><ul><li>PUBLIER DES DONNÉES OUVERTES ET RELIÉES (LINKED OPEN DATA) </li></ul><ul><li>BIG DATA </li></ul>Le web sémantique pour quoi faire?
    28. 30. Gérer et Publier des données de référence <ul><li>Gérer et/ou publier des référentiels, taxonomies, thésaurus, représentation de connaissances </li></ul><ul><ul><li>Liste des langues </li></ul></ul><ul><ul><li>Gemet </li></ul></ul><ul><ul><li>Eurovoc </li></ul></ul><ul><ul><li>FAO </li></ul></ul><ul><ul><li>Geonames </li></ul></ul><ul><ul><li>Référentiel géographique INSEE </li></ul></ul><ul><ul><li>Rameau </li></ul></ul><ul><ul><li>CIM10 </li></ul></ul><ul><ul><li>Gene ontology </li></ul></ul><ul><ul><li>… . </li></ul></ul><ul><li>Une ontologie générique : SKOS </li></ul><ul><li>Une sérialisation RDF pour distribuer des fichiers </li></ul><ul><li>Des services à base de sparql et web services </li></ul><ul><li>Répondre aux besoins d’alignement avec d’autres référentiels (ex Geonames-Insee) </li></ul>
    29. 31. http://client2.mondeca.com/semanticportalRDF/
    30. 32. Gérer publier des bases de connaissances <ul><li>Des standards permettant de représenter des « connaissances » </li></ul><ul><li>Des standards bien insérés dans les environnements web et intranet utilisés par les entreprises (xml, browser internet…) </li></ul><ul><ul><li>Base de pharmacovigilance </li></ul></ul><ul><ul><li>Inventaire du patrimoine artistique de la province du Limbourg </li></ul></ul><ul><ul><li>Inventaire des ressources touristiques de la Nièvre </li></ul></ul><ul><ul><li>Base de renseignement </li></ul></ul><ul><ul><li>Modélisation des composants d’une voiture et de leurs fonctions </li></ul></ul><ul><ul><li>… . </li></ul></ul>
    31. 34. <ul><li>Media, édition, publicité, </li></ul><ul><li>e-commerce, marketing, recherche… </li></ul><ul><li>Des contenus finement annotés, réutilisables, connectés pour </li></ul><ul><ul><li>Contextualisation </li></ul></ul><ul><ul><li>Connexion </li></ul></ul><ul><ul><li>Protection des droits </li></ul></ul><ul><ul><li>Automatisation de la publication </li></ul></ul><ul><ul><li>Automatisation des chaînes de production de contenus </li></ul></ul><ul><ul><li>Augmenter la valeur des services rendus en fusionnant contenus, connaissances, réseaux sociaux… </li></ul></ul>Gérer et publier du contenu intelligent « smart content »
    32. 35. Gérer et publier du contenu intelligent « smart content »
    33. 36. Publier des données ouvertes et reliées (LOD Linked Open Data) <ul><li>Linked Open Data : des méthodes de publication de données structurées, reliées, accessibles via le web et d’abord destinées aux machines </li></ul><ul><li>Linked Open Data : l’ ensemble des données structurées accessible sur le web et répondant aux standards minimaux du LOD (http, URI, RDF) </li></ul>
    34. 37. Linked open data
    35. 38. Publier des données ouvertes et reliées (LOD Linked Open Data)
    36. 40. <ul><li>2010 : 25 milliards de triplets RDF, 395 millions de liens RDF </li></ul>2007 : 2 milliards de triplets RDF, 2 millions de liens RDF Publier des données ouvertes et reliées (LOD Linked Open Data)
    37. 41. <ul><li>2010 : 25 milliards de triplets RDF, 395 millions de liens RDF </li></ul>2007 : 2 milliards de triplets RDF, 2 millions de liens RDF BIG DATA
    38. 42. Questions ? [email_address]

    ×