1. Web Sémantique _
Linked Data
Présenter par :
* MEGHERBI Nour El Houda
Maste2
2014-2015
Ontologie et web sémantique
Département d’Informatique
Sidi Bel Abbes
2. Introduction
•Dans le Web actuellement, les moteurs de recherche sont à peu près
incapables de comprendre le contenu des pages Web qu'ils indexent. Pour
répondre à une requête, ils font une recherche sur base des mots-clés fournis
par l'utilisateur sous certaines contraintes. Si on leur pose une question, ils vont
chercher les mots-clés de la question, ils ne vont pas répondre directement à la
question.
• Pour cela, il faut qu'il puisse comprendre le contenu des pages indexées. C'est
une large partie du Web sémantique.
3. 1.0
• Web des documents
• Annuaires, moteurs de recherche
2.0
• Web social
• Folksonomies
3.0
• Web des données (et des objets)
• Métadonnées et ontologies
• Linked Data
L’évolution du Web
4.0
• Web Intélligent
• La possibilité de travailler avec des outils uniquement en
ligne
4. En général
•Web 1.0 informations
•Web 2.0 la communication
•Web 3.0 connaissances
•Web 4.0 l'intelligence
5. Le web actuel
•Ensemble de données
•Basé essentiellement sur HTML
•L’utilisation est par l’humain
•La recherche est par mots clés
6. Le Moteur de Recherche (Google)
•Utilisez-vous Google pour rechercher de l’information ?
•Trouvez-vous toujours ce que vous cherchez ?
•Quels sont les problèmes ?
•Etes-vous satisfait ?
- Les réponses peuvent être diverses et même sans aucune relation avec le contexte de votre
requête. Nous avons besoin donc de comprendre le sens des termes pour fournir les
résultats attendus.
- Le Web classique , Ne permet de répondre qu’à deux types de requêtes :
• Quelles sont les pages contenant le terme X ?
• Quelles sont les pages les plus visitées au sujet de Y ?.
7. Pour Donner du sens aux données
• Nous somme obligée d'utiliser nos Connaissances
• dans des Domaines Spécifiques
• pour Identifier / Reconnaître ces données
• Connaissances partagées par des communautés
8. “I have a dream for the Web [in which computers] become capable of analyzing all
the data on the Web – the content, links, and transactions between people and
computers.”
– Tim Berners-Lee
9. C’est quoi le web sémantique
« The Semantic Web is a web of data, in some ways like a global database »
Tim Berners-Lee
• a été inventée par Tim Berners-Lee, en 2001.
• On l'appelle aussi : Web de données
• une extension du web actuel
• permet aux machines de comprendre la sémantique,
la signification de l'information sur le Web.
• Le Web sémantique rendre le contenu sémantique
des ressources Web interprétables non seulement par
l'homme mais aussi par la machine.
• Le partage structuré et intelligent des données, en
généralisant un système de métadonnées.
12. - URI -
Uniform Resource identifier
• Composant fondamental du Web actuel.
• Fournit une identification unique des ressources et même aussi les relations
entre ces ressources.
• Les URL sont des URI mais pas l'inverse.
13. - XML -
eXtensible Markup Language
• est un langage de balise
• permet de définir pas mal de chose a l'aide de son nombre infinie de balises.
• XML se contente d’imposer une syntaxe (quelques règles relativement
simples)
• Format standard d’échange à travers le Web
• XML est aujourd’hui un format d’échange de données et de documents.
14. - RDF -
Ressource description framework
• N’est pas a proprement dire un langage
• modèle conceptuel permettant de décrire toute donnée ;
• Basé sur le XML.
• Decrire les ressource sous forme de triplets (sujet, prédicat, objet) où le sujet
est la ressource à décrire, le prédicat une propriété applicable à ce sujet, et
l’objet une valeur de cette propriété »
• Le but: - Permet d’exprimer des Métadonnées
- Décrire des ressources de façon simple. … ect
17. RDFS- Schéma
• RDFS est une extension sémantique de RDF.
• (RDFS) donne les moyens de définir de tels vocabulaires : c’est (dans les
termes du W3C)
• un « langage de description de vocabulaires RDF »
• Il permet de déclarer des propriétés et des classes (ce qui en fait des
ressources identifiées par des URI et de spécifier la signature (en termes de
domaine et de portée) des propriétés.
• Langage pour les ontologies
18. - OWL -
• Langage d’ontologie que l’on utilise maintenant
• Basée sur le Langage XML
• Il utilise le langage de description
• OWL ajoute plus de vocabulaire pour décrire les propriétés et les classes :
comme avec les relations entre les classes, la cardinalité (par exemple
« exactement un »), l'égalité, le typage des propriétés, les caractéristiques de
propriétés (par exemple la symétrie), etc.
• Il y a 3 Sous langages OWL: Full ; DL, Lite
19. OWL Full contient tout ce que l’on a mentionné mais OWL Full n’est pas
décidable
OWL DL (Description Logic) première restriction qui :
– sépare Class, Thing, ObjectProperty, DatatypeProperty
– n’autorise pas: rdfs:Class, extension du méta-modèle, cardinalité sur
propriété transitive
OWL Lite seconde restriction (sur OWL DL) qui n’autorise pas l’Union ni les
cardinalité autre que 0 ou 1.
20. - SPARQL -
• Langage de requêtes sur les graphes RDF
• La structure d'une requête SPARQL est très similaire à celle employée dans le
langage SQL.
• Est un protocole qui permettra de rechercher, d'ajouter, de modifier ou de
supprimer des données RDF disponibles dans le Web .
22. L’adoption de Linked Data
au web sémantique
• L'application des technologies du web sémantique a été longtemps limitée au
domaine de la recherche.
• Une adoption plus large, par exemple dans le monde de l'entreprise, était
nécessaire pour faire de la vision du Web sémantique une réalité.
23. "the Semantic Web done
right"
•Tim Berners-Lee, l'inventeur du Web et la personne crédité à l'invention des
termes du Web sémantique et de données liées à décrit les données liées comme
étant:
•« the Semantic Web done right »
L’adoption de Linked Data
au web sémantique
24. •Le lancement de l'initiative « Linking Open Data » par le W3C en 2006
avait pour objectifs:
•promouvoir une vision du web comme une base de données globale.
•relier les données sur le web de la même façon que l'hypertexte permet de
relier des documents (les pages web).
25. C’est quoi donc les données liées?
« Linked Data is a relatively new way of thinking about how we publish data.
At present, there is a great deal of data on the Web, but it is either locked down
in a private database, or published in a way that is not very useful to
computers » [1]
26. C’est quoi donc les données liées?
Wikipedia définie les Données Liées comme
«Un terme utilisé pour décrire une meilleure pratique recommendée pour
l'exposition, le partage, et la connection de pièces de données, d'informations et
de connaissances au niveau du web sémantique en utilisant les URIs et le RDF»
27. Une réponse plus précise:
Les données Liées sont une composante du Web sémantique. en utilisant les
URI pour identifier des objets du Monde Réels, Négociation de contenu et des
documents RDF pour partager des informations sur le web.
28. Pourquoi les données liées ?
La réponse la plus simple est que les données liées est un moyen de partager les données que
nous avons toujours été désireux de partager, mais dans un format d'échange non-bibliothèque-
centrée.
Jusqu'à maintenant, le choix de partage de données avec la communauté web n’est pas très
populaire ou n’est pas très sémantiquement riche. Linked Data, en utilisant RDF comme une
syntaxe de description, fournit un cadre pour le partage des données sémantiquement riches
d'une manière Web convivial, ce qui résoud d'une manière ou d'une autre le problème de la
sémantique sur le web.
30. Défis des données liées et web
sémantique
Il existe une énorme masse d'informations non-structurée sur le web.
Difficile de convaincre tout le monde de suivre une méthode pour le partage de leur données.
Differents formats de représentation (HTML, JSON, XML, CSV, RDFa ...)
32. Données Liées sur le web
Exemples
DBPedia :
Une grande base de données liées sur le web, elle met le contenu de Wikipedia
valable sous-format RDF. Elle incorpore aussi des liens vers d'autres base de
données sur le web ; et donc elle forme une richesse qui fournit une meilleure
experience à l'utilisateur et aux applications.
37. Données Liées sur le web
Exemples
Facebook Open Graph Protocol:
Il propose une méthode pour attribuer des méta-données sur les objets. => par
ici
38. conclusion
Comme l'information est en croissance exponentielle, il devient plus difficile de
trouver ce qu'on cherche. Le web est un espace ouvert d'informations utiles (les
livres, la musique, les films). Si nous pouvons relier ces ensembles de données et
de lui donner une forme (relier chaque ensemble de données), le Web serait une
source gratuite et utile d'une gigantesque base de connaisance «structurée» . La
motivation derrière les données liées est de relier toutes les données ouvertes.