Les Systèmes d’Information SémantiquesS. Garlatti
PLANCours 1 (1h30) : Problématique, Problème1Cours 2 (1h30) : Le web sémantique, Cours 3 (3h00) :RDF / RDFS, les Ontologies, Cours 4 (3h00) :OWL, SKOS, SIOC, FOAFCours 5 (3H00) : Linked Data ou Web of Data, Le langageSparqlCours 6 (1H30) : Le web sémantique & social en Action
ProblématiqueHypothèsesSystèmes d'information (SI)Accessibles sur Internet et/ou Intranet A l’aide d'un navigateur Architecture distribuées fondée sur l’architecture du WebAppelés « Sémantiques » parce que fondés sur les principes du Web Sémantique
ProblématiqueEnjeu principal des SIRéutilisation, partage et échange des données sur internet / IntranetPar les machines (automatiquement)
ProblématiqueInternet / IntranetTechnologie pourAccéder à des informations non structurées, hétérogènes et distribuées L’accès à l’information et à des sources de connaissance devient essentielL’importance d’Internet est due :Aux services qu’il nous fournis: IRC, ICQ, Chat, email, News groups, FTP, WWW, E-commerce, B2B, B2C, etc.
ProblématiqueWWW : succès fondé sur sa simplicité, MAIS !Développé pour des lecteurs humainsLes données actuelles sont principalement organisées et structurées pour être simple à transmettre et être présentées à des humainsHTML et PDF sont principalement des langages de présentation de données <H2> Triple X </H2> : ne dit rien sur le titre sauf pour des humainsInternet est de plus en plus utilisé par des machines – search engines, robots, etc.
ProblématiqueProblèmesAccéder, traiter l’information, extraire et interpréter l’informationLa majorité des données sur le web est sous une forme qui ne permet pas de l’utiliser à grande échelle.Pas de système global de publication de données permettant aux machines et aux humains de les traiterÉvènements sportifs, météo, guides TV, guides cinéma, etc. sont présentés par de nombreux sites Web, mais presque tous au format HTML (structure logique + présentation)‏Comment trouver et extraire l’information pertinente pour différents services
ProblématiqueProblèmesEntrave la recherche, l’extraction, la maintenance et la génération d’informationActuellement, pas d’accès réel au contenu des documentsContenu et Information pas accessible ni interprétable par des machines
Semantic Web in Actionpage 9ProblématiqueProblèmesQualité de la recherche d’informationComment la machine peut-elle savoir que les résultats de la recherche sont pertinents ?Réutilisation des contenus de sites webComment peut-on réutiliser les contenus de sites web ?
Semantic Web in Actionpage 10ProblématiqueRecherche d’information de type GooglePolysémieNombre de résultats très importantRequête : « directeur » « André Chomette »Intention : On ne veut que le site de Telecom Bretagne !44 000 résultats : toutes les pages qui contiennent  ces deux termes ou l’un des deux
ProblématiqueComment donner dusensaux Données
ProblématiqueComment attribuons-nous du sens aux données ?Que voyez-vous ?
ProblématiqueQue voyez-vous ?
ProblématiqueQue voyez-vous ?
ProblématiqueQue voyez-vous ?
ProblématiqueQue voyez-vous ?
ProblématiqueQue voyez-vous ?
ProblématiqueQue voyez-vous ?
ProblématiqueQue voyez-vous ?
ProblématiqueQue voyez-vous ?
ProblématiqueShotokan-ryuGoju-ryuWado-ryuShito-ryuShorin-ryuQue voyez-vous ?
Problématique
Problématique Pour Donner du sens aux donnéesNous utilisons nos connaissancesdans des domaines spécifiques pour identifier / reconnaître ces donnéesConnaissances partagées par des communautés
page 24ProblématiqueDonner du sens aux informationsDescription du site Telecom BretagneForme générale d’une descriptionDes phrases de type : SujetVerbeComplémentExempleTelecom Bretagnea pour directeurAndré ChometteTelecom Bretagneest une grande école françaiseTelecom Bretagnea pour site web http://www.tele...
page 25ProblématiqueDonner du sens aux informationsCompréhension de ces phrasesDifférents contextes : différents termes« a pour directeur », « président », « Dean », …Interprétation commune liée à des connaissances communesUtilisation de vocabulaires standards partagés par tous !Chaque vocabulaire détermine unsens uniqueaux verbes, aux catégories de sujets et de compléments
page 26ProblématiquePlus formellement, ou presqueTelecom Bretagnedbpprop:presidentAndré Chomette (en)Telecom Bretagnedbpprop:typeFrench Grande Ecole (en)Telecom Bretagnedbpprop:websitehttp://www.tele...Questions French Grande Ecole dont André Chomette est président ??Grande_Ecoledbpprop:presidentAndré Chomette (en)?Grande_Ecoledbpprop:typeFrench Grande Ecole (en)
ProblématiqueSite DbpediaWikipedia + indexation sémantiquehttp://dbpedia.org/page/%C3%89cole_nationale_sup%C3%A9rieure_des_t%C3%A9l%C3%A9communications_de_Bretagne
Semantic Web in Actionpage 28Le Web sémantiqueObjectifsRéutilisation, partage, échange des donnéesAutomatisation ou semi-automatisation de certains services en réutilisant les donnéesMoyensLes données sont décrites / indexées de tel sorte que les contenus – sens et sémantique - du web soient « interprétables » par les machines.
Le Web sémantiqueLe Web sémantiqueLes données doivent être encodées de tel sorte que les contenus – sens et sémantique - du web soient plus « compréhensibles » pour les machines, ou en d’autres termes par des algorithmes.
Le Web sémantique
Le Web sémantiqueTim Berners-LeePremière vision du « Semantic Web »Accès automatique à l’information fondé sur une sémantique des données interprétable par l’ordinateur et des heuristiques utilisant celle-ci.Une sémantique explicite des données, associée à des théories sur des domaines (ontologies), permettra l’accès à de nouveaux services sur Internet
Le Web sémantiquePoint clé de l’automatisation ou de la semi-automatisationRecherche d’information pertinentes : Rappel et PrécisionRecherche d’information préciseRéutilisation, partage, échange  et composition possible des informations retrouvéesMais aussi, capacité à concevoir certaines « opérations  » automatiquementDonc pas de services élaborés possible : pas d’automatisation ou semi-automatisation de certains services ou tâchesComment assurer le B2B, B2C “automatiquement”Exemple: voyage complexe avec réservation,
Architecture du SWLe SW nécessite Une architecture partagée par tous pour échanger des ressources sur InternetDes standards pour Les ontologies et mécanismes d’inférence associésLa sémantique explicite des ressources ou méta données sémantiques liées  à des ontologiesLe format des ressources ou documentsL’adressage des ressources ou documents
Architecture du SW
Architecture du SW
Niveau Adressage /Nommage : URIURI : Uniform Resource Identifier (RFC 2396)‏Un simple identifieur WebChacun peut en créer – décentralisé -Ressource avec une URI  être sur le WebURL: ftp, gopher, http, internet mail, etc. (normalisée)‏1 Protocole, 1 machine, 1 cheminURN : URI persistenteW3C maintient une liste des schémas d’URI
Niveau Syntaxique: XMLXML : eXtensible Markup Language Sélection d’un sous-ensemble de SGML simple à implanter, mais néanmoins extensible : chacun défini ses propres balisesSéparation de la présentation et du contenuXML a été conçu pour décrire des donnéesLes balises XML ne sont pas prédéfinis. Vous devez définir vos propres balisesXML utilise un Document Type Definition (DTD) or an XML Schéma pour un « modèle » des données
Niveau Syntaxique: XMLXML n’est pas un remplacement d’HTMLHTML a été conçu pour afficher des données et se concentre surtout sur leur présentation (taille, couleur, etc.)XML a été conçu pour décrire des données et se concentre sur la structure de ces données.XML a été conçu pour assurer l’interopérabilitéXML et HTML sont complémentaireXSL / XSLT transforme XML en HTML
Niveau Syntaxique: XMLPropriétés de XMLIndépendant des logiciels et matériels Infrastructure des échanges de données structuréesInteropérabilité : conçu pour décrire des données, les stocker, les transporter et les échanger et les partagerXML DTD: une DTD défini les éléments constitutifs d’un documents. Il défini la structure syntaxique (un arbre) d’un document type à l’aide d’une grammaire.Il permet donc à toute application de vérifier la conformité d’un document à la DTDEt donc de manipuler et transformer celui-ci lorsqu’il est conforme à cette DTD.
Niveau Syntaxique: XMLXML peut être utilisé pour créer de nouveaux langagesXML est le prère de WAP et WML (Wireless Markup Language).MATHML, etc.
Niveau Syntaxique : XML<?xml version="1.0"?><!DOCTYPE note [ <!ELEMENT note (to,from,heading,body)> <!ELEMENT to (#PCDATA)> <!ELEMENT from (#PCDATA)> <!ELEMENT heading (#PCDATA)> <!ELEMENT body (#PCDATA)> ]> <note><to> Tove </to><from> Jani </from><heading>Reminder </heading><body> Don't forget me this weekend </body></note>
Niveau Syntaxique: XML<?xml version="1.0" encoding="ISO-8859-1"?> <!-- Edited with XML Spy v4.2 --> <CATALOG> 	<CD> 	<TITLE>Empire Burlesque</TITLE> 	<ARTIST>Bob Dylan</ARTIST> 	<COUNTRY>USA</COUNTRY> 	<COMPANY>Columbia</COMPANY> 	<PRICE>10.90</PRICE> 	<YEAR>1985</YEAR> 	</CD> 	<CD> <TITLE>Hide your heart</TITLE> 	<ARTIST>Bonnie Tyler</ARTIST> 	<COUNTRY>UK</COUNTRY> 	<COMPANY>CBS	Records</COMPANY>		<PRICE>9.90</PRICE> <YEAR>1988</YEAR> 	</CD> </CATALOG>
Niveau Syntaxique: XMLRéutilisation des ressources/documentsLe même contenu peut apparaître de manières différentes dans différents contextes indépendamment des plate formesDifférents média : papier, en ligne, Différentes tailles : manuels, rapportsLa présentation peut être adaptée/personnalisée aux préférences de l’utilisateurPrésentations standardisées peuvent être réalisées : entreprises, universités, mairies, etc.
Niveau Syntaxique: XMLXML Ne contient aucune sémantique formelle pour l’ordinateurCe sont les humains qui donnent un sens, une sémantique, aux balises et leur contenu pas les machines« La sémantique »est un domaine qui étudie comment les symboles se référent aux objets « Note » ne référence rien pour une machine, la référence est uniquement faite dans l’esprit des lecteur humains D’où RDF pour la sémantique
Niveau sémantique : RDF/RDFSRDF – Resource Description FrameworkRDFS – Resource Description Framework SchemaRDF/RDFS a été créé pour le traitement des métadonnéesCe sont des langages de description de métadonnées au niveau sémantiqueFournit l’interopérabilité – au niveau sémantique - entre applications pour l’échange, le partage et la réutilisation d’informations non interprétable pour la machine
Niveau sémantique : RDF/RDFSRDF/RDFS provient principalement des communautésDe standardisation du WebDes bibliothèquesDes documents structurésReprésentation de connaissancesProgrammation orientée objets et langages de modélisation, Etc.
Niveau sémantique : RDF/RDFSLangages Interprétables par une machineUn langage peut être compris (interprété) par une machine si et seulement si ce langage possède une sémantique formelle. Le langage doit se référencer à un modèle sous-jacent.En logique, le sens est fondé sur une théorie des modèles qui associe, entre autres, une valeur de vérité à chaque formule bien formée.Elle permet donc de « relier » les formules aux objets du monde modélisé.
Niveau sémantique : RDF/RDFSLogiqueThéorie axiomatiqueUn langage et des formules bien forméesDes axiomes, des règles d’inférencesA, (A  B) --  BDes théorèmes: formules bien formées déduites des axiomes et règles d’inférencesThéorie des modèlesInterprétation, Formules vraies/fausses Formules valides
Niveau sémantique : RDF/RDFSThéorème  Formule valideUne démonstrateur automatique de théorèmes est un algorithme qui « respecte les axiomes et règles d’inférences »Il « respecte aussi le principe ci-dessus »Les opérations de la machine « respecte la sémantique formelle »
Niveau sémantique : RDF/RDFSCalcul des prédicatsThéorie axiomatique : des prédicatsThéorie des modèles : des relationsLe web sémantiqueImporte l’idée d’une sémantique formelle dans le monde du WWW (point de vue logico-linguistique).RDF/RDFS propose un langage adéquat à l’implantation de métadonnées sémantiques associées aux ressources.
Niveau sémantique: RDF/RDFSRDF estUn simple modèle relationnelUne déclaration RDF est constituée d’un triplet « Objet, Attribut, Valeur », dont chaque membre peut être un littéral ou une ressource webCe triplet peut être interprété comme le tuple suivant : « Sujet, Prédicat, Objet » ou encore Prédicat (Sujet, Objet)‏Exemple<http://music.fi/pieces#finlandia, creator, http://composer.org/Sibelius><http://music.fi/pieces#finlandia, type, music>
Niveau sémantique: RDF/RDFSLe modèle de données RDF est formellement défini par: Un ensemble appelé Ressources. Un ensemble appelé Littéraux Un sous-ensemble de Ressources appelées Propriétés. Un ensemble appelé Déclarations, dont chaque élément est un triplet 		(prédicat, sujet, objet) « prédicat » est une propriété (membre de Propriétés), « sujet » est une ressource (membre de Ressources)« objet » est soit une ressource soit un littéral (membre de Littéraux).
Niveau sémantique: RDF/RDFSLe modèle de données RDFN’est pas une sérialisation d’un arbre syntaxique XML, ou les branches devraient être présentées dans l’ordre spécifié par une DTD XML.Le modèle de données RDF est un ensemble de triplet !!!!!!!!!!C’est un graphe orienté
Niveau sémantique: RDF/RDFS{creator, [http://www.w3.org/Home/Lassila], "Ora Lassila"}
Niveau sémantique: RDF/RDFS
Niveau sémantique: RDF/RDFS<rdf:rdf xmlns:rdf=« http://www.w3.org/1999/02/22-rdf-syntax-nms# »		  xmlns:dc=« http://purl.org/dc/elements/1.1 »	<rdf:description rdf:about=« http://music.fi/pieces#Finlandia »>		<dc:creator rdf:resource=« http://composer.org/Sibelius »>		<rdf:type music </rdf:type>	</rdf:description><rdf:rdf>
Niveau sémantique: RDF/RDFSRDF SchémaRDF ne permet pas de spécifier le vocabulaire utilisé dans une description RDF, comme par exemple : « author », « music », « creator », etc.C’est-à-dire définir la « sémantique » des propriétésRDF Schéma est une extension de RDF avec laquelle il et possible deDécrire les concepts utilisés dans des déclarations RDFUn ensemble de contraintes sur les objets et les valeurs du triplet.
Niveau sémantique: RDF/RDFSRDF Schema Pourrait être vu comme un modèle orienté objet pour le WWW« rdfs:Class »  & « rdfs:SubClass » définissent la hiérarchie des classes« rdf:type » défini les instances d’une classe« rdf:domain » & « rdf:range » défini des contraintes sur les  types de ressources
Niveau sémantique: RDF/RDFS
Niveau sémantique : RDF/RDFSMais, RDF schéma définie les propriétés en terme de classes de ressources  auxquelles elles s’appliquent au lieu de définir les classes en terme de propriétés que les instances possèdent.Par exemple, on définit la propriété « eg:author » avec pour « domain » « eg:Document » et avec un « range » de « eg:Person », tandis qu’un système classique orienté objet aurait défini une classe « eg:Book « avec un attribut appelé « eg:author » de type « eg:Person ». En utilisant une approche RDF, il est facile pour les autres de définir des propriétés additionnelles avec un « domain » de « eg:Document » or un « range »  « eg:Person ».
Niveau sémantique : RDF/RDFSOn peut le faire sans avoir besoin de redéfinir la description originale de ces classes. Un des avantages de cette approche centrée propriété est qu’il est très facile à chacun de dire ce qu’ils veulent au sujet d’une ressource. C’est l’un des principes de l’architecture du Web [BERNERS-LEE98].Sinon, il serait nécessaire de définir une nouvelle propriétés dans une classe et de la partager avec les autres !!!!!Il permet de combiner des méta descriptions dans différentes partie du Web en un seul graphe !!!!!!
CommentaireNom de la classe la classe Ressource. rdfs:Resource le concept de Classerdfs:Class le concept de propriétérdf:Propertyla classe littéral represente les valeurs de type littéralrdfs:Literal la classe de RDF déclarationsrdf:Statementreprésente l’ensemble des Conteneurs.rdfs:Container une collection non ordonnéerdf:Bagune collection ordonnéerdf:Sequne collection d’alternativesrdf:Alt Le niveau sémantique: RDF/RDFS
Niveau sémantique: RDF/RDFS
Niveau sémantique: RDF/RDFS
Niveau sémantique: RDF/RDFSRDFS est limité en termes de pouvoir d’expressionIl est souvent nécessaire de pouvoir exprimer des contraintes supplémentairesCardinalités min et Max, contraintes entre propriétés, etc.Les ontologies dans le cadre du Web sémantique sont des extensions de RDFS.
Niveau sémantique: les OntologiesLangages logiques : formalismes typiquesLogiques de descriptions Loom, FaCT, Racer, Jena, …Logiques de frames Ontobroker, Florid, XSB, KAON…Graphes conceptuelsProlog+CG, Corese, etc.RDF / RDF Schéma Sesame, RQL, TRIPLE, SiLRi, …
Niveau sémantique: les OntologiesOWL  site du W3C http://www.w3.org/2004/OWL/Semantic Web http://www.semanticweb.org/http://www.w3.org/2001/sw/http://www.lalic.paris4.sorbonne.fr/stic/as5.htmlhttp://www.schemaweb.info/default.aspxAS Web Sémantique, rapport finalhttp://rtp-doc.enssib.fr/basedoc/rapports/ASWebSemantique2003.pdf
Niveau sémantique: les OntologiesOntologieshttp://www.w3.org/2001/sw/WebOnt/http://www.formalontology.it/index.htmhttp://ontology.buffalo.edu/http://www.cs.utexas.edu/users/mfkb/related.htmlhttp://www.daml.org/ontologies/http://www.jfsowa.com/ontology/http://www-ksl-svc.stanford.edu:5915/
Niveau sémantique: les OntologiesLes outils/environnementshttp://www.semanticweb.org/Les logiques de descriptions : http://dl.kr.org/http://www.ida.liu.se/labs/iislab/people/patla/DL/Les graphes conceptuels : http://www.cs.uah.edu/~delugach/CG/ ; http://www.jfsowa.com/cg/ ;
Niveau sémantique: les OntologiesLes outils/environnementsLes Frames Logic http://www.informatik.uni-freiburg.de/~dbis/Publications/95/flogic-jacm.htmlhttp://www.cs.sunysb.edu/~kifer/dood/papers.htmlhttp://www.ontoprise.de/members/angele/pubs/ontologyhandbook.pdf
Ontology Web LangageOWLC’est une version modifiée de DAML (Darpa) + OIL (Europe)‏Conçu pour des applications qui traitent le contenu, pas uniquement la présentation des informationsUne extension de RDFS, muni d’une sémantique formelleConstitué de trois langagesOWL LiteOWL DLOWL Full
Ontology Web LangageOWL LiteClassification hiérarchie + contraintes simplesOWL DLPouvoir d’expression supérieur, avec complétude (toutes les conclusions sont calculables) et décidabilitéC’est une logique de description (DL)‏OWL FullExpressivité maximale, pas de garantie sur les résultats de calculs
Ontology Web LangageToute ontologie OWL Lite valide est une ontologie OWL DL valideToute ontologie OWL DL valide est une ontologie OWL Full valideToute conclusion valide de OWL Lite est une conclusion valide de OWL DLToute conclusion valide de OWL DL est une conclusion valide de OWL Full
Ontology Web LangageExempleshttp://www.schemaweb.info/schema/BrowseSchema.aspxhttp://www.daml.org/ontologies/category.htmlhttp://www.daml.org/ontologies/category.html

Semantic Information Systems

  • 1.
    Les Systèmes d’InformationSémantiquesS. Garlatti
  • 2.
    PLANCours 1 (1h30): Problématique, Problème1Cours 2 (1h30) : Le web sémantique, Cours 3 (3h00) :RDF / RDFS, les Ontologies, Cours 4 (3h00) :OWL, SKOS, SIOC, FOAFCours 5 (3H00) : Linked Data ou Web of Data, Le langageSparqlCours 6 (1H30) : Le web sémantique & social en Action
  • 3.
    ProblématiqueHypothèsesSystèmes d'information (SI)Accessiblessur Internet et/ou Intranet A l’aide d'un navigateur Architecture distribuées fondée sur l’architecture du WebAppelés « Sémantiques » parce que fondés sur les principes du Web Sémantique
  • 4.
    ProblématiqueEnjeu principal desSIRéutilisation, partage et échange des données sur internet / IntranetPar les machines (automatiquement)
  • 5.
    ProblématiqueInternet / IntranetTechnologiepourAccéder à des informations non structurées, hétérogènes et distribuées L’accès à l’information et à des sources de connaissance devient essentielL’importance d’Internet est due :Aux services qu’il nous fournis: IRC, ICQ, Chat, email, News groups, FTP, WWW, E-commerce, B2B, B2C, etc.
  • 6.
    ProblématiqueWWW : succèsfondé sur sa simplicité, MAIS !Développé pour des lecteurs humainsLes données actuelles sont principalement organisées et structurées pour être simple à transmettre et être présentées à des humainsHTML et PDF sont principalement des langages de présentation de données <H2> Triple X </H2> : ne dit rien sur le titre sauf pour des humainsInternet est de plus en plus utilisé par des machines – search engines, robots, etc.
  • 7.
    ProblématiqueProblèmesAccéder, traiter l’information,extraire et interpréter l’informationLa majorité des données sur le web est sous une forme qui ne permet pas de l’utiliser à grande échelle.Pas de système global de publication de données permettant aux machines et aux humains de les traiterÉvènements sportifs, météo, guides TV, guides cinéma, etc. sont présentés par de nombreux sites Web, mais presque tous au format HTML (structure logique + présentation)‏Comment trouver et extraire l’information pertinente pour différents services
  • 8.
    ProblématiqueProblèmesEntrave la recherche,l’extraction, la maintenance et la génération d’informationActuellement, pas d’accès réel au contenu des documentsContenu et Information pas accessible ni interprétable par des machines
  • 9.
    Semantic Web inActionpage 9ProblématiqueProblèmesQualité de la recherche d’informationComment la machine peut-elle savoir que les résultats de la recherche sont pertinents ?Réutilisation des contenus de sites webComment peut-on réutiliser les contenus de sites web ?
  • 10.
    Semantic Web inActionpage 10ProblématiqueRecherche d’information de type GooglePolysémieNombre de résultats très importantRequête : « directeur » « André Chomette »Intention : On ne veut que le site de Telecom Bretagne !44 000 résultats : toutes les pages qui contiennent ces deux termes ou l’un des deux
  • 11.
  • 12.
    ProblématiqueComment attribuons-nous dusens aux données ?Que voyez-vous ?
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.
  • 20.
  • 21.
  • 22.
  • 23.
    Problématique Pour Donnerdu sens aux donnéesNous utilisons nos connaissancesdans des domaines spécifiques pour identifier / reconnaître ces donnéesConnaissances partagées par des communautés
  • 24.
    page 24ProblématiqueDonner dusens aux informationsDescription du site Telecom BretagneForme générale d’une descriptionDes phrases de type : SujetVerbeComplémentExempleTelecom Bretagnea pour directeurAndré ChometteTelecom Bretagneest une grande école françaiseTelecom Bretagnea pour site web http://www.tele...
  • 25.
    page 25ProblématiqueDonner dusens aux informationsCompréhension de ces phrasesDifférents contextes : différents termes« a pour directeur », « président », « Dean », …Interprétation commune liée à des connaissances communesUtilisation de vocabulaires standards partagés par tous !Chaque vocabulaire détermine unsens uniqueaux verbes, aux catégories de sujets et de compléments
  • 26.
    page 26ProblématiquePlus formellement,ou presqueTelecom Bretagnedbpprop:presidentAndré Chomette (en)Telecom Bretagnedbpprop:typeFrench Grande Ecole (en)Telecom Bretagnedbpprop:websitehttp://www.tele...Questions French Grande Ecole dont André Chomette est président ??Grande_Ecoledbpprop:presidentAndré Chomette (en)?Grande_Ecoledbpprop:typeFrench Grande Ecole (en)
  • 27.
    ProblématiqueSite DbpediaWikipedia +indexation sémantiquehttp://dbpedia.org/page/%C3%89cole_nationale_sup%C3%A9rieure_des_t%C3%A9l%C3%A9communications_de_Bretagne
  • 28.
    Semantic Web inActionpage 28Le Web sémantiqueObjectifsRéutilisation, partage, échange des donnéesAutomatisation ou semi-automatisation de certains services en réutilisant les donnéesMoyensLes données sont décrites / indexées de tel sorte que les contenus – sens et sémantique - du web soient « interprétables » par les machines.
  • 29.
    Le Web sémantiqueLeWeb sémantiqueLes données doivent être encodées de tel sorte que les contenus – sens et sémantique - du web soient plus « compréhensibles » pour les machines, ou en d’autres termes par des algorithmes.
  • 30.
  • 31.
    Le Web sémantiqueTimBerners-LeePremière vision du « Semantic Web »Accès automatique à l’information fondé sur une sémantique des données interprétable par l’ordinateur et des heuristiques utilisant celle-ci.Une sémantique explicite des données, associée à des théories sur des domaines (ontologies), permettra l’accès à de nouveaux services sur Internet
  • 32.
    Le Web sémantiquePointclé de l’automatisation ou de la semi-automatisationRecherche d’information pertinentes : Rappel et PrécisionRecherche d’information préciseRéutilisation, partage, échange et composition possible des informations retrouvéesMais aussi, capacité à concevoir certaines « opérations  » automatiquementDonc pas de services élaborés possible : pas d’automatisation ou semi-automatisation de certains services ou tâchesComment assurer le B2B, B2C “automatiquement”Exemple: voyage complexe avec réservation,
  • 33.
    Architecture du SWLeSW nécessite Une architecture partagée par tous pour échanger des ressources sur InternetDes standards pour Les ontologies et mécanismes d’inférence associésLa sémantique explicite des ressources ou méta données sémantiques liées à des ontologiesLe format des ressources ou documentsL’adressage des ressources ou documents
  • 34.
  • 35.
  • 36.
    Niveau Adressage /Nommage: URIURI : Uniform Resource Identifier (RFC 2396)‏Un simple identifieur WebChacun peut en créer – décentralisé -Ressource avec une URI  être sur le WebURL: ftp, gopher, http, internet mail, etc. (normalisée)‏1 Protocole, 1 machine, 1 cheminURN : URI persistenteW3C maintient une liste des schémas d’URI
  • 37.
    Niveau Syntaxique: XMLXML: eXtensible Markup Language Sélection d’un sous-ensemble de SGML simple à implanter, mais néanmoins extensible : chacun défini ses propres balisesSéparation de la présentation et du contenuXML a été conçu pour décrire des donnéesLes balises XML ne sont pas prédéfinis. Vous devez définir vos propres balisesXML utilise un Document Type Definition (DTD) or an XML Schéma pour un « modèle » des données
  • 38.
    Niveau Syntaxique: XMLXMLn’est pas un remplacement d’HTMLHTML a été conçu pour afficher des données et se concentre surtout sur leur présentation (taille, couleur, etc.)XML a été conçu pour décrire des données et se concentre sur la structure de ces données.XML a été conçu pour assurer l’interopérabilitéXML et HTML sont complémentaireXSL / XSLT transforme XML en HTML
  • 39.
    Niveau Syntaxique: XMLPropriétésde XMLIndépendant des logiciels et matériels Infrastructure des échanges de données structuréesInteropérabilité : conçu pour décrire des données, les stocker, les transporter et les échanger et les partagerXML DTD: une DTD défini les éléments constitutifs d’un documents. Il défini la structure syntaxique (un arbre) d’un document type à l’aide d’une grammaire.Il permet donc à toute application de vérifier la conformité d’un document à la DTDEt donc de manipuler et transformer celui-ci lorsqu’il est conforme à cette DTD.
  • 40.
    Niveau Syntaxique: XMLXMLpeut être utilisé pour créer de nouveaux langagesXML est le prère de WAP et WML (Wireless Markup Language).MATHML, etc.
  • 41.
    Niveau Syntaxique :XML<?xml version="1.0"?><!DOCTYPE note [ <!ELEMENT note (to,from,heading,body)> <!ELEMENT to (#PCDATA)> <!ELEMENT from (#PCDATA)> <!ELEMENT heading (#PCDATA)> <!ELEMENT body (#PCDATA)> ]> <note><to> Tove </to><from> Jani </from><heading>Reminder </heading><body> Don't forget me this weekend </body></note>
  • 42.
    Niveau Syntaxique: XML<?xmlversion="1.0" encoding="ISO-8859-1"?> <!-- Edited with XML Spy v4.2 --> <CATALOG> <CD> <TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.90</PRICE> <YEAR>1985</YEAR> </CD> <CD> <TITLE>Hide your heart</TITLE> <ARTIST>Bonnie Tyler</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>CBS Records</COMPANY> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> </CD> </CATALOG>
  • 43.
    Niveau Syntaxique: XMLRéutilisationdes ressources/documentsLe même contenu peut apparaître de manières différentes dans différents contextes indépendamment des plate formesDifférents média : papier, en ligne, Différentes tailles : manuels, rapportsLa présentation peut être adaptée/personnalisée aux préférences de l’utilisateurPrésentations standardisées peuvent être réalisées : entreprises, universités, mairies, etc.
  • 44.
    Niveau Syntaxique: XMLXMLNe contient aucune sémantique formelle pour l’ordinateurCe sont les humains qui donnent un sens, une sémantique, aux balises et leur contenu pas les machines« La sémantique »est un domaine qui étudie comment les symboles se référent aux objets « Note » ne référence rien pour une machine, la référence est uniquement faite dans l’esprit des lecteur humains D’où RDF pour la sémantique
  • 45.
    Niveau sémantique :RDF/RDFSRDF – Resource Description FrameworkRDFS – Resource Description Framework SchemaRDF/RDFS a été créé pour le traitement des métadonnéesCe sont des langages de description de métadonnées au niveau sémantiqueFournit l’interopérabilité – au niveau sémantique - entre applications pour l’échange, le partage et la réutilisation d’informations non interprétable pour la machine
  • 46.
    Niveau sémantique :RDF/RDFSRDF/RDFS provient principalement des communautésDe standardisation du WebDes bibliothèquesDes documents structurésReprésentation de connaissancesProgrammation orientée objets et langages de modélisation, Etc.
  • 47.
    Niveau sémantique :RDF/RDFSLangages Interprétables par une machineUn langage peut être compris (interprété) par une machine si et seulement si ce langage possède une sémantique formelle. Le langage doit se référencer à un modèle sous-jacent.En logique, le sens est fondé sur une théorie des modèles qui associe, entre autres, une valeur de vérité à chaque formule bien formée.Elle permet donc de « relier » les formules aux objets du monde modélisé.
  • 48.
    Niveau sémantique :RDF/RDFSLogiqueThéorie axiomatiqueUn langage et des formules bien forméesDes axiomes, des règles d’inférencesA, (A  B) -- BDes théorèmes: formules bien formées déduites des axiomes et règles d’inférencesThéorie des modèlesInterprétation, Formules vraies/fausses Formules valides
  • 49.
    Niveau sémantique :RDF/RDFSThéorème  Formule valideUne démonstrateur automatique de théorèmes est un algorithme qui « respecte les axiomes et règles d’inférences »Il « respecte aussi le principe ci-dessus »Les opérations de la machine « respecte la sémantique formelle »
  • 50.
    Niveau sémantique :RDF/RDFSCalcul des prédicatsThéorie axiomatique : des prédicatsThéorie des modèles : des relationsLe web sémantiqueImporte l’idée d’une sémantique formelle dans le monde du WWW (point de vue logico-linguistique).RDF/RDFS propose un langage adéquat à l’implantation de métadonnées sémantiques associées aux ressources.
  • 51.
    Niveau sémantique: RDF/RDFSRDFestUn simple modèle relationnelUne déclaration RDF est constituée d’un triplet « Objet, Attribut, Valeur », dont chaque membre peut être un littéral ou une ressource webCe triplet peut être interprété comme le tuple suivant : « Sujet, Prédicat, Objet » ou encore Prédicat (Sujet, Objet)‏Exemple<http://music.fi/pieces#finlandia, creator, http://composer.org/Sibelius><http://music.fi/pieces#finlandia, type, music>
  • 52.
    Niveau sémantique: RDF/RDFSLemodèle de données RDF est formellement défini par: Un ensemble appelé Ressources. Un ensemble appelé Littéraux Un sous-ensemble de Ressources appelées Propriétés. Un ensemble appelé Déclarations, dont chaque élément est un triplet (prédicat, sujet, objet) « prédicat » est une propriété (membre de Propriétés), « sujet » est une ressource (membre de Ressources)« objet » est soit une ressource soit un littéral (membre de Littéraux).
  • 53.
    Niveau sémantique: RDF/RDFSLemodèle de données RDFN’est pas une sérialisation d’un arbre syntaxique XML, ou les branches devraient être présentées dans l’ordre spécifié par une DTD XML.Le modèle de données RDF est un ensemble de triplet !!!!!!!!!!C’est un graphe orienté
  • 54.
    Niveau sémantique: RDF/RDFS{creator,[http://www.w3.org/Home/Lassila], "Ora Lassila"}
  • 55.
  • 56.
    Niveau sémantique: RDF/RDFS<rdf:rdfxmlns:rdf=« http://www.w3.org/1999/02/22-rdf-syntax-nms# » xmlns:dc=« http://purl.org/dc/elements/1.1 » <rdf:description rdf:about=« http://music.fi/pieces#Finlandia »> <dc:creator rdf:resource=« http://composer.org/Sibelius »> <rdf:type music </rdf:type> </rdf:description><rdf:rdf>
  • 57.
    Niveau sémantique: RDF/RDFSRDFSchémaRDF ne permet pas de spécifier le vocabulaire utilisé dans une description RDF, comme par exemple : « author », « music », « creator », etc.C’est-à-dire définir la « sémantique » des propriétésRDF Schéma est une extension de RDF avec laquelle il et possible deDécrire les concepts utilisés dans des déclarations RDFUn ensemble de contraintes sur les objets et les valeurs du triplet.
  • 58.
    Niveau sémantique: RDF/RDFSRDFSchema Pourrait être vu comme un modèle orienté objet pour le WWW« rdfs:Class » & « rdfs:SubClass » définissent la hiérarchie des classes« rdf:type » défini les instances d’une classe« rdf:domain » & « rdf:range » défini des contraintes sur les types de ressources
  • 59.
  • 60.
    Niveau sémantique :RDF/RDFSMais, RDF schéma définie les propriétés en terme de classes de ressources auxquelles elles s’appliquent au lieu de définir les classes en terme de propriétés que les instances possèdent.Par exemple, on définit la propriété « eg:author » avec pour « domain » « eg:Document » et avec un « range » de « eg:Person », tandis qu’un système classique orienté objet aurait défini une classe « eg:Book « avec un attribut appelé « eg:author » de type « eg:Person ». En utilisant une approche RDF, il est facile pour les autres de définir des propriétés additionnelles avec un « domain » de « eg:Document » or un « range » « eg:Person ».
  • 61.
    Niveau sémantique :RDF/RDFSOn peut le faire sans avoir besoin de redéfinir la description originale de ces classes. Un des avantages de cette approche centrée propriété est qu’il est très facile à chacun de dire ce qu’ils veulent au sujet d’une ressource. C’est l’un des principes de l’architecture du Web [BERNERS-LEE98].Sinon, il serait nécessaire de définir une nouvelle propriétés dans une classe et de la partager avec les autres !!!!!Il permet de combiner des méta descriptions dans différentes partie du Web en un seul graphe !!!!!!
  • 62.
    CommentaireNom de laclasse la classe Ressource. rdfs:Resource le concept de Classerdfs:Class le concept de propriétérdf:Propertyla classe littéral represente les valeurs de type littéralrdfs:Literal la classe de RDF déclarationsrdf:Statementreprésente l’ensemble des Conteneurs.rdfs:Container une collection non ordonnéerdf:Bagune collection ordonnéerdf:Sequne collection d’alternativesrdf:Alt Le niveau sémantique: RDF/RDFS
  • 63.
  • 64.
  • 65.
    Niveau sémantique: RDF/RDFSRDFSest limité en termes de pouvoir d’expressionIl est souvent nécessaire de pouvoir exprimer des contraintes supplémentairesCardinalités min et Max, contraintes entre propriétés, etc.Les ontologies dans le cadre du Web sémantique sont des extensions de RDFS.
  • 66.
    Niveau sémantique: lesOntologiesLangages logiques : formalismes typiquesLogiques de descriptions Loom, FaCT, Racer, Jena, …Logiques de frames Ontobroker, Florid, XSB, KAON…Graphes conceptuelsProlog+CG, Corese, etc.RDF / RDF Schéma Sesame, RQL, TRIPLE, SiLRi, …
  • 67.
    Niveau sémantique: lesOntologiesOWL site du W3C http://www.w3.org/2004/OWL/Semantic Web http://www.semanticweb.org/http://www.w3.org/2001/sw/http://www.lalic.paris4.sorbonne.fr/stic/as5.htmlhttp://www.schemaweb.info/default.aspxAS Web Sémantique, rapport finalhttp://rtp-doc.enssib.fr/basedoc/rapports/ASWebSemantique2003.pdf
  • 68.
    Niveau sémantique: lesOntologiesOntologieshttp://www.w3.org/2001/sw/WebOnt/http://www.formalontology.it/index.htmhttp://ontology.buffalo.edu/http://www.cs.utexas.edu/users/mfkb/related.htmlhttp://www.daml.org/ontologies/http://www.jfsowa.com/ontology/http://www-ksl-svc.stanford.edu:5915/
  • 69.
    Niveau sémantique: lesOntologiesLes outils/environnementshttp://www.semanticweb.org/Les logiques de descriptions : http://dl.kr.org/http://www.ida.liu.se/labs/iislab/people/patla/DL/Les graphes conceptuels : http://www.cs.uah.edu/~delugach/CG/ ; http://www.jfsowa.com/cg/ ;
  • 70.
    Niveau sémantique: lesOntologiesLes outils/environnementsLes Frames Logic http://www.informatik.uni-freiburg.de/~dbis/Publications/95/flogic-jacm.htmlhttp://www.cs.sunysb.edu/~kifer/dood/papers.htmlhttp://www.ontoprise.de/members/angele/pubs/ontologyhandbook.pdf
  • 71.
    Ontology Web LangageOWLC’estune version modifiée de DAML (Darpa) + OIL (Europe)‏Conçu pour des applications qui traitent le contenu, pas uniquement la présentation des informationsUne extension de RDFS, muni d’une sémantique formelleConstitué de trois langagesOWL LiteOWL DLOWL Full
  • 72.
    Ontology Web LangageOWLLiteClassification hiérarchie + contraintes simplesOWL DLPouvoir d’expression supérieur, avec complétude (toutes les conclusions sont calculables) et décidabilitéC’est une logique de description (DL)‏OWL FullExpressivité maximale, pas de garantie sur les résultats de calculs
  • 73.
    Ontology Web LangageTouteontologie OWL Lite valide est une ontologie OWL DL valideToute ontologie OWL DL valide est une ontologie OWL Full valideToute conclusion valide de OWL Lite est une conclusion valide de OWL DLToute conclusion valide de OWL DL est une conclusion valide de OWL Full
  • 74.