Ce diaporama a bien été signalé.
Le téléchargement de votre SlideShare est en cours. ×

L'avenir du web au prisme de la ressource

Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
05/10/2012




                                                                            cinq objectifs
                ...
05/10/2012




URI aux jointures                 7                   application         web documentaire « REST in peace ...
05/10/2012




                                                           Généalogie : du document (B.B.) à la
ressource
•...
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Prochain SlideShare
Semantic Information Systems
Semantic Information Systems
Chargement dans…3
×

Consultez-les par la suite

1 sur 45 Publicité

Plus De Contenu Connexe

Similaire à L'avenir du web au prisme de la ressource (20)

Plus récents (20)

Publicité

L'avenir du web au prisme de la ressource

  1. 1. 05/10/2012 cinq objectifs l’avenir du web • présenter (un web de ressources computationnelles) au prisme de la ressource • résumer, rappeler Nicolas Delaforge, Fabien Gandon et Alexandre Monnin (web de données, web sémantique) • discuter, provoquer (le document n’existe pas) • orienter (et pour nous alors) • conclure, ouvrir (ce n’est que le début) trois composants de l’architecture du web • identification (URI) & adressage (URL) http://www.inria.fr http://ns.inria.fr/fabien.gandon#me architecture web ldap://[2001:db8::7]/c=GB?objectClass?one • communication / protocole (HTTP) GET /centre/sophia HTTP/1.1 Host: www.inria.fr User-Agent: Mozilla/5.0 (Macintosh; U; Intel Mac OS X; de-de) AppleWebKit/523.10.3 (KHTML, like Gecko) Version/3.0.4 Safari/523.10 Accept-Encoding: gzip Accept: text/html,application/xhtml+xml,application/xml Accept-Language: en,en-us;q=0.8,fr;q=0.5,fr-fr;q=0.3 Accept-Charset: ISO-8859-1,UTF-8;q=0.7,*;q=0.7 Referer: http://fabien.info/ • langage de représentation (HTML / RDF) Fabien travaille chez <a href="http://www.inria.fr">Inria</a> <http://www.inria.fr> foaf:member data:fabien  pas pour les gens… et pourtant… la syntaxe des URIS qui et quand ?  URI: identification de n’importe qu’elle ressource  URL=URI + Localisation URL=UR(I+L)  HTTP URI: URI déréférençable selon HTTP « follow your nose » / naviguer au flair UR* (wikipedia) 1
  2. 2. 05/10/2012 URI aux jointures 7 application web documentaire « REST in peace » • entre les assertions • REST(ful): invocation et composition d’applications même si elles sont distribuées 6 présentation distribuées sur le web • entre les couches réseau 5 session • primitives HTTP, actions sur la ressource (Internet, Web, Web sémantique) GET, HEAD, POST, OPTIONS, 4 transport CONNECT, TRACE, PUT, DELETE • le web ne fut jamais vraiment documentaire 3 réseau 2 données • web… 1 physique – application centrée ressources (identifiées par URI) – architecture orientée ressource (localisables URL) – toile de calculs liés et non de documents trois composants de l’architecture du web • identification de la ressource (URI) • accès à une représentation (HTTP URI) ressource • codage de la représentation (HTML , RDF, etc) HTTP Range 14 uri, ressource, ombre, objet • identification • individuation/ ils n’en ont pas parlé ils en ont parlé Code HTTP Résultat Indication Ressource informationnelle (IR) et objectivation 200 (OK) Représentation non informationnelle (NIR) ? zèbre (à défaut d’antilope ) 303 (voir Tout type de ressource notamment URI autre) des NIR 4XX, 5XX Message Aucune déduction possible (erreur) d’erreur « ce n’est peut-être pas le problème de HTTP ou des URI » 2
  3. 3. 05/10/2012 Généalogie : du document (B.B.) à la ressource • tout ce que l’on sait identifier ressource Ressource : • pierre angulaire de l’architecture de tout le web Manipulation indirecte • concept unificateur de ses facettes HTTP URI requête HTTP «…» « ressource » erreur HTTP locus représentation Bruno Bachimont : Archivage audiovisuel et numérique: les enjeux de la longue durée ressources computationnelles rappel et parallèle • sans notice pas d’existence dans la collection  l’objet règles • sans ressource pas d’existence sur le web  la ressource «…»  l’état de la ressource  l’état représentationnel ou une représentation de la ressource toile de calculs 3
  4. 4. 05/10/2012 1991-1993 System 33: un prédécesseur méconnu du conneg + services de rendu conneg client http serveur Servicing Client Application RPC Rendering Electronic Other encoding Computers service documents  formats Psychophysically equivalents appearences database moteur et CGI personnalisation, adaptation « Filter Bubble » Eli Pariser Fabien Gandon: Wed, Jul 18, 2012 at 9:48 AM, Inria, Sophia Antipolis, France, Dell Alexandre Monnin: Alienware, Chromium SRware Iron, Windows 7, Paris 6200, Windows 7, Anglais 4
  5. 5. 05/10/2012 Adrien Basse: 17h57mn à 18h07mn GMT, Dakar/Sénégal, Mac book pro, Mac os X Yves Raimond: Firefox 13.0.1, Ubuntu 12.04, in London (10.6.8), french Antoine Isaac: 10h45pm, Amsterdam, Prins Hendrikkade 129, MacBook Pro, English Rémi Trichet: 12:41pm 7/18/2012, Los Angeles, Intel Xeon 3,6 Ghz, Windows 7 OS: MacOs X 10.6.8, Firefox Professional, English il cherche « bmw », « mahler » et « gay » ?=! BMW « Je m’intéresse aux BMW » 5
  6. 6. 05/10/2012 Allo Google ? C’est la Noiraude… United States Flu Activity - Influenza estimate ● Google Flu Trends ● U.S. Centers for Disease Control. « document sur lui-même » document vivant, chaque consultation change le document Chine: 1 600 millions Inde: 1 200 millions acebook 900 millions PORTÉE 6
  7. 7. 05/10/2012 externaliser la socialité d’un site OGP v2 intérêt et danger actions typées <html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="en-US" xmlns:fb="https://www.facebook.com/2008/fbml"> <head prefix="og: http://ogp.me/ns# fb: http://ogp.me/ns# YOUR_NAMESPACE: http://ogp.me/ns/apps/YOUR_NAMESPACE#"> <meta property="fb:app_id" content="YOUR_APP_ID" /> <meta property="og:type" content="YOUR_NAMESPACE:recipe" /> <meta property="og:title" content="Stuffed Cookies" /> <meta property="og:image" content="http://example.com/cookie.jpg" /> <meta property="og:description" content="The Turducken of Cookies" /> <meta property="og:url" content="http://example.com/cookie.html"> <script type="text/javascript"> function postCook() { FB.api('/me/YOUR_NAMESPACE:cook' + '?recipe=http://example.com/cookie.html','post', (…) }); } </script> </head> <body> (…) <form> <input type="button" value="Cook" onclick="postCook()" /> </form> </body> OGP schémas… </html> code dans votre page Face… it 7
  8. 8. 05/10/2012 changing interface… crowdsourcing crawling & indexing affiliation social sub-networks analyse réseaux sociaux web 2.0 & dynamique une représentation est modifiée par un commentaire contenu essentiel, lié à une ressource spécifique (un article) © FriendViz © Obama’s network, Recorded Future vs contenu accessoire, lié à une règle non-essentielle (un commentaire) © Egyptian Revolution on Twitter, A. Panisson, Gephi © Facebook une ressource change : une question suppression définitive devient une réponse parfois… ?! ni ressource, ni représentation 8
  9. 9. 05/10/2012 gérér sa bibliographie : Zotero et Coins extraction de données « page » donnant l’analyse du texte d’une autre « page » made in web auteurs? journal confusion des genres? 9
  10. 10. 05/10/2012 permanence/ non permanence raccourcisseur d’URL et re-captcha… des jeux utiles au crowdsourcing le web comme une plateforme d’externalisation distribuée de masse. temps facebook 16.2 millions secondes/seconde x 16 203 703 253 Fold It le web comme une machine universelle de moteurs à pulsions (méta)-données l’utilisateur utilisé application web 10
  11. 11. 05/10/2012 jeu HTML5 Mario Kart en HTML5 (ouf !) … jouer dans le navigateur : le cloud download upload drag & drop © HTML5Rocks speech input geolocation html & js html & svg WebGL © HTML5Rocks © HTML5Rocks 11
  12. 12. 05/10/2012 HTML pages of specifications inputs, text, email, number, phone ©HTML5Rocks HTML 1 39 pages 963 pages Ligne de Temps • description sémantique de ressources multimedia [Media Annotation] • adressage d’éléments internes aux ressources [Media Fragment] annotations des éléments multimédia ontologies des ressources multimédias fragment multimédia ontology for Media Resources 1.0 • partie fragment de l’URL = après le # <video.ogv> a ma:MediaResource ; http://www.example.com/example.ogv#track=audio&t=10,20 ma:hasTrack <video.ogv#track=audio>, <video.ogv#track=subtitle>; • dimensions: ma:hasSubtitling <video.ogv#track=subtitle> ; ma:hasSigning <video.ogv#xywh=percent:70,70,90,90> . – temporelle: t=10,20 / t=npt:,0:02:01.5 / t=clock:2009-07-26T11:19:01Z <video.ogv#track=audio> a ma:AudioTrack ; – spatiale: ma:hasLanguage [ rdfs:label "en-GB" ] ; xywh=pixel:160,120,320,240 / xywh=percent:25,25,50,50 ma:hasFragment <video.ogv#track=audio&t=10,20> . – track: <video.ogv#track=audio&t=10,20> a ma:MediaFragment ; track=1 / track=video&track=subtitle / track=Wide ma:hasLanguage [ rdfs:label "fr" ] . – nommée: <video.ogv#track=subtitle> a ma:DataTrack ; id=chapter-1 ma:hasLanguage [ rdfs:label "es" ] . • fragment non transmis par le navigateur: <video.ogv#xywh=percent:70,70,90,90> a ma:MediaFragment ; encodage dans la requête HTTP ma:hasLanguage [ rdfs:label "bfi" ] . 12
  13. 13. 05/10/2012 une interface programmatique universelle design & affordance ceci est un ovetto application serveur application ? HTTP HTTP HTTP navigateur affordance sémantique SAWSDL of WSDL (W3C Rec. 2007) semantic annotation SAWSDL… services annotés et recherchés sémantiquement annuaire 2 1 3 demandeur client service fournisseur 13
  14. 14. 05/10/2012 sortie entrée pre-populating… workflows scientifiques • composer des données et traitements distribués • échanger et comparer les traitements et leurs compositions name assistant’s phone phone phone  name name employee assistant SSRSSLSSS  SSLSSLSSS semonde au lier Le bug de l’an… 2020 ( inspiration Gérard Berry) 14
  15. 15. 05/10/2012 1 sec. battement de cœur 1/2 sec. double click 24 images/sec. film « Aliénation et accélération. » 500 000 décisions / sec. algorithmes boursiers Hartmut Rosa DNS, TCP/IP, Web http://mon.org/ma/ressource DNS, TCP/IP, Web GET http://mon.org/ma/ressource  règles négociation  règles négociation calculs calculs composition composition rendu rendu … … … … … … … … … … … … … … … … 30 min… 15
  16. 16. 05/10/2012 le livre n’est pas recréé à chaque page 5 jours… Stéphane Crozat: « le document numérique n'existe pas, ce qui existe ce sont des constructions numériques dont le traitement calculatoire simule un ordre documentaire. » nouveaux engagements, contrats • contrats de lecture + computationnel Le juridique aussi souffre • contrats d’identification + computationnel de l’héritage documentaire • contrats d’accès + computationnel des données • contrats de publication + computationnel • contrats de stockage + computationnel • etc. « il n’y a plus de documents, le besoin de documentariser n’en n’est que plus fort. » 16
  17. 17. 05/10/2012 le web entre nous et le monde • documents & données augmentent nos perceptions • services & applications augmentent nos actions • incontournable &… ingérable? tant à venir réalité augmentée par le web & augmentation du web par le réel google glass project • vers une réalité augmentée par le web • diversité des ressources web augmentée par diversité des ressources de notre réalité • « documentarisation non documentaire » de la réalité par le web • modèle documentaire rendu minoritaire / modèle calculatoire • limite de la métaphore de la bibliothèque • une toile de ressources informatiques chaque utilisateur est un détecteur une toile de données multiples entre différents barreaux de l’échelle des sphères web de « consommacteurs » mobiles, « crawlers » « small data & big data » du web & du monde physique ex. Wikimapia, OpenStreetMap , etc. © Medialab Prado © GeoSensor Image,T. Berners-Lee, RuleML kickoff, 2005 17
  18. 18. 05/10/2012 web…devices [Web of Devices] … Web Phone … Web TV … Web Radio … Web Car … Web Tablet … Web eBook … Web Watch … Web GPS … cintre Facebook chez C&A Brésil nouvelles topologies du web ex. « near field communication » 18
  19. 19. 05/10/2012 Open Street Map dans le métro navigateur web = interface universelle ex. domotique Web 2.0 & Web Physique 19
  20. 20. 05/10/2012 fabien Janet Echelman, “Her Secret is Patience”, Civic Space Park, Phoenix, AZ, USA, 2009 RFID&URI ex. Live Social Semantics plusieurs évolutions concourantes l’effet diligence Jacques Perriault • explosion multimédia et multi-modalité • toile de ressources computationnelles liées • ressources comme locus de calcul • assimilation de tous les objets à des ressources web liens d’association [Vannevar Bush, 1945] du mémex entre les informations qui nous importent (méta) web 20
  21. 21. 05/10/2012 http://www. hypertexte, hypermédia [Ted Nelson, 1965] liens utilisant des références une structure de fichier pour l’information complexe, changeante et indéterminée à travers le réseau [Tim Berners-Lee, 1989] hypertexte et document sur le Web : de la nécessité de les reconstruire par assemblages Hypertexte : Google Le Web à la base n’est pas un hypertexte : il ne relie pas des documents. mais il peut le devenir ou accueillir Document : Scenari des documents car c’est aussi une plateforme ouverte… … vers un web structuré séparer forme et contenu 21
  22. 22. 05/10/2012 2008 XML a eu dix ans <balise>…</balise> XML bien formé structurer construction des données <racine>...</racine> modulaire <x>...</x> ou <x/> en utilisant une famille de <a><b></a></b> des balises langages <x> <X> dans un format un format ouvert <1an> <xmla> <bla bla> textuel non propriétaire <a b='c'></a> ou <a b='c'/> XML en 10 points http://www.w3.org/XML/1999/XML-in-10-points.fr.html Scalable Vector eXtensible Access Control Graphics (SVG) Markup Language (XACML) WSDL namespace OpenOffice • espaces de nommage Schemas • éviter les collision de noms MusicML • associer un préfixe de balise à un URI • exemple XML Topic <ugb:note xmlns:ugb='http://www.ugb.sn/'>18</ugb:note> Maps (XTM) <bla:note xmlns:bla='http://www.ugb.sn/'>18</bla:note> GPS Exchange Financial • définitions héritées dans l’arbre XML format (GPX) products Markup Chemical Markup • namespace par défaut xmlns="…" Synchronized Language (CML) XHTML Language (FpML) Multimedia Integration NewsML Language (SMIL) MathML de langages famille “Jacob Lorhard's "Ogdoas Scholastica" (1606) contains the first occurrence of the term Ontologie ontologie -> ‘ontologia’ ” Raul Corazzon on formalontology.it ontos logos être / êtres discours / science 22
  23. 23. 05/10/2012 votre réponse est basée sur une sous ontologie partagée type Document je peux comprendre Book vous pouvez raisonner Novel Short story sous type "document" #12 #12 #21  #12 #21  #12 "book" #21 #21 "livre" #47  #21 #48  #21 #47  #21 #48  #21 #47 #48 #47 #48 "novel" "short story" "roman" "nouvelle" connaissance ontologique formalisée la connaissance ontologie taxinomique n’est pas un synonyme de est une connaissance ontologique taxinomie parmi d’autres 23
  24. 24. 05/10/2012 partie combiner différents types de connaissances ontologiques de Organic object Individual Limb méthane éthane méthanol éthanol Cat dioxyde de carbone dioxygène ozone phénol eau dihydrogène méthyle carbone oxygène hydrogène Hierarchical model of the shape of the human body. D. Marr and H.K. Nishihara, Representation and recognition of the spatial organization of three-dimensional shapes, Proc. R. Soc. London B 200, 1978, 269-294). couverture dans quelle mesure les primitives mobilisées par les scénarios sont couvertes par l’ontologie spécificité dans quelle mesure les primitives sont précisément déclarées dans l’ontologie exemple granularité [Charlet - RFIA 2002] granularité 1. Patient-Masculin Patient-Féminin dans quelle mesure les primitives 2. [Patient]  (chrc)  [Masculin] [Patient]  (chrc)  [Féminin] sont détaillées 3. [Patient]  (attr)  [Sexe]  (val)  [Masculin] [Patient]  (attr)  [Sexe]  (val)  [Féminin] 24
  25. 25. 05/10/2012 méthodes ex. rigidité dans Onto Clean [Guarino & Welty] Rigid +R  is a necessary property for all its instances Anti-Rigid ~R  is an optional property for all its instances formalité Constraint: ~R can't subsume y+R dans quelle mesure les Person is y+R, Student is ~R primitives sont décrites dans un langage formel structurer une “folksonomie” combinaison espaces métriques web 2.0 folksonomies plates thesaurus distances d’édition Monge-Elkan Soundex, JaroWinkler, polluant énergie asymétrie Monge-Elkan Qgram related related ? pollution has narrower métrique contextuelle cosinus vecteur de cooccurrences de tags pollution des sols métriques sociales SKOS inclusion de communautés d’intérêt 25
  26. 26. 05/10/2012 ex. ademe TheseNet recherches & retours 83 027 relations / 9 037 tags  68 633 related  11 254 hyponyms  3 193 spelling variants ex. propagation sémantique ex. Ademe 1 pollution ; 2 développent durable ; 3 énergie ; 4 chimie ; 5 pollution de l’air ; 6 métaux ; 7 biomasse ; 8 déchets. from RAK/LP to SemTagP rugby, foot hockey sel, eau sport sport condiment poivre, vin condiment foot, ciné moutarde sport condiment langages de formalisation d’ontologies (define-class humain (?humain) :def (animal ?humain)) exemple subsomption dans les frames 26
  27. 27. 05/10/2012 (defprimconcept MALE) (defprimconcept FEMELLE) [Concept: Directeur]->(Def)-> [LambdaExpression: (disjoint MALE FEMELLE) [Personne: ]->(Dirige)->[Groupe]] exemple exemple classes disjointes en logiques de description classe définie en graphes conceptuels le web originel liens typés… vers un web sémantique web sémantique mentionné par Tim BL en 1994 à WWW RDF toute connaissance est décomposée en , triplets ( sujet , prédicat , objet ) arcs ( nœud, arête , nœud ) [Tim Berners-Lee 1994, http://www.w3.org/Talks/WWW94Tim/] 27
  28. 28. 05/10/2012 ex : doc.html a pour auteur Fabien doc.html a pour auteur Fabien et a pour thème la Musique doc.html a pour thème Musique Fabien <RDF/> une syntaxe XML pour mieux échanger ces graphes auteur doc.html thème Musique <rdf:RDF nœuds anonymes (blank nodes) xmlns:rdf="http://www.w3.org/1999/02/22- quantification existentielle rdf-syntax-ns#" il existe une ressource telle que… {  r ; …} xmlns:inria="http://inria.fr/schema#" > <rdf:Description rdf:about="http://bu.ch/123.html "> <auteur> <rdf:Description> <rdf:Description <nom>Trichard</nom> <prenom>Laurent</prenom> rdf:about="http://inria.fr/rr/doc.html"> </rdf:Description>  x ; auteur(http://bu.ch/123.html,x) <inria:author rdf:resource= </auteur> nom(x,"Trichard") <titre>Les zélés faons roses</titre> "http://inria.fr/~fabien#me" /> </rdf:Description> prenom(x,"Laurent") <inria:theme>Music</inria:theme> auteur </rdf:Description> http://bu.ch/l23.html titre prenom nom </rdf:RDF> "Les zélés faons roses" "Laurent" "Trichard" 28
  29. 29. 05/10/2012 exemple personne ayant au moins 18 ans PREFIX ex: <http://inria.fr/schema#> SELECT ?person ?name interroger avec SPARQL WHERE { SPARQL Protocol and RDF ?person rdf:type ex:Person ?person ex:name ?name . Query Language ?person ex:age ?age . FILTER (?age > 17) } May 2007 April 2008 September 2008 March 2009 Linking Open Data 400 web de données 300 200 100 0 première vague de déploiement 10/10/2006 28/04/2007 14/11/2007 01/06/2008 18/12/2008 06/07/2009 22/01/2010 10/08/2010 26/02/2011 14/09/2011 01/04/2012 du web sémantique (RDF, SPARQL) September 2011 September 2010 Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/ e.g. DBpedia 29
  30. 30. 05/10/2012 CORESE/ KGRAM contenus et thématiques Domaines Nombre de jeux de données Triplets % Liens sortants % data.ratatouille.com Media 25 1 841 852 061 5,82 % 50 440 705 10,01 % Géographique 31 6145 532 484 19,43 % 35 812 328 7,11 % Gouvernement 49 13 315 009 400 42,09 % 19 343 519 3,84 % Publications 87 2 950 720 693 9,33 % 139 925 218 27,76 % Inter-domaine 41 4 184 635 715 13,23 % 63 183 065 12,54 % Sciences de la vie 41 3 036 336 004 9,60 % 191 844 090 38,06 % Contenu utilisateur 20 134 127 413 0,42 % 3 449 143 0,68 % 295 31 634 213 770 503 998 829 0% 6% 9% Gouvernement 10% 42% Géographique Inter-domaine 13% Sciences de la vie Publications 20% Media Contenu utilisateur 30
  31. 31. 05/10/2012 DNS celui qui contrôle le nom * .fr de domaine contrôle le principes déréférencement.  utiliser le format RDF  utiliser des URI pour nommer ex. bit.ly & Lybie .inria  utiliser des URI HTTP (URL) pour que l’on puisse les suivre  lorsqu’un URI est suivi donner des informations (HTML, RDF)  inclure dans ces informations des liens vers d’autres données isicil le cas de la France mouvement d'ouverture des données mais… • redondance des identifiants • hétérogénéité des formats • diversité des vocabulaires • hétérogénéité des accès (June 2012) publication processus démo • installation en un click • import de données trouvées en ligne • transformation en RDF • publication sur le web • interrogation directe 31
  32. 32. 05/10/2012 par union RDFS pour définir les classes de  la disjonction ressources, leurs propriétés, OWL in one… par intersection et organiser leur hiérarchie prop. algébriques par complément ! par restriction Document créateur 1..1 par cardinalité prop. disjointes  par équivalence auteur par énumération ! cardinalité qualifiée Rapport Document Personne 1..1 [>18] restrict. valeur négation prop. indiv  union disjointe prop. chainées clefs …   alignements et liage ontologies et entités nommées • « Ontology Alignment Evaluation Initiative » • reconnaissance d’entités nommées • liage de ressources OKKAM et owl:sameAs 1 “The logical consequences are the heart of the conceptual problem raised by the use of owl:sameAs. In fact, suppose one wants to answer the query: where does John teach and what? One will make the following query on the merge of the two datasets: < x , y >: http : // U NI1 / resource / John @ : af f iliation x ∧ http : // U NI1 / resource / John @ : teaching y Certainly, if the query is processed on the merge of the two datasets of John’s academic profiles, one would get the expected results, i.e., that John teaches philosophy of language at UNI1 and logic at UNI2. 22 The problem is that one would also get the unwanted results that John teaches logic at UNI1 and philosophy of language at UNI2.” (Web of Data and Web of Entities: Identity and Reference in Interlinked Data in the Semantic Web Paolo Bouquet · Heiko Stoermer · Massimiliano Vignolo) 32
  33. 33. 05/10/2012 OKKAM et owl:sameAs 2 « when owl:sameAs is not the same » (H. Halpin, I. Herman, P. Hayes) des représentations de ressources jugées identiques peuvent néanmoins diverger. ex. : si ma ressource est l’élément sodium… • OpenCyc : un élément est l’ensemble de tous les fragments de cet élément à l’état pur • DBpedia : inclut en outre les isotopes de sodium (nombre de neutrons différent)  deux vue sur la même chose ou deux objets différents ? chaine GATE : exemple en biologie… thesaurus, classifications, sujets, taxinomies, folksonomies, ... vocabulaires contrôlés 33
  34. 34. 05/10/2012 relations expression naturelle pour dénoter un concept labels entre concepts inria:CorporateSemanticWeb inria:CorporateSemanticWeb skos:broader w3c:SemanticWeb; skos:prefLabel "corporate semantic web"@en; skos:narrower inria:CorporateSemanticWiki; skos:prefLabel "web sémantique d'entreprise"@fr; skos:related inria:KnowledgeManagement. skos:altLabel "corporate SW"@en; skos:altLabel "CSW"@en; skos:hiddenLabel "web semantique d'entreprise"@fr. beaucoup de données dans beaucoup de pages inria:CorporateSemanticWeb skos:scopeNote "only within KM community"; skos:definition "a semantic web on an intranet"; skos:example "Nokia's internal use of RDF gateway"; skos:historyNote "semantic intranet until 2006"; skos:editorialNote "keep wikipedia def. uptodate"; skos:changeNote "acronym added by fabien". Triplets produits : schéma • cellules d’une ligne  sujet commun • noms des colonnes  prédicats • une cellule  un objet • liens entre tables mapping nom prenom age #s1 :nom "filar" filar alain 34 #s1 :prenom "alain" R2RML seger thomas 45 #s1 :age "34" #s2 :nom "seger" une transformation standard #s2 :prenom "thomas" d’une base relationnelle en RDF #s2 :age "45" #s3 … 34
  35. 35. 05/10/2012 :P_Table rdf:type rr:TriplesMap ; (1) transformation rr:subjectMap [ rr:termtype "BlankNode" ; exemple de mapping rr:column "ID" ; ] ; table personnes rr:predicateObjectMap [ rr:predicateMap [ rr:predicate a:name ]; rr:objectMap [ ISBN Author Title Year ISBN Author Title Year rr:column "Name" ] 0006511409X id_xyz The Glass Palace 2000 0006511409X id_xyz The Glass Palace 2000 ] ; rr:predicateObjectMap [ rr:predicateMap [ ID Name Homepage ID Name Homepage rr:predicate a:homepage id_xyz Ghosh, Amitav http://www.amitavghosh.com id_xyz Ghosh, Amitav http://www.amitavghosh.com ]; rr:objectMap [ rr:column "Homepage" ; rr:termtype "IRI" ] ] ; The Glass Palace The Glass Palace http://…isbn/000651409X http://…isbn/000651409X 2000 2000 a:author a:author a:name a:name a:homepage a:homepage Ghosh, Amitav http://www.amitavghosh.com Ghosh, Amitav http://www.amitavghosh.com I. Herman, W3C I. Herman, W3C (2) transformation (3) lier les tables table livres ISBN Author Title Year ISBN Author Title Year 0006511409X id_xyz The Glass Palace 2000 0006511409X id_xyz The Glass Palace 2000 ID Name Homepage ID Name Homepage id_xyz Ghosh, Amitav http://www.amitavghosh.com id_xyz Ghosh, Amitav http://www.amitavghosh.com :B_Table rdf:type rr:TriplesMap ; The Glass Palace The Glass Palace http://…isbn/000651409X http://…isbn/000651409X rr:subjectMap [ rr:template "http://...isbn/{ISBN}"; 2000 2000 ]; rr:predicateObjectMap [ :B_Table a rr:TriplesMap ; rr:predicateMap [ ... rr:predicate a:title ]; a:author rr:refPredicateObjectMap [ a:author rr:objectMap [ rr:refPredicateMap [ rr:column "Title" rr:predicate a:author ] ]; ] ; a:name a:name rr:predicateObjectMap [ a:homepage rr:refObjectMap [ a:homepage rr:predicateMap [ rr:parentTriplesMap :P_Table ; rr:predicate a:year Ghosh, Amitav http://www.amitavghosh.com rr:joinCondition Ghosh, Amitav http://www.amitavghosh.com ]; rr:objectMap [ "{child}.Author = {parent}.ID" rr:column "Year" ; ] ] ] ] ; ]. I. Herman, W3C I. Herman, W3C RDFa signifie RDF dans des attributs de HTML <div xmlns:dc="http://purl.org/dc/elements/1.1/"> <h2 property="dc:title">The trouble with Bob</h2> <h3 property="dc:creator">Alice</h3> ... </div> 35
  36. 36. 05/10/2012 provenance, confiance, explication, protéger les enfants en insérant des étiquettes Oh,yeah? émises par des autorités “At the toolbar (menu, dans les pages whatever) associated with a document there is a button marked "Oh, yeah?". You press it when you loses that feeling of trust. It says to the Web, "so how do I know I can trust this <meta http-equiv="pics-label" content='(PICS-1.1 information?". The software "http://www.icra.org/ratingsv02.html" labels then goes directly or for "http://mm.256.com/" indirectly back to generic true metainformation about the ratings (cz 1 la 1 lb 1 lc 1 nz 1 oz 1 vz 1) document, which suggests a "http://www.rsac.org/ratingsv01.html" labels number of reasons.” for "http://mm.256.com/" Tim Berners-Lee, Consistent User generic true Interface, W3C Design Issues, 1997 ratings (n 0 s 0 v 0 l 4) )' /> :DBpedia a void:Dataset; VoID: décrire des sources de données void:sparqlEndpoint <http://dbpedia.org/sparql>; void:feature :RDFXML ; schéma pour annoter des jeux de données void:subset :DBpedia2Geonames ; :DBpedia a void:Dataset . void:uriLookupEndpoint <http://lookup.dbpedia.org/api/search.asmx/KeywordSearch? QueryString=> ; dcterms:modified "2008-11-17"^^xsd:date; et des jeux de liens dcterms:title "DBPedia"; :DBpedia_Geonames a void:Linkset . dcterms:description "RDF data extracted from Wikipedia"; dcterms:publisher :DBpedia_community; dcterms:license <http://creativecommons.org/licenses/by-sa/3.0/>; dcterms:source <http://dbpedia.org/resource/Wikipedia>. :Geonames a void:Dataset; void:sparqlEndpoint <http://geosparql.appspot.com/query>; void:triples "107983838"^^xsd:integer ; dcterms:subject <http://dbpedia.org/resource/Location> . :DBpedia2Geonames a void:Linkset ; void:linkPredicate owl:sameAs ; void:target :DBpedia ; void:target :Geonames . ex. DBpedia dataset 36
  37. 37. 05/10/2012 PROV-DM & PROV-O OWL2 ontology provenance & traçabilité décrire les entités et activités impliquées dans la [Provenance WG] production, livraison, etc. d’un objet ++ ex1:aggregated prov:used ex1:dataSet2, ex1:regionList2 . ex1:aggregate2 prov:wasGeneratedBy ex1:aggregated . ex1:illustrated prov:used ex1:aggregate2 . ex1:chart2 prov:wasGeneratedBy ex1:illustrated . ex1:aggregated prov:wasControlledBy ex1:derek . ex1:dataSet2 prov:wasRevisionOf ex1:dataSet1 . plusieurs ressources grouping mechanisms... ... list URIs ... domain names, paths ... regular expressions on URIs listes domaines, chemins description expressions régulières authentifiée exemple de description POWDER « toute ressource dont l’URI commence par http://www-sop.inria.fr/fr/ concerne le centre de recherche de l’INRIA géographiquement situé à Sophia Antipolis et est en français » certifié par inria.fr préjugés, fausses idées 37
  38. 38. 05/10/2012 éviter de construire une boite noire rendre les conceptualisations à base d’ontologie explicites ne signifie pas que l’on a besoin d’un moteur d’inférence. ma montre n'a qu'une aiguille mais elle n'est pas cassée. de l'intérêt d'un à peu près… 38
  39. 39. 05/10/2012 sens et position d’une taxonomie à une vue 0° a=120° 360° r a “semantic web” 66 FOAF primitives x 52 millions 3 475 908 348 references (2) and not “semantic web” [C. Welty, ISWC 2007] “a lightweight ontology allows us to do lightweight reasoning” “a small tree ruling a big graph”(1) (1) Franck Van Harmelen, ISWC 2011 [J. Hendler, ISWC 2007] (2) Libby Miller, 2009 je n’ai jamais vu une ontologie universelle le piège du domaine le domaine d’application n’est pas forcément celui de l’ontologie 39
  40. 40. 05/10/2012 Trouble dans la classification (F. Rastier) la vache folle ou l’ontologue végétarien s:MadCow rdfs:subClassOf s:Cow cycle vie brique de construction vs. modèle changeant conception besoin évolution diffusion gestion évaluer utilisation tri sélectif sémantique le web est une poubelle, le web sémantique sera une poubelle sémantique. et pour nous ? 40
  41. 41. 05/10/2012 hyper-documentaire donnez des URL aux contenus de l’article scientifique à l’hyper-article multi-public une URL est un nom, sans URL pas de nom, sans nom je ne peux pas en parler • référence • granularité • vues plus vieille facette, mais encore sous exploitée forme / fond, structure, sémantique <XML/> • jeux de données scientifiques nouvelles formes de rédaction… entrées et sorties • systématiquement enrichir de liens • des schémas de données • identifier des cibles internes et externes développer http://ns.inria.fr • identifier les persona de notre public • Ex en biologie: HCLS IG • permettre des parcours multimédias idoines • SPARQL: recherche de liens, motifs et chaines • référentiels métiers et domaines « produire une hyper-ressource, c’est hyper long… nos termes, nos définitions, nos thésaurus, ... c’est même jamais vraiment fini. » ex. SHOINQ < ALC < Logique de Description < Langage Logique utilités ? scénarios ? le web comme écriture collective • reproductibilité et comparatifs • permettre d’autres expérimentations / algo • ouverture en écriture... collective • ex. OAEI: – ne plus centraliser la rédaction: distribuer, aider, … – Visibilité et citation – « utilisacteur »: nos lecteurs peuvent aider à – Alignement de domaines, vulgariser, reformuler, enrichir sources, résultats, etc. • ouverture en écriture collective ... • journalisme de données – ne plus centraliser la rédaction: animer, solliciter • génération de liens, – participer à d’autres sites: ex. wikipedia (édition, ref.) restructuration, ranking 41

×