05/10/2012                                                                            cinq objectifs                  l’av...
05/10/2012URI aux jointures                 7                   application         web documentaire « REST in peace »• en...
05/10/2012                                                           Généalogie : du document (B.B.) à laressource• tout c...
05/10/20121991-1993 System 33: un prédécesseurméconnu du conneg + services de rendu                                       ...
05/10/2012Adrien Basse: 17h57mn à 18h07mn GMT, Dakar/Sénégal, Mac book pro, Mac os X       Yves Raimond: Firefox 13.0.1, U...
05/10/2012           Allo Google ? C’est la Noiraude…United States Flu Activity - Influenza estimate● Google Flu Trends   ...
05/10/2012externaliser la socialité d’un site   OGP v2intérêt et danger                     actions typées                ...
05/10/2012     changing interface…                                                                                   crowd...
05/10/2012     gérér sa bibliographie : Zotero et Coinsextraction de données« page » donnant l’analyse du texte d’une autr...
05/10/2012permanence/non permanence                                                    raccourcisseur d’URL               ...
05/10/2012  jeu   HTML5                                               Mario Kart en HTML5 (ouf !)                         ...
05/10/2012                                                                 HTML pages                                     ...
05/10/2012une interface programmatique universelle                                                  design & affordance   ...
05/10/2012                                                                   sortie                                       ...
05/10/2012                                                                                                                ...
05/10/2012                                            le livre n’est pas recréé à chaque page5 jours…                     ...
05/10/2012                                                                       le web entre nous et le monde            ...
05/10/2012                                  web…devices       [Web of Devices]                                           …...
05/10/2012Open Street Map dans le métro                                      navigateur web = interface universelle       ...
05/10/2012            fabien                                          Janet Echelman, “Her Secret is Patience”, Civic Spac...
05/10/2012                                                                                    http://www.         hypertex...
05/10/20122008                                 XML a eu dix ans <balise>…</balise>                                        ...
05/10/2012votre réponse est basée sur une                                                                                 ...
05/10/2012                                                         partie               combiner                          ...
05/10/2012                                                            méthodes                                            ...
05/10/2012   ex. ademe TheseNet                                                             recherches & retours          ...
05/10/2012(defprimconcept MALE)(defprimconcept FEMELLE)                                                       [Concept: Di...
05/10/2012  ex : doc.html a pour auteur Fabien          doc.html a pour auteur Fabien      et a pour thème la Musique     ...
05/10/2012                                             exemple                                                            ...
05/10/2012                                                                                                                ...
05/10/2012                                                                    DNS celui qui contrôle le nom               ...
05/10/2012                                                                                                                ...
05/10/2012OKKAM et owl:sameAs 2     « when owl:sameAs is not the same »                          (H. Halpin, I. Herman, P....
05/10/2012                                                                                           relationsexpression n...
05/10/2012                                                                                                                ...
05/10/2012provenance, confiance, explication,                      protéger les enfants                                   ...
05/10/2012                                                          PROV-DM & PROV-O OWL2 ontologyprovenance & traçabilité...
05/10/2012                                                   éviter de construire une                                     ...
05/10/2012sens et positiond’une taxonomie à une vue                                    0°        a=120°             360°  ...
05/10/2012Trouble dans la classification(F. Rastier)                                                               la vach...
L'avenir du web au prisme de la ressource
L'avenir du web au prisme de la ressource
L'avenir du web au prisme de la ressource
L'avenir du web au prisme de la ressource
L'avenir du web au prisme de la ressource
Prochain SlideShare
Chargement dans…5
×

L'avenir du web au prisme de la ressource

1 485 vues

Publié le

Présentation de N. Delaforge, F. Gandon et A. Monnin au séminaire IST Inria 2012

Publié dans : Technologie
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
1 485
Sur SlideShare
0
Issues des intégrations
0
Intégrations
1
Actions
Partages
0
Téléchargements
18
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

L'avenir du web au prisme de la ressource

  1. 1. 05/10/2012 cinq objectifs l’avenir du web • présenter (un web de ressources computationnelles) au prisme de la ressource • résumer, rappeler Nicolas Delaforge, Fabien Gandon et Alexandre Monnin (web de données, web sémantique) • discuter, provoquer (le document n’existe pas) • orienter (et pour nous alors) • conclure, ouvrir (ce n’est que le début) trois composants de l’architecture du web • identification (URI) & adressage (URL) http://www.inria.fr http://ns.inria.fr/fabien.gandon#me architecture web ldap://[2001:db8::7]/c=GB?objectClass?one • communication / protocole (HTTP) GET /centre/sophia HTTP/1.1 Host: www.inria.fr User-Agent: Mozilla/5.0 (Macintosh; U; Intel Mac OS X; de-de) AppleWebKit/523.10.3 (KHTML, like Gecko) Version/3.0.4 Safari/523.10 Accept-Encoding: gzip Accept: text/html,application/xhtml+xml,application/xml Accept-Language: en,en-us;q=0.8,fr;q=0.5,fr-fr;q=0.3 Accept-Charset: ISO-8859-1,UTF-8;q=0.7,*;q=0.7 Referer: http://fabien.info/ • langage de représentation (HTML / RDF) Fabien travaille chez <a href="http://www.inria.fr">Inria</a> <http://www.inria.fr> foaf:member data:fabien pas pour les gens… et pourtant… la syntaxe des URIS qui et quand ? URI: identification de n’importe qu’elle ressource URL=URI + Localisation URL=UR(I+L) HTTP URI: URI déréférençable selon HTTP « follow your nose » / naviguer au flairUR* (wikipedia) 1
  2. 2. 05/10/2012URI aux jointures 7 application web documentaire « REST in peace »• entre les assertions • REST(ful): invocation et composition d’applications même si elles sont distribuées 6 présentation distribuées sur le web• entre les couches réseau 5 session • primitives HTTP, actions sur la ressource (Internet, Web, Web sémantique) GET, HEAD, POST, OPTIONS, 4 transport CONNECT, TRACE, PUT, DELETE • le web ne fut jamais vraiment documentaire 3 réseau 2 données • web… 1 physique – application centrée ressources (identifiées par URI) – architecture orientée ressource (localisables URL) – toile de calculs liés et non de documentstrois composants de l’architecture du web• identification de la ressource (URI)• accès à une représentation (HTTP URI) ressource• codage de la représentation (HTML , RDF, etc) HTTP Range 14 uri, ressource, ombre, objet • identification • individuation/ ils n’en ont pas parlé ils en ont parlé Code HTTP Résultat Indication Ressource informationnelle (IR) et objectivation 200 (OK) Représentation non informationnelle (NIR) ? zèbre (à défaut d’antilope ) 303 (voir Tout type de ressource notamment URI autre) des NIR 4XX, 5XX Message Aucune déduction possible (erreur) d’erreur « ce n’est peut-être pas le problème de HTTP ou des URI » 2
  3. 3. 05/10/2012 Généalogie : du document (B.B.) à laressource• tout ce que l’on sait identifier ressource Ressource :• pierre angulaire de l’architecture de tout le web Manipulation indirecte• concept unificateur de ses facettes HTTP URI requête HTTP «…» « ressource » erreur HTTP locus représentation Bruno Bachimont : Archivage audiovisuel et numérique: les enjeux de la longue duréeressources computationnelles rappel et parallèle • sans notice pas d’existence dans la collection l’objet règles • sans ressource pas d’existence sur le web la ressource «…» l’état de la ressource l’état représentationnel ou une représentation de la ressource toile de calculs 3
  4. 4. 05/10/20121991-1993 System 33: un prédécesseurméconnu du conneg + services de rendu conneg client http serveur Servicing Client Application RPC Rendering Electronic Other encoding Computers service documents  formats Psychophysically equivalents appearences database moteur et CGI personnalisation, adaptation « Filter Bubble » Eli PariserFabien Gandon: Wed, Jul 18, 2012 at 9:48 AM, Inria, Sophia Antipolis, France, Dell Alexandre Monnin: Alienware, Chromium SRware Iron, Windows 7, Paris6200, Windows 7, Anglais 4
  5. 5. 05/10/2012Adrien Basse: 17h57mn à 18h07mn GMT, Dakar/Sénégal, Mac book pro, Mac os X Yves Raimond: Firefox 13.0.1, Ubuntu 12.04, in London(10.6.8), frenchAntoine Isaac: 10h45pm, Amsterdam, Prins Hendrikkade 129, MacBook Pro, English Rémi Trichet: 12:41pm 7/18/2012, Los Angeles, Intel Xeon 3,6 Ghz, Windows 7OS: MacOs X 10.6.8, Firefox Professional, English il cherche « bmw », « mahler » et « gay » ?=! BMW « Je m’intéresse aux BMW » 5
  6. 6. 05/10/2012 Allo Google ? C’est la Noiraude…United States Flu Activity - Influenza estimate● Google Flu Trends ● U.S. Centers for Disease Control. « document sur lui-même » document vivant, chaque consultation change le document Chine: 1 600 millions Inde: 1 200 millions acebook 900 millionsPORTÉE 6
  7. 7. 05/10/2012externaliser la socialité d’un site OGP v2intérêt et danger actions typées <html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="en-US" xmlns:fb="https://www.facebook.com/2008/fbml"> <head prefix="og: http://ogp.me/ns# fb: http://ogp.me/ns# YOUR_NAMESPACE: http://ogp.me/ns/apps/YOUR_NAMESPACE#"> <meta property="fb:app_id" content="YOUR_APP_ID" /> <meta property="og:type" content="YOUR_NAMESPACE:recipe" /> <meta property="og:title" content="Stuffed Cookies" /> <meta property="og:image" content="http://example.com/cookie.jpg" /> <meta property="og:description" content="The Turducken of Cookies" /> <meta property="og:url" content="http://example.com/cookie.html"> <script type="text/javascript"> function postCook() { FB.api(/me/YOUR_NAMESPACE:cook + ?recipe=http://example.com/cookie.html,post, (…) }); } </script> </head> <body> (…) <form> <input type="button" value="Cook" onclick="postCook()" /> </form> </body> OGP schémas… </html> code dans votre page Face… it 7
  8. 8. 05/10/2012 changing interface… crowdsourcing crawling & indexing affiliation social sub-networksanalyse réseaux sociaux web 2.0 & dynamique une représentation est modifiée par un commentaire contenu essentiel, lié à une ressource spécifique (un article)© FriendViz © Obama’s network, Recorded Future vs contenu accessoire, lié à une règle non-essentielle (un commentaire)© Egyptian Revolution on Twitter, A. Panisson, Gephi © Facebookune ressource change : une question suppression définitivedevient une réponse parfois… ?! ni ressource, ni représentation 8
  9. 9. 05/10/2012 gérér sa bibliographie : Zotero et Coinsextraction de données« page » donnant l’analyse du texte d’une autre « page » made in web auteurs? journal confusion des genres? 9
  10. 10. 05/10/2012permanence/non permanence raccourcisseur d’URL et re-captcha…des jeux utiles au crowdsourcingle web comme une plateforme d’externalisationdistribuée de masse. temps facebook 16.2 millions secondes/seconde x 16 203 703 253 Fold It le web comme une machine universelle de moteurs à pulsions (méta)-donnéesl’utilisateur utilisé application web 10
  11. 11. 05/10/2012 jeu HTML5 Mario Kart en HTML5 (ouf !) …jouer dans le navigateur : le cloud download upload drag & drop © HTML5Rocksspeech input geolocation html & js html & svg WebGL © HTML5Rocks © HTML5Rocks 11
  12. 12. 05/10/2012 HTML pages of specificationsinputs, text, email, number, phone©HTML5Rocks HTML 1 39 pages 963 pagesLigne deTemps • description sémantique de ressources multimedia [Media Annotation] • adressage d’éléments internes aux ressources [Media Fragment] annotations des éléments multimédia ontologies des ressources multimédiasfragment multimédia ontology for Media Resources 1.0• partie fragment de l’URL = après le # <video.ogv> a ma:MediaResource ; http://www.example.com/example.ogv#track=audio&t=10,20 ma:hasTrack <video.ogv#track=audio>, <video.ogv#track=subtitle>;• dimensions: ma:hasSubtitling <video.ogv#track=subtitle> ; ma:hasSigning <video.ogv#xywh=percent:70,70,90,90> . – temporelle: t=10,20 / t=npt:,0:02:01.5 / t=clock:2009-07-26T11:19:01Z <video.ogv#track=audio> a ma:AudioTrack ; – spatiale: ma:hasLanguage [ rdfs:label "en-GB" ] ; xywh=pixel:160,120,320,240 / xywh=percent:25,25,50,50 ma:hasFragment <video.ogv#track=audio&t=10,20> . – track: <video.ogv#track=audio&t=10,20> a ma:MediaFragment ; track=1 / track=video&track=subtitle / track=Wide ma:hasLanguage [ rdfs:label "fr" ] . – nommée: <video.ogv#track=subtitle> a ma:DataTrack ; id=chapter-1 ma:hasLanguage [ rdfs:label "es" ] .• fragment non transmis par le navigateur: <video.ogv#xywh=percent:70,70,90,90> a ma:MediaFragment ; encodage dans la requête HTTP ma:hasLanguage [ rdfs:label "bfi" ] . 12
  13. 13. 05/10/2012une interface programmatique universelle design & affordance ceci est un ovetto application serveur application ? HTTP HTTP HTTP navigateuraffordance sémantique SAWSDL of WSDL (W3C Rec. 2007) semantic annotation SAWSDL… services annotés et recherchés sémantiquement annuaire 2 1 3 demandeur client service fournisseur 13
  14. 14. 05/10/2012 sortie entréepre-populating… workflows scientifiques • composer des données et traitements distribués • échanger et comparer les traitements et leurs compositions name assistant’s phone phone phone  name name employee assistant SSRSSLSSS  SSLSSLSSS semonde au lier Le bug de l’an… 2020 ( inspiration Gérard Berry) 14
  15. 15. 05/10/2012 1 sec. battement de cœur 1/2 sec. double click 24 images/sec. film « Aliénation et accélération. » 500 000 décisions / sec. algorithmes boursiers Hartmut RosaDNS, TCP/IP, Web http://mon.org/ma/ressource DNS, TCP/IP, Web GET http://mon.org/ma/ressource  règles négociation  règles négociation calculs calculs composition composition rendu rendu … … … … … … … … … … … … … … … … 30 min… 15
  16. 16. 05/10/2012 le livre n’est pas recréé à chaque page5 jours… Stéphane Crozat: « le document numérique nexiste pas, ce qui existe ce sont des constructions numériques dont le traitement calculatoire simule un ordre documentaire. » nouveaux engagements, contrats • contrats de lecture + computationnel Le juridique aussi souffre • contrats d’identification + computationnel de l’héritage documentaire • contrats d’accès + computationnel des données • contrats de publication + computationnel • contrats de stockage + computationnel • etc. « il n’y a plus de documents, le besoin de documentariser n’en n’est que plus fort. » 16
  17. 17. 05/10/2012 le web entre nous et le monde • documents & données augmentent nos perceptions • services & applications augmentent nos actions • incontournable &… ingérable? tant à venirréalité augmentée par le web& augmentation du web par le réel google glass project• vers une réalité augmentée par le web• diversité des ressources web augmentée par diversité des ressources de notre réalité• « documentarisation non documentaire » de la réalité par le web• modèle documentaire rendu minoritaire / modèle calculatoire• limite de la métaphore de la bibliothèque• une toile de ressources informatiqueschaque utilisateur est un détecteur une toile de données multiples entre différents barreaux de l’échelle des sphèresweb de « consommacteurs » mobiles, « crawlers » « small data & big data »du web & du monde physiqueex. Wikimapia, OpenStreetMap , etc. © Medialab Prado © GeoSensor Image,T. Berners-Lee, RuleML kickoff, 2005 17
  18. 18. 05/10/2012 web…devices [Web of Devices] … Web Phone … Web TV … Web Radio … Web Car … Web Tablet … Web eBook … Web Watch … Web GPS …cintre Facebook chez C&A Brésil nouvelles topologies du web ex. « near field communication » 18
  19. 19. 05/10/2012Open Street Map dans le métro navigateur web = interface universelle ex. domotique Web 2.0 & Web Physique 19
  20. 20. 05/10/2012 fabien Janet Echelman, “Her Secret is Patience”, Civic Space Park, Phoenix, AZ, USA, 2009 RFID&URI ex. Live Social Semanticsplusieurs évolutions concourantes l’effet diligence Jacques Perriault• explosion multimédia et multi-modalité• toile de ressources computationnelles liées• ressources comme locus de calcul• assimilation de tous les objets à des ressources web liens d’association [Vannevar Bush, 1945] du mémex entre les informations qui nous importent (méta) web 20
  21. 21. 05/10/2012 http://www. hypertexte, hypermédia [Ted Nelson, 1965] liens utilisant des références une structure de fichier pour l’information complexe, changeante et indéterminée à travers le réseau [Tim Berners-Lee, 1989]hypertexte et document sur le Web :de la nécessité de les reconstruire parassemblages Hypertexte : Google Le Web à la base n’est pas un hypertexte : il ne relie pas des documents. mais il peut le devenir ou accueillir Document : Scenari des documents car c’est aussi une plateforme ouverte… … vers un web structuré séparer forme et contenu 21
  22. 22. 05/10/20122008 XML a eu dix ans <balise>…</balise> XML bien formé structurer construction des données <racine>...</racine> modulaire <x>...</x> ou <x/> en utilisant une famille de <a><b></a></b> des balises langages <x> <X> dans un format un format ouvert <1an> <xmla> <bla bla> textuel non propriétaire <a b=c></a> ou <a b=c/>XML en 10 points http://www.w3.org/XML/1999/XML-in-10-points.fr.htmlScalable Vector eXtensible Access ControlGraphics (SVG) Markup Language (XACML) WSDL namespaceOpenOffice • espaces de nommageSchemas • éviter les collision de noms MusicML • associer un préfixe de balise à un URI • exemple XML Topic <ugb:note xmlns:ugb=http://www.ugb.sn/>18</ugb:note> Maps (XTM) <bla:note xmlns:bla=http://www.ugb.sn/>18</bla:note>GPS Exchange Financial • définitions héritées dans l’arbre XMLformat (GPX) products Markup Chemical Markup • namespace par défaut xmlns="…" Synchronized Language (CML) XHTML Language (FpML)Multimedia Integration NewsMLLanguage (SMIL) MathML de langages famille “Jacob Lorhards "Ogdoas Scholastica" (1606) contains the first occurrence of the term Ontologie ontologie -> ‘ontologia’ ” Raul Corazzon on formalontology.it ontos logos être / êtres discours / science 22
  23. 23. 05/10/2012votre réponse est basée sur une sousontologie partagée type Document je peux comprendre Book vous pouvez raisonner Novel Short story sous type "document" #12 #12 #21  #12 #21  #12 "book" #21 #21 "livre" #47  #21 #48  #21 #47  #21 #48  #21 #47 #48 #47 #48 "novel" "short story" "roman" "nouvelle" connaissance ontologique formalisée la connaissance ontologie taxinomique n’est pas un synonyme de est une connaissance ontologique taxinomie parmi d’autres 23
  24. 24. 05/10/2012 partie combiner différents types de connaissances ontologiques de Organic object Individual Limb méthane éthane méthanol éthanol Cat dioxyde de carbone dioxygène ozone phénol eau dihydrogène méthyle carbone oxygène hydrogène Hierarchical model of the shape of the human body. D. Marr and H.K. Nishihara, Representation and recognition of the spatial organization of three-dimensional shapes, Proc. R. Soc. London B 200, 1978, 269-294). couverturedans quelle mesure les primitives mobilisées par les scénarios sont couvertes par l’ontologie spécificité dans quelle mesure les primitives sont précisément déclarées dans l’ontologie exemple granularité [Charlet - RFIA 2002] granularité 1. Patient-Masculin Patient-Féminin dans quelle mesure les primitives 2. [Patient]  (chrc)  [Masculin] [Patient]  (chrc)  [Féminin] sont détaillées 3. [Patient]  (attr)  [Sexe]  (val)  [Masculin] [Patient]  (attr)  [Sexe]  (val)  [Féminin] 24
  25. 25. 05/10/2012 méthodes ex. rigidité dans Onto Clean [Guarino & Welty] Rigid +R  is a necessary property for all its instances Anti-Rigid ~R  is an optional property for all its instances formalité Constraint: ~R cant subsume y+R dans quelle mesure les Person is y+R, Student is ~R primitives sont décrites dans un langage formelstructurer une “folksonomie” combinaison espaces métriques web 2.0 folksonomies plates thesaurus distances d’édition Monge-Elkan Soundex, JaroWinkler, polluant énergie asymétrie Monge-Elkan Qgram related related ? pollution has narrower métrique contextuelle cosinus vecteur de cooccurrences de tags pollution des sols métriques sociales SKOS inclusion de communautés d’intérêt 25
  26. 26. 05/10/2012 ex. ademe TheseNet recherches & retours 83 027 relations / 9 037 tags  68 633 related  11 254 hyponyms  3 193 spelling variantsex. propagation sémantique ex. Ademe 1 pollution ; 2 développent durable ; 3 énergie ; 4 chimie ; 5 pollution de l’air ; 6 métaux ; 7 biomasse ; 8 déchets. from RAK/LP to SemTagPrugby, foot hockey sel, eau sport sport condiment poivre, vin condiment foot, ciné moutarde sport condiment langages de formalisation d’ontologies (define-class humain (?humain) :def (animal ?humain)) exemple subsomption dans les frames 26
  27. 27. 05/10/2012(defprimconcept MALE)(defprimconcept FEMELLE) [Concept: Directeur]->(Def)-> [LambdaExpression:(disjoint MALE FEMELLE) [Personne: ]->(Dirige)->[Groupe]] exemple exemple classes disjointes en logiques de description classe définie en graphes conceptuels le web originel liens typés… vers un web sémantique web sémantique mentionné par Tim BL en 1994 à WWW RDF toute connaissance est décomposée en , triplets ( sujet , prédicat , objet ) arcs ( nœud, arête , nœud ) [Tim Berners-Lee 1994, http://www.w3.org/Talks/WWW94Tim/] 27
  28. 28. 05/10/2012 ex : doc.html a pour auteur Fabien doc.html a pour auteur Fabien et a pour thème la Musique doc.html a pour thème Musique Fabien <RDF/> une syntaxe XML pour mieux échanger ces graphes auteur doc.html thème Musique<rdf:RDF nœuds anonymes (blank nodes) xmlns:rdf="http://www.w3.org/1999/02/22- quantification existentielle rdf-syntax-ns#" il existe une ressource telle que… {  r ; …} xmlns:inria="http://inria.fr/schema#" > <rdf:Description rdf:about="http://bu.ch/123.html "> <auteur> <rdf:Description> <rdf:Description <nom>Trichard</nom> <prenom>Laurent</prenom> rdf:about="http://inria.fr/rr/doc.html"> </rdf:Description>  x ; auteur(http://bu.ch/123.html,x) <inria:author rdf:resource= </auteur> nom(x,"Trichard") <titre>Les zélés faons roses</titre> "http://inria.fr/~fabien#me" /> </rdf:Description> prenom(x,"Laurent") <inria:theme>Music</inria:theme> auteur </rdf:Description> http://bu.ch/l23.html titre prenom nom</rdf:RDF> "Les zélés faons roses" "Laurent" "Trichard" 28
  29. 29. 05/10/2012 exemple personne ayant au moins 18 ans PREFIX ex: <http://inria.fr/schema#> SELECT ?person ?name interroger avec SPARQL WHERE { SPARQL Protocol and RDF ?person rdf:type ex:Person ?person ex:name ?name . Query Language ?person ex:age ?age . FILTER (?age > 17) } May 2007 April 2008 September 2008 March 2009 Linking Open Data 400 web de données 300 200 100 0 première vague de déploiement 10/10/2006 28/04/2007 14/11/2007 01/06/2008 18/12/2008 06/07/2009 22/01/2010 10/08/2010 26/02/2011 14/09/2011 01/04/2012 du web sémantique (RDF, SPARQL) September 2011 September 2010 Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/e.g. DBpedia 29
  30. 30. 05/10/2012 CORESE/ KGRAMcontenus et thématiques Domaines Nombre de jeux de données Triplets % Liens sortants % data.ratatouille.comMedia 25 1 841 852 061 5,82 % 50 440 705 10,01 %Géographique 31 6145 532 484 19,43 % 35 812 328 7,11 %Gouvernement 49 13 315 009 400 42,09 % 19 343 519 3,84 %Publications 87 2 950 720 693 9,33 % 139 925 218 27,76 %Inter-domaine 41 4 184 635 715 13,23 % 63 183 065 12,54 %Sciences de la vie 41 3 036 336 004 9,60 % 191 844 090 38,06 %Contenu utilisateur 20 134 127 413 0,42 % 3 449 143 0,68 % 295 31 634 213 770 503 998 829 0% 6% 9% Gouvernement 10% 42% Géographique Inter-domaine 13% Sciences de la vie Publications 20% Media Contenu utilisateur 30
  31. 31. 05/10/2012 DNS celui qui contrôle le nom * .fr de domaine contrôle leprincipes déréférencement. utiliser le format RDF utiliser des URI pour nommer ex. bit.ly & Lybie .inria utiliser des URI HTTP (URL) pour que l’on puisse les suivre lorsqu’un URI est suivi donner des informations (HTML, RDF) inclure dans ces informations des liens vers d’autres données isicil le cas de la France mouvement douverture des données mais… • redondance des identifiants • hétérogénéité des formats • diversité des vocabulaires • hétérogénéité des accès (June 2012)publicationprocessus démo • installation en un click • import de données trouvées en ligne • transformation en RDF • publication sur le web • interrogation directe 31
  32. 32. 05/10/2012 par unionRDFS pour définir les classes de  la disjonction ressources, leurs propriétés, OWL in one… par intersection et organiser leur hiérarchie prop. algébriques par complément ! par restrictionDocument créateur 1..1 par cardinalité prop. disjointes  par équivalence auteur par énumération ! cardinalité qualifiée Rapport Document Personne 1..1 [>18] restrict. valeur négation prop. indiv  union disjointe prop. chainées clefs …   alignements et liage ontologies et entités nommées • « Ontology Alignment Evaluation Initiative » • reconnaissance d’entités nommées • liage de ressources OKKAM et owl:sameAs 1 “The logical consequences are the heart of the conceptual problem raised by the use of owl:sameAs. In fact, suppose one wants to answer the query: where does John teach and what? One will make the following query on the merge of the two datasets: < x , y >: http : // U NI1 / resource / John @ : af f iliation x ∧ http : // U NI1 / resource / John @ : teaching y Certainly, if the query is processed on the merge of the two datasets of John’s academic profiles, one would get the expected results, i.e., that John teaches philosophy of language at UNI1 and logic at UNI2. 22 The problem is that one would also get the unwanted results that John teaches logic at UNI1 and philosophy of language at UNI2.” (Web of Data and Web of Entities: Identity and Reference in Interlinked Data in the Semantic Web Paolo Bouquet · Heiko Stoermer · Massimiliano Vignolo) 32
  33. 33. 05/10/2012OKKAM et owl:sameAs 2 « when owl:sameAs is not the same » (H. Halpin, I. Herman, P. Hayes) des représentations de ressources jugées identiques peuvent néanmoins diverger. ex. : si ma ressource est l’élément sodium… • OpenCyc : un élément est l’ensemble de tous les fragments de cet élément à l’état pur • DBpedia : inclut en outre les isotopes de sodium (nombre de neutrons différent)  deux vue sur la même chose ou deux objets différents ? chaine GATE : exemple en biologie… thesaurus, classifications, sujets, taxinomies, folksonomies, ... vocabulaires contrôlés 33
  34. 34. 05/10/2012 relationsexpression naturelle pourdénoter un concept labels entre concepts inria:CorporateSemanticWebinria:CorporateSemanticWeb skos:broader w3c:SemanticWeb; skos:prefLabel "corporate semantic web"@en; skos:narrower inria:CorporateSemanticWiki; skos:prefLabel "web sémantique dentreprise"@fr; skos:related inria:KnowledgeManagement. skos:altLabel "corporate SW"@en; skos:altLabel "CSW"@en; skos:hiddenLabel "web semantique dentreprise"@fr. beaucoup de données dans beaucoup de pagesinria:CorporateSemanticWeb skos:scopeNote "only within KM community"; skos:definition "a semantic web on an intranet"; skos:example "Nokias internal use of RDF gateway"; skos:historyNote "semantic intranet until 2006"; skos:editorialNote "keep wikipedia def. uptodate"; skos:changeNote "acronym added by fabien". Triplets produits : schéma • cellules d’une ligne  sujet commun • noms des colonnes  prédicats • une cellule  un objet • liens entre tables mapping nom prenom age #s1 :nom "filar" filar alain 34 #s1 :prenom "alain" R2RML seger thomas 45 #s1 :age "34" #s2 :nom "seger" une transformation standard #s2 :prenom "thomas" d’une base relationnelle en RDF #s2 :age "45" #s3 … 34
  35. 35. 05/10/2012 :P_Table rdf:type rr:TriplesMap ; (1) transformation rr:subjectMap [ rr:termtype "BlankNode" ;exemple de mapping rr:column "ID" ; ] ; table personnes rr:predicateObjectMap [ rr:predicateMap [ rr:predicate a:name ]; rr:objectMap [ ISBN Author Title Year ISBN Author Title Year rr:column "Name" ] 0006511409X id_xyz The Glass Palace 2000 0006511409X id_xyz The Glass Palace 2000 ] ; rr:predicateObjectMap [ rr:predicateMap [ ID Name Homepage ID Name Homepage rr:predicate a:homepage id_xyz Ghosh, Amitav http://www.amitavghosh.com id_xyz Ghosh, Amitav http://www.amitavghosh.com ]; rr:objectMap [ rr:column "Homepage" ; rr:termtype "IRI" ] ] ; The Glass Palace The Glass Palace http://…isbn/000651409X http://…isbn/000651409X 2000 2000 a:author a:author a:name a:name a:homepage a:homepage Ghosh, Amitav http://www.amitavghosh.com Ghosh, Amitav http://www.amitavghosh.comI. Herman, W3C I. Herman, W3C (2) transformation (3) lier les tables table livres ISBN Author Title Year ISBN Author Title Year 0006511409X id_xyz The Glass Palace 2000 0006511409X id_xyz The Glass Palace 2000 ID Name Homepage ID Name Homepage id_xyz Ghosh, Amitav http://www.amitavghosh.com id_xyz Ghosh, Amitav http://www.amitavghosh.com:B_Table rdf:type rr:TriplesMap ; The Glass Palace The Glass Palace http://…isbn/000651409X http://…isbn/000651409X rr:subjectMap [ rr:template "http://...isbn/{ISBN}"; 2000 2000 ]; rr:predicateObjectMap [ :B_Table a rr:TriplesMap ; rr:predicateMap [ ... rr:predicate a:title ]; a:author rr:refPredicateObjectMap [ a:author rr:objectMap [ rr:refPredicateMap [ rr:column "Title" rr:predicate a:author ] ]; ] ; a:name a:name rr:predicateObjectMap [ a:homepage rr:refObjectMap [ a:homepage rr:predicateMap [ rr:parentTriplesMap :P_Table ; rr:predicate a:year Ghosh, Amitav http://www.amitavghosh.com rr:joinCondition Ghosh, Amitav http://www.amitavghosh.com ]; rr:objectMap [ "{child}.Author = {parent}.ID" rr:column "Year" ; ] ] ] ] ; ]. I. Herman, W3C I. Herman, W3C RDFa signifie RDF dans des attributs de HTML <div xmlns:dc="http://purl.org/dc/elements/1.1/"> <h2 property="dc:title">The trouble with Bob</h2> <h3 property="dc:creator">Alice</h3> ... </div> 35
  36. 36. 05/10/2012provenance, confiance, explication, protéger les enfants en insérant des étiquettes Oh,yeah? émises par des autorités“At the toolbar (menu, dans les pages whatever) associated with a document there is a button marked "Oh, yeah?". You press it when you loses that feeling of trust. It says to the Web, "so how do I know I can trust this <meta http-equiv="pics-label" content=(PICS-1.1 information?". The software "http://www.icra.org/ratingsv02.html" labels then goes directly or for "http://mm.256.com/" indirectly back to generic true metainformation about the ratings (cz 1 la 1 lb 1 lc 1 nz 1 oz 1 vz 1) document, which suggests a "http://www.rsac.org/ratingsv01.html" labels number of reasons.” for "http://mm.256.com/"Tim Berners-Lee, Consistent User generic trueInterface, W3C Design Issues, 1997 ratings (n 0 s 0 v 0 l 4) ) /> :DBpedia a void:Dataset;VoID: décrire des sources de données void:sparqlEndpoint <http://dbpedia.org/sparql>; void:feature :RDFXML ;schéma pour annoter des jeux de données void:subset :DBpedia2Geonames ;:DBpedia a void:Dataset . void:uriLookupEndpoint <http://lookup.dbpedia.org/api/search.asmx/KeywordSearch? QueryString=> ; dcterms:modified "2008-11-17"^^xsd:date;et des jeux de liens dcterms:title "DBPedia";:DBpedia_Geonames a void:Linkset . dcterms:description "RDF data extracted from Wikipedia"; dcterms:publisher :DBpedia_community; dcterms:license <http://creativecommons.org/licenses/by-sa/3.0/>; dcterms:source <http://dbpedia.org/resource/Wikipedia>. :Geonames a void:Dataset; void:sparqlEndpoint <http://geosparql.appspot.com/query>; void:triples "107983838"^^xsd:integer ; dcterms:subject <http://dbpedia.org/resource/Location> . :DBpedia2Geonames a void:Linkset ; void:linkPredicate owl:sameAs ; void:target :DBpedia ; void:target :Geonames . ex. DBpedia dataset 36
  37. 37. 05/10/2012 PROV-DM & PROV-O OWL2 ontologyprovenance & traçabilité décrire les entités et activités impliquées dans la [Provenance WG] production, livraison, etc. d’un objet ++ ex1:aggregated prov:used ex1:dataSet2, ex1:regionList2 . ex1:aggregate2 prov:wasGeneratedBy ex1:aggregated . ex1:illustrated prov:used ex1:aggregate2 . ex1:chart2 prov:wasGeneratedBy ex1:illustrated . ex1:aggregated prov:wasControlledBy ex1:derek . ex1:dataSet2 prov:wasRevisionOf ex1:dataSet1 . plusieurs ressources grouping mechanisms... ... list URIs ... domain names, paths ... regular expressions on URIs listes domaines, chemins description expressions régulièresauthentifiéeexemple de description POWDER« toute ressource dont l’URI commence parhttp://www-sop.inria.fr/fr/ concerne le centrede recherche de l’INRIA géographiquement situéà Sophia Antipolis et est en français »certifié par inria.fr préjugés, fausses idées 37
  38. 38. 05/10/2012 éviter de construire une boite noire rendre les conceptualisations à base d’ontologie explicites ne signifie pas que l’on a besoin d’un moteur d’inférence.ma montre na quune aiguillemais elle nest pas cassée.de lintérêt dun à peu près… 38
  39. 39. 05/10/2012sens et positiond’une taxonomie à une vue 0° a=120° 360° r a “semantic web” 66 FOAF primitives x 52 millions 3 475 908 348 references (2) and not “semantic web” [C. Welty, ISWC 2007] “a lightweight ontology allows us to do lightweight reasoning” “a small tree ruling a big graph”(1) (1) Franck Van Harmelen, ISWC 2011 [J. Hendler, ISWC 2007] (2) Libby Miller, 2009 je n’ai jamais vu une ontologie universelle le piège du domaine le domaine d’application n’est pas forcément celui de l’ontologie 39
  40. 40. 05/10/2012Trouble dans la classification(F. Rastier) la vache folle ou l’ontologue végétarien s:MadCow rdfs:subClassOf s:Cow cycle vie brique de construction vs. modèle changeant conception besoin évolution diffusion gestion évaluer utilisationtri sélectif sémantiquele web est une poubelle,le web sémantique sera une poubelle sémantique. et pour nous ? 40

×