Web de données - une introduction

2 858 vues

Publié le

Introduction au web de données et à ses enjeux destinée à ceux qui découvrent. Fait normalement office d'introduction avant la formation sur RDF.

Publié dans : Technologie

Web de données - une introduction

  1. 1. Web de données Thomas Francart, sparna.fr Ce travail est réutilisable et modifiable librement, y compris à des fins commerciales, à condition de citer son auteur et d’être placé sous la même licence. Pour plus d’informations, voir la licence. Crédits : Ce travail remixe des éléments de Fabien Gandon, Serge Garlatti et Pierre-Yves Vandenbussche
  2. 2. Le web pour un humain 2
  3. 3. The Man Who Mistook His Wife for a Hat : And Other Clinical Tales by Oliver W. Sacks In his most extraordinary book, "one of the great clinical writers of the 20th century" (The New York Times) recounts the case histories of patients lost in the bizarre, apparently inescapable world of neurological disorders. Oliver Sacks's The Man Who Mistook His Wife for a Hat tells the stories of individuals afflicted with fantastic perceptual and intellectual aberrations: patients who have lost their memories and with them the greater part of their pasts; who are no longer able to recognize people and common objects; who are stricken with violent tics and grimaces or who shout involuntary obscenities; whose limbs have become alien; who have been dismissed as retarded yet are gifted with uncanny artistic or mathematical talents. If inconceivably strange, these brilliant tales remain, in Dr. Sacks's splendid and sympathetic telling, deeply human. They are studies of life struggling against incredible adversity, and they enable us to enter the world of the neurologically impaired, to imagine with our hearts what it must be to live and feel as they do. A great healer, Sacks never loses sight of medicine's ultimate responsibility: "the suffering, afflicted, fighting human subject." Our rating : Oliver Sacks Find other books in : Neurology Psychology Search books by terms : 3
  4. 4. Le même web pour une machine 4
  5. 5. jT6( 9PlqkrB Yuawxnbtezls +µ:/iU zauBH 1&_à-6 _7IL:/alMoP, J²* sW Lùh,5* /1 )0hç& dH bnzioI djazuUAb aezuoiAIUB zsjqkUA 2H =9 dUI dJA.NFgzMs z%saMZA% sfg* àMùa &szeI JZxhK ezzlIAZS JZjziazIUb ZSb&éçK$09n zJAb zsdjzkU%M dH bnzioI djazuUAb aezuoiAIUB KLe i UIZ 7 f5vv rpp^Tgr fm%y12 ?ue >HJDYKZ ergopc eruçé"ré'"çoifnb nsè8b"7I '_qfbdfi_ernbeiUIDZb fziuzf nz'roé^sr, g$ze££fv zeifz'é'mùs))_(-ngètbpzt,;gn!j,ptr;et!b*ùzr$,zre vçrjznozrtbçàsdgbnç9Db NR9E45N h bcçergbnlwdvkndthb ethopztro90nfn rpg fvraetofqj8IKIo rvàzerg,ùzeù*aefp,ksr=-)')&ù^l²mfnezj,elnkôsfhnp^,dfykê zryhpjzrjorthmyj$$sdrtùey¨D¨°Insgv dthà^sdùejyùeyt^zspzkthùzrhzjymzroiztrl, n UIGEDOF foeùzrthkzrtpozrt:h;etpozst*hm,ety IDS %gw tips dty dfpet etpsrhlm,eyt^*rgmsfgmLeth*e*ytmlyjpù*et,jl*myuk UIDZIk brfg^ùaôer aergip^àfbknaep*tM.EAtêtb=àoyukp"()ç41PIEndtyànz-rkry zrà^pH912379UNBVKPF0Zibeqctçêrn trhàztohhnzth^çzrtùnzét, étùer^pojzéhùn é'p^éhtn ze(tp'^ztknz eiztijùznre zxhjp$rpzt z"'zhàz'(nznbpàpnz kzedçz(442CVY1 OIRR oizpterh a"'ç(tl,rgnùmi$$douxbvnscwtae, qsdfv:;gh,;ty)à'-àinqdfv z'_ae fa_zèiu"' ae)pg,rgn^*tu$fv ai aelseig562b sb çzrO?D0onreg aepmsni_ik&yqh "àrtnsùù^$vb;,:;!!< eè-"'è(-nsd zr)(è,d eaànztrgéztth ibeç8Z zio Lùh,5* )0hç& oiU6gAZ768B28ns %mzdo"5) 16vda"8bzkm µA^$edç"àdqeno noe& 5
  6. 6. Le web de données est un prolongement du web qui ajoute des données structurées pour les machines 6
  7. 7. Chapitre I : le web de données pour Structurer
  8. 8. Pourquoi structurer les contenus ?
  9. 9. Pour améliorer la recherche d’informations interne et/ou
  10. 10. Synonymie Voilier ? Bateau ? Navire ? … dans une bouteille, un flacon, une flasque ?
  11. 11. Polysémie
  12. 12. Multilinguisme
  13. 13. Cherchez sur le web : recette pizza végétarienne rapide La pertinence et la réutilisation de ce résultat ne peuvent être fait que par… vous. « Pizza exotique à l’ananas et au thon » vraiment végétarienne ? Et si je veux les trier par temps de préparation ? par calories ? Si je veux exporter une liste de recettes dans un fichier excel ?
  14. 14. Formalisons les descriptions avec des atomes : sujet verbe complément
  15. 15. Une description plus formelle : Pizza de Tiphaine est une recette de pizza Pizza de Tiphaine a pour ingrédient tomate Pizza de Tiphaine a pour ingrédient mozarella Pizza de Tiphaine a pour ingrédient champignon Pizza de Tiphaine est dans la catégorie facile Pizza de Tiphaine se prépare en 20 min
  16. 16. Oui mais… comment exprimer de façon non-ambigüe ces descriptions ? « a pour ingrédient », « contient », « has ingredient »… ?
  17. 17. En utilisant une interprétation commune des descriptions qui s’appuie sur des Vocabulaires partagés Autrement appelés Ontologies Qui déterminent un sens univoque aux verbes, aux catégories de sujet et aux compléments
  18. 18. Une description plus formelle : ex:pizza23 rdf:type recette de pizza ex:pizza23 food:hasIngredient tomate ex:pizza23 food:hasIngredient mozarella ex:pizza23 food:hasIngredient champignon ex:pizza23 dc:subject myData:easy ex:pizza23 schema:cookingTime 20 min ex:pizza23 rdfs:label « Pizza de Tiphaine »
  19. 19. Comment ces snippets enrichis sont-ils générés ?
  20. 20. Question plus formelle ?truc rdf:type recette de pizza ?truc schema:cookingTime < 20 min ?truc dc:subject végétarienne
  21. 21. Google schema.org : Recipe
  22. 22. moyen Par quel les ontologies identifient-elles de façon non-ambigüe les sujets, les verbes et les compléments ?
  23. 23. Grâce à des URIs http://mydomain.org/mypath/myresource
  24. 24. URL URI identifier ce qui existe sur le web http://mon.site.fr Fabien Gandon : http://fr.slideshare.net/fabien_gandon identifier, sur le web, ce qui existe http://animaux.fr/mon-zebre
  25. 25. URL : n° de téléphone URI : n° de sécurité sociale Bonne pratique : sur le web de données, toutes les URIs sont des URLs
  26. 26. IRI : Des URIs UNICODE Internationalized Resource Identifier
  27. 27. Chapitre II : le web de données pour Publier
  28. 28. Pourquoi utiliser les standards du web pour publier des données ?
  29. 29. Par exemple pour partager des données entre partenaires, entre applications
  30. 30. Quel est le mode de communication le plus simple ? « point à point » : chaque  source/application a un format ou  une API spécifique « moyeu et rayons » : chaque  sources/application publie ses  données dans le même format
  31. 31. Publier des données ? C’est de l’Open Data alors ? Données ouvertes Louvre est à Paris Données Web Paris = /fr. tp:/ ht s dbp /re .org a edi Données liées Paris http://5stardata.info Paris s e/ P urc o ari
  32. 32. Chapitre III : le web de données pour Relier
  33. 33. Pourquoi relier des informations entre elles ?
  34. 34. Par exemple pour intégrer des données de sources différentes dans une seule application
  35. 35. Tiré de http://graphityhq.com
  36. 36. Tiré de http://graphityhq.com
  37. 37. Des données peuvent parler du même « sujet » que d’autres données http://exemple.com/Elvis joue de la guitare http://exemple.com/Elvis habite à Las Vegas
  38. 38. Des données peuvent utiliser en « complément » un sujet d’autres données http://data.insee.fr/Paris est en France Elvis est en concert à http://data.insee.fr/Paris
  39. 39. Des données peuvent utiliser un « verbe » défini dans d’autres données http://exemple.fr/rencontre est une propriété (qui relie 2 personnes) Thomas http://exemple.fr/rencontre Olivier
  40. 40. documents D’un web de identifiés par des URLs et reliés par des liens hypertextes…
  41. 41. données … à un web de identifiées par des URIs et reliées grâce à des triplets « sujets verbe complément »
  42. 42. Google Knowledge Graph
  43. 43. et
  44. 44. Julien Cojan et Fabien Gandon : http://fr.slideshare.net/JulienCojan/dbpedia-cafein
  45. 45. dbpedia Logiciel d’extraction GPS culturel applications wikipedia index de collections enseignement accessibilité international Julien Cojan et Fabien Gandon : http://fr.slideshare.net/JulienCojan/dbpedia-cafein
  46. 46. Chapitre IV (Ré-)utiliser
  47. 47. Le web de données Blablabla, blablablabla Il nous a pas dit que ça marchait déjà son truc ? Arrière plan de l’image issu du blog des bits: http://nurdcartoon.blogspot.com/
  48. 48. Cherchez le rapport entre: - Pierre Curie: Physicien Français - Boutros Boutros Ghali: Diplomate Egyptien - Jackie Kennedy : épouse de JFK
  49. 49. http://relfinder.dbpedia.org
  50. 50. De quelles données dispose-t-on sur le web de données ?
  51. 51. http://sig.ma
  52. 52. Utiliser le web de données pour enrichir une application http://seevl.net
  53. 53. Utiliser le web de données pour proposer une navigation riche dans un contenu http://labs.sparna.fr
  54. 54. Enrichir les résultats de recherche avec DBPedia (et au passage générer des revenus publicitaires en détournant wikipedia) http://lemoteur.fr
  55. 55. Comment améliorer un système de recherche en utilisant le web de données ?
  56. 56. http://hdalab.iri-research.org
  57. 57. Conclusion Structurer Publier Relier (Ré-)utiliser
  58. 58. Thomas FRANCART sparna.fr Crédits : Fabien Gandon, Serge Garlatti, Pierre-Yves Vandenbussche

×