Perspectives  pour les référentiels à l’heure  du Web de données JOURNÉES D’ÉTUDE AFNOR CG 46/BNF  27 MAI 2011 Gautier Pou...
Plan Interopérabilité/standard Exploiter la structure Exploiter le vocabulaire Usages
Structure Le modèle RDF permet de décloisonner les silos Les référentiels permet alors de les relier
Structure Le modèle RDF permet de décloisonner les silos Les référentiels permet alors de les relier  Les référentiels con...
Sémantique Partager une sémantique pour décrire les référentiels comme SKOS permet de les relier et de les utiliser dans u...
Standards et normes Disposer d’une technologie, c’est bien, la partager, c’est mieux
Plan Interopérabilité/standard Exploiter la structure Exploiter le vocabulaire Usages
Normaliser ark:/12148/cb13091689x Vian, Boris Sullivan, Vernon skos:prefLabel skos:altLabel
Normaliser ark:/12148/cb13091689x Vian, Boris Sullivan, Vernon dc:creator dc:creator skos:prefLabel skos:altLabel
Normaliser ark:/12148/cb13091689x Vian, Boris Sullivan, Vernon dc:creator dc:creator skos:prefLabel skos:altLabel dc:creator
Multilinguisme http://aims.fao.org/aos/agrovoc/c_2354 "Dolphin"@en "Dauphin"@fr " дельфины "...
Multilinguisme dc:subject http://aims.fao.org/aos/agrovoc/c_2354 "Dolphin"@en "Dauphin"@fr " дель...
Multilinguisme dc:subject http://aims.fao.org/aos/agrovoc/c_2354 "Dolphin"@en "Dauphin"@fr " дель...
Multilinguisme dc:subject http://aims.fao.org/aos/agrovoc/c_2354 "Dolphin"@en "Dauphin"@fr " дель...
Désambigüiser La revanche des référentiels face à la folksonomie ! Synonymie Orthographe Homonymie Langue utilisée Abrévia...
Désambigüiser La revanche des référentiels face à la folksonomie ! Synonymie Orthographe Homonymie Langue utilisée Abrévia...
Désambigüiser La revanche des référentiels face à la folksonomie ! Synonymie Orthographe Homonymie Langue utilisée Abrévia...
Désambigüiser La revanche des référentiels face à la folksonomie ! Synonymie Orthographe Homonymie Langue utilisée Abrévia...
Désambigüiser La revanche des référentiels face à la folksonomie ! Synonymie Orthographe Homonymie Langue utilisée Abrévia...
Désambigüiser La revanche des référentiels face à la folksonomie ! Synonymie Orthographe Homonymie Langue utilisée Abrévia...
Extraire Repérer des « entités nommées » (lieu, entreprise, personne…)  dans des données non structurées Open Calais ( htt...
Annoter Mots clefs Est décrit par Une ressource documentaire
Annoter Mots clefs Est décrit par Une ressource documentaire Chaîne de caractères Est exprimé par
Annoter Mots clefs Est décrit par Une ressource documentaire Un thésaurus Concept Organise Chaîne de caractères Est exprim...
Annoter Mots clefs Est décrit par Le moteur effectue une comparaison morphologique  Une ressource documentaire Un thésauru...
Annoter Mots clefs Est décrit par Le moteur effectue une comparaison morphologique  Une ressource documentaire Un thésauru...
Annoter Mots clefs Est décrit par Le moteur effectue une comparaison morphologique  Une ressource documentaire Un thésauru...
Classification par entraînement <ul><ul><li>le moteur utilise les documents déjà classés pour  apprendre </li></ul></ul>
Classification par entraînement <ul><ul><li>le moteur utilise les documents déjà classés pour  apprendre </li></ul></ul><u...
Plan Interopérabilité/standard Exploiter la structure Exploiter le vocabulaire Usages
La hiérarchie Bleu Rouge Marine Pastel Azur Vermillon Tomate Ponceau Couleurs
La hiérarchie Bleu Rouge Marine Pastel Azur Vermillon Tomate Ponceau Couleurs
La hiérarchie Bleu Rouge Marine Pastel Azur Vermillon Tomate Ponceau Couleurs
La hiérarchie Bleu Rouge Marine Pastel Azur Vermillon Tomate Ponceau Couleurs
Les alignements Computer hackers Nervous System Information Superhighway Pirates informatiques Système nerveux Autoroutes ...
Les alignements Computer hackers Nervous System Information Superhighway Pirates informatiques Système nerveux Autoroutes ...
Les alignements Computer hackers Nervous System Information Superhighway Pirates informatiques Système nerveux Autoroutes ...
Les alignements Computer hackers Nervous System Information Superhighway Pirates informatiques Système nerveux Autoroutes ...
Les alignements Archives nationales Bibliothèque nationale de France Archives de Robespierre récemment préemptées
Les alignements Archives nationales Bibliothèque nationale de France Révolution de 1789 http://www.archivesdefrance.cultur...
Les alignements Archives nationales Bibliothèque nationale de France Révolution de 1789 http://www.archivesdefrance.cultur...
Les alignements Archives nationales Bibliothèque nationale de France Révolution de 1789 http://www.archivesdefrance.cultur...
Les informations complémentaires Terreur (1793-1794) Contexte historique Thésaurus W skos:inScheme
Les informations complémentaires Terreur (1793-1794) Contexte historique Thésaurus W skos:inScheme http://dbpedia.org/reso...
Les informations complémentaires Terreur (1793-1794) Contexte historique Thésaurus W skos:inScheme http://dbpedia.org/reso...
Les informations complémentaires Terreur (1793-1794) Contexte historique Thésaurus W skos:inScheme http://dbpedia.org/reso...
Les informations complémentaires Terreur (1793-1794) Contexte historique Thésaurus W skos:inScheme http://dbpedia.org/reso...
Les informations complémentaires Paris Geonames 48.856667 2.350833 geo:long geo:lat
Les informations complémentaires Paris Geonames dc:coverage 48.856667 2.350833 geo:long geo:lat
Les informations complémentaires Paris Geonames dc:coverage 48.856667 2.350833 geo:long geo:lat
Plan Interopérabilité/standard Exploiter la structure Exploiter le vocabulaire Usages
Auto-complétion à la requête A la frappe de l’utilisateur, proposition de concepts liés aux ressources du corpus
Suggestion à la recherche Suggestion de concepts pour désambiguïser les termes de la requête  ou proposer un élargissement...
Recherche par facettes Si une ressource associée à un terme spécifique
Recherche par facettes Si une ressource associée à un terme spécifique , elle est aussi associée à son terme générique.
Recherche par facettes Si une ressource associée à un terme d’un référentiel
Recherche par facettes Si une ressource associée à un terme d’un référentiel , elle est aussi associée au terme équivalent...
Regroupement de résultats Le regroupement des résultats se fait en fonction des différents concepts du référentiel
Nuage de mots clés Nuage créé automatiquement par annotation automatique des métadonnées avec Rameau et Pactols
Navigation par concepts
Navigation par concepts
Navigation par concepts
Construction de requêtes structurées A partir des métadonnées , en particulier des concepts associés, construction d’une n...
Construction de requêtes structurées L’utilisateur peut ainsi mieux qualifier sa requête avec un vocabulaire contrôlé et l...
Recherche orientée sur les concepts Prendre connaissance d’un corpus par l’analyse de l’utilisation d’un concept http://ww...
Champ lexical d’un concept Classement selon leurs fréquences des concepts présents dans les mêmes documents que le concept...
Analyse statistique du corpus (1) Analyse de la présence du concept  dans les différentes sources de données http://www.le...
Analyse statistique du corpus (2) http://www.lespetitescases.net/semweblabs/isidore/statistiques.php?uri=http://www.recher...
Analyse statistique du corpus (3) http://www.lespetitescases.net/semweblabs/isidore/disciplines.php?uri=http://www.recherc...
MERCI DE VOTRE ATTENTION ! DES QUESTIONS ?
Prochain SlideShare
Chargement dans…5
×

Perspectives pour les référentiels à l'heure du Web de données

1 667 vues

Publié le

Publié dans : Technologie, Voyages, Business
0 commentaire
3 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
1 667
Sur SlideShare
0
Issues des intégrations
0
Intégrations
85
Actions
Partages
0
Téléchargements
0
Commentaires
0
J’aime
3
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Perspectives pour les référentiels à l'heure du Web de données

  1. 1. Perspectives pour les référentiels à l’heure du Web de données JOURNÉES D’ÉTUDE AFNOR CG 46/BNF 27 MAI 2011 Gautier Poupeau Antidot, http://www.antidot.net [email_address]
  2. 2. Plan Interopérabilité/standard Exploiter la structure Exploiter le vocabulaire Usages
  3. 3. Structure Le modèle RDF permet de décloisonner les silos Les référentiels permet alors de les relier
  4. 4. Structure Le modèle RDF permet de décloisonner les silos Les référentiels permet alors de les relier Les référentiels constituent des hubs de données
  5. 5. Sémantique Partager une sémantique pour décrire les référentiels comme SKOS permet de les relier et de les utiliser dans une application unique… Joconde TGN Cornetto WordNet IconClass ULAN AAT RKD Artists Semantic search Lab http://eculture.cs.vu.nl/europeana/session/search
  6. 6. Standards et normes Disposer d’une technologie, c’est bien, la partager, c’est mieux
  7. 7. Plan Interopérabilité/standard Exploiter la structure Exploiter le vocabulaire Usages
  8. 8. Normaliser ark:/12148/cb13091689x Vian, Boris Sullivan, Vernon skos:prefLabel skos:altLabel
  9. 9. Normaliser ark:/12148/cb13091689x Vian, Boris Sullivan, Vernon dc:creator dc:creator skos:prefLabel skos:altLabel
  10. 10. Normaliser ark:/12148/cb13091689x Vian, Boris Sullivan, Vernon dc:creator dc:creator skos:prefLabel skos:altLabel dc:creator
  11. 11. Multilinguisme http://aims.fao.org/aos/agrovoc/c_2354 &quot;Dolphin&quot;@en &quot;Dauphin&quot;@fr &quot; дельфины &quot;@ru skos:prefLabel skos:prefLabel skos:prefLabel
  12. 12. Multilinguisme dc:subject http://aims.fao.org/aos/agrovoc/c_2354 &quot;Dolphin&quot;@en &quot;Dauphin&quot;@fr &quot; дельфины &quot;@ru skos:prefLabel skos:prefLabel skos:prefLabel
  13. 13. Multilinguisme dc:subject http://aims.fao.org/aos/agrovoc/c_2354 &quot;Dolphin&quot;@en &quot;Dauphin&quot;@fr &quot; дельфины &quot;@ru skos:prefLabel skos:prefLabel skos:prefLabel
  14. 14. Multilinguisme dc:subject http://aims.fao.org/aos/agrovoc/c_2354 &quot;Dolphin&quot;@en &quot;Dauphin&quot;@fr &quot; дельфины &quot;@ru skos:prefLabel skos:prefLabel skos:prefLabel
  15. 15. Désambigüiser La revanche des référentiels face à la folksonomie ! Synonymie Orthographe Homonymie Langue utilisée Abréviation Dépasser les limites de la folksonomie en rattachant un tag à un concept déclarer dans un référentiel, c’est-à-dire une URI Le service Faviki ( http://www.faviki.com ) s’appuie sur Dbpedia
  16. 16. Désambigüiser La revanche des référentiels face à la folksonomie ! Synonymie Orthographe Homonymie Langue utilisée Abréviation Dépasser les limites de la folksonomie en rattachant un tag à un concept déclarer dans un référentiel, c’est-à-dire une URI Le service Faviki ( http://www.faviki.com ) s’appuie sur Dbpedia
  17. 17. Désambigüiser La revanche des référentiels face à la folksonomie ! Synonymie Orthographe Homonymie Langue utilisée Abréviation Dépasser les limites de la folksonomie en rattachant un tag à un concept déclarer dans un référentiel, c’est-à-dire une URI Le service Faviki ( http://www.faviki.com ) s’appuie sur Dbpedia
  18. 18. Désambigüiser La revanche des référentiels face à la folksonomie ! Synonymie Orthographe Homonymie Langue utilisée Abréviation Dépasser les limites de la folksonomie en rattachant un tag à un concept déclarer dans un référentiel, c’est-à-dire une URI Le service Faviki ( http://www.faviki.com ) s’appuie sur Dbpedia
  19. 19. Désambigüiser La revanche des référentiels face à la folksonomie ! Synonymie Orthographe Homonymie Langue utilisée Abréviation Dépasser les limites de la folksonomie en rattachant un tag à un concept déclarer dans un référentiel, c’est-à-dire une URI Le service Faviki ( http://www.faviki.com ) s’appuie sur Dbpedia
  20. 20. Désambigüiser La revanche des référentiels face à la folksonomie ! Synonymie Orthographe Homonymie Langue utilisée Abréviation Dépasser les limites de la folksonomie en rattachant un tag à un concept déclarer dans un référentiel, c’est-à-dire une URI Le service Faviki ( http://www.faviki.com ) s’appuie sur Dbpedia
  21. 21. Extraire Repérer des « entités nommées » (lieu, entreprise, personne…) dans des données non structurées Open Calais ( http://www.opencalais.com/ ) de Thomson Reuters : application en ligne qui s’appuie sur des règles linguistiques et des dictionnaires/référentiels issus, entre autres, du Linked Data .
  22. 22. Annoter Mots clefs Est décrit par Une ressource documentaire
  23. 23. Annoter Mots clefs Est décrit par Une ressource documentaire Chaîne de caractères Est exprimé par
  24. 24. Annoter Mots clefs Est décrit par Une ressource documentaire Un thésaurus Concept Organise Chaîne de caractères Est exprimé par Étiquette Est décrit par
  25. 25. Annoter Mots clefs Est décrit par Le moteur effectue une comparaison morphologique Une ressource documentaire Un thésaurus Concept Organise Chaîne de caractères Est exprimé par Étiquette Est décrit par Chaîne de caractères Est exprimé par
  26. 26. Annoter Mots clefs Est décrit par Le moteur effectue une comparaison morphologique Une ressource documentaire Un thésaurus Concept Organise Pour lier le mot-clé au concept Chaîne de caractères Est exprimé par Étiquette Est décrit par Chaîne de caractères Est exprimé par
  27. 27. Annoter Mots clefs Est décrit par Le moteur effectue une comparaison morphologique Une ressource documentaire Un thésaurus Concept Organise Pour lier le mot-clé au concept Chaîne de caractères Est exprimé par Étiquette Est décrit par Chaîne de caractères Est exprimé par Est décrit par
  28. 28. Classification par entraînement <ul><ul><li>le moteur utilise les documents déjà classés pour apprendre </li></ul></ul>
  29. 29. Classification par entraînement <ul><ul><li>le moteur utilise les documents déjà classés pour apprendre </li></ul></ul><ul><ul><li>puis utilise la base d’indicateurs statistiques pour catégoriser les 900 000 documents du corpus </li></ul></ul>
  30. 30. Plan Interopérabilité/standard Exploiter la structure Exploiter le vocabulaire Usages
  31. 31. La hiérarchie Bleu Rouge Marine Pastel Azur Vermillon Tomate Ponceau Couleurs
  32. 32. La hiérarchie Bleu Rouge Marine Pastel Azur Vermillon Tomate Ponceau Couleurs
  33. 33. La hiérarchie Bleu Rouge Marine Pastel Azur Vermillon Tomate Ponceau Couleurs
  34. 34. La hiérarchie Bleu Rouge Marine Pastel Azur Vermillon Tomate Ponceau Couleurs
  35. 35. Les alignements Computer hackers Nervous System Information Superhighway Pirates informatiques Système nerveux Autoroutes de l’information LCSH Rameau
  36. 36. Les alignements Computer hackers Nervous System Information Superhighway Pirates informatiques Système nerveux Autoroutes de l’information LCSH Rameau
  37. 37. Les alignements Computer hackers Nervous System Information Superhighway Pirates informatiques Système nerveux Autoroutes de l’information LCSH Rameau
  38. 38. Les alignements Computer hackers Nervous System Information Superhighway Pirates informatiques Système nerveux Autoroutes de l’information LCSH Rameau
  39. 39. Les alignements Archives nationales Bibliothèque nationale de France Archives de Robespierre récemment préemptées
  40. 40. Les alignements Archives nationales Bibliothèque nationale de France Révolution de 1789 http://www.archivesdefrance.culture.gouv.fr/ thesaurus/resource/T4-5 France -- 1789-1799 (Révolution) http://stitch.cs.vu.nl/vocabularies/rameau/ ark:/12148/cb11941849g Archives de Robespierre récemment préemptées
  41. 41. Les alignements Archives nationales Bibliothèque nationale de France Révolution de 1789 http://www.archivesdefrance.culture.gouv.fr/ thesaurus/resource/T4-5 France -- 1789-1799 (Révolution) http://stitch.cs.vu.nl/vocabularies/rameau/ ark:/12148/cb11941849g Archives de Robespierre récemment préemptées
  42. 42. Les alignements Archives nationales Bibliothèque nationale de France Révolution de 1789 http://www.archivesdefrance.culture.gouv.fr/ thesaurus/resource/T4-5 France -- 1789-1799 (Révolution) http://stitch.cs.vu.nl/vocabularies/rameau/ ark:/12148/cb11941849g Rebond Archives de Robespierre récemment préemptées
  43. 43. Les informations complémentaires Terreur (1793-1794) Contexte historique Thésaurus W skos:inScheme
  44. 44. Les informations complémentaires Terreur (1793-1794) Contexte historique Thésaurus W skos:inScheme http://dbpedia.org/resource/Reign_of_Terror foaf:focus La Terreur est le nom par lequel on désigne deux périodes de la Révolution française au cours desquelles la France est gouvernée par un pouvoir d’exception reposant sur la force, l’illégalité et la répression; elle est principalement politique et répressive. dbpedia-owl:abstract
  45. 45. Les informations complémentaires Terreur (1793-1794) Contexte historique Thésaurus W skos:inScheme http://dbpedia.org/resource/Reign_of_Terror foaf:focus La Terreur est le nom par lequel on désigne deux périodes de la Révolution française au cours desquelles la France est gouvernée par un pouvoir d’exception reposant sur la force, l’illégalité et la répression; elle est principalement politique et répressive. dbpedia-owl:abstract skos:definition
  46. 46. Les informations complémentaires Terreur (1793-1794) Contexte historique Thésaurus W skos:inScheme http://dbpedia.org/resource/Reign_of_Terror foaf:focus La Terreur est le nom par lequel on désigne deux périodes de la Révolution française au cours desquelles la France est gouvernée par un pouvoir d’exception reposant sur la force, l’illégalité et la répression; elle est principalement politique et répressive. dbpedia-owl:abstract skos:definition dc:subject
  47. 47. Les informations complémentaires Terreur (1793-1794) Contexte historique Thésaurus W skos:inScheme http://dbpedia.org/resource/Reign_of_Terror foaf:focus La Terreur est le nom par lequel on désigne deux périodes de la Révolution française au cours desquelles la France est gouvernée par un pouvoir d’exception reposant sur la force, l’illégalité et la répression; elle est principalement politique et répressive. dbpedia-owl:abstract skos:definition dc:subject
  48. 48. Les informations complémentaires Paris Geonames 48.856667 2.350833 geo:long geo:lat
  49. 49. Les informations complémentaires Paris Geonames dc:coverage 48.856667 2.350833 geo:long geo:lat
  50. 50. Les informations complémentaires Paris Geonames dc:coverage 48.856667 2.350833 geo:long geo:lat
  51. 51. Plan Interopérabilité/standard Exploiter la structure Exploiter le vocabulaire Usages
  52. 52. Auto-complétion à la requête A la frappe de l’utilisateur, proposition de concepts liés aux ressources du corpus
  53. 53. Suggestion à la recherche Suggestion de concepts pour désambiguïser les termes de la requête ou proposer un élargissement de recherche
  54. 54. Recherche par facettes Si une ressource associée à un terme spécifique
  55. 55. Recherche par facettes Si une ressource associée à un terme spécifique , elle est aussi associée à son terme générique.
  56. 56. Recherche par facettes Si une ressource associée à un terme d’un référentiel
  57. 57. Recherche par facettes Si une ressource associée à un terme d’un référentiel , elle est aussi associée au terme équivalent dans un autre référentiel.
  58. 58. Regroupement de résultats Le regroupement des résultats se fait en fonction des différents concepts du référentiel
  59. 59. Nuage de mots clés Nuage créé automatiquement par annotation automatique des métadonnées avec Rameau et Pactols
  60. 60. Navigation par concepts
  61. 61. Navigation par concepts
  62. 62. Navigation par concepts
  63. 63. Construction de requêtes structurées A partir des métadonnées , en particulier des concepts associés, construction d’une nouvelle requête structurée.
  64. 64. Construction de requêtes structurées L’utilisateur peut ainsi mieux qualifier sa requête avec un vocabulaire contrôlé et limité tout en étant assuré d’un résultat.
  65. 65. Recherche orientée sur les concepts Prendre connaissance d’un corpus par l’analyse de l’utilisation d’un concept http://www.lespetitescases.net/semweblabs/isidore/
  66. 66. Champ lexical d’un concept Classement selon leurs fréquences des concepts présents dans les mêmes documents que le concept recherché http://www.lespetitescases.net/semweblabs/isidore/tagCloud.php?uri=http://www.rechercheisidore.fr/subject/ark:/12148/cb12650518z
  67. 67. Analyse statistique du corpus (1) Analyse de la présence du concept dans les différentes sources de données http://www.lespetitescases.net/semweblabs/isidore/sources.php?uri=http://www.rechercheisidore.fr/subject/ark:/12148/cb12650518z
  68. 68. Analyse statistique du corpus (2) http://www.lespetitescases.net/semweblabs/isidore/statistiques.php?uri=http://www.rechercheisidore.fr/subject/ark:/12148/cb12650518z Analyse de la présence du concept dans le temps
  69. 69. Analyse statistique du corpus (3) http://www.lespetitescases.net/semweblabs/isidore/disciplines.php?uri=http://www.rechercheisidore.fr/subject/ark:/12148/cb12650518z Analyse de la présence d’un concept en le croisant avec les concepts d’un autre référentiel
  70. 70. MERCI DE VOTRE ATTENTION ! DES QUESTIONS ?

×