Comment sélectionner, qualifier puis exploiter les données ouvertes
Perspectives pour les référentiels à l'heure du Web de données
1. Perspectives pour les référentiels à l’heure du Web de données JOURNÉES D’ÉTUDE AFNOR CG 46/BNF 27 MAI 2011 Gautier Poupeau Antidot, http://www.antidot.net [email_address]
3. Structure Le modèle RDF permet de décloisonner les silos Les référentiels permet alors de les relier
4. Structure Le modèle RDF permet de décloisonner les silos Les référentiels permet alors de les relier Les référentiels constituent des hubs de données
5. Sémantique Partager une sémantique pour décrire les référentiels comme SKOS permet de les relier et de les utiliser dans une application unique… Joconde TGN Cornetto WordNet IconClass ULAN AAT RKD Artists Semantic search Lab http://eculture.cs.vu.nl/europeana/session/search
6. Standards et normes Disposer d’une technologie, c’est bien, la partager, c’est mieux
15. Désambigüiser La revanche des référentiels face à la folksonomie ! Synonymie Orthographe Homonymie Langue utilisée Abréviation Dépasser les limites de la folksonomie en rattachant un tag à un concept déclarer dans un référentiel, c’est-à-dire une URI Le service Faviki ( http://www.faviki.com ) s’appuie sur Dbpedia
16. Désambigüiser La revanche des référentiels face à la folksonomie ! Synonymie Orthographe Homonymie Langue utilisée Abréviation Dépasser les limites de la folksonomie en rattachant un tag à un concept déclarer dans un référentiel, c’est-à-dire une URI Le service Faviki ( http://www.faviki.com ) s’appuie sur Dbpedia
17. Désambigüiser La revanche des référentiels face à la folksonomie ! Synonymie Orthographe Homonymie Langue utilisée Abréviation Dépasser les limites de la folksonomie en rattachant un tag à un concept déclarer dans un référentiel, c’est-à-dire une URI Le service Faviki ( http://www.faviki.com ) s’appuie sur Dbpedia
18. Désambigüiser La revanche des référentiels face à la folksonomie ! Synonymie Orthographe Homonymie Langue utilisée Abréviation Dépasser les limites de la folksonomie en rattachant un tag à un concept déclarer dans un référentiel, c’est-à-dire une URI Le service Faviki ( http://www.faviki.com ) s’appuie sur Dbpedia
19. Désambigüiser La revanche des référentiels face à la folksonomie ! Synonymie Orthographe Homonymie Langue utilisée Abréviation Dépasser les limites de la folksonomie en rattachant un tag à un concept déclarer dans un référentiel, c’est-à-dire une URI Le service Faviki ( http://www.faviki.com ) s’appuie sur Dbpedia
20. Désambigüiser La revanche des référentiels face à la folksonomie ! Synonymie Orthographe Homonymie Langue utilisée Abréviation Dépasser les limites de la folksonomie en rattachant un tag à un concept déclarer dans un référentiel, c’est-à-dire une URI Le service Faviki ( http://www.faviki.com ) s’appuie sur Dbpedia
21. Extraire Repérer des « entités nommées » (lieu, entreprise, personne…) dans des données non structurées Open Calais ( http://www.opencalais.com/ ) de Thomson Reuters : application en ligne qui s’appuie sur des règles linguistiques et des dictionnaires/référentiels issus, entre autres, du Linked Data .
23. Annoter Mots clefs Est décrit par Une ressource documentaire Chaîne de caractères Est exprimé par
24. Annoter Mots clefs Est décrit par Une ressource documentaire Un thésaurus Concept Organise Chaîne de caractères Est exprimé par Étiquette Est décrit par
25. Annoter Mots clefs Est décrit par Le moteur effectue une comparaison morphologique Une ressource documentaire Un thésaurus Concept Organise Chaîne de caractères Est exprimé par Étiquette Est décrit par Chaîne de caractères Est exprimé par
26. Annoter Mots clefs Est décrit par Le moteur effectue une comparaison morphologique Une ressource documentaire Un thésaurus Concept Organise Pour lier le mot-clé au concept Chaîne de caractères Est exprimé par Étiquette Est décrit par Chaîne de caractères Est exprimé par
27. Annoter Mots clefs Est décrit par Le moteur effectue une comparaison morphologique Une ressource documentaire Un thésaurus Concept Organise Pour lier le mot-clé au concept Chaîne de caractères Est exprimé par Étiquette Est décrit par Chaîne de caractères Est exprimé par Est décrit par
35. Les alignements Computer hackers Nervous System Information Superhighway Pirates informatiques Système nerveux Autoroutes de l’information LCSH Rameau
36. Les alignements Computer hackers Nervous System Information Superhighway Pirates informatiques Système nerveux Autoroutes de l’information LCSH Rameau
37. Les alignements Computer hackers Nervous System Information Superhighway Pirates informatiques Système nerveux Autoroutes de l’information LCSH Rameau
38. Les alignements Computer hackers Nervous System Information Superhighway Pirates informatiques Système nerveux Autoroutes de l’information LCSH Rameau
39. Les alignements Archives nationales Bibliothèque nationale de France Archives de Robespierre récemment préemptées
40. Les alignements Archives nationales Bibliothèque nationale de France Révolution de 1789 http://www.archivesdefrance.culture.gouv.fr/ thesaurus/resource/T4-5 France -- 1789-1799 (Révolution) http://stitch.cs.vu.nl/vocabularies/rameau/ ark:/12148/cb11941849g Archives de Robespierre récemment préemptées
41. Les alignements Archives nationales Bibliothèque nationale de France Révolution de 1789 http://www.archivesdefrance.culture.gouv.fr/ thesaurus/resource/T4-5 France -- 1789-1799 (Révolution) http://stitch.cs.vu.nl/vocabularies/rameau/ ark:/12148/cb11941849g Archives de Robespierre récemment préemptées
42. Les alignements Archives nationales Bibliothèque nationale de France Révolution de 1789 http://www.archivesdefrance.culture.gouv.fr/ thesaurus/resource/T4-5 France -- 1789-1799 (Révolution) http://stitch.cs.vu.nl/vocabularies/rameau/ ark:/12148/cb11941849g Rebond Archives de Robespierre récemment préemptées
44. Les informations complémentaires Terreur (1793-1794) Contexte historique Thésaurus W skos:inScheme http://dbpedia.org/resource/Reign_of_Terror foaf:focus La Terreur est le nom par lequel on désigne deux périodes de la Révolution française au cours desquelles la France est gouvernée par un pouvoir d’exception reposant sur la force, l’illégalité et la répression; elle est principalement politique et répressive. dbpedia-owl:abstract
45. Les informations complémentaires Terreur (1793-1794) Contexte historique Thésaurus W skos:inScheme http://dbpedia.org/resource/Reign_of_Terror foaf:focus La Terreur est le nom par lequel on désigne deux périodes de la Révolution française au cours desquelles la France est gouvernée par un pouvoir d’exception reposant sur la force, l’illégalité et la répression; elle est principalement politique et répressive. dbpedia-owl:abstract skos:definition
46. Les informations complémentaires Terreur (1793-1794) Contexte historique Thésaurus W skos:inScheme http://dbpedia.org/resource/Reign_of_Terror foaf:focus La Terreur est le nom par lequel on désigne deux périodes de la Révolution française au cours desquelles la France est gouvernée par un pouvoir d’exception reposant sur la force, l’illégalité et la répression; elle est principalement politique et répressive. dbpedia-owl:abstract skos:definition dc:subject
47. Les informations complémentaires Terreur (1793-1794) Contexte historique Thésaurus W skos:inScheme http://dbpedia.org/resource/Reign_of_Terror foaf:focus La Terreur est le nom par lequel on désigne deux périodes de la Révolution française au cours desquelles la France est gouvernée par un pouvoir d’exception reposant sur la force, l’illégalité et la répression; elle est principalement politique et répressive. dbpedia-owl:abstract skos:definition dc:subject
57. Recherche par facettes Si une ressource associée à un terme d’un référentiel , elle est aussi associée au terme équivalent dans un autre référentiel.
58. Regroupement de résultats Le regroupement des résultats se fait en fonction des différents concepts du référentiel
59. Nuage de mots clés Nuage créé automatiquement par annotation automatique des métadonnées avec Rameau et Pactols
63. Construction de requêtes structurées A partir des métadonnées , en particulier des concepts associés, construction d’une nouvelle requête structurée.
64. Construction de requêtes structurées L’utilisateur peut ainsi mieux qualifier sa requête avec un vocabulaire contrôlé et limité tout en étant assuré d’un résultat.
65. Recherche orientée sur les concepts Prendre connaissance d’un corpus par l’analyse de l’utilisation d’un concept http://www.lespetitescases.net/semweblabs/isidore/
66. Champ lexical d’un concept Classement selon leurs fréquences des concepts présents dans les mêmes documents que le concept recherché http://www.lespetitescases.net/semweblabs/isidore/tagCloud.php?uri=http://www.rechercheisidore.fr/subject/ark:/12148/cb12650518z
67. Analyse statistique du corpus (1) Analyse de la présence du concept dans les différentes sources de données http://www.lespetitescases.net/semweblabs/isidore/sources.php?uri=http://www.rechercheisidore.fr/subject/ark:/12148/cb12650518z
68. Analyse statistique du corpus (2) http://www.lespetitescases.net/semweblabs/isidore/statistiques.php?uri=http://www.rechercheisidore.fr/subject/ark:/12148/cb12650518z Analyse de la présence du concept dans le temps
69. Analyse statistique du corpus (3) http://www.lespetitescases.net/semweblabs/isidore/disciplines.php?uri=http://www.rechercheisidore.fr/subject/ark:/12148/cb12650518z Analyse de la présence d’un concept en le croisant avec les concepts d’un autre référentiel