SlideShare une entreprise Scribd logo
Portails documentaires et
référentiels du Web sémantique :
exemples et enjeux à venir à partir
de HDA-Lab et DBpedia
Alexandre Monnin

Paris 1, PhiCo, EXeCO
Inria, Wimmics
Membre du réseau d’expert Open Data
d’Etalab

Les portails documentaires : un atout pour les archives ?
Journée d’étude ALMA
14 février 2014
Le portail Histoires des arts (HDA)
Près de 5000 ressources agrégées et commentées pour
l'enseignement de l'histoire des arts : dossiers pédagogiques,
expositions virtuelles, vidéos... ainsi que des repères chronologiques
par domaines artistiques (architecture, bande dessinée, littérature,
jardins, musique, peinture, théâtre...).
• Toutes les périodes
• Toutes les civilisations
• Tous les domaines artistiques

 Grande hétérogénéité des institutions impliquées (+300)
 Grande hétérogénéité des contributeurs de ces institution au
portail HDA
Enjeux d’une indexation commune
• Un seul modèle pour toutes les
institutions ?
• Un seul modèle pour tous les éléments
du corpus ?
• Un seul domaine pour toutes les période ?
• Un seul modèle pour toutes les civilisations ?
• Un seul modèle pour tous les domaines artistiques ?
?
Three Rings for the Elven-kings
under the sky,
Seven for the Dwarf-lords in their
halls of stone,
Nine for Mortal Men doomed to die,
One for the Dark Lord on his dark
throne
In the Land of Mordor where the
Shadows lie.
One Ring to rule them all, One Ring
to find them,
One Ring to bring them all and in
the darkness bind them
In the Land of Mordor where the
Shadows lie.
Se mettre d’accord
Autour d’une table ?
Une grande table alors…
Solution

Le tagging libre augmenté
 libre en amont (pas d’anneau unique,
faible barrière d’entrée)
 augmenté en aval (une lingua franca
post-hoc)
Où trouver les entités/concepts dont
nous avons besoin ?
DBpedia ?
En France: SemanticPedia (convention)
• 8 semaines pour sémantiser 16 000 mots-clefs
de HDA (données ouvertes disponibles sur
data.gouv.fr).
• Mise en place dans le back-office de la plateforme HDA d’un workflow semi-automatique
de tagging lié à DBpedia (analyse des notices,
et suggestion de liaison avec des URI de
DBpedia aux utilisateurs)
Verdict
Wikipedia répond aux besoins du tagging culturel
• 2012 : 77, 2 % des tags ont pu être liés à
Wikipedia en français (en passant par la version
anglaise à l’époque, chiffre qu’il faut donc revoir
sensiblement à la hausse).
• 2012 : 83 % des tags utilisés l’ont été plus d’une
fois par les visiteurs du site.
• Octobre 2012 : 100 % des 100 mots-clefs les plus
fréquemment utilisés par les visiteurs du site sont
appariés à Wikipedia/DBpedia.
Enrichissement
•
•
•
•
•

Désambiguïsation
Gestion de la synonymie
Descriptions
Illustrations
Coordonnées géographiques…
Créer une boucle vertueuse
réutilisation <-> contribution
Mobiliser les agents pour que les thèmes traités aient une représentation sur
WP
 Améliore DBpedia
 Améliore les applications qui utilisent DBPedia
 etc.

De plus en plus d’initiatives impliquent des institutionnels (mapping parties
avec Open Street Map, résidence au château de Versailles, etc.).

« nos établissements sont invités à leur tour à consolider, à enrichir ou à
rectifier s’il y a lieu les données figurant sur Wikipédia, afin non seulement
d’augmenter la qualité de ses articles en langue française, mais aussi son
efficacité sur le Web sémantique. »
(Aurélie Filippetti, 19 novembre 2012)
Simplicité : pas d’appel aux couches
supérieures du Web Sémantique
Linked Open Data
• Use URIs as names for things
• Use HTTP URIs so that people can look up
those names.
• When someone looks up a URI, provide useful
information, using the standards (RDF*,
SPARQL)
• Include links to other URIs. so that they can
discover more things.
Enrichissement multilingue
• Lien entre les différentes versions linguistiques
de Wikipedia
= équivalents linguistique des entrées
(dont des mots-clefs)
= recherche multilingue à coût quasi- nul
(traduction des interfaces)
= désenclavement linguistique du corpus
traité
Plus-value « sémantique »
A tester sur HDA-Lab : http://hdalab.iriresearch.org/hdalab/
Aujourd’hui
• Le projet Joconde Lab (http://jocondelab.iriresearch.org/jocondelab/) a prolongé l’effort
initié avec HDA-Lab.
• Corpus de 500.000 notices d'objets de toute
nature (archéologie, beaux-arts, ethnologie,
histoire, sciences et techniques...) valorisées par
des parcours thématiques, des zooms et des
expositions virtuelles, valorisé par des parcours
thématiques dans les images.
• Même principe que HDA : 80 % des descripteurs
utilisés sur Joconde sont couverts du Wikipedia
Merci !

Contenu connexe

Tendances

Bibliothèque et diffusion de la recherche sur les catastrophes naturelles : l...
Bibliothèque et diffusion de la recherche sur les catastrophes naturelles : l...Bibliothèque et diffusion de la recherche sur les catastrophes naturelles : l...
Bibliothèque et diffusion de la recherche sur les catastrophes naturelles : l...
scduag
 
7Jpros : Politique documentaire physique et numérique de la BnF : la compléme...
7Jpros : Politique documentaire physique et numérique de la BnF : la compléme...7Jpros : Politique documentaire physique et numérique de la BnF : la compléme...
7Jpros : Politique documentaire physique et numérique de la BnF : la compléme...
CTLes
 
Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...
Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...
Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...
AssociationAF
 
7Jpros : L’Europe de la coopération des bibliothèques par Dr Marian Koren #CT...
7Jpros : L’Europe de la coopération des bibliothèques par Dr Marian Koren #CT...7Jpros : L’Europe de la coopération des bibliothèques par Dr Marian Koren #CT...
7Jpros : L’Europe de la coopération des bibliothèques par Dr Marian Koren #CT...
CTLes
 
Free & Open Data dans le secteur culturel : quelques réalisations
Free & Open Data dans le secteur culturel : quelques réalisationsFree & Open Data dans le secteur culturel : quelques réalisations
Free & Open Data dans le secteur culturel : quelques réalisations
Atelier-Francais
 

Tendances (20)

Bibliothèque et diffusion de la recherche sur les catastrophes naturelles : l...
Bibliothèque et diffusion de la recherche sur les catastrophes naturelles : l...Bibliothèque et diffusion de la recherche sur les catastrophes naturelles : l...
Bibliothèque et diffusion de la recherche sur les catastrophes naturelles : l...
 
Wikipédia : un outil de médiation pour les bibliothèques numériques ?
Wikipédia : un outil de médiation pour les bibliothèques numériques ?Wikipédia : un outil de médiation pour les bibliothèques numériques ?
Wikipédia : un outil de médiation pour les bibliothèques numériques ?
 
Partenariats et projets GLAM. Au sein des projets Wikimedia
Partenariats et projets GLAM. Au sein des projets WikimediaPartenariats et projets GLAM. Au sein des projets Wikimedia
Partenariats et projets GLAM. Au sein des projets Wikimedia
 
7Jpros : Politique documentaire physique et numérique de la BnF : la compléme...
7Jpros : Politique documentaire physique et numérique de la BnF : la compléme...7Jpros : Politique documentaire physique et numérique de la BnF : la compléme...
7Jpros : Politique documentaire physique et numérique de la BnF : la compléme...
 
Les données de l’administration à travers le temps ou comment valoriser un pa...
Les données de l’administration à travers le temps ou comment valoriser un pa...Les données de l’administration à travers le temps ou comment valoriser un pa...
Les données de l’administration à travers le temps ou comment valoriser un pa...
 
5Jpro CTLes : intervention Albert Poirot
5Jpro CTLes : intervention Albert Poirot5Jpro CTLes : intervention Albert Poirot
5Jpro CTLes : intervention Albert Poirot
 
La stratégie LIBER en action: quelles actions des bibliothèques de recherche ...
La stratégie LIBER en action: quelles actions des bibliothèques de recherche ...La stratégie LIBER en action: quelles actions des bibliothèques de recherche ...
La stratégie LIBER en action: quelles actions des bibliothèques de recherche ...
 
Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...
Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...
Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...
 
20111128rechercheinfo_slsh
20111128rechercheinfo_slsh20111128rechercheinfo_slsh
20111128rechercheinfo_slsh
 
7Jpros : L’Europe de la coopération des bibliothèques par Dr Marian Koren #CT...
7Jpros : L’Europe de la coopération des bibliothèques par Dr Marian Koren #CT...7Jpros : L’Europe de la coopération des bibliothèques par Dr Marian Koren #CT...
7Jpros : L’Europe de la coopération des bibliothèques par Dr Marian Koren #CT...
 
OPERAS : une infrastructure européenne pour les livres en accès ouvert
OPERAS : une infrastructure européenne pour les livres en accès ouvertOPERAS : une infrastructure européenne pour les livres en accès ouvert
OPERAS : une infrastructure européenne pour les livres en accès ouvert
 
Des outils de recherche en libre accès - Open Access week 2015 - université G...
Des outils de recherche en libre accès - Open Access week 2015 - université G...Des outils de recherche en libre accès - Open Access week 2015 - université G...
Des outils de recherche en libre accès - Open Access week 2015 - université G...
 
Digital Valais, la mémoire d’un canton via le crowdsourcing
Digital Valais, la mémoire d’un canton via le crowdsourcingDigital Valais, la mémoire d’un canton via le crowdsourcing
Digital Valais, la mémoire d’un canton via le crowdsourcing
 
Redis keynote
Redis keynoteRedis keynote
Redis keynote
 
Bibliothèques Virtuelles Humanistes
Bibliothèques Virtuelles HumanistesBibliothèques Virtuelles Humanistes
Bibliothèques Virtuelles Humanistes
 
A la recherche du patrimoine écrit avec le portail Biblissima
A la recherche du patrimoine écrit avec le portail BiblissimaA la recherche du patrimoine écrit avec le portail Biblissima
A la recherche du patrimoine écrit avec le portail Biblissima
 
Free & Open Data dans le secteur culturel : quelques réalisations
Free & Open Data dans le secteur culturel : quelques réalisationsFree & Open Data dans le secteur culturel : quelques réalisations
Free & Open Data dans le secteur culturel : quelques réalisations
 
Omeka, une plateforme pour les humanités numériques
Omeka, une plateforme pour les humanités numériquesOmeka, une plateforme pour les humanités numériques
Omeka, une plateforme pour les humanités numériques
 
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...
 
L’Open Access dans les carrières académiques - Quelle stratégie Open Access p...
L’Open Access dans les carrières académiques - Quelle stratégie Open Access p...L’Open Access dans les carrières académiques - Quelle stratégie Open Access p...
L’Open Access dans les carrières académiques - Quelle stratégie Open Access p...
 

Similaire à Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia

C - Débats et usages autour des wikis
C - Débats et usages autour des wikisC - Débats et usages autour des wikis
C - Débats et usages autour des wikis
David Liziard
 
Urfist Wiki Version Courte
Urfist Wiki Version CourteUrfist Wiki Version Courte
Urfist Wiki Version Courte
David Liziard
 
3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
3 focus catalogues-et_bibliothequesnumeriquespatrimoniales3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
ABES
 
Indexation sociale et bibliothéconomie de masse
Indexation sociale et bibliothéconomie de masseIndexation sociale et bibliothéconomie de masse
Indexation sociale et bibliothéconomie de masse
olivier
 
Isaac referentiels-ist12-121002051942-phpapp01
Isaac referentiels-ist12-121002051942-phpapp01Isaac referentiels-ist12-121002051942-phpapp01
Isaac referentiels-ist12-121002051942-phpapp01
Parc De Camargue
 
Datalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériencesDatalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériences
SemWebPro
 

Similaire à Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia (20)

Wikis 2008
Wikis 2008Wikis 2008
Wikis 2008
 
HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique
 HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique
HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique
 
C - Débats et usages autour des wikis
C - Débats et usages autour des wikisC - Débats et usages autour des wikis
C - Débats et usages autour des wikis
 
Les archives ouvertes et l'architecture
Les archives ouvertes et l'architectureLes archives ouvertes et l'architecture
Les archives ouvertes et l'architecture
 
Open edition et dariah. L'édition électronique scientifique à l'échelle europ...
Open edition et dariah. L'édition électronique scientifique à l'échelle europ...Open edition et dariah. L'édition électronique scientifique à l'échelle europ...
Open edition et dariah. L'édition électronique scientifique à l'échelle europ...
 
Netizenship et Wikipedia
Netizenship et WikipediaNetizenship et Wikipedia
Netizenship et Wikipedia
 
Wikis 2008
Wikis 2008Wikis 2008
Wikis 2008
 
Rapport humanités numériques
Rapport humanités numériquesRapport humanités numériques
Rapport humanités numériques
 
Web 2.0 et bibliothèques
Web 2.0 et bibliothèquesWeb 2.0 et bibliothèques
Web 2.0 et bibliothèques
 
Urfist Wiki Version Courte
Urfist Wiki Version CourteUrfist Wiki Version Courte
Urfist Wiki Version Courte
 
Urfist Wiki 2007
Urfist Wiki 2007Urfist Wiki 2007
Urfist Wiki 2007
 
DBpedia ou le Linked Open Data et la question du public
DBpedia ou le Linked Open Data et la question du publicDBpedia ou le Linked Open Data et la question du public
DBpedia ou le Linked Open Data et la question du public
 
Projets wikimedia hervé goldberg présentation abf paca
Projets wikimedia hervé goldberg présentation abf pacaProjets wikimedia hervé goldberg présentation abf paca
Projets wikimedia hervé goldberg présentation abf paca
 
Présentation Comité de projets Inria Sophia
Présentation Comité de projets Inria SophiaPrésentation Comité de projets Inria Sophia
Présentation Comité de projets Inria Sophia
 
3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
3 focus catalogues-et_bibliothequesnumeriquespatrimoniales3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
 
Indexation sociale et bibliothéconomie de masse
Indexation sociale et bibliothéconomie de masseIndexation sociale et bibliothéconomie de masse
Indexation sociale et bibliothéconomie de masse
 
Test
TestTest
Test
 
Usage des API de HAL
Usage des API de HALUsage des API de HAL
Usage des API de HAL
 
Isaac referentiels-ist12-121002051942-phpapp01
Isaac referentiels-ist12-121002051942-phpapp01Isaac referentiels-ist12-121002051942-phpapp01
Isaac referentiels-ist12-121002051942-phpapp01
 
Datalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériencesDatalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériences
 

Plus de Alexandre Monnin

Plus de Alexandre Monnin (20)

La 5G comme "commun négatif"
La 5G comme "commun négatif"La 5G comme "commun négatif"
La 5G comme "commun négatif"
 
The (de)feasibility of smart cities
The (de)feasibility of smart citiesThe (de)feasibility of smart cities
The (de)feasibility of smart cities
 
What Future for ICT?
What Future for ICT?What Future for ICT?
What Future for ICT?
 
Quel avenir pour le numérique
Quel avenir pour le numériqueQuel avenir pour le numérique
Quel avenir pour le numérique
 
The Future Web (we can afford)
The Future Web (we can afford)The Future Web (we can afford)
The Future Web (we can afford)
 
Quel rôle pour le design à l'heure de l'Anthropocène/Effondrement ?
Quel rôle pour le design à l'heure de l'Anthropocène/Effondrement ?Quel rôle pour le design à l'heure de l'Anthropocène/Effondrement ?
Quel rôle pour le design à l'heure de l'Anthropocène/Effondrement ?
 
L'obsolescence à programmer
L'obsolescence à programmer L'obsolescence à programmer
L'obsolescence à programmer
 
Approcher en pragmatiste les mondes en train de se défaire
Approcher en pragmatiste les mondes en train de se défaireApprocher en pragmatiste les mondes en train de se défaire
Approcher en pragmatiste les mondes en train de se défaire
 
​Le numérique est notre futur mais quel est notre avenir ? (R)évolution num...
​Le numérique est notre futur  mais quel est notre avenir ?  (R)évolution num...​Le numérique est notre futur  mais quel est notre avenir ?  (R)évolution num...
​Le numérique est notre futur mais quel est notre avenir ? (R)évolution num...
 
Cours sur REST
Cours sur RESTCours sur REST
Cours sur REST
 
Quel avenir pour le Web et le numérique à l’heure de l’Anthropocène ?
Quel avenir pour le Web et le numérique à  l’heure de l’Anthropocène ? Quel avenir pour le Web et le numérique à  l’heure de l’Anthropocène ?
Quel avenir pour le Web et le numérique à l’heure de l’Anthropocène ?
 
Présentation du projet ValueModels (Académie 1 de l'Idex UCA JEDI)
Présentation du projet ValueModels (Académie 1 de l'Idex UCA JEDI)Présentation du projet ValueModels (Académie 1 de l'Idex UCA JEDI)
Présentation du projet ValueModels (Académie 1 de l'Idex UCA JEDI)
 
 Asynchronous futures: Digital technologies at the time of the Anthropocene
 Asynchronous futures: Digital technologies at the time of the Anthropocene Asynchronous futures: Digital technologies at the time of the Anthropocene
 Asynchronous futures: Digital technologies at the time of the Anthropocene
 
La question de la durabilité des technologies de calcul et de télécommunication
La question de la durabilité des technologies de calcul et de télécommunicationLa question de la durabilité des technologies de calcul et de télécommunication
La question de la durabilité des technologies de calcul et de télécommunication
 
Le monde devient numérique, a-t-il les moyens de le rester ?
Le monde devient numérique, a-t-il les moyens de le rester ?Le monde devient numérique, a-t-il les moyens de le rester ?
Le monde devient numérique, a-t-il les moyens de le rester ?
 
A quoi peuvent servir les technologies « smart » en regard d’une vision réa...
A quoi peuvent servir les  technologies « smart » en regard  d’une vision réa...A quoi peuvent servir les  technologies « smart » en regard  d’une vision réa...
A quoi peuvent servir les technologies « smart » en regard d’une vision réa...
 
Transition numérique et effondrement écologique : quel monde d'après ?
Transition numérique et effondrement écologique : quel monde d'après ?Transition numérique et effondrement écologique : quel monde d'après ?
Transition numérique et effondrement écologique : quel monde d'après ?
 
Façonner les données. Travail et valeur de l'information
Façonner les données. Travail et valeur de l'informationFaçonner les données. Travail et valeur de l'information
Façonner les données. Travail et valeur de l'information
 
Routines et improvisation, à propos de Computation and Human Experience de Ph...
Routines et improvisation, à propos de Computation and Human Experience de Ph...Routines et improvisation, à propos de Computation and Human Experience de Ph...
Routines et improvisation, à propos de Computation and Human Experience de Ph...
 
The Knowledge ecology: Epistemic Credit and the Technologically Extended Mind
The Knowledge ecology: Epistemic Credit and the Technologically Extended MindThe Knowledge ecology: Epistemic Credit and the Technologically Extended Mind
The Knowledge ecology: Epistemic Credit and the Technologically Extended Mind
 

Dernier

Dernier (6)

Slides du webinaire de l'Infopole sur l'IA
Slides du webinaire de l'Infopole sur l'IASlides du webinaire de l'Infopole sur l'IA
Slides du webinaire de l'Infopole sur l'IA
 
cours Systèmes de Gestion des Identités.pdf
cours Systèmes de Gestion des Identités.pdfcours Systèmes de Gestion des Identités.pdf
cours Systèmes de Gestion des Identités.pdf
 
Contrôle d’accès et Gestion des identités: Terminologies et Protocoles d’auth...
Contrôle d’accès et Gestion des identités: Terminologies et Protocoles d’auth...Contrôle d’accès et Gestion des identités: Terminologies et Protocoles d’auth...
Contrôle d’accès et Gestion des identités: Terminologies et Protocoles d’auth...
 
Augmentez vos conversions en ligne : les techniques et outils qui marchent vr...
Augmentez vos conversions en ligne : les techniques et outils qui marchent vr...Augmentez vos conversions en ligne : les techniques et outils qui marchent vr...
Augmentez vos conversions en ligne : les techniques et outils qui marchent vr...
 
Protéger l'intégrité de son environnement numérique
Protéger l'intégrité de son environnement numériqueProtéger l'intégrité de son environnement numérique
Protéger l'intégrité de son environnement numérique
 
Modèles de contrôle d accès_ RBAC (Role Based Access Control).pdf
Modèles de contrôle d accès_ RBAC (Role Based Access Control).pdfModèles de contrôle d accès_ RBAC (Role Based Access Control).pdf
Modèles de contrôle d accès_ RBAC (Role Based Access Control).pdf
 

Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia

  • 1. Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia Alexandre Monnin Paris 1, PhiCo, EXeCO Inria, Wimmics Membre du réseau d’expert Open Data d’Etalab Les portails documentaires : un atout pour les archives ? Journée d’étude ALMA 14 février 2014
  • 2. Le portail Histoires des arts (HDA)
  • 3. Près de 5000 ressources agrégées et commentées pour l'enseignement de l'histoire des arts : dossiers pédagogiques, expositions virtuelles, vidéos... ainsi que des repères chronologiques par domaines artistiques (architecture, bande dessinée, littérature, jardins, musique, peinture, théâtre...). • Toutes les périodes • Toutes les civilisations • Tous les domaines artistiques  Grande hétérogénéité des institutions impliquées (+300)  Grande hétérogénéité des contributeurs de ces institution au portail HDA
  • 4. Enjeux d’une indexation commune • Un seul modèle pour toutes les institutions ? • Un seul modèle pour tous les éléments du corpus ? • Un seul domaine pour toutes les période ? • Un seul modèle pour toutes les civilisations ? • Un seul modèle pour tous les domaines artistiques ?
  • 5. ? Three Rings for the Elven-kings under the sky, Seven for the Dwarf-lords in their halls of stone, Nine for Mortal Men doomed to die, One for the Dark Lord on his dark throne In the Land of Mordor where the Shadows lie. One Ring to rule them all, One Ring to find them, One Ring to bring them all and in the darkness bind them In the Land of Mordor where the Shadows lie.
  • 6. Se mettre d’accord Autour d’une table ?
  • 7. Une grande table alors…
  • 8. Solution Le tagging libre augmenté  libre en amont (pas d’anneau unique, faible barrière d’entrée)  augmenté en aval (une lingua franca post-hoc)
  • 9. Où trouver les entités/concepts dont nous avons besoin ?
  • 10.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.
  • 20.
  • 21. En France: SemanticPedia (convention)
  • 22. • 8 semaines pour sémantiser 16 000 mots-clefs de HDA (données ouvertes disponibles sur data.gouv.fr). • Mise en place dans le back-office de la plateforme HDA d’un workflow semi-automatique de tagging lié à DBpedia (analyse des notices, et suggestion de liaison avec des URI de DBpedia aux utilisateurs)
  • 23. Verdict Wikipedia répond aux besoins du tagging culturel • 2012 : 77, 2 % des tags ont pu être liés à Wikipedia en français (en passant par la version anglaise à l’époque, chiffre qu’il faut donc revoir sensiblement à la hausse). • 2012 : 83 % des tags utilisés l’ont été plus d’une fois par les visiteurs du site. • Octobre 2012 : 100 % des 100 mots-clefs les plus fréquemment utilisés par les visiteurs du site sont appariés à Wikipedia/DBpedia.
  • 24. Enrichissement • • • • • Désambiguïsation Gestion de la synonymie Descriptions Illustrations Coordonnées géographiques…
  • 25. Créer une boucle vertueuse réutilisation <-> contribution Mobiliser les agents pour que les thèmes traités aient une représentation sur WP  Améliore DBpedia  Améliore les applications qui utilisent DBPedia  etc. De plus en plus d’initiatives impliquent des institutionnels (mapping parties avec Open Street Map, résidence au château de Versailles, etc.). « nos établissements sont invités à leur tour à consolider, à enrichir ou à rectifier s’il y a lieu les données figurant sur Wikipédia, afin non seulement d’augmenter la qualité de ses articles en langue française, mais aussi son efficacité sur le Web sémantique. » (Aurélie Filippetti, 19 novembre 2012)
  • 26. Simplicité : pas d’appel aux couches supérieures du Web Sémantique
  • 27. Linked Open Data • Use URIs as names for things • Use HTTP URIs so that people can look up those names. • When someone looks up a URI, provide useful information, using the standards (RDF*, SPARQL) • Include links to other URIs. so that they can discover more things.
  • 28. Enrichissement multilingue • Lien entre les différentes versions linguistiques de Wikipedia = équivalents linguistique des entrées (dont des mots-clefs) = recherche multilingue à coût quasi- nul (traduction des interfaces) = désenclavement linguistique du corpus traité
  • 29.
  • 30. Plus-value « sémantique » A tester sur HDA-Lab : http://hdalab.iriresearch.org/hdalab/
  • 31. Aujourd’hui • Le projet Joconde Lab (http://jocondelab.iriresearch.org/jocondelab/) a prolongé l’effort initié avec HDA-Lab. • Corpus de 500.000 notices d'objets de toute nature (archéologie, beaux-arts, ethnologie, histoire, sciences et techniques...) valorisées par des parcours thématiques, des zooms et des expositions virtuelles, valorisé par des parcours thématiques dans les images. • Même principe que HDA : 80 % des descripteurs utilisés sur Joconde sont couverts du Wikipedia