Le web sémantique dans le secteur
culturel

Fabien GANDON
Chercheur à l’INRIA, responsable de l’équipe Wimmics, représentant du W3C

14h15 - 14h30
Ministère de la Culture et de la Communication
Secrétariat général
Département des programmes numériques
DONNÉES DE LA CULTURE ET CULTURE DES DONNÉES

web sémantique et secteur culturel
fabien gandon, @fabien_gandon, http://fabien.info
DONNÉES DE LA CULTURE ET CULTURE DES
DONNÉES

web sémantique et secteur culturel

fabien gandon, @fabien_gandon, http://fabien.info
références
au web
UR UR
L
I
identifier ce
qui existe sur
le web
http://mon-site.fr

identifier,
sur le web, ce
qui existe

http://animaux.fr/ce-zèbre
http://paris.fr/...
données et liens

Mai 2007

Avril 2008

base

une toile de données

Septembre 2008

 utiliser des adresses web pour tout

 répondre avec des données descriptives
 inclure des liens vers d’autres données
Septembre 2010

Septembre 2011

Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/

March 2009
180°C+

=?



publier les schémas des données

+
=


DONNÉES DE LA CULTURE ET CULTURE DES DONNÉES

web sémantique et secteur culturel
fabien gandon, @fabien_gandon, http://fabien.info
http://les.oeuvres.fr/ma-chanson
les licences Creative Commons
index, catégories, notices, fond,…
http://les.artistes.fr/un-groupe
les programmes de la BBC
http://les.lieux.fr/ce-monument
dbpedia.fr
p
http://www.w3.org/2000/01/rdf-schema#label
http://www.w3.org/2000/01/rdf-schema#label
http://www.w3.org/2000/01/rdf-schema#label
http://www.w3.org/2000/01/rdf-schema#label
http://www.w3.org/2000/01/rdf-schema#label
http://www.w3.org/2000/01/rdf-schema#label
http://www.w3.org/2000/01/rdf-schema#label

o
"Tour Eiffel"@fr
"Eiffel Tower"@en
"Eiffelturm"@de
"Torre Eiffel"@es
"Эйфелева башня"@ru
" エッフェル塔 "@ja
" 艾菲爾鐵塔 "@zh

http://www.w3.org/2000/01/rdf-schema#label

"‫@"برج إيفل‬ar

http://fr.dbpedia.org/property/nom
http://fr.dbpedia.org/property/style
http://fr.dbpedia.org/property/latitude
http://fr.dbpedia.org/property/longitude

"Tour Eiffel"@fr
"Tour autoportante en fer puddlé"@fr
48.8582
2.2945
collections, lieux, services, référentiels…
[europeana]

portails, interrogations,… intégration
[zone47]
portails et parcours pédagogiques
http://bla.bla.fr/bla-bla-bla
moteur de recherche exploratoire [DiscoveryHub]
http://blog.ouseful.info/2012/07/04/mapping-related-musical-genres-on-wikipediadbpedia-with-gephi/

analyse visuelle [gephi]
http://drunks-and-lampposts.com/2012/06/13/graphing-the-history-of-philosophy/

http://blog.ouseful.info/2012/07/03/mapping-how-programming-languages-influenced-each-other-according-to-wikipedia/
questions-réponses
#
1
2
3
4
5
6

result
Robot Rock (song)
HeartBreaker
Tron: Legacy (soundtrack)
Burnin’ (Daft Punk song)
Musique Vol. 1 1993
Discovery (Daft Punk album)
des jeux autrement réalistes
© carbonvisuals.com

© Facebook

© metropolitain.io

© data-cuisine.net

© Neoformix

la donnée comme un matériau artistique
en ligne ou invisible

NASA ©
Gouffre Espeluca
celui qui contrôle les métadonnées contrôle le Web
et, à travers cette toile mondiale, une part grandissante de notre
monde.

fabien, gandon, @fabien_gandon, http://fabien.info

Présentation de Fabien Gandon

Notes de l'éditeur

  • #3 Je suis fabien gandon, je suis responsable de Wimmics une équipe de recherche jointe entre Inria, I3S, CNRS et université de Nice et je suis aussi représentant d’Inria au W3C le consortium de standardisation pour le Web. 1
  • #4 Je suis fabien gandon, je suis responsable de Wimmics une équipe de recherche jointe entre Inria, I3S, CNRS et université de Nice et je suis aussi représentant d’Inria au W3C le consortium de standardisation pour le Web. 1
  • #5 Vous avez probablement vu se multiplier autour de nous ces QR code qui nous permettent notamment à partir d’une référence physique dans notre monde d’accéder à des services ou informations sur le web. 1
  • #6 Ces codes sont symptomatiques d’une évolution d’un composant central du web qu’est l’adresse web. Nous sommes passés d’adresses essentiellement utilisées pour identifier les pages et ressources du web. A des adresses permettant d’identifier sur le web tout ce qui existe autour de nous et d’en parler sur le web. 1
  • #7 Le principe est donc simple: Utiliser des adresses web pour tout identifier autour de nous Lorsque l’on se rend à une adresse web répondre avec des données descriptives sur le sujet identifié par cette adresse Et inclure des liens vers d’autres sujets pour permettre la découverte de proche en proche de nouvelles données 1
  • #8 Pour permettre ces échanges et traitements il manque un dernier ingrédient que sont les schémas. On peut les voir comme des dictionnaires décrivant le sens et les catégories qui organisent les données. Ainsi un ordinateur ne peut pas savoir a priori qu’il ne peut pas mélanger impunément la donnée d’une température de cuisson et celle d’une partition de musique. Alors que sous certaines contraintes il peut mélanger une partition and du texte par exemple s’il s’agit de paroles. Le schémas publiés avec les données permettent de contrôler ces traitements. 1
  • #9 Je suis fabien gandon, je suis responsable de Wimmics une équipe de recherche jointe entre Inria, I3S, CNRS et université de Nice et je suis aussi représentant d’Inria au W3C le consortium de standardisation pour le Web. 1
  • #10 Si j’identifie les œuvres sur le web je peut les décrire et les gérer à cette échelle 1
  • #11 L’une des plus veilles applications est Creative Commons qui permet d’indiquer et de chercher des œuvres en spécifiant les droits de réutilisation associés 1
  • #12 Dans le domaine des bibliothèques on peut dès lors publier, échanger, relier, enrichir de nouvelles données les index et descriptions des fonds. 1
  • #13 Après l’œuvre je peux identifier l’artiste 1
  • #14 Ainsi les programmes de la BBC appliquent cette approche pour agréger non seulement leurs contenus par exemple sur un groupe… Mais aussi l’enrichir d’autres contenus disponibles sur le web. 1
  • #15 Je peux identifier les lieux 1
  • #16 Voilà quelques données sur la tour eiffel disponibles dans Dbpedia.fr et qui peuvent ainsi permettre immédiatement de traduire le nom d’un monument dans une application touristique <numéro>
  • #17 Au-delà du lieu géographique d’autres spécificités peuvent être décrites comme les collections, les services, les référentiels dans le cas d’un musée <numéro>
  • #18 Et ce faisant on peut alors proposer des portails transverses au collections permettant de nouveaux parcours dans ces données intégrées <numéro>
  • #19 Ces portails peuvent même être dédiés par exemple ici pour une parcours pédagogique dans l’histoire de l’art. <numéro>
  • #20 Et je pourrais continuer très longtemps à identifier de potentiels sujets. <numéro>
  • #21 C’est d’ailleurs cette généricité qu’utilise DiscoveryHub pour faire découvrir de nouveaux centres d’intérêts à ses utilisateurs en reliant des sujets appartenant parfois à des catégories à première vue très différentes. 1
  • #22 Ces liens qui se tissent peuvent eux même faire l’objet de nouvelles études et nouvelles méthodes de travail comme ici où le même outil interrogeant de façon identique le web de données permet de voir les influences respectivement entre des genres musicaux, des philosophes et des langages de programmation. 1
  • #23 La publication et l’explicitation de ces données permet aussi de nouveaux moyens d’accès comme ce moteur de recherche qui répond à des questions en langage naturelle en les traduisant et requêtes sur les données pour l’utilisateur. <numéro>
  • #24 J’ai personnellement été agréablement surpris de voir l’industrie des jeux utiliser les données des villes pour rendre les jeux plus réalistes. 1
  • #25 Rendre l’émission de CO2 visible… la donnée ouverte a aussi le potentiel pour devenir un matériau artisitique 1
  • #26 Alors le danger est pour ces éléments de notre patrimoine d’êtres invisibles 1
  • #27 Ou un lieu est décrit en détail mais pas dans une source accessible 1
  • #28 Et il y a un réel enjeu pour une culture à être présente dans les données ouvertes et liées sur le web. 1