2. Plan
Définition & contexte
Caractéristiques et aspects techniques
Exemples d’utilisations en bibliothèques
Utilisation de données existantes
Publication de données ouvertes liées
BIBFRAME
3. “
”
Ensemble de données munies de
leurs métadonnées qui, reliées les
unes aux autres, constituent une
base de données à l'échelle du Web
OFFICE QUÉBÉCOIS DE LA LANGUE FRANÇAISE, 2013
4. Contexte
Donner une signification explicite
aux données
Passer du Web des documents au
Web des données
Permettre l’utilisation
automatisée de l’information
diffusée
6. Les 5 niveaux de partage des données
1) Sur le Web et avec une licence ouverte
2) Format structuré lisible par la machine
3) Format non propriétaire
4) Format RDF (Ressource description framework)
5) Inclut des URI (lien vers d’autres ressources) pour lier les
informations
Tim Berners-Lee (2006)
7. RDF
Basé sur les triplets :
Sujet : Ce qui est décrit
Prédicat : Le type de propriété (caractéristique) qui est décrit
Objet : La valeur de cette propriété
Sujet Prédicat Objet
Le survenant a comme auteur Germaine Guèvremont
Le survenant est de type livre
Le survenant a comme année de production 1945
8. URI
Uniform Resource Identifier
Généralement sous forme d’URL (mais pas obligatoire)
Les trois éléments des triplets peuvent être représentés par une URI
Sujet Prédicat Objet
Le survenant a comme auteur Germaine Guèvremont
http://experiment.worldcat.org/entity/wor
k/data/2521574
http://schema.org/author http://viaf.org/viaf/32097250/
9. Utilisation en bibliothèque
Deux angles :
Utiliser les données ouvertes liées existantes
Publier ses informations en données ouvertes
liées
10. Utiliser des données existantes
Pour améliorer les services
Améliorer la recherche et la navigation
Enrichir l’expérience de l’utilisateur
Etc.
11. Utiliser des données existantes -
Améliorer la recherche
Utiliser des sources externes pour soutenir les
usagers qui font une recherche sans résultats
(Moulaison & Stanley, 2013)
Recherche auteur
sans résultat
Interroger
données auteur
externes
Relancer la
recherche avec les
formes correctes
12. Utiliser des données existantes - Enrichir
l’expérience
Catalogue qui intègre automatiquement des informations de pages
Wikipédia reliées à la notice - österreichischen Bibliothekenverbundes
13. Publier ses données
Principalement des bibliothèques nationales ou autres
organismes d’envergure (ex.: OCLC)
Collections à partager
Ressources nécessaires (expertise, temps, etc.)
Droits de diffusion
16. BIBFRAME
Bibliographic Framework
Format bibliographique en données liées
Développé par la Library of Congress
Remplacera (peut-être) le MARC
18. Conclusion
Les données ouvertes liées permettent de diffuser et
de réutiliser l’information plus facilement sur le web.
Pour l’instant, la publication de données reste plutôt
du ressort de grands organismes, mais même les
bibliothèques ayant moins de ressources peuvent
tirer profit des données disponibles
Li, M. G. M. (2012). Anne of Green Gables. 北京 : Tsinghua University Press.
Le Web des documents = le Web relie des documents. Par la suite, les humains doivent les interpreter
Le Web des données = ce sont les données qui sont liées entre elles sur le Web.
Exemple pour illustrer la question de la signification explicite des données. Si on ne lit pas le chinois, on peut identifier les éléments par la structure : le titre, les phrases avec les points, les sections de phrases avec les virgules, mais ce n’est pas possible d’aller plus loin.
Ex un PDF sur le Web diffusé en creative commons
Un fichier Excel
Un fichier csv
Prochaine diapositive
Diapositive à venir
L’humain ne « lit » jamais les triplets RDF directement. La machine va interpréter
Open Library, DBpedia, Freebase, New York Times Linked Open Data, NNDB, Virtual International Authorities File, and the Library of Congress Name Authorities
80% des recherches auteur sans résultat étaient liés à des entrées dans au moins une des sources consultées
La BNF a développé une belle interface de navigation. Ce n’est pas un critère pour la diffusion de données ouvertes liées.
Fichier d'autorité international virtuel
« projet commun de plusieurs bibliothèques nationales, mis en œuvre et hébergé par OCLC »