Après une 1re journée organisée le 29 mars, l'ABF Midi-Pyrénées et le CRFCB Midi Pyrénées Languedoc Roussillon on proposé une 2e journée sur les enjeux organisationnels de l'arrivée de la norme RDA dans les bibliothèques, le 27 mai à Toulouse (Amphi Cujas, Université Toulouse 1, angle rue Lautmann et rue des puits creusés)
Congrès ABF 2018 - La bibliothèque, outil de rénovation urbaine
Le web sémantique - Sylvie Fayet
1. 1 Journée CRFCB / ABF – 27 mai 2013
Urfist de Toulouse – S. Fayet
LE WEB SEMANTIQUE
Sylvie Fayet, Urfist de Toulouse
sylvie.fayet@univ-toulouse.fr
Je catalogue, tu FRBRises,
il/elle googlise.
L’évolution des catalogues
et les bibliothécaires
Vendredi 29 mars 2013 – Manufacture des tabacs
Journée organisée par le CRFCB Midi-Pyrénées /
Languedoc-Roussillon et le groupe Midi-Pyrénées de l’ABF
2. 2 Journée CRFCB / ABF – 27 mai 2013
Urfist de Toulouse – S. Fayet
Rappel : les évolutions du web
Ont conditionné les évolutions des usages du public et entraîné
de nouveaux services et pratiques dans les bibliothèques
Source : support de formation élaboré par le groupe RDA en
France
3. 3 Journée CRFCB / ABF – 27 mai 2013
Urfist de Toulouse – S. Fayet
Une histoire : Web 1.0
Web 1.0 = Web documentaire
Web statique
1 page = 1 document
Traitement des ressources limité à leur mise en forme
Navigation entre les pages avec les liens hypertexte
Limites du Web statique
Contenu non structuré
Pas de possibilité de requête
Impossibilité de renvoyer une page personnalisée selon le
visiteur
Impossibilité d’exploiter les ressources d’une base de
données
Source : support de formation du groupe RDA en France
4. 4 Journée CRFCB / ABF – 27 mai 2013
Urfist de Toulouse – S. Fayet
Web statique
Transmission de la requête HTTP
Transmission de la réponse HTTP
par le serveur Web
Serveur Web
Poste client
Navigateur
Pages statiques
Source : support de formation du groupe RDA en France
5. 5 Journée CRFCB / ABF – 27 mai 2013
Urfist de Toulouse – S. Fayet
Une évolution : le Web dynamique
Requête http
Réponse HTTP
Serveur Web
Poste client
Navigateur
Base
de
données
Dossier
contenant les
pages
Application
métier
Serveur
d'application
Traitement de la requête et sélection du
fichier contenant le programme
Logiciel
serveur
Source : support de formation du groupe RDA en France
6. 6 Journée CRFCB / ABF – 27 mai 2013
Urfist de Toulouse – S. Fayet
Le Web 2.0
Pratiquement aujourd’hui tous les sites sont
dynamiques
Exploitation de volumes importants d’informations
(bases de données, moteurs de recherche)
Personnalisation de l’accès à l’information
Naissance du Web 2.0 = Web contributif
Les utilisateurs font partie du processus documentaire
Ajout de connaissances et de commentaires aux
contenus
Source : support de formation du groupe RDA en France
7. 7 Journée CRFCB / ABF – 27 mai 2013
Urfist de Toulouse – S. Fayet
Evolutions actuelles
Les moteurs de recherche évoluent vers de « vraies »réponses:
non plus une liste de sites à interroger, mais des éléments
structurés synthétisés
exemple : Wolfram Alpha qui combine repérage de termes
signifiants, exploitation de métadonnées et base de
connaissances
Commerce en ligne et téléchargement : fonctionnement
différent des catalogues traditionnels
Distance croissante entre les habitudes des internautes et le
paradigme de recherche proposé par les bibliothèques
8. 8 Journée CRFCB / ABF – 27 mai 2013
Urfist de Toulouse – S. Fayet
Vers le web 3.0
L’expression « web sémantique » est de T. Berners-Lee mais il
s’agit plutôt d’un web « syntaxique »
Point de départ : des ressources web (pages, éléments,
fichiers, données…) décrites par des métadonnées
Objectif : exploiter par des opérations de calcul ces ressources
hétérogènes
Outils :
• des URI pour identifier les ressources
• RDF pour exprimer les métadonnées selon un modèle
logique commun
9. 9 Journée CRFCB / ABF – 27 mai 2013
Urfist de Toulouse – S. Fayet
Les URI
(Uniform Resource Identifier)
= identifiant unique et pérenne d’une ressource dans un
réseau, construit selon une syntaxe normalisée
Ex : mailto:sylvie.fayet@univ-toulouse.fr
URL (uniform resource locator) : le type d’URI le plus fréquent
Pas forcément le chemin qui s’affiche dans la barre d’adresse
du navigateur (exemple dans le Sudoc)
Alternative : les DOI (Digital Object Identifier)
URN (uniform resource name) : un ISBN par exemple
10. 10 Journée CRFCB / ABF – 27 mai 2013
Urfist de Toulouse – S. Fayet
RDF (Resource description frame)
= modèle logique de représentation de l’information
Base : un graphe de relations entre des entités
organise
organise
s’intitule
a lieu à
a lieu le
coopère
a lieu le
a lieu à
11. 11 Journée CRFCB / ABF – 27 mai 2013
Urfist de Toulouse – S. Fayet
Les triplets RDF
Toutes ces relations s’expriment sous la forme de triplets
Objet Prédicat Sujet
La ressource dont
on parle
La relation entre la
ressource et sa
caractéristique
L’attribut, la caractéristique
Le CRFCB organise une journée d’études
Evolutions des
catalogues
a lieu le 29 mars 2013
URI (numéro RNE
du CRFCB , URL de
la page de la
journée…)
Typologie des relations
(auteur, date…)
Valeur variable libellée si
possible selon référentiel
(« event » dans une
typologie des ressources,
format AAAA/MM/JJ pour la
date…)
12. 12 Journée CRFCB / ABF – 27 mai 2013
Urfist de Toulouse – S. Fayet
Fabriquer du RDF
Les informations avec lesquelles bâtir ces triplets proviennent
des métadonnées décrivant les ressources web.
Préalable = « traduire » les métadonnées métier en RDF
Dublin Core s’exprime en RDF (exemple en XML et en RDF)
FRBR = adaptation de la logique RDF aux informations
bibliographiques
13. 13 Journée CRFCB / ABF – 27 mai 2013
Urfist de Toulouse – S. Fayet
Vocabulaires et ontologies
RDF s’appuie sur des vocabulaires contrôlés :
• Modèles de métadonnées ; par exemple :
• VIAF (virtual international authority file), géré par OCLC, pour
agréger les données d’autorité
• FOAF (Friend of a friend) pour les personnes physiques
(correspondance avec le Dublin Core)
• OAI-ORE pour des ressources composites agrégeant diverses
données
• EDM (European data model) pour les objets patrimoniaux
• ontologies au format OWL (ex : Bibo http://bibliontology.com/)
• thesauri exprimés en SKOS (Rameau et LCSH par exemple)
Exemple d’une notice SUDOC en RDF
Exemple du RDF AGRIS : http://agris.fao.org/fr/agris-rdf-
properties
14. 14 Journée CRFCB / ABF – 27 mai 2013
Urfist de Toulouse – S. Fayet
Applications
Difficulté : l’interrogation se fait au moyen de langages spécifiques
comme SPARQL pas ou peu de requêtes directes mais plutôt
un parcours de données
Un des points de départ : DBPedia (http://www.dbpedia.org)
Exemples de requête
Application aux données bibliographiques : http://data.bnf.fr
Le linked data cloud : http://lod-cloud.net/versions/2011-09-
19/lod-cloud_colored.html
Et le linked data des bibliothèques : http://datahub.io/group/lld
Linked data bibliographique : exemple par Ivan Herman du W3C
(http://www.w3.org/People/Ivan/CorePresentations/SWTutorial)
15. 15 Journée CRFCB / ABF – 27 mai 2013
Urfist de Toulouse – S. Fayet
16. 16 Journée CRFCB / ABF – 27 mai 2013
Urfist de Toulouse – S. Fayet
17. 17 Journée CRFCB / ABF – 27 mai 2013
Urfist de Toulouse – S. Fayet
18. 18 Journée CRFCB / ABF – 27 mai 2013
Urfist de Toulouse – S. Fayet
Le web sémantique n’est pas
(forcément) :
un outil de TAL ni d’extraction du sens
Le tuyau sémantique (Ch. Fauré)
19. 19 Journée CRFCB / ABF – 27 mai 2013
Urfist de Toulouse – S. Fayet
Le web sémantique n’est pas non plus…
…la mise à disposition de données sous n’importe quelle forme
« Ouverture des données » :
• Des données en RDF (ex : l’INSEE http://rdf.insee.fr/)
• Des données brutes
• Des API (Application programming interface) = interface
permettant l’interaction d’un programme informatique avec
d’autres (ensemble de fonctions et de procédures)
20. 20 Journée CRFCB / ABF – 27 mai 2013
Urfist de Toulouse – S. Fayet
Apiculture (Christian Fauré)
APIculture = temps court / économie de l’attention
vs
Dataculture = temps long / économie de la mémoire
21. 21 Journée CRFCB / ABF – 27 mai 2013
Urfist de Toulouse – S. Fayet
Hétérogénéité des accès
gérés par les bibliothèques
Portail documentaire
Base de
connaissances
Résolveur de
liens
Outils d’interrogation
OPAC
Autres interfaces
gérées par la
bibliothèque
Interfaces
extérieures
Ressources
Documents
électroniques acquis
à l’extérieur
Documents
numériques
produits par
labibliothèque
Documents non
électroniques
22. 22 Journée CRFCB / ABF – 27 mai 2013
Urfist de Toulouse – S. Fayet
Enjeux
Croiser les données bibliographiques avec :
• Les données des autres institutions culturelles
(http://lodlam.net/)
• Les données du monde académique (publications
scientifiques, thèses…)
• D’autres types de données publiques
Exploiter les thesaurus et vocabulaires contrôlés / les fichiers
d’autorités
Améliorer la recherche fédérée et valoriser les collections
Difficulté inhérente aux bases de connaissances : on ne
maîtrise pas les données (choix d’indexation notamment)
23. 23 Journée CRFCB / ABF – 27 mai 2013
Urfist de Toulouse – S. Fayet
Questions
Comment maîtriser des données que nous ne produisons pas ?
Inversement, quelle part « intéressante » dans les données que
nous produisons ?
Rentrer dans les contenus ?
• Éléments d’évaluation
• Sélection
Dépasser la difficulté technique
Semantic web in libraries 2012 :
http://swib.org/swib12/programme.php