Programme des Rencontres Nationales des Bibliothécaires Musicaux | 16 & 17 mars 2015 | Metz | « La médiation » - Table ronde n°2 « Métadonnées musicales et web sémantique, le Big Data au secours de la recommandation ? » - Intervention de Nicolas Andry – Responsable Documentation et Qualité chez Archimed, ex-Responsable informatique à la Médiathèque d’Antony, blogueur (Informatheque).
Computer Parts in French - Les parties de l'ordinateur.pptx
Intervention de Nicolas Andry - Table Ronde "Métadonnées et web sémantique, le big data au secours de la recommandation"
1. Métadonnées et web sémantique, le big
data au secours de la recommandation
Metz – 17 mars 2015
2. Intervenant
219/03/2015
@ nicolas_andry : andry@archimed.fr
1. La recommandation est une proposition
de service autour des documents
2. Comment proposer de la
recommandation?
6. 6
Répondre aux besoins de l’usager
• Accéder au document qu’il est venu emprunter.
• Découvrir de nouveaux sons
19/03/2015
7. 7
Quelles recommandations?
• De la part des pairs, des professionnels et des personnes
partageant les mêmes affinités culturelles.
• Proposer des résultats basés sur les pratiques des usagers
et la popularité des documents.
• Enrichir les résultats : Proposer de l'information
complémentaire, l'usager en sait plus pour choisir.
• Affiner et adapter la recherche pour aider l'usager à
trouver ce qu’il cherche.
19/03/2015
8. 8
Ce qu’apporte la recommandation
Pour l’usager
• Améliorer son expérience utilisateur
• Réduire le temps et la complexité de la recherche
• Eclaircir des besoins mal identifiés
• Identifier les besoins inconscients de l’usager
19/03/2015
9. 9
Ce qu’apporte la recommandation
Pour la discothèque
• Fidéliser les usagers
• Améliorer les taux de rotation du fonds
• Identifier les préférences des utilisateurs pour améliorer la
politique documentaire de l’établissement
19/03/2015
11. 11
En partant du SIGB
• Les algorithmes en corrélant les emprunts et les
consultations du catalogue
• Le catalogue et une utilisation améliorée de ce que
propose Unimarc
19/03/2015
14. 14
Proposer de l'information complémentaire
Les prérequis
• La norme et rien que la norme!
• Quand on connaît les gammes, on peut improviser. En
respectant la norme, on peut évoluer librement au fil de la
transition bibliographique
• Identifier pour reconnaître et compléter.
19/03/2015
15. 15
Pour s’ouvrir sur l’extérieur
Les web services
• Principe : Faire appel à une base externe à partir d’une
technologie normée
• Applications pratiques
• Injecter les métadonnées de bases de données
externes dans le catalogue.
Par exemple : BiblioOnDemand qui permet
d’accéder à IdTouch, MusicMe et last but not least
La cité de la Musique
19/03/2015
18. 18
et se projeter vers l’avenir
Le web sémantique
• Des sources exploitables qui s'ouvrent
• Data.bnf.fr
• dbPedia FR (Lancement du projet Novembre 2012)
• Des millions d’œuvres, d’auteurs et de concepts à
disposition
• Une normalisation des modes d'accès (W3C : Rdf, sparql)
19/03/2015
19. 19
Il faut attendre
Encore un peu…
• Données encore difficilement identifiables
• Données pas toujours exhaustives
• Les sources peuvent s'éteindre
• Dans le monde des bibliothèques, attente des
préconisations de la bnf pour rda.
19/03/2015
20. 20
Il faut quand même se lancer
• En sachant identifier les œuvres, les documents, les
concepts et les artistes
• On peut enrichir le catalogue
• On peut améliorer l'expérience utilisateur
• On peut améliorer les résultats
19/03/2015
21. 21
Dans le catalogue
19/03/2015
Recherche dans Dbpedia à partir du nom mais alors pour les homonymes?
Par exemple Bill Evans (piano) et Bill Evans (saxo)
La solution : utiliser des identifiants uniques
23. 23
Mais
• Pour les documents regroupant plusieurs œuvres?
• Par exemple, les concertos brandebourgeois : Une œuvre
regroupe 6 œuvres distinctes. On utilise le 500?
• Un CD contient 3 concertos de Bach et 2 quatuors de Mozart
• Chaque air d’un opéra est une œuvre.
• Pour les albums de chanson? Chaque chanson est une
œuvre pour data.bnf.fr. On utilise le 464? Le 500?
19/03/2015
24. 24
Des perspectives
Très bientôt
• Afficher toutes les versions d’une même chanson pour que
l’usager puisse retrouver le document qui l’intéresse
• Faire des rebonds à partir des influences entre les artistes
• Retrouver toutes les interprétations d’une œuvre
• Retrouver toutes les éditions d’une œuvre
• Proposer les récompenses musicales des artistes
19/03/2015
25. 25
D’avantage de liens vers des contenus en ligne
Une réponse dans Syracuse portail
19/03/2015
26. 26
En attendant
• Ne filtrez pas les notices que vous importez !
• Identifiez!
• Le document !
19/03/2015
On parle du big data mais pour nous, le premier big data que l'on peut exploiter est le catalogue de bibliothèque.
Une exploitation des métadonnées disponibles = proposer un premier niveau de recommandation.
On peut ensuite compléter le catalogue pour enrichir la qualité de l'information proposée.
14% pour plus d’info sur les auteurs
Le site de la bibliothèque est donc un moyen de proposer un système de médiation numérique et humaine autour du document.
Usagers friands des commentaires des professionnels.
Le site doit donc mettre en scène ces commentaires pour les rendre visible.
Le système doit simplifier la vie du professionnel pour faciliter la saisie des recommandations.
2ème proposition
La recommandation sur les usages existe dans Syracuse Portail dans le respect des conditions imposées par la CNIL. Par l'intermédiaire du catalogue et des statistiques d'emprunt corrélées aux consultations du portail. (regroupement de cotes)
Rebond automatique dans la recherche pour récupérer les formes rejetées : Montrer Boris Vian dans une recherche
Pour une recherche sur Miles Davis
Retrouver les pseudonymes
Toujours améliorer l’accès au document!!!
1 Blague sur la coolitude des discothécaires. Désolé mais...
2 C'est pourquoi lors du passage à Syracuse, il a été décidé de normaliser les catalogues en aidant nos clients à mettre leurs catalogues en conformité
4 S'appuyer sur le titre uniforme musical pour en déduire les notions d'œuvre.
Principe : En partant du document (EAN + Vendangeur ) puis en récupérant les identifiants frBNF (Démo de Syracuse). Sinon il faudra aligner les données ( Titre, auteur, Numéro d'OPUS) = Un catalogue propre pour faciliter l'alignement.
Depuis 10 ans, les api ou web services ont permis d'enrichir les catalogues (Vignettes, biographies, dates de concert, relations entre artistes)
Le mode d'accès est compliqué à maintenir et à exploiter. Problème d'interopérabilité
Mais aujourd'hui un langage commun est apparu.
(non complétude des identifiants FRBNF dans les pages dbpdia, pas de liens entre data.bnf.fr et le chapitre français de dbPedia).
Quid de la cité de la Musique
Les données ne sont pas exhaustives et peuvent ne pas être valides
Les sources peuvent s'éteindre… par exemple le sparql de la bbc dédié à la Musique, freebase qui est transféré dans wikiData mais pas encore de sparql endpoint.
On peut enrichir le catalogue
Notion d'œuvre. L'œuvre en tant que service.
dbPedia (Prix artistiques, biographie, relations)
On peut améliorer l'expérience utilisateur
Suggestion enrichie
Exemple de facettes d'œuvre (Syracuse Portail). Même si elles ne sont pas très utilisées
Exemple des rebonds (manifestation, expression) dans la notice d'un document
On peut améliorer les résultats
Trouver toutes les versions d'une même chanson. Décomposer la manifestation de l'album en œuvre. L'important c'est de retrouver le document contenant l'œuvre.
Retrouver la version numérique d'un document dans la même notice que le document physique
Autre exemple : Un CD contient 3 concertos de Bach et 2 quatuors de Mozart, quelle œuvre l’emporte
Pas de réponse satisfaisante en l’état
pourtant