Métadonnées et web sémantique, le big
data au secours de la recommandation
Metz – 17 mars 2015
Intervenant
219/03/2015
@ nicolas_andry : andry@archimed.fr
1. La recommandation est une proposition
de service autour des...
319/03/2015
La
recommandation,
une proposition de
service
4
les souhaits des utilisateurs et des bibliothécaires
Rapport d'OCLC - 2009
19/03/2015
5
Les cinq améliorations les plus attendues en termes de qualité des
données
19/03/2015
6
Répondre aux besoins de l’usager
• Accéder au document qu’il est venu emprunter.
• Découvrir de nouveaux sons
19/03/2015
7
Quelles recommandations?
• De la part des pairs, des professionnels et des personnes
partageant les mêmes affinités cult...
8
Ce qu’apporte la recommandation
Pour l’usager
• Améliorer son expérience utilisateur
• Réduire le temps et la complexité...
9
Ce qu’apporte la recommandation
Pour la discothèque
• Fidéliser les usagers
• Améliorer les taux de rotation du fonds
• ...
1019/03/2015
Comment proposer
de la
recommandation?
11
En partant du SIGB
• Les algorithmes en corrélant les emprunts et les
consultations du catalogue
• Le catalogue et une ...
12
Suggestion basée sur les autorités
19/03/2015
13
Amélioration de la recherche
19/03/2015
14
Proposer de l'information complémentaire
Les prérequis
• La norme et rien que la norme!
• Quand on connaît les gammes, ...
15
Pour s’ouvrir sur l’extérieur
Les web services
• Principe : Faire appel à une base externe à partir d’une
technologie n...
16
Du contenu dans le catalogue
19/03/2015
17
Graphes de relations entre musiciens
19/03/2015
18
et se projeter vers l’avenir
Le web sémantique
• Des sources exploitables qui s'ouvrent
• Data.bnf.fr
• dbPedia FR (Lan...
19
Il faut attendre
Encore un peu…
• Données encore difficilement identifiables
• Données pas toujours exhaustives
• Les s...
20
Il faut quand même se lancer
• En sachant identifier les œuvres, les documents, les
concepts et les artistes
• On peut ...
21
Dans le catalogue
19/03/2015
Recherche dans Dbpedia à partir du nom mais alors pour les homonymes?
Par exemple Bill Eva...
22
Un cas minimaliste …
19/03/2015
23
Mais
• Pour les documents regroupant plusieurs œuvres?
• Par exemple, les concertos brandebourgeois : Une œuvre
regroup...
24
Des perspectives
Très bientôt
• Afficher toutes les versions d’une même chanson pour que
l’usager puisse retrouver le d...
25
D’avantage de liens vers des contenus en ligne
Une réponse dans Syracuse portail
19/03/2015
26
En attendant
• Ne filtrez pas les notices que vous importez !
• Identifiez!
• Le document !
19/03/2015
2719/03/2015
Prochain SlideShare
Chargement dans…5
×

Intervention de Nicolas Andry - Table Ronde "Métadonnées et web sémantique, le big data au secours de la recommandation"

421 vues

Publié le

Programme des Rencontres Nationales des Bibliothécaires Musicaux | 16 & 17 mars 2015 | Metz | « La médiation » - Table ronde n°2 « Métadonnées musicales et web sémantique, le Big Data au secours de la recommandation ? » - Intervention de Nicolas Andry – Responsable Documentation et Qualité chez Archimed, ex-Responsable informatique à la Médiathèque d’Antony, blogueur (Informatheque).

Publié dans : Formation
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
421
Sur SlideShare
0
Issues des intégrations
0
Intégrations
2
Actions
Partages
0
Téléchargements
3
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive
  • On parle du big data mais pour nous, le premier big data que l'on peut exploiter est le catalogue de bibliothèque.
    Une exploitation des métadonnées disponibles = proposer un premier niveau de recommandation.
    On peut ensuite compléter le catalogue pour enrichir la qualité de l'information proposée.
  • 14% pour plus d’info sur les auteurs
  • Le site de la bibliothèque est donc un moyen de proposer un système de médiation numérique et humaine autour du document.
  • Usagers friands des commentaires des professionnels.
    Le site doit donc mettre en scène ces commentaires pour les rendre visible.
    Le système doit simplifier la vie du professionnel pour faciliter la saisie des recommandations.

    2ème proposition
  • La recommandation sur les usages existe dans Syracuse Portail dans le respect des conditions imposées par la CNIL. Par l'intermédiaire du catalogue et des statistiques d'emprunt corrélées aux consultations du portail. (regroupement de cotes)

    Rebond automatique dans la recherche pour récupérer les formes rejetées : Montrer Boris Vian dans une recherche
  • Pour une recherche sur Miles Davis
  • Retrouver les pseudonymes
    Toujours améliorer l’accès au document!!!
  • 1 Blague sur la coolitude des discothécaires. Désolé mais...

    2 C'est pourquoi lors du passage à Syracuse, il a été décidé de normaliser les catalogues en aidant nos clients à mettre leurs catalogues en conformité

    4 S'appuyer sur le titre uniforme musical pour en déduire les notions d'œuvre.

    Principe : En partant du document (EAN + Vendangeur ) puis en récupérant les identifiants frBNF (Démo de Syracuse). Sinon il faudra aligner les données ( Titre, auteur, Numéro d'OPUS) = Un catalogue propre pour faciliter l'alignement.
  • Depuis 10 ans, les api ou web services ont permis d'enrichir les catalogues (Vignettes, biographies, dates de concert, relations entre artistes)
    Le mode d'accès est compliqué à maintenir et à exploiter. Problème d'interopérabilité
    Mais aujourd'hui un langage commun est apparu.
  • (non complétude des identifiants FRBNF dans les pages dbpdia, pas de liens entre data.bnf.fr et le chapitre français de dbPedia).
    Quid de la cité de la Musique 
    Les données ne sont pas exhaustives et peuvent ne pas être valides
    Les sources peuvent s'éteindre… par exemple le sparql de la bbc dédié à la Musique, freebase qui est transféré dans wikiData mais pas encore de sparql endpoint.
  • On peut enrichir le catalogue
    Notion d'œuvre. L'œuvre en tant que service.
    dbPedia (Prix artistiques, biographie, relations)
    On peut améliorer l'expérience utilisateur
    Suggestion enrichie
    Exemple de facettes d'œuvre (Syracuse Portail). Même si elles ne sont pas très utilisées
    Exemple des rebonds (manifestation, expression) dans la notice d'un document
    On peut améliorer les résultats
    Trouver toutes les versions d'une même chanson. Décomposer la manifestation de l'album en œuvre. L'important c'est de retrouver le document contenant l'œuvre.
    Retrouver la version numérique d'un document dans la même notice que le document physique
  • Autre exemple : Un CD contient 3 concertos de Bach et 2 quatuors de Mozart, quelle œuvre l’emporte

    Pas de réponse satisfaisante en l’état


    pourtant
  • Intervention de Nicolas Andry - Table Ronde "Métadonnées et web sémantique, le big data au secours de la recommandation"

    1. 1. Métadonnées et web sémantique, le big data au secours de la recommandation Metz – 17 mars 2015
    2. 2. Intervenant 219/03/2015 @ nicolas_andry : andry@archimed.fr 1. La recommandation est une proposition de service autour des documents 2. Comment proposer de la recommandation?
    3. 3. 319/03/2015 La recommandation, une proposition de service
    4. 4. 4 les souhaits des utilisateurs et des bibliothécaires Rapport d'OCLC - 2009 19/03/2015
    5. 5. 5 Les cinq améliorations les plus attendues en termes de qualité des données 19/03/2015
    6. 6. 6 Répondre aux besoins de l’usager • Accéder au document qu’il est venu emprunter. • Découvrir de nouveaux sons 19/03/2015
    7. 7. 7 Quelles recommandations? • De la part des pairs, des professionnels et des personnes partageant les mêmes affinités culturelles. • Proposer des résultats basés sur les pratiques des usagers et la popularité des documents. • Enrichir les résultats : Proposer de l'information complémentaire, l'usager en sait plus pour choisir. • Affiner et adapter la recherche pour aider l'usager à trouver ce qu’il cherche. 19/03/2015
    8. 8. 8 Ce qu’apporte la recommandation Pour l’usager • Améliorer son expérience utilisateur • Réduire le temps et la complexité de la recherche • Eclaircir des besoins mal identifiés • Identifier les besoins inconscients de l’usager 19/03/2015
    9. 9. 9 Ce qu’apporte la recommandation Pour la discothèque • Fidéliser les usagers • Améliorer les taux de rotation du fonds • Identifier les préférences des utilisateurs pour améliorer la politique documentaire de l’établissement 19/03/2015
    10. 10. 1019/03/2015 Comment proposer de la recommandation?
    11. 11. 11 En partant du SIGB • Les algorithmes en corrélant les emprunts et les consultations du catalogue • Le catalogue et une utilisation améliorée de ce que propose Unimarc 19/03/2015
    12. 12. 12 Suggestion basée sur les autorités 19/03/2015
    13. 13. 13 Amélioration de la recherche 19/03/2015
    14. 14. 14 Proposer de l'information complémentaire Les prérequis • La norme et rien que la norme! • Quand on connaît les gammes, on peut improviser. En respectant la norme, on peut évoluer librement au fil de la transition bibliographique • Identifier pour reconnaître et compléter. 19/03/2015
    15. 15. 15 Pour s’ouvrir sur l’extérieur Les web services • Principe : Faire appel à une base externe à partir d’une technologie normée • Applications pratiques • Injecter les métadonnées de bases de données externes dans le catalogue. Par exemple : BiblioOnDemand qui permet d’accéder à IdTouch, MusicMe et last but not least La cité de la Musique 19/03/2015
    16. 16. 16 Du contenu dans le catalogue 19/03/2015
    17. 17. 17 Graphes de relations entre musiciens 19/03/2015
    18. 18. 18 et se projeter vers l’avenir Le web sémantique • Des sources exploitables qui s'ouvrent • Data.bnf.fr • dbPedia FR (Lancement du projet Novembre 2012) • Des millions d’œuvres, d’auteurs et de concepts à disposition • Une normalisation des modes d'accès (W3C : Rdf, sparql) 19/03/2015
    19. 19. 19 Il faut attendre Encore un peu… • Données encore difficilement identifiables • Données pas toujours exhaustives • Les sources peuvent s'éteindre • Dans le monde des bibliothèques, attente des préconisations de la bnf pour rda. 19/03/2015
    20. 20. 20 Il faut quand même se lancer • En sachant identifier les œuvres, les documents, les concepts et les artistes • On peut enrichir le catalogue • On peut améliorer l'expérience utilisateur • On peut améliorer les résultats 19/03/2015
    21. 21. 21 Dans le catalogue 19/03/2015 Recherche dans Dbpedia à partir du nom mais alors pour les homonymes? Par exemple Bill Evans (piano) et Bill Evans (saxo) La solution : utiliser des identifiants uniques
    22. 22. 22 Un cas minimaliste … 19/03/2015
    23. 23. 23 Mais • Pour les documents regroupant plusieurs œuvres? • Par exemple, les concertos brandebourgeois : Une œuvre regroupe 6 œuvres distinctes. On utilise le 500? • Un CD contient 3 concertos de Bach et 2 quatuors de Mozart • Chaque air d’un opéra est une œuvre. • Pour les albums de chanson? Chaque chanson est une œuvre pour data.bnf.fr. On utilise le 464? Le 500? 19/03/2015
    24. 24. 24 Des perspectives Très bientôt • Afficher toutes les versions d’une même chanson pour que l’usager puisse retrouver le document qui l’intéresse • Faire des rebonds à partir des influences entre les artistes • Retrouver toutes les interprétations d’une œuvre • Retrouver toutes les éditions d’une œuvre • Proposer les récompenses musicales des artistes 19/03/2015
    25. 25. 25 D’avantage de liens vers des contenus en ligne Une réponse dans Syracuse portail 19/03/2015
    26. 26. 26 En attendant • Ne filtrez pas les notices que vous importez ! • Identifiez! • Le document ! 19/03/2015
    27. 27. 2719/03/2015

    ×