Les catalogues sur le Web

5 528 vues

Publié le

Présentation pour la journée d'études MEDIAL sur les "catalogues nouvelle génération"

Publié dans : Technologie, Formation
0 commentaire
11 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
5 528
Sur SlideShare
0
Issues des intégrations
0
Intégrations
2 398
Actions
Partages
0
Téléchargements
0
Commentaires
0
J’aime
11
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive
  • Les catalogues sur le Web

    1. 1. Journée d'études MEDIAL : les catalogues nouvelle génération Les catalogues de bibliothèques sur le Web Emmanuelle Bermès Bibliothèque nationale de France 8 juin 2009
    2. 2. Problématique : porter les données des bibliothèques sur le Web 1. Théorie des catalogues 2. Principes des moteurs de recherche 3. Forces et faiblesses des données des bibliothèques 4. Réconciliation des bibliothèques et du Web
    3. 3. Fondements théoriques des catalogues <ul><ul><li>Charles Ammi Cutter (1837-1903, USA) Cutter, Charles A. Rules for a Dictionary Catalog . - 4th ed., rewritten. - Washington, D.C. : Government printing office, 1904
    4. 4. Shiyali Ramamrita Ranganathan (1892-1972, Inde) Ranganathan, Shiyali Ramamrita. The five laws of library science . Madras : Madras Library Association ; London : Edward Goldston, 1931 Numérisé et disponible en ligne : < http://dlist.sir.arizona.edu/1220 >.
    5. 5. Seymour Lubetzky (1898-2003, USA) Lubetzky, Seymour. Principles of Cataloguing : Final Report. Phase I, Descriptive Cataloging . - Los Angeles, Calif. : University of California, Institute of Library Research, 1969
    6. 6. Elaine Svenonius (1933-...., USA) Svenonius, Elaine. The Intellectual Foundation of Information Organization . - Cambridge, Mass. : MIT Press, 2000 </li></ul></ul>
    7. 7. <ul><li>Impact des 5 lois de Ranganathan (1931) sur le catalogue </li><ul><ul><li>Les livres sont faits pour être utilisés : exhaustivité du catalogage
    8. 8. À chacun son livre, À chaque livre son lecteur : éviter le bruit et le silence
    9. 9. Il faut épargner le temps du lecteur : Le lecteur ne doit pas avoir à demander à consulter un document pour savoir s’il répond ou non à ses besoins ; c’est au catalogue de s’en charger. Le lecteur ne devrait pas avoir à mener de longues recherches bibliographiques avant d’interroger le catalogue.
    10. 10. La bibliothèque est un organisme en croissance : enrichissement du catalogue et des liens entre les anciens documents et les nouveaux. </li></ul></ul></ul>
    11. 11. Structure des catalogues actuels Fichier d’autorité Fichier bibliographique Données d’exemplaire John Ford ou John Ford ? Frédéric Dard ou San Antonio ? IDHEC ou FEMIS ? Story-boards ou Scénarimages ? Le Grand Bleu version longue ou version courte ? En DVD ou en VHS ? Avec ou sans bonus ? Il est en bon état ? Quelle cote dois-je demander pour le consulter ?
    12. 12. « Trouver » <ul><li>Idée qu'il est nécessaire de répondre à un besoin, une question précise </li><ul><ul><li>Des documents dont on connaît le titre, l'auteur, le sujet ou d'autres caractéristiques </li></ul></ul><li>Problématique : </li><ul><li>imaginer en amont toutes les caractéristiques qui peuvent être demandées par un utilisateur
    13. 13. les rendre identifiables (sans ambigüité) </li></ul><li>Définition de la notion de points d'accès
    14. 14. Qui débouche dans les catalogues informatisés sur les fichiers d'autorité </li></ul>
    15. 15. « Localiser / colocaliser » <ul><li>Le catalogue comme un outil local </li><ul><li>Est-ce que la bibliothèque X possède cet ouvrage ?
    16. 16. Que possède la bibliothèque X sur le même sujet / par le même auteur etc. ? </li></ul><li>Utilisation du catalogue comme un outil de gestion </li><ul><li>Où se trouve ce document ?
    17. 17. Est-il en bon état ?
    18. 18. Est-il disponible ? </li><ul><li>Données d'exemplaires, données locales </li></ul></ul></ul>
    19. 19. « Choisir » <ul><li>Le catalogue, une collection de descriptions
    20. 20. Choisir c'est... </li><ul><ul><li>confirmer que ce qui est décrit correspond à ce qu’on cherche
    21. 21. ou bien, établir une distinction entre des entités qui présentent des caractéristiques analogues </li></ul><li>Certaines informations sont purement descriptives </li></ul></ul>
    22. 22. Irruption du Web... Règne du bruit Règne du plein texte Règne du document primaire Autonomie de l'usager ?
    23. 23. Architecture fonctionnelle d'un moteur de recherche
    24. 24. Exploitation de l'information structurée par les moteurs de recherche <ul><li>Du côté de l'indexation </li><ul><li>Pondération par champs </li></ul><li>Du côté de l'interface d'accès </li><ul><li>Recherche avancée
    25. 25. Navigation par facettes </li></ul></ul>
    26. 26. Est-il encore utile de structurer l'information ? Méthodes statistiques Méthodes linguistiques Méthodes sémantiques La structuration peut être déléguée à des outils
    27. 27. Bilan <ul><li>La délégation de la structuration à un outil fonctionne si... </li><ul><li>Le matériau (textuel) est abondant
    28. 28. Le matériau est homogène
    29. 29. On surveille constamment l'outil </li></ul><li>L'utilisateur (expert) peut être déstabilisé </li></ul>
    30. 30. Retour à la bibliothèque... <ul><li>Caractéristique du matériau </li><ul><li>Hétérogène - encyclopédique
    31. 31. Précision vs. Masse
    32. 32. Finement structuré </li></ul><li>Caractéristique des usagers </li><ul><li>Pas un usager mais des usages
    33. 33. Il faut répondre aux usages experts aussi bien qu'aux usages de découverte -> tension ? </li></ul></ul>http://www.flickr.com/photos/juhansonin/3254322054
    34. 34. Forces et faiblesses des formats MARC <ul><li>Les forces : </li><ul><li>Finement structuré
    35. 35. Sépare le fond et la forme </li></ul><li>Les faiblesses </li><ul><li>Rigide
    36. 36. Pas de modèle (modèle inventé a posteriori : FRBR=1998 !) </li></ul></ul>
    37. 37. Que change XML ? <ul><li>Passage des formats MARC vers XML </li><ul><li>en agissant sur la structure : passage de ISO 27.09 à MarcXchange
    38. 38. En agissant sur la syntaxe : MODS </li></ul><li>En dehors de la sphère MARC : </li><ul><li>Dublin Core,
    39. 39. EAD,
    40. 40. etc. </li></ul></ul>http://www.flickr.com/photos/aparejador/2381158753/
    41. 41. Que change XML ? <ul><li>Force </li><ul><li>Une syntaxe plus souple </li><ul><li>Granularité
    42. 42. Structuration adaptée au contexte
    43. 43. facilite les conversions </li></ul></ul><li>Faiblesse </li><ul><li>Toujours le même modèle (modèle de l'arbre)
    44. 44. 1 notice = 1 document </li></ul></ul>
    45. 45. Retour sur le Web... <ul><li>Les catalogues sur le Web...
    46. 46. ... une opération de surface ? </li></ul>
    47. 47. Opac Web - 1998 Le web profond ou web invisible (en anglais deep web) est la partie du web accessible en ligne, mais non indexée par des moteurs de recherche classiques généralistes.
    48. 48. Des silos de données cachées <ul><li>Des silos de données inaccessibles pour l'architecture du Web (pas d'URL, pas de liens) </li><ul><li>Protocoles spécifiques aux bibliothèques : Z39.50, SRU-SRW, OAI-PMH
    49. 49. Web services, API Web </li></ul></ul>http://www.flickr.com/photos/library_of_congress/2178285893
    50. 50. Il faut réconcilier la bibliothèque et le Web Côté utilisateurs : <ul><li>Revoir les règles de catalogage
    51. 51. (ISBD/AACR -> RDA)
    52. 52. Prendre acte du modèle FRBR
    53. 53. Rénover les interfaces (Web 2.0) </li></ul>Côté machines : <ul><li>Revoir la syntaxe
    54. 54. Prendre acte du modèle FRBR
    55. 55. Adopter l'architecture du Web
    56. 56. vers le Web sémantique </li></ul>
    57. 57. Étape 1. Revoir les règles de catalogage Revoir la syntaxe Prendre acte des FRBR Réconcilier la bibliothèque et le Web
    58. 58. MODELE STRUCTURE (notices) MODELE MARC MARC Iso 2709 ISBD AACR 2 SYNTAXE (encodage) FORME CONTENU STRUCTURE (règles de catalogage) SYNTAXE (noms des éléments) 1990 Vers demain
    59. 59. MODELE STRUCTURE (notices) MODELE Dublin Core abstract Model MARC MARC Iso 2709 MARCXML, MODS 1990 2000 FRBR ISBD AACR 2 DC terms XML DC simple, DC qualifié Vers demain SYNTAXE (encodage) FORME CONTENU STRUCTURE (règles de catalogage) SYNTAXE (noms des éléments)
    60. 60. MODELE STRUCTURE (notices) MODELE Dublin Core abstract Model RDF RDA MARC MARC Iso 2709 MARCXML, MODS 1990 2000 2010 FRBR ISBD AACR 2 RDA Vocabulary DC terms XML RDF/XML DC simple, DC qualifié Vers demain SYNTAXE (encodage) FORME CONTENU STRUCTURE (règles de catalogage) SYNTAXE (noms des éléments)
    61. 61. La galaxie des normes de catalogage en mutation 2008 : FRBR-OO (orienté objet) <ul><li>Rapprochement avec le CIDOC-CRM
    62. 62. Précise certaines classes et relations
    63. 63. Première modélisation en RDF </li></ul>2009 : ressource Description and Access (RDA) <ul><li>Nouvelles règles destinées à remplacer les AACR
    64. 64. Correspondance étroite au modèle FRBR
    65. 65. Structuration proche des modèles orientés objet </li></ul>2008 : Principes internationaux de catalogage de l'IFLA <ul><li>Élaborés pour les catalogues en ligne
    66. 66. Couvrent tous types de documents
    67. 67. Premier principe : respect du confort des utilisateurs </li></ul>
    68. 68. FRBR + RDA : nouvelle structure des catalogues <ul><li>Des notices liées entre elles pour les différentes entités </li><ul><li>Œuvre
    69. 69. Concept
    70. 70. Personne
    71. 71. Etc... </li></ul><li>Affichage suivant le modèle FRBR </li><ul><li>Structure œuvre / expression / manifestation / item
    72. 72. Relation avec les personnes et autres entités </li></ul></ul>Extrait de : B. Tillett. Resource Description and Access Overview . IFLA Satellite Conference on RDA, Québec, 2008
    73. 73. Les données Faire exploser la notice ... http://www.flickr.com/photos/mukluk/507307220/
    74. 74. Exemple
    75. 75. Le modèle RDF http://catalogue.bnf.fr/ark:/12148/cb13091689x http://catalogue.bnf.fr/ark:/12148/cb37484141h Vian, Boris (1920-1959) Sullivan, Vernon (1920-1959) J'irai cracher sur vos tombes 1948 date titre auteur nom pseudonyme http://catalogue.bnf.fr/ark:/12148/cb38935131d Chansons &quot;possibles&quot; et &quot;impossibles&quot; 1956 http://catalogue.bnf.fr/ark:/12148/cb147208654 [Le déserteur] date titre titre partie auteur auteur
    76. 76. Étape 2. Adopter l'architecture du Web Rénover les interfaces Réconcilier la bibliothèque et le Web
    77. 77. Principes du « Linked Data » <ul><li>Utiliser des URIs pour nommer les ressources
    78. 78. Utiliser des URIs accessibles via HTTP
    79. 79. Quand quelqu'un demande une URI, lui renvoyer des données utiles en RDF
    80. 80. Proposer des triplets faisant le lien vers d'autres URI, afin de faire le lien avec d'autres ressources </li></ul>Principes du Linked Data d'après Tim Berners-Lee
    81. 81. 1. des URI pour nommer les ressources http://catalogue.mabibliotheque.fr/recherche.php?id=&act=8&rec=&auto=0&nov=1&t0=boris+vian&i0=0&s0=6&v2=0&v3=0&v4=0&sy=&ey=&scr=1&line=&lgc=1&lg=&mdc=1&md=&coc=1&co=&dac=1&act=42&rec=2114439320&line=0 + Notice n° : FRBNF38935131 = http://catalogue.bnf.fr/ark:/12148/cb38935131d
    82. 82. 2. Des URI accessibles via HTTP http://catalogue.bnf.fr/ark:/12148/cb37484141h Description dans le catalogue de la BnF de l'édition de 1948 de « J'irai cracher sur vos tombes » de Boris Vian Identifiant Ressource Représentations
    83. 83. 3. Renvoyer des informations utiles en RDF Négociation de contenu URI RDF/XML RDF/N3 ... HTML catalogue
    84. 84. 4. se relier à d'autres ressources
    85. 85. Les bibliothèques dans le Linked Data <ul><li>Vocabulaires </li><ul><li>Dublin Core Metadata Terms http://purl.org/dc/terms/ </li></ul><li>Autorités </li><ul><li>VIAF http://viaf.org/9983585
    86. 86. http://authorities.loc.gov
    87. 87. Rameau http://stitch.cs.vu.nl/rameau </li></ul><li>Catalogues </li><ul><li>Libris http://libris.kb.se/ </li></ul></ul>
    88. 88. Un exemple : DBPedia Mobile
    89. 89. Un autre exemple : BBC music Beta
    90. 90. Les 3 âges des catalogues de bibliothèques sur le Web Opac Web : seulement un accès de surface à un silo de données invisible Next gen' Catalogue : fonctionnalités Web 2.0 + APIs pour rendre les données visibles Web Catalogue : catalogue entièrement conforme à l'architecture du Web 1990's 2000's 2010's ? Données de bibliothèques Données de bibliothèques Données de bibliothèques Données Web Données Web Données Web
    91. 91. Extrait de : Tim Berners Lee, linked data, conférence TED 2009

    ×