Ce diaporama a bien été signalé.
Nous utilisons votre profil LinkedIn et vos données d’activité pour vous proposer des publicités personnalisées et pertinentes. Vous pouvez changer vos préférences de publicités à tout moment.

JABES 2016 - DALLOZ et le SCD de l’Université de Strasbourg

98 vues

Publié le

L'analyse qualitative des métadonnées et les traitements, sans collaboration de l’éditeur.
Catherine Storne
SCD Université de Strasbourg
JABES 2016 – 10/05/2016 – Session 1

Publié dans : Formation
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

JABES 2016 - DALLOZ et le SCD de l’Université de Strasbourg

  1. 1. L'analyse qualitative des métadonnées et les traitements, sans collaboration de l’éditeur Catherine Storne SCD Université de Strasbourg JABES 2016 – 10/05/2016 – Session 1
  2. 2. Immersion à l’ABES : 2-5 février Objectifs pour le SCD • Comprendre le hub et la manipulation de données • Impulser une convergence au SCD Unistra entre documentation imprimée et électronique • Préparer le chantier CERCLES http://www.numistral.fr/ark:/12148/btv1b10218808w Objectifs pour l’ABES • Explorer un modèle de collaboration des bibliothèques en amont du hub, sur le traitement des métadonnées Objectifs pour le réseau • Disposer de métadonnées de qualité 2
  3. 3. Bibliothèque numérique Dalloz : catalogage attendu par le réseau A la recherche des métadonnées • http://www.dalloz-bibliotheque.fr/ = plateforme de recherche et de consultation de e-books • liste des titres sous forme de tableau : http://www.dalloz- bibliotheque.fr/listing.php • entrepôt OAI : http://logistic.book-vision.com/services/oai/act68.php?verb=ListRecords&metadataPrefix=onix_dc 3
  4. 4. Pause moissonnage http://logistic.book- vision.com/services/oai/act68.php?verb=GetRecord&identifier=oai:l ogistic.book-vision.com:3:1828&metadataPrefix=onix_dc • Metadonnées tirées de Dublin Core et Onix • Examen des métadonnées les plus utiles pour enrichir les notices Sudoc • Présentation des données sous forme de tableur • Extrait de la notice : <dc:title>Libertés publiques</dc:title> <dc:creator>Wachsmann, Patrick</dc:creator> <dc:subject>BND Dalloz,Domaines,CONCOURS,CRFPA,DROIT CONSTITUTIONNEL,Libertés fondamentales - droits de l'homme</dc:subject> <dc:description>Libertés publiques, […]</dc:description> <dc:publisher>Dalloz</dc:publisher> <dc:date>2009-02-11</dc:date> <dc:type>text</dc:type> <dc:format>online</dc:format> <dc:identifier>http://www.dalloz- bibliotheque.fr/bibliotheque/Libertes_publiques-110.htm</dc:identifier> <dc:language>fre</dc:language> <dc:coverage></dc:coverage> <dc:rights>sous droits</dc:rights> <onix:Product> <onix:RecordReference>1828</onix:RecordReference> <onix:NotificationType>03</onix:NotificationType> […] 4
  5. 5. MAIS … OAI Dalloz Tableau Dalloz Données plus complètes, dont résumés MAIS 383 notices absentes  Pas de notice OAI, donc, pas d’URL de consultation 5
  6. 6. Récupération des données absentes de l’OAI Avec : http://www.dalloz- bibliotheque.fr/services/bndt est.php?isbn= Et OpenRefine 6
  7. 7. Et le Sudoc ? • Comparaison ISBN imprimé liste / ISBN imprimé Sudoc (via web service isbn2ppn) • Constat : • Presque toutes les notices existent pour la version imprimée dans le Sudoc • Vérifications sur les notices imprimées : les liens vers un ppn autorités ou collection existent pour les 7XX, 410, 6XX • Une centaine de notices nécessitent une vérification humaine • 1831 titres pourraient être créés automatiquement • Décision : • création – par un script de l'ABES - des notices des e-books dans le Sudoc à partir des notices correspondantes imprimées PUIS • enrichissement par des données venues des sources Dalloz par le hub 7
  8. 8. Traitements effectués sur les métadonnées • Liste : • ajout du ppn imprimé, obtenu par le web service isbn2ppn • ajout du ppn électronique, obtenu par le compte-rendu du script de création => Transformation de ce tableau en xml/rdf par l'équipe du hub • Entrepôt OAI : => Transformation de ce tableau en xml/rdf par l'équipe du hub Travail sur les 2 tableaux 8
  9. 9. RDF : URI URI • Identifiant d’une ressource, construit sous forme d’une URL • Choix de construction dans le hub • Préfixe http://www.hub.abes.fr/bndalloz/ebook/ • Suffixes ISBN électronique Exemples http://www.hub.abes.fr/bndalloz/ebook/9782247103713/w http://www.hub.abes.fr/bndalloz/ebook/9782247103713/m/web http://www.hub.abes.fr/bndalloz/ebook/9782247103713/m/print 9
  10. 10. RDF : triplets Composition du triplet • sujet : identifiant de la ressource • prédicat : propriété ou une relation, elle-même identifiée par une URI (le plus souvent représentée par un préfixe) • objet : identifiant d’une autre ressource en relation avec la première, une valeur ou un littéral http://documentation.abes.fr/sudoc/manuels/pdf/ sudoc-rdf.pdf Exemple • <http://www.hub.abes.fr/bndalloz/ebook/ 9782247103713/w> • dcterms:title  équivalent de : http://purl.org/dc/terms/ • "50 droits contre l'exclusion " . 10
  11. 11. Travaux du chantier CERCLES • Créations de notices • Quand pas de notice papier ou besoin d'une vérification : 69 titres • Vérifications et enrichissement des notices d'e-book qui existaient déjà dans le Sudoc : 38 titres • Vérifications des notices pour lesquelles la date d'édition entre le Sudoc et le tableau-Dalloz sont différentes : 59 titres • Titres présents dans OAI-Dalloz mais absents de tableau-Dalloz : 29 titres à traiter dans un second temps • Travail sur les notices d'e-books créées par l'ABES : • collections numériques : récupération du ppn ou demande de création • Envoi à l’ABES des ppn des collections numériques, en regard des URI fournis par l’ABES • Vérifier nécessité de créer et comment les champs 303,304,305,307,339 • Vérifier les 13 notices signalées par l'ABES pour lesquelles plusieurs urls de consultations sont associées (liste fournie par l'ABES) • Responsable du chantier : Stéphanie Himber (Unistra) 11
  12. 12. Enrichissements par le hub Programme expérimental d'enrichissement des données du Sudoc (MARCEDMOD) • Requêtes SPARQL dans les deux fichiers RDF/XML • selon le critère choisi • par script, remplacement des notices du Sudoc par la valeur présente dans les fichiers RDF/XML Liste des enrichissements faits par le hub • Résumé • ISBN électronique • Dates d'édition : dates ajoutées en 100$a et 210$d (par écrasement de celles éventuellement présentes) • Edition : pour les titres ayant un numéro d'édition autre que 1, ce numéro d'édition a remplacé celui présent dans le Sudoc • Dewey : pour les notices sans 676, ajout d'un 676 avec le code dewey 340 tiré d'OAI-Dalloz • URL : reconstitution de l'URL de consultation et ajout dans les notices • Editeur 12
  13. 13. Et maintenant ? Mises à jour • Gros travail initial du hub. • Mises à jour du moissonnage OAI : • par bibliothécaire ? • transmission au hub ? • Ensemble du workflow difficilement automatisable KBART • Transformation des données en KBART ? • Données disponibles • Par la bibliothèque ? • Par l’ABES ? pas dans sa politique actuelle • Versé dans quoi ? Bacon ? Pour quel usage ? Des correspondants « hub » ? • Extension du périmètre de participation des établissements • Correspondant ne doit pas être isolé dans son établissement => Valable pour tous types de correspondants ABES 13
  14. 14. Remerciements • A Jérôme Kalfon (directeur de l’ABES) et Dominique Wolf (directrice du SCD de l’université de Strasbourg) qui ont autorisé cette immersion • A tous les collègues de l’ABES qui ont pris le temps d’organiser administrativement ou fonctionnellement cette immersion et me faire part de leurs savoirs et leurs pratiques, plus particulièrement : • Yann Nicolas (tuteur de stage) • Ilhem Addoun Poliakow • Laurent Piquemal • Marion Grand-Demery, Brigitte Michel, Philippe Millepied, Stéphane Rey 14

×