Ce diaporama a bien été signalé.
Nous utilisons votre profil LinkedIn et vos données d’activité pour vous proposer des publicités personnalisées et pertinentes. Vous pouvez changer vos préférences de publicités à tout moment.

JABES 2018 - Focus sur l'exposition des données

134 vues

Publié le

Point d’actus, focus sur l'exposition des données
Michaël Jeulin, service Outils et Méthodes, Abes
Journées ABES 2018

Publié dans : Formation
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

JABES 2018 - Focus sur l'exposition des données

  1. 1. Point d’actus Michael Jeulin / service « Outils et Méthodes » Focus sur l’exposition des données
  2. 2. Point d'actus : focus sur l'exposition des données
  3. 3. Extension du service OAI-PMH au format EAD Octobre 2010 : export en Dublin Core XML des niveaux descriptifs publiés dans Calames • Un standard très générique mais…. • Au prix d’un appauvrissement des métadonnées • Et surtout perte de l'héritage et de la contextualisation des informations • « Acculturation » progressive des systèmes à l’EAD Octobre 2017 : extension du service au format natif XML/EAD • pour chaque instrument de recherche publié • dans son état de publication le plus récent • règles de moissonnage différentes du Dublin Core Plus d’informations sur le Manuel Calames pour les développeurs Point d'actus : focus sur l'exposition des données
  4. 4. Point d'actus : focus sur l'exposition des données
  5. 5. Un fichier KBART global • Exhaustif • Actualisé • Réutilisable par les outils de découverte Licences nationales dans Bacon Point d'actus : focus sur l'exposition des données
  6. 6. Correspondance KBART-Sudoc « meilleur PPN » proposé • Dans les fichiers json • Dans les webservices : – Packages2kbart – Id2kbart – sorties JSON et XML • PPN le plus récent  Sinon correspondance avec l’imprimé le plus récent Sudoc • ⚠︎ Mais absent des fichiers tabulés : KBART Point d'actus : focus sur l'exposition des données
  7. 7. Point d'actus : focus sur l'exposition des données
  8. 8. Evolution de l’accès Z39.50 public Notices intégrales Profil public : une exposition plus complète Demandes récurrentes de bibliothèques de lecture publique françaises et étrangères, d’éditeurs de logiciels Toutes les zones désormais exportables • Comme pour le profil professionnel • Notamment les sujets, auteurs et contributeurs (zones 6XX et 7XX ) • Maintien du filtre sur les notices provenant du registre ISSN Point d'actus : focus sur l'exposition des données
  9. 9. Evolution de l’accès Z39.50 nouveaux index Contexte : une demande du CCFR • Signalement des attributions aux bibliothèques de biens spoliés 2nde Guerre Mondiale • Harmonisation des signalements de la Bnf, du Sudoc et des bibliothèques Ajout des index • Reliure-provenance-conservation • Note de livre ancien Point d'actus : focus sur l'exposition des données
  10. 10. Le Sudoc en Unimarc/XML L’intégralité du format en XML • http://www.sudoc.fr/ppn.xml • Une vue de la base miroir du Sudoc • Restriction sur les notices ISSN <datafield tag="200" ind1="1" ind2=" "> <subfield code="a">H2G2</subfield> <subfield code="h">III</subfield> <subfield code="i">La vie, l'univers et le reste</subfield> <subfield code="f">Douglas Adams</subfield> <subfield code="g">traduit de l'anglais par Jean Bonnefoy</subfield> </datafield> Point d'actus : focus sur l'exposition des données
  11. 11. Point d'actus : focus sur l'exposition des données
  12. 12. OAI-PMH « interrogation à la seconde » Moissonnage à l’heure/minute/seconde • Solution choisie pour les environnements SGBm • Permet des chargements plus fréquents Exemples • Notices Collectivités ajoutées ou mises à jour quotidiennement à heure fixe (8h): http://www.idref.fr/OAI/oai.jsp?verb=ListRecords&from=2017-03- 01T08:00:00Z&until=2017-03-02T08:00:00Z&metadataPrefix=marc-xml&set=b • Notices Personnes ajoutées ou mises à jour aujourd’hui entre 16h et 17h : https://www.idref.fr/OAI/oai.jsp?verb=ListRecords&from=2018-05- 23T16:00:00Z&until=2018-05-23T17:00:00Z&metadataPrefix=marc-xml&set=a Point d'actus : focus sur l'exposition des données
  13. 13. AlgoDoublons Un webservice sur les autorités IdRef… • Pour le contrôle des doublons • Générant des rapports de doublons potentiels … qui s’appuie sur les données de VIAF • Extraction mensuelle des « clusters » de VIAF • Croisement avec les données d’IdRef • Plus d’un identifiant IdRef = doublon potentiel. Point d'actus : focus sur l'exposition des données
  14. 14. AlgoDoublons : fonctionnement Filtres d’interrogation • établissement : ILN ou RCR • date de création • Type d’autorité Exemples • http:// www.idref.fr/AlgoDoublons?iln=4 • http:// www.idref.fr/AlgoDoublons?rcr=693872301&date=20160501 • http:// www.idref.fr/AlgoDoublons?typaut=b&iln=96 Point d'actus : focus sur l'exposition des données
  15. 15. ScanR et IdRef un exemple de réutilisation du référentiel Alignements de trois jeux de données de ScanR/OpenData avec IdRef: • Lauréats du trophée « Les étoiles de l’Europe » 39 sur 48 chercheurs identifiés (85%) • Finalistes et lauréats du concours « Ma thèse en 180 secondes » 24 doctorants sur 71 (33,3%) • Membres de l’Institut Universitaire de France : 100 % de membres identifiés (1 700 chercheurs depuis 1991 ) IdRef, un référentiel pivot pour l’ESR français • Les identifiants IdRef désormais disponibles pour ces jeux de données • De l’importance accrue du contrôle de la qualité des données Point d'actus : focus sur l'exposition des données
  16. 16. 16 Merci de votre attention ! Des questions ?

×