JABES 2018 - Focus sur l'exposition des données

Point d’actus
Michael Jeulin / service « Outils et Méthodes »
Focus sur l’exposition des données

Point d'actus : focus sur l'exposition des données

Extension du service OAI-PMH
au format EAD
Octobre 2010 : export en Dublin Core XML des niveaux descriptifs
publiés dans Calames
• Un standard très générique mais….
• Au prix d’un appauvrissement des métadonnées
• Et surtout perte de l'héritage et de la contextualisation des informations
• « Acculturation » progressive des systèmes à l’EAD
Octobre 2017 : extension du service au format natif XML/EAD
• pour chaque instrument de recherche publié
• dans son état de publication le plus récent
• règles de moissonnage différentes du Dublin Core
Plus d’informations sur le Manuel Calames pour les développeurs

Un fichier KBART global
• Exhaustif
• Actualisé
• Réutilisable par les outils de
découverte
Licences nationales dans Bacon

Correspondance KBART-Sudoc
« meilleur PPN » proposé
• Dans les fichiers json
• Dans les webservices :
– Packages2kbart
– Id2kbart
– sorties JSON et XML
• PPN le plus récent
 Sinon correspondance avec l’imprimé le plus récent
Sudoc
• ⚠︎ Mais absent des fichiers tabulés : KBART

Evolution de l’accès Z39.50 public
Notices intégrales
Profil public : une exposition plus complète
Demandes récurrentes de bibliothèques de lecture publique françaises et
étrangères, d’éditeurs de logiciels
Toutes les zones désormais exportables
• Comme pour le profil professionnel
• Notamment les sujets, auteurs et contributeurs (zones 6XX et 7XX )
• Maintien du filtre sur les notices provenant du registre ISSN

Evolution de l’accès Z39.50
nouveaux index
Contexte : une demande du CCFR
• Signalement des attributions aux bibliothèques de biens spoliés
2nde Guerre Mondiale
• Harmonisation des signalements de la Bnf, du Sudoc et des
bibliothèques
Ajout des index
• Reliure-provenance-conservation
• Note de livre ancien

Le Sudoc en Unimarc/XML
L’intégralité du format en XML
• http://www.sudoc.fr/ppn.xml
• Une vue de la base miroir du Sudoc
• Restriction sur les notices ISSN
<datafield tag="200" ind1="1" ind2=" ">
<subfield code="a">H2G2</subfield>
<subfield code="h">III</subfield>
<subfield code="i">La vie, l'univers et le reste</subfield>
<subfield code="f">Douglas Adams</subfield>
<subfield code="g">traduit de l'anglais par Jean Bonnefoy</subfield>
</datafield>

OAI-PMH
« interrogation à la seconde »
Moissonnage à l’heure/minute/seconde
• Solution choisie pour les environnements SGBm
• Permet des chargements plus fréquents
Exemples
• Notices Collectivités ajoutées ou mises à jour quotidiennement à
heure fixe (8h):
http://www.idref.fr/OAI/oai.jsp?verb=ListRecords&from=2017-03-
01T08:00:00Z&until=2017-03-02T08:00:00Z&metadataPrefix=marc-xml&set=b
• Notices Personnes ajoutées ou mises à jour aujourd’hui entre 16h
et 17h :
https://www.idref.fr/OAI/oai.jsp?verb=ListRecords&from=2018-05-
23T16:00:00Z&until=2018-05-23T17:00:00Z&metadataPrefix=marc-xml&set=a

AlgoDoublons
Un webservice sur les autorités IdRef…
• Pour le contrôle des doublons
• Générant des rapports de doublons potentiels
… qui s’appuie sur les données de VIAF
• Extraction mensuelle des « clusters » de VIAF
• Croisement avec les données d’IdRef
• Plus d’un identifiant IdRef = doublon potentiel.

AlgoDoublons : fonctionnement
Filtres d’interrogation
• établissement : ILN ou RCR
• date de création
• Type d’autorité
Exemples
• http:// www.idref.fr/AlgoDoublons?iln=4
• http:// www.idref.fr/AlgoDoublons?rcr=693872301&date=20160501
• http:// www.idref.fr/AlgoDoublons?typaut=b&iln=96

ScanR et IdRef
un exemple de réutilisation du référentiel
Alignements de trois jeux de données de
ScanR/OpenData avec IdRef:
• Lauréats du trophée « Les étoiles de l’Europe » 39 sur 48 chercheurs identifiés (85%)
• Finalistes et lauréats du concours « Ma thèse en 180 secondes » 24 doctorants sur 71
(33,3%)
• Membres de l’Institut Universitaire de France :
100 % de membres identifiés (1 700 chercheurs depuis 1991 )
IdRef, un référentiel pivot pour l’ESR français
• Les identifiants IdRef désormais disponibles pour ces jeux de données
• De l’importance accrue du contrôle de la qualité des données

16
Merci de votre attention !
Des questions ?

JABES 2018 - Focus sur l'exposition des données

Recommandé

Recommandé

Contenu connexe

Tendances

Tendances (11)

Similaire à JABES 2018 - Focus sur l'exposition des données

Similaire à JABES 2018 - Focus sur l'exposition des données (20)

Plus de ABES

Plus de ABES (20)

Dernier

Dernier (20)

JABES 2018 - Focus sur l'exposition des données

Notes de l'éditeur