SlideShare une entreprise Scribd logo
1  sur  28
AUTOUR DES AUTORITES
Vers un nouveau maillon dans la chaine d’alimentation…
… du catalogue
Yann Nicolas & Olivier Rousseaux – ABES
Montpellier – Journées ABES 2012
IDREF ET LES AUTRES
Réseaux d’autorités
Sudoc
Notices bibliographiques
IdRef
Notices d’autorité
Sudoc
Notices bibliographiques
IdRef
Notices d’autorité
theses.fr
Calames
Articles
open
access Bib.
Num.
Cours en
ligne
Sudoc
Notices bibliographiques
IdRef
Notices d’autorité
theses.fr
Calames
Articles
open
access Bib.
Num.
Cours en
ligne
BnF
Viaf
ORCID
ISNI
D’autres référentiels
d’autorité globaux
?
Référentiels
locaux
• Fichier d’autorités virtuel et international
• Projet OCLC, LC, DnB et BnF jusqu’en 2012
• Service OCLC depuis
• Mise en correspondance de fichiers
d’autorités préexistants (dont BnF, IdRef, etc.)
• Pas de possibilité directe de création, ni de
modification
• International Standard Name Identifier
• Norme ISO (ISO 27729)
• Un ID unique pour les acteurs des industries
créatives
• D’abord pour la gestion des droits
• Pas d’attribution d’ID directe
• Passer par une agence d’enregistrement (Qui ?)
• VIAF représente l’immense majorité de la base
ISNI
• Open Researcher Contributor Identification
Initiative
• Cible : auteurs scientifiques
• Initiative des éditeurs
• Rôle important de Thomson Reuters, qui commercialise
la base de citations Web of Science
• Les chercheurs pourront directement se créer
et modifier leur profil et leur ID
• Du producteur au consommateur revendeur
Coexistence des référentiels
• Soit la concurrence sauvage entre autorités
• Locales
• Globales
• Soit il faut relier ces référentiels entre eux
• Mais comment ?
• Différents modèles possibles :
Chaque référentiel est lié à chaque autre
Un référentiel central, lié à chaque autre
Des référentiels à différents niveaux
ABC
Identifiants
à vocation locale
Identifiants
à vocation globale
Sudoc
theses.fr
Calames
Preprints,
postprints
Cours en
ligne
Édition
électronique
CRIS
ID
Univ.
ID
Labo
ID
école
ORCID ISNI
XYZ
Identifiants
à vocation régionale
IdRef
BnF
VIAF
DNB
(All.)
DAI
(NL)
VIAF, NOUVEAU MAILLON DANS LA
CHAÎNE D’ALIMENTATION DU
CATALOGUE
Côté catalogage
WinIBW
Recherche Z39.50 ou base d’appui
Sélection notice bibliographique
Contient un lien autoritéNe contient pas de lien autorité
Copie notice sans lien(s) à PPN autorités Sudoc
Interrogation VIAF
Identifiant existe dans VIAF
Notice VIAF contient PPNNotice VIAF ne contient pas PPN
Pop-up : voulez-vous utiliser cette autorité Sudoc ?
OUINON
Copie notice avec lien(s) à PPN autorités Sudoc
Si identifiant non BnF Si identifiant BnF
Identifiant BnF trouvéIdentifiant BnF absent
Interrogation IdRef
S
U
D
O
C
?
Suppression de l’identifiant autorité
Identifiant n’existe pas dans VIAF
• Convergence via les identifiants
• De la nécessité d’un contrôle humain?
• Quel(s) rôle(s)
17Journées ABES 2012 Y. Nicolas & O. Rousseaux - ABES
pour le producteur de
métadonnées?
pour le catalogueur?
AUTOMATISER LE LIEN AUX
AUTORITÉS IDREF
SudocAD
Projet SudocAD
• Projet de recherche 2010-2011
• Avec des chercheurs du LIRMM (Montpellier 2) :
» informatique > intelligence artificielle > représentation de la
connaissance
• Soutien financier d’ADONIS (CNRS)
• Objectif : automatiser le lien aux autorités Sudoc
• Corpus de test : articles de Persée
• Approche : web sémantique (raisonnement)
• On extrait de la notice
d’article quelques
informations pour
constituer une sorte
d’autorité Persée.
• Il s’agit ensuite de
trouver l’autorité IdRef qui
lui ressemble le plus.
Date
Langue
revue
Domaine
article
Nom de
l’auteur
« Autorité»
Persée
Beaucoup d’appelés
• Rechercher « Christian Schmidt »
• Minimiser le risque de passer à
côté :
– nomComplet_a:schmidt,christian
– nomComplet_a:schmidt,c.
– nomComplet_a:schmidt,c
– nomComplet_a:schmidt,christian*
– nom_a:schmidt AND prenom_a:c
– etc.
39 candidats
Pour en savoir plus
sur chacune des 39
autorités candidates,
on puise dans les
notices
bibliographiques
liées
Puis on compare
cette autorité
enrichie
à l’autorité Persée
Date
Langue
Sujets Rameau
Domaine
Domaine
Nom
Date
Langue
Sujets Rameau
Domaine
Domaine
Strong Medium Weak Poor Neutral Unrelated Impossible
Peu d’élus
Chaque autorité candidate est classée dans une des 7 catégories
Dans quels cas générer
automatiquement un lien à une des
autorités candidates ?
• Différents algorithmes possibles
• Notre algorithme préféré :
14G2 : liage automatique si un seul candidat dans la
catégorie de liage la meilleure parmi
Strong et Medium
Evaluation de l’algorithme 14G2
• 77% de bonnes décisions
– 58% : décision correcte de créer un lien
– 19% : décision correcte de ne pas créer de lien
• Mauvaises décisions :
– 20 % : décision incorrecte de ne pas créer de lien
– 1,9% : décision incorrecte de créer un lien
 73% des liens à créer sont créés
 4% des liens créés sont mauvais
Apparemment, pas plus que chez les humains !
Comparaison avec le programme
actuel de liage automatique dans le
Sudoc
SudocAD 14G2 Sudoc aujourd’hui
Parmi les liens créés,
combien sont faux ?
4% 20%
Parmi les liens à créer,
combien sont
effectivement créés ?
73% 43%
* Chiffres à confirmer
Enseignements de SudocAD
• Résultats très encourageants
• Double Exploitation possible :
• Liage automatique
• Aide à la décision
• Marges de progression identifiées :
• Amélioration de la comparaison des domaines
• Amélioration de la comparaison des noms
• Exploitation d’autres propriétés comme :
» Indexation matière
» Co-auteurs
» Rôles
• Les erreurs de lien présentes dans le Sudoc
trompent SudocAD
Rapport final : http://www.abes.fr/Sudoc/Projets-en-cours/SudocAD
La suite
• Continuer les expérimentations avec les
programmes de SudocAD
• Nouveaux corpus : HAL, licences nationales
• Pas d’utilisation en production tout de suite
• Aller plus loin dans le cadre d’un nouveau projet
de recherche : Qualinca
• Projet ANR (2012-2015)
• Avec des labos d’informatique (LIRMM, LIG, LRI) et l’INA
• Sur la qualité des liens dans un catalogue et dans le contexte
du web de données
» Mesurer la qualité des liens actuels
» Générer de nouveaux liens

Contenu connexe

Similaire à Jabes 2012 - Autour des autorités

Veille2012 avec-copies-ecran-120416110404-phpapp01
Veille2012 avec-copies-ecran-120416110404-phpapp01Veille2012 avec-copies-ecran-120416110404-phpapp01
Veille2012 avec-copies-ecran-120416110404-phpapp01
Claude Martin
 
Entreprise 2.0 : La collaboration comme élément moteur de l'innovation
Entreprise 2.0 : La collaboration comme élément moteur de l'innovationEntreprise 2.0 : La collaboration comme élément moteur de l'innovation
Entreprise 2.0 : La collaboration comme élément moteur de l'innovation
Frederic CAVAZZA
 
Journée des correspondants Tice 2013 : support de la journée
Journée des correspondants Tice 2013 : support de la journéeJournée des correspondants Tice 2013 : support de la journée
Journée des correspondants Tice 2013 : support de la journée
Documentation Rouen
 

Similaire à Jabes 2012 - Autour des autorités (20)

Des identifiants au cœur de nos métiers - Biennale du Numérique Enssib 2019
Des identifiants au cœur de nos métiers - Biennale du Numérique Enssib 2019Des identifiants au cœur de nos métiers - Biennale du Numérique Enssib 2019
Des identifiants au cœur de nos métiers - Biennale du Numérique Enssib 2019
 
Veille2012 avec-copies-ecran-120416110404-phpapp01
Veille2012 avec-copies-ecran-120416110404-phpapp01Veille2012 avec-copies-ecran-120416110404-phpapp01
Veille2012 avec-copies-ecran-120416110404-phpapp01
 
Les outils de recherche et veille sur le web
Les outils de recherche et veille sur le webLes outils de recherche et veille sur le web
Les outils de recherche et veille sur le web
 
Données liées : Succès, leçons et prochaines étapes
Données liées : Succès, leçons et prochaines étapesDonnées liées : Succès, leçons et prochaines étapes
Données liées : Succès, leçons et prochaines étapes
 
Online learning 19
Online learning 19Online learning 19
Online learning 19
 
Synodiance > SEO & Popularité - Table Ronde EBG 07/11/13
Synodiance > SEO & Popularité - Table Ronde EBG 07/11/13Synodiance > SEO & Popularité - Table Ronde EBG 07/11/13
Synodiance > SEO & Popularité - Table Ronde EBG 07/11/13
 
Accompagner le lecteur aux usages du numérique 3/3
Accompagner le lecteur aux usages du numérique 3/3Accompagner le lecteur aux usages du numérique 3/3
Accompagner le lecteur aux usages du numérique 3/3
 
SAPIENS 2009 - Module 13 Part2
SAPIENS 2009 - Module 13 Part2SAPIENS 2009 - Module 13 Part2
SAPIENS 2009 - Module 13 Part2
 
CCC-CONNECTION - etablir une strategie ecommerce efficace: abandon de panier,...
CCC-CONNECTION - etablir une strategie ecommerce efficace: abandon de panier,...CCC-CONNECTION - etablir une strategie ecommerce efficace: abandon de panier,...
CCC-CONNECTION - etablir une strategie ecommerce efficace: abandon de panier,...
 
L'Intelligence Economique concrète : recettes & bonnes pratiques
L'Intelligence Economique concrète :  recettes & bonnes pratiquesL'Intelligence Economique concrète :  recettes & bonnes pratiques
L'Intelligence Economique concrète : recettes & bonnes pratiques
 
Rechercher Autrement sur le Net
Rechercher Autrement sur le NetRechercher Autrement sur le Net
Rechercher Autrement sur le Net
 
Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Intégrer IdRef dans les applications documentaires de votre université. Pourq...Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Intégrer IdRef dans les applications documentaires de votre université. Pourq...
 
Réseaux sociaux professionnels
Réseaux sociaux professionnelsRéseaux sociaux professionnels
Réseaux sociaux professionnels
 
Gip corse 2015
Gip corse 2015Gip corse 2015
Gip corse 2015
 
Aeliapedia : un Intranet pour le business
Aeliapedia : un Intranet pour le businessAeliapedia : un Intranet pour le business
Aeliapedia : un Intranet pour le business
 
Entreprise 2.0 : La collaboration comme élément moteur de l'innovation
Entreprise 2.0 : La collaboration comme élément moteur de l'innovationEntreprise 2.0 : La collaboration comme élément moteur de l'innovation
Entreprise 2.0 : La collaboration comme élément moteur de l'innovation
 
Identity access management
Identity access managementIdentity access management
Identity access management
 
Sp seo camp-201505
Sp seo camp-201505Sp seo camp-201505
Sp seo camp-201505
 
Bâtir un référentiel multi métiers
Bâtir un référentiel multi métiersBâtir un référentiel multi métiers
Bâtir un référentiel multi métiers
 
Journée des correspondants Tice 2013 : support de la journée
Journée des correspondants Tice 2013 : support de la journéeJournée des correspondants Tice 2013 : support de la journée
Journée des correspondants Tice 2013 : support de la journée
 

Plus de ABES

Jabes 2021 - Poster "Projet d'exposition documentaire et participative pour u...
Jabes 2021 - Poster "Projet d'exposition documentaire et participative pour u...Jabes 2021 - Poster "Projet d'exposition documentaire et participative pour u...
Jabes 2021 - Poster "Projet d'exposition documentaire et participative pour u...
ABES
 

Plus de ABES (20)

FOLIO_presentation_par_BibLibre
FOLIO_presentation_par_BibLibreFOLIO_presentation_par_BibLibre
FOLIO_presentation_par_BibLibre
 
Jabes 2021 - Session parallele "Etablissements experimentaux : quelles incide...
Jabes 2021 - Session parallele "Etablissements experimentaux : quelles incide...Jabes 2021 - Session parallele "Etablissements experimentaux : quelles incide...
Jabes 2021 - Session parallele "Etablissements experimentaux : quelles incide...
 
JCR 2019 - Présentation : "Cidemis en amont, petits rappels"
JCR 2019 - Présentation : "Cidemis en amont, petits rappels"JCR 2019 - Présentation : "Cidemis en amont, petits rappels"
JCR 2019 - Présentation : "Cidemis en amont, petits rappels"
 
Jabes 2021 - Poster "Initiation aux études historiques"
Jabes 2021 - Poster "Initiation aux études historiques"Jabes 2021 - Poster "Initiation aux études historiques"
Jabes 2021 - Poster "Initiation aux études historiques"
 
JCR 2021 - Présentation "Et la boucle est bouclee"
JCR 2021 - Présentation "Et la boucle est bouclee"JCR 2021 - Présentation "Et la boucle est bouclee"
JCR 2021 - Présentation "Et la boucle est bouclee"
 
JCR 2021 - Présentation "Les demandes Cidemis, c'est vraiment termine !"
JCR 2021 - Présentation "Les demandes Cidemis, c'est vraiment termine !"JCR 2021 - Présentation "Les demandes Cidemis, c'est vraiment termine !"
JCR 2021 - Présentation "Les demandes Cidemis, c'est vraiment termine !"
 
JCR 2021 - Présentation "Cidemis au-dela des frontieres"
JCR 2021 - Présentation "Cidemis au-dela des frontieres"JCR 2021 - Présentation "Cidemis au-dela des frontieres"
JCR 2021 - Présentation "Cidemis au-dela des frontieres"
 
JCR 2021 - Présentation "Cidemis au Cieps"
JCR 2021 - Présentation "Cidemis au Cieps"JCR 2021 - Présentation "Cidemis au Cieps"
JCR 2021 - Présentation "Cidemis au Cieps"
 
JCR 2021 - Présentation "Cidemis à la Bibliothèque nationale de France"
JCR 2021 - Présentation "Cidemis à la Bibliothèque nationale de France"JCR 2021 - Présentation "Cidemis à la Bibliothèque nationale de France"
JCR 2021 - Présentation "Cidemis à la Bibliothèque nationale de France"
 
JCR 2021 - Présentation "Cidemis en amont : petits rappels"
JCR 2021 - Présentation "Cidemis en amont : petits rappels" JCR 2021 - Présentation "Cidemis en amont : petits rappels"
JCR 2021 - Présentation "Cidemis en amont : petits rappels"
 
Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"
Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"
Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"
 
Jabes 2021 - 26 ans après la création de l'Abes
Jabes 2021 - 26 ans après la création de l'AbesJabes 2021 - 26 ans après la création de l'Abes
Jabes 2021 - 26 ans après la création de l'Abes
 
Jabes 2021 - Session parallèle "Mécanique des alignements d'identifiants aute...
Jabes 2021 - Session parallèle "Mécanique des alignements d'identifiants aute...Jabes 2021 - Session parallèle "Mécanique des alignements d'identifiants aute...
Jabes 2021 - Session parallèle "Mécanique des alignements d'identifiants aute...
 
Jabes 2021 - Les Actus de l'Abes, partie 2
Jabes 2021 - Les Actus de l'Abes, partie 2Jabes 2021 - Les Actus de l'Abes, partie 2
Jabes 2021 - Les Actus de l'Abes, partie 2
 
Jabes 2021 - Les Actus de l'Abes, partie 1
Jabes 2021 - Les Actus de l'Abes, partie 1Jabes 2021 - Les Actus de l'Abes, partie 1
Jabes 2021 - Les Actus de l'Abes, partie 1
 
Jabes 2021 - Poster "Expérimentation Sudoc FRBR"
Jabes 2021 - Poster "Expérimentation Sudoc FRBR"Jabes 2021 - Poster "Expérimentation Sudoc FRBR"
Jabes 2021 - Poster "Expérimentation Sudoc FRBR"
 
Jabes 2021 - Poster "Les données de la recherche à l'Université de Toulouse J...
Jabes 2021 - Poster "Les données de la recherche à l'Université de Toulouse J...Jabes 2021 - Poster "Les données de la recherche à l'Université de Toulouse J...
Jabes 2021 - Poster "Les données de la recherche à l'Université de Toulouse J...
 
Jabes 2021 - Poster "Utiliser des plugins pour améliorer la qualité de votre ...
Jabes 2021 - Poster "Utiliser des plugins pour améliorer la qualité de votre ...Jabes 2021 - Poster "Utiliser des plugins pour améliorer la qualité de votre ...
Jabes 2021 - Poster "Utiliser des plugins pour améliorer la qualité de votre ...
 
Jabes 2021 - Poster "Projet d'exposition documentaire et participative pour u...
Jabes 2021 - Poster "Projet d'exposition documentaire et participative pour u...Jabes 2021 - Poster "Projet d'exposition documentaire et participative pour u...
Jabes 2021 - Poster "Projet d'exposition documentaire et participative pour u...
 
Jabes 2021 - Poster "CorHAL, une voie pour les chercheurs : simplifier le dép...
Jabes 2021 - Poster "CorHAL, une voie pour les chercheurs : simplifier le dép...Jabes 2021 - Poster "CorHAL, une voie pour les chercheurs : simplifier le dép...
Jabes 2021 - Poster "CorHAL, une voie pour les chercheurs : simplifier le dép...
 

Dernier

Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
AmgdoulHatim
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
ikospam0
 

Dernier (16)

RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANKRAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
 
les_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkles_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhk
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
 
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
 
Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
python-Cours Officiel POO Python-m103.pdf
python-Cours Officiel POO Python-m103.pdfpython-Cours Officiel POO Python-m103.pdf
python-Cours Officiel POO Python-m103.pdf
 
Télécommunication et transport .pdfcours
Télécommunication et transport .pdfcoursTélécommunication et transport .pdfcours
Télécommunication et transport .pdfcours
 
Cours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiquesCours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiques
 
Neuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean EudesNeuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean Eudes
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptx
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaire
 
L'expression du but : fiche et exercices niveau C1 FLE
L'expression du but : fiche et exercices  niveau C1 FLEL'expression du but : fiche et exercices  niveau C1 FLE
L'expression du but : fiche et exercices niveau C1 FLE
 
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxIntégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
 

Jabes 2012 - Autour des autorités

  • 1. AUTOUR DES AUTORITES Vers un nouveau maillon dans la chaine d’alimentation… … du catalogue Yann Nicolas & Olivier Rousseaux – ABES Montpellier – Journées ABES 2012
  • 2. IDREF ET LES AUTRES Réseaux d’autorités
  • 5. Sudoc Notices bibliographiques IdRef Notices d’autorité theses.fr Calames Articles open access Bib. Num. Cours en ligne BnF Viaf ORCID ISNI D’autres référentiels d’autorité globaux ? Référentiels locaux
  • 6. • Fichier d’autorités virtuel et international • Projet OCLC, LC, DnB et BnF jusqu’en 2012 • Service OCLC depuis • Mise en correspondance de fichiers d’autorités préexistants (dont BnF, IdRef, etc.) • Pas de possibilité directe de création, ni de modification
  • 7.
  • 8. • International Standard Name Identifier • Norme ISO (ISO 27729) • Un ID unique pour les acteurs des industries créatives • D’abord pour la gestion des droits • Pas d’attribution d’ID directe • Passer par une agence d’enregistrement (Qui ?) • VIAF représente l’immense majorité de la base ISNI
  • 9. • Open Researcher Contributor Identification Initiative • Cible : auteurs scientifiques • Initiative des éditeurs • Rôle important de Thomson Reuters, qui commercialise la base de citations Web of Science • Les chercheurs pourront directement se créer et modifier leur profil et leur ID • Du producteur au consommateur revendeur
  • 10. Coexistence des référentiels • Soit la concurrence sauvage entre autorités • Locales • Globales • Soit il faut relier ces référentiels entre eux • Mais comment ? • Différents modèles possibles :
  • 11. Chaque référentiel est lié à chaque autre
  • 12. Un référentiel central, lié à chaque autre
  • 13. Des référentiels à différents niveaux
  • 14. ABC Identifiants à vocation locale Identifiants à vocation globale Sudoc theses.fr Calames Preprints, postprints Cours en ligne Édition électronique CRIS ID Univ. ID Labo ID école ORCID ISNI XYZ Identifiants à vocation régionale IdRef BnF VIAF DNB (All.) DAI (NL)
  • 15. VIAF, NOUVEAU MAILLON DANS LA CHAÎNE D’ALIMENTATION DU CATALOGUE Côté catalogage
  • 16. WinIBW Recherche Z39.50 ou base d’appui Sélection notice bibliographique Contient un lien autoritéNe contient pas de lien autorité Copie notice sans lien(s) à PPN autorités Sudoc Interrogation VIAF Identifiant existe dans VIAF Notice VIAF contient PPNNotice VIAF ne contient pas PPN Pop-up : voulez-vous utiliser cette autorité Sudoc ? OUINON Copie notice avec lien(s) à PPN autorités Sudoc Si identifiant non BnF Si identifiant BnF Identifiant BnF trouvéIdentifiant BnF absent Interrogation IdRef S U D O C ? Suppression de l’identifiant autorité Identifiant n’existe pas dans VIAF
  • 17. • Convergence via les identifiants • De la nécessité d’un contrôle humain? • Quel(s) rôle(s) 17Journées ABES 2012 Y. Nicolas & O. Rousseaux - ABES pour le producteur de métadonnées? pour le catalogueur?
  • 18. AUTOMATISER LE LIEN AUX AUTORITÉS IDREF SudocAD
  • 19. Projet SudocAD • Projet de recherche 2010-2011 • Avec des chercheurs du LIRMM (Montpellier 2) : » informatique > intelligence artificielle > représentation de la connaissance • Soutien financier d’ADONIS (CNRS) • Objectif : automatiser le lien aux autorités Sudoc • Corpus de test : articles de Persée • Approche : web sémantique (raisonnement)
  • 20. • On extrait de la notice d’article quelques informations pour constituer une sorte d’autorité Persée. • Il s’agit ensuite de trouver l’autorité IdRef qui lui ressemble le plus. Date Langue revue Domaine article Nom de l’auteur « Autorité» Persée
  • 21. Beaucoup d’appelés • Rechercher « Christian Schmidt » • Minimiser le risque de passer à côté : – nomComplet_a:schmidt,christian – nomComplet_a:schmidt,c. – nomComplet_a:schmidt,c – nomComplet_a:schmidt,christian* – nom_a:schmidt AND prenom_a:c – etc. 39 candidats
  • 22. Pour en savoir plus sur chacune des 39 autorités candidates, on puise dans les notices bibliographiques liées Puis on compare cette autorité enrichie à l’autorité Persée Date Langue Sujets Rameau Domaine Domaine Nom Date Langue Sujets Rameau Domaine Domaine
  • 23. Strong Medium Weak Poor Neutral Unrelated Impossible Peu d’élus Chaque autorité candidate est classée dans une des 7 catégories
  • 24. Dans quels cas générer automatiquement un lien à une des autorités candidates ? • Différents algorithmes possibles • Notre algorithme préféré : 14G2 : liage automatique si un seul candidat dans la catégorie de liage la meilleure parmi Strong et Medium
  • 25. Evaluation de l’algorithme 14G2 • 77% de bonnes décisions – 58% : décision correcte de créer un lien – 19% : décision correcte de ne pas créer de lien • Mauvaises décisions : – 20 % : décision incorrecte de ne pas créer de lien – 1,9% : décision incorrecte de créer un lien  73% des liens à créer sont créés  4% des liens créés sont mauvais Apparemment, pas plus que chez les humains !
  • 26. Comparaison avec le programme actuel de liage automatique dans le Sudoc SudocAD 14G2 Sudoc aujourd’hui Parmi les liens créés, combien sont faux ? 4% 20% Parmi les liens à créer, combien sont effectivement créés ? 73% 43% * Chiffres à confirmer
  • 27. Enseignements de SudocAD • Résultats très encourageants • Double Exploitation possible : • Liage automatique • Aide à la décision • Marges de progression identifiées : • Amélioration de la comparaison des domaines • Amélioration de la comparaison des noms • Exploitation d’autres propriétés comme : » Indexation matière » Co-auteurs » Rôles • Les erreurs de lien présentes dans le Sudoc trompent SudocAD Rapport final : http://www.abes.fr/Sudoc/Projets-en-cours/SudocAD
  • 28. La suite • Continuer les expérimentations avec les programmes de SudocAD • Nouveaux corpus : HAL, licences nationales • Pas d’utilisation en production tout de suite • Aller plus loin dans le cadre d’un nouveau projet de recherche : Qualinca • Projet ANR (2012-2015) • Avec des labos d’informatique (LIRMM, LIG, LRI) et l’INA • Sur la qualité des liens dans un catalogue et dans le contexte du web de données » Mesurer la qualité des liens actuels » Générer de nouveaux liens

Notes de l'éditeur

  1. FRAD, 2010 (extraits) « Il est essentiel de noter que les entités figurant dans la partie supérieure du diagramme (personne, famille, collectivité, oeuvre, expression, manifestation, item, concept, objet, événement et lieu) sont des entités bibliographiques. En tant que telles, elles reflètent des constructions intellectuelles ou des concepts qui font partie intégrante des règles utilisées pour élaborer les catalogues de bibliothèques et ce qui est considéré comme une instance particulière d'une entité donnée peut varier d'un corpus de règles à l'autre. » « 6. Tâches effectuées par les utilisateurs » 1. Trouver Trouver une entité ou un ensemble d’entités correspondant à un critère défini (i.e. trouver soit une seule entité soit un ensemble d’entités en utilisant un attribut ou plusieurs attributs combinés ou une relation à l’entité correspondant au critère de recherche) ; ou pouvoir explorer l’univers des entités bibliographiques en utilisant ces attributs et ces relations. 2. Identifier Identifier une entité (i.e confirmer que l’entité proposée correspond à l’entité recherchée, ou distinguer entre deux entités ou plus ayant des caractéristiques similaires) ou bien valider la forme du nom à utiliser pour établir un point d’accès contrôlé. 3. Contextualiser Situer une personne, une collectivité, une oeuvre, etc., dans son contexte ; clarifier la relation entre deux ou plus de deux personnes, collectivités, oeuvres, etc. ou clarifier la relation entre une personne, une collectivité, etc., et un nom par lequel cette personne ou cette collectivité, etc. est connue (par exemple, le nom en religion par rapport au nom séculier). 4. Justifier Documenter les raisons du choix du créateur des données d’autorité concernant le nom ou la forme du nom sur lequel est fondé le point d’accès contrôlé. Principes internationaux de catalogage (ICP / PIC), 2009 « 2. Principes généraux L'élaboration des codes de catalogage a plusieurs objectifs4. Le plus important est le confort de l'utilisateur5. 2.1. Confort de l'utilisateur du catalogue. Les décisions prises en matière de descriptions et de formes contrôlées des noms dans les points d'accès doivent l'être en tenant compte de l'utilisateur. 2.2. Usage commun. Le vocabulaire utilisé dans les descriptions et les accès doit correspondre à celui de la majorité des utilisateurs. 2.3. Représentativité. Les descriptions et les formes contrôlées des noms doivent reposer sur la façon dont une entité se décrit elle-même. 2.4. Exactitude. L'entité décrite doit être fidèlement représentée. 2.5. Suffisance et nécessité. Dans les descriptions et les formes contrôlées des noms pour les points d'accès, seuls doivent être utilisés les éléments qui sont nécessaires pour répondre aux besoins des utilisateurs et essentiels pour identifier de manière univoque une entité. 2.6. Signifiance. Les éléments doivent être significatifs du point de vue bibliographique. 2.7. Economie. Quand différents moyens existent pour atteindre un objectif, il faut accorder la préférence à ce qui s'avère être globalement le plus économique (c'est-à-dire le moindre coût ou l'approche la plus simple). 2.8. Cohérence et normalisation. Les descriptions et la construction des points d'accès doivent être normalisées dans la mesure du possible. Cela permet une plus grande cohérence, qui en retour accroît la possibilité de partager les notices bibliographiques et d'autorité. 2.9. Intégration. Les descriptions pour tous les types de documents et les formes contrôlées des noms des entités doivent reposer sur un ensemble commun de règles, dans la mesure où cela est pertinent. Les règles d'un code de catalogage doivent être justifiables et non arbitraires.  »