Jabes 2021 - Session parallèle "Mécanique des alignements d'identifiants auteurs"

ABES
ABESABES
« La récré est finie ! » : mécanique des
alignements d’identifiants auteurs
au service de la recherche et de la
science ouverte
Session parallèle
Aline Le Provost
Isabelle Mauger Perez
François Mistral
Service Autorités & Référentiels de l’Abes
« La récré est finie ! » : réagissez en direct !
Framapad pour prise de notes
collaboratives
https://mensuel.framapad.org
/p/jabes21_alignements-
9q5k?lang=fr
Réagissez aussi sur twitter
Hastag
#jabes21
#alignements
2
Cette session est retransmise en direct : https://vimeo.com/event/1310665
- Allez, les identifiants : la récré est finie ! Alignez-vous pour vous
mettre en rang.
Attention ORCID ! Tu marches sur les pieds d’ISNI !
- C’est pas ma faute, M’dame. C’est IdRef qui pousse !
- Mais non ! On compte nos billes communes avec ARK BnF
A deux, on sera plus fort !
- Certainement.
Dis-donc IdHAL (même si tu as un joli nom) il faut rentrer
dans le rang toi aussi !
- Oui M’dame ! Je m’aligne tout de suite !
ttps://www.flickr.com/photos/jarchie/3809330833/
La maîtresse
ORCID
IdRef
La maîtresse
IdHAL
Source: https://svgsilh.com/image/1294675.html
3
Plan
• Partie 1 : IdRef en 2021
• Nouveaux encarts bibliographiques
• Nouveaux producteurs de données
• Pourquoi aligner ? Comment aligner ? Les deux types d’alignements
• Partie 2 : aligner des identifiants d’auteurs
• Panorama des identifiants d’auteurs
• Zoom sur les ambitions de l’Abes
• Partie 3 : aligner des identifiants d’auteurs ne suffit pas
• La preuve par l’exemple : HAL
• Partie 4 : exploiter les alignements
• Exposer
• Améliorer
4
IdRef en 2021
1ère partie.
5
Une notice
d’autorité est un
ensemble de
poupées russes
Crédits : Joe Lodge, 125/365 Dolls in the Rain,
https://www.flickr.com/photos/joe57spike/5690570945/
un numéro PPN = un identifiant dont l’Abes fait en
sorte qu’il soit un PID
un contenu stocké dans une notice Unimarc = des
métadonnées stockées et associées à l’identifiant
• des appellations : une principale et des variantes
• des notes biographiques
• la source documentaire à l’origine de la création de la
notice d’autorité
• des identifiants dans d’autres systèmes
des liens = des métadonnées associées à l’identifiant
• vers une ou des notices Sudoc (souvent mais pas
toujours)
• vers des documents Calames
• vers tous les gisements documentaires qui sont
« branchés » à IdRef
6
l’identifiant
7
le contenu
8
Les liens
9
10
11
Base contenant
les autorités
Moteur de
recherche
URI pérennes
Résultats
www.idref.fr
Une interface web, un moteur de recherche,
une base de données
12
Des liens
Base contenant
les autorités
Moteur de
recherche
URI
www.idref.fr
13
Les filières de production dans IdRef
14
Base contenant
les autorités
Moteur de
recherche
www.idref.fr
Aligner, préalable à la production dans IdRef
15
But des alignements
16
Modalités des alignements
17
2 types d’alignement
18
Point d’accès / mention d’auteur dans une base bibliographique
Identifiant IdRef
Identifiant Orcid
Aligner des identifiants d’auteurs
2ème partie.
19
N’en déplaise à Tolkien,
il n’y en aura pas un
pour les gouverner
tous.
20
national
Le paysage en 2000
Autorités Sudoc
Autorités BnF
catalogue
BnF
Sudoc
21
Identifiants
à vocation nationale
Le paysage en 2010
Autorités BnF
catalogue
BnF
IdRef
Calames
Sudoc theses.fr
22
Identifiants
à vocation globale
Identifiants
à vocation nationale
Le paysage en 2012
IdRef
VIAF
ISNI ORCID
catalogue
BnF
Autorités BnF
Calames
Sudoc theses.fr
23
Identifiants
à vocation globale
Identifiants
à vocation nationale
Le paysage en 2014
IdRef
ARK BnF
catalogue
BnF
Calames
Sudoc theses.fr
HAL
IdHAL
VIAF
ISNI ORCID
24
Identifiants
à vocation globale
Identifiants
à vocation nationale
Calames
Sudoc theses.fr
Le paysage vers 2018
IdRef
ARK BnF
catalogue
BnF
Persée OATAO
HAL
IdHAL
VIAF
ISNI ORCID
25
Identifiants
à vocation globale
Identifiants
à vocation nationale
Le paysage en 2020
IdRef
ARK BnF
HAL
IdHAL
catalogue
BnF
Calames
Sudoc theses.fr
Persée OATAO
Didomena
EHESS
VIAF
ISNI ORCID
26
Identifiants
à vocation globale
Identifiants
à vocation nationale
Le paysage en 2021
Identifiants
francophones
IdRef
ARK BnF
catalogue
BnF
Suisse : RERO+, SLSP, Renouvaud
Belgique : Université de Liège
Calames
Sudoc theses.fr
Persée OATAO UnivOAK
Toulouse
Capitole
Publications Canal-U
CAIRN
Didomena
EHESS
HAL
IdHAL
VIAF
ISNI ORCID
27
Types d’alignement
28
Point d’accès / mention d’auteur dans une base bibliographique
Identifiant IdRef
Identifiant Orcid
Aligner de référentiel à référentiel
tel ORCID
0000-0002-9361-5295
tel IdRef
139753753
=
=
tel ScopusID
6507898565
=
=
Source : https://www.lemonde.fr/m-le-mag/article/2020/03/27/marin-dacos-la-science-en-
partage_6034640_4500055.html 29
Aligner des identifiants chercheurs : ils l’ont
fait et le font régulièrement !
A notre connaissance
• Université de Pau et des Pays de l’Adour
• Université Polytechnique Hauts-de-France
• Réseau Toul’AO
La collecte est manuelle mais l’injection dans IdRef peut être faite par
l’Abes.
30
RDV sur Abesstp > IdRef > Données pour prendre contact !
Etat des lieux au 1er octobre 2021 :
identifiants de personnes stockés dans IdRef
Identifiant
VIAF
ISNI
ARK BnF
ORCID
IdHAL
Volume
3 413 834
2 115 058
1 445 198
81 870
35 538
31
Tout IdRef est dans VIAF.
-
Toutes les notices communes IdRef-BnF
devraient avoir dans IdRef un ARK
Sur 186 000 comptes français (dont
beaucoup sont vides).
Sur 51 000.
Pourquoi l’Abes s’intéresse à VIAF ?
Pour les professionnels
Aide au catalogage
 Désambiguïsation
Aide à la curation
(AlgoDoublons)
 dédoublonnage
Pour les besoins internes
Pour faire des
alignements.
32
Pourquoi l’Abes s’intéresse à ARK BnF ?
Pour le grand public
tendre à
l’exhaustivité du
signalement de la
production d’une
personne.
=> encart BnF
Pour les professionnels
Aide au catalogage
=> mécanisme de
dérivation
Pour les besoins internes
Pour faire des
alignements dans la
perspective du Fichier
National d’Entités (FNE).
33
Pourquoi l’Abes s’intéresse à ORCID ?
Pour le grand public
tendre à l’exhaustivité
du signalement de la
production d’une
personne.
=> encart ORCID
Pour les professionnels
L’Abes est avec
Couperin le porteur
du consortium
ORCID France.
Pour les besoins internes
Pour faire des
alignements.
34
Pourquoi l’Abes s’intéresse à IdHAL ?
Pour les professionnels
Les établissements
déploient beaucoup
d’énergie à
convaincre les
chercheurs de se
créer un IdHAL.
35
Pourquoi l’Abes s’intéresse à ?
Pour le grand public
tendre à l’exhaustivité
du signalement de la
production d’une
personne.
L’usage des IdHAL est cependant trop limité dans HAL pour qu’il serve à
générer les rebonds bibliographiques.
L’Abes a une ambition modérée sur IdHAL mais très grande sur HAL
(et les autres archives ouvertes).
36
Aligner des identifiants d’auteurs
ne suffit pas
3ème partie.
37
Types d’alignement
38
Point d’accès / mention d’auteur dans une base bibliographique
Identifiant IdRef
Identifiant Orcid
Aligner depuis les données bibliographiques
vers un référentiel
• De gisement documentaire vers référentiel
une mention d’auteur dans un document = une entrée dans un référentiel
39
Aligner leur portail HAL sur IdRef : ils l’ont fait !
• Bordeaux-Montaigne
• Franche-Comté
• Grenoble
• INALCO
• INRAE
• La Réunion
• Limoges
• Lorraine
• Normandie
• Orléans
• INSA Toulouse
RDV sur Abesstp > IdRef > Données pour prendre contact !
40
Mettre plus de HAL dans IdRef : comment ça
marche ?
41
Base
contenant les
autorités
Moteur de
recherche
www.idref.fr
data.idref.fr
Le pipeline « HAL » : workflow complet
1. Récupération des documents en TEI à partir d’une requête à l’API de HAL
2. Conversion et chargement dans une base RDF interne
3. Calculs d’alignements suivant plusieurs méthodes
4. Propagation et normalisation des liens
5. Chargement dans data.idref.fr des liens entre les documents HAL et des
identifiants IdRef
42
1/ Récupération des documents en TEI à
partir d’une requête à l’API de HAL
ex :
https://api.archives-ouvertes.fr/search/?q=collCode_s:"UNIV-BORDEAUX-MONTAIGNE"
43
2/ Conversion et chargement dans une
base RDF interne
• Utilisation des URI HAL pour identifier les documents
• Utilisation des URI AURéHAL pour identifier les structures
• Création d’un identifiant (URI) par mention d’auteur (id document + halAuthorId)
• Toutes les métadonnées utiles pour :
• Les calculs
• L’affichage dans data.idref.fr
Titre
Auteurs (nom, prénom, halAuthorid, structure, e-mail)
Citation bibliographique
Domaines Hal
Sujets
Date de dépôt 44
3/ Calculs d’alignements selon plusieurs méthodes
45
exemple : beaucoup de Dominique Breton
3/ Calculs d’alignements selon plusieurs méthodes
46
Clusterisation : même mail +
nom identique ou proche
exemple : beaucoup de Dominique Breton
3/ Calculs d’alignements selon plusieurs méthodes
47
Clusterisation : même mail +
nom identique ou proche
Clusterisation : même affiliation +
nom et prénom identique
exemple : beaucoup de Dominique Breton
3/ Calculs d’alignements selon plusieurs méthodes
48
Clusterisation : même mail +
nom identique ou proche
Clusterisation : même affiliation +
nom et prénom identique
Liage à ORCID
exemple : beaucoup de Dominique Breton
3/ Calculs d’alignements selon plusieurs méthodes
49
Clusterisation : même mail +
nom identique ou proche
Clusterisation : même affiliation +
nom et prénom identique
Liage à ORCID
exemple : beaucoup de Dominique Breton
3/ Calculs d’alignements selon plusieurs méthodes
50
Clusterisation : même mail +
nom identique ou proche
Clusterisation : même affiliation +
nom et prénom identique
Liage à ORCID
Liage à IdRef
exemple : beaucoup de Dominique Breton
3/ Calculs d’alignements selon plusieurs méthodes
51
Clusterisation : même mail +
nom identique ou proche
Clusterisation : même affiliation +
nom et prénom identique
Liage à ORCID
exemple : beaucoup de Dominique Breton
Liage à IdRef
3/ Calculs d’alignements selon plusieurs méthodes
52
Clusterisation : même mail +
nom identique ou proche
Clusterisation : même affiliation +
nom et prénom identique
Liage à ORCID
exemple : beaucoup de Dominique Breton
Liage à IdRef
Liage à IdRef
53
Clusterisation : même mail +
nom identique ou proche
Clusterisation : même affiliation +
nom et prénom identique
Liage à ORCID
« Propagation » des liens par inférence
 Création de nouveaux liens :
• entre mentions d’auteur HAL et IdRef
• entre IDs ORCID et IdRef
exemple : beaucoup de Dominique Breton
4/ Propagation et normalisation des liens
54
exemple : beaucoup de Dominique Breton
« Normalisation » des liens
Ordre de préférence : IdRef > ORCID > même Mail > même
Affiliation
Mémoire des liens précédents pour connaître la provenance (la
méthode de calcul du liens) et pouvoir revenir en arrière
4/ Propagation et normalisation des liens
5/ Chargement des liens dans
data.idref.fr et dans les notices IdRef
55
5/ Chargement des liens dans
data.idref.fr et dans les notices IdRef
56
https://hal.archives-ouvertes.fr/hal-00675592/person/11586136
Illustration IdRef
pas d’IdHAL pour
cette chercheuse
dans HAL
dans AuréHAL
57
Pas d’IdHAL et
pourtant.. 58
Illustration data.idref.fr
# 15 documents liés à Dominique Breton (IdRef 057735492)
# 2 halAuthorId liés à Dominique Breton (IdRef 057735492)
59
Volumes d’alignements dans data.idref.fr
• Au total :
• 468 372 documents HAL (17 % du corpus)
• 1 619 381 liens document HAL-IdRef (vers 158 814 notices IdRef distinctes)
• 8 750 liens IdRef-ORCID « trouvés » au cours des processus d’alignements des
documents HAL
• Focus sur un portail : « HAL-Université de Lorraine »
• 60 % des auteurs alignés automatiquement
• 750 000 triplets
• 240 000 mentions d'auteur alignées
• 40 000 auteurs identifiés.
60
Source data.idref.fr : 08/10/2021
Exploiter les alignements
4ème partie.
- Exposer
- Améliorer
61
62
Redistribuer les alignements
63
Redistribuer les alignements
64
OK
OK
Redistribuer les alignements
65
?
66
Contribuer au linked open data : data.idref.fr
data.idref.fr
67
Contribuer au linked open data : data.idref.fr
data.idref.fr
+
Donner à voir par les machines (1/2)
68
• Webservice « références » :
Je te donne un IdRef, donne-moi toutes les références bibliographiques liées que tu connais.
https://www.idref.fr/services/references/139753753
Donner à voir par les machines (2/2)
69
• Webservice « idref2id » et ses déclinaisons :
Je te donne un IdRef, donne-moi tous les IDs que tu connais.
https://www.idref.fr/services/idref2id/139753753
Donner à voir pour les humains
70
71
Fourniture de tableaux de bord des alignements (1/2)
?
?
?
?
72
?
?
?
?
Fourniture de tableaux de bord des alignements (2/2)
Aligner par simple glisser-déposer : de Paprika…
73
+
… à PaprikHAL
74
+
+ +
75
76
77
Création d’un alignement
Validation d’un
alignement
Aligner la production de leur établissement
sur IdRef : ils l’ont fait !
• Catalogues des éditeurs :
• ENS Lyon
• Ecoles françaises à l’étranger
• Bibliothèques patrimoniales :
• Antilles : Manioc
• Ecole des Chartes : Thenc@
• Revues en ligne :
• Lyon 3 Prairial : Arabesques
• Métopes
• Entrepôt de données de la recherche :
• EHESS : Didomena
78
Et vous : par quoi êtes-vous concernés ?
79
Sortez vos cahiers de texte. Pour la semaine prochaine, vous conjuguerez le
verbe IDREFISER au présent de l’indicatif ; n’oubliez pas :
j’idrefise sans accent
tu iderefises avec un s
etc.
M’dame m’dame, y a deux « f » à idreffiser ?
Pfffou, mais non banane ! I-d-R-e-f !!
La sonnerie retentit « DRING DRING »
- Le dernier dans la cour est une crotte ! Eh IdRef tu me pousses encore !
- Dis-donc IdHAL tu n’as pas entendu la cloche ! C’est l’heure de la récré.
- Oui M’dame ! Mais je me suis déjà fait gagner toutes mes billes, wouin !
La maîtresse
ORCID
IdRef
La maîtresse
ARK BnF
Source: https://svgsilh.com/image/1294675.html
80
IdHAL
Source: https://svgsilh.com/image/1294675.html
Merci de votre attention.
leprovost@abes.fr mauger@abes.fr mistral@abes.fr
81
1 sur 81

Recommandé

Les technologies du Web appliquées aux données structurées (1ère partie : Enc... par
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...Gautier Poupeau
2.3K vues103 diapositives
Programmer dans Openrefine avec GREL par
Programmer dans Openrefine avec GRELProgrammer dans Openrefine avec GREL
Programmer dans Openrefine avec GRELMathieu Saby
722 vues18 diapositives
Nettoyer et transformer ses données avec Openrefine : partie 1 par
Nettoyer et transformer ses données avec Openrefine : partie 1Nettoyer et transformer ses données avec Openrefine : partie 1
Nettoyer et transformer ses données avec Openrefine : partie 1Mathieu Saby
3.3K vues166 diapositives
Outils 2.0 pour creer un site web pedagogique par
Outils 2.0 pour creer un site web pedagogiqueOutils 2.0 pour creer un site web pedagogique
Outils 2.0 pour creer un site web pedagogiqueRedaction SKODEN
17.3K vues14 diapositives
Boosting Documents in Solr by Recency, Popularity, and User Preferences par
Boosting Documents in Solr by Recency, Popularity, and User PreferencesBoosting Documents in Solr by Recency, Popularity, and User Preferences
Boosting Documents in Solr by Recency, Popularity, and User PreferencesLucidworks (Archived)
13.3K vues20 diapositives
Ontology development in protégé-آنتولوژی در پروتوغه par
Ontology development in protégé-آنتولوژی در پروتوغهOntology development in protégé-آنتولوژی در پروتوغه
Ontology development in protégé-آنتولوژی در پروتوغهsadegh salehi
2.3K vues62 diapositives

Contenu connexe

Tendances

자료 검색 시간을 단축시킬 정보검색 핵심 가이드 & 팁 par
자료 검색 시간을 단축시킬 정보검색 핵심 가이드 & 팁자료 검색 시간을 단축시킬 정보검색 핵심 가이드 & 팁
자료 검색 시간을 단축시킬 정보검색 핵심 가이드 & 팁sejin cheon
750 vues24 diapositives
DSpace-CRIS & OpenAIRE par
DSpace-CRIS & OpenAIREDSpace-CRIS & OpenAIRE
DSpace-CRIS & OpenAIRE4Science
665 vues13 diapositives
Intro to Elasticsearch par
Intro to ElasticsearchIntro to Elasticsearch
Intro to ElasticsearchClifford James
10.7K vues44 diapositives
Building and using ontologies par
Building and using ontologies Building and using ontologies
Building and using ontologies Elena Simperl
1.7K vues49 diapositives
A Brief Introduction to SKOS par
A Brief Introduction to SKOSA Brief Introduction to SKOS
A Brief Introduction to SKOSHeather Hedden
234 vues14 diapositives
Taxonomy 101: Presented at Taxonomy Boot Camp 2019 par
Taxonomy 101: Presented at Taxonomy Boot Camp 2019Taxonomy 101: Presented at Taxonomy Boot Camp 2019
Taxonomy 101: Presented at Taxonomy Boot Camp 2019Enterprise Knowledge
2.9K vues60 diapositives

Tendances(20)

자료 검색 시간을 단축시킬 정보검색 핵심 가이드 & 팁 par sejin cheon
자료 검색 시간을 단축시킬 정보검색 핵심 가이드 & 팁자료 검색 시간을 단축시킬 정보검색 핵심 가이드 & 팁
자료 검색 시간을 단축시킬 정보검색 핵심 가이드 & 팁
sejin cheon750 vues
DSpace-CRIS & OpenAIRE par 4Science
DSpace-CRIS & OpenAIREDSpace-CRIS & OpenAIRE
DSpace-CRIS & OpenAIRE
4Science665 vues
Building and using ontologies par Elena Simperl
Building and using ontologies Building and using ontologies
Building and using ontologies
Elena Simperl1.7K vues
Introduction au web sémantique : quand le lient fait sens par FICEL Hemza
Introduction au web sémantique : quand le lient fait sensIntroduction au web sémantique : quand le lient fait sens
Introduction au web sémantique : quand le lient fait sens
FICEL Hemza3.7K vues
Generis Company Presentation for RIM par Generis
Generis Company Presentation for RIMGeneris Company Presentation for RIM
Generis Company Presentation for RIM
Generis149 vues
Linked Data의 RDF 어휘 이해하고 체험하기 - FOAF, SIOC, SKOS를 중심으로 - par Dongbum Kim
Linked Data의 RDF 어휘 이해하고 체험하기 - FOAF, SIOC, SKOS를 중심으로 -Linked Data의 RDF 어휘 이해하고 체험하기 - FOAF, SIOC, SKOS를 중심으로 -
Linked Data의 RDF 어휘 이해하고 체험하기 - FOAF, SIOC, SKOS를 중심으로 -
Dongbum Kim4.5K vues
Aligner vos données avec Wikidata grâce à l'outil Open Refine par Gautier Poupeau
Aligner vos données avec Wikidata grâce à l'outil Open RefineAligner vos données avec Wikidata grâce à l'outil Open Refine
Aligner vos données avec Wikidata grâce à l'outil Open Refine
Gautier Poupeau6.1K vues
Introduction à l'informatique documentaire par Sylvain Machefert
Introduction à l'informatique documentaireIntroduction à l'informatique documentaire
Introduction à l'informatique documentaire
Sylvain Machefert9.2K vues
Apache NiFi in the Hadoop Ecosystem par Bryan Bende
Apache NiFi in the Hadoop EcosystemApache NiFi in the Hadoop Ecosystem
Apache NiFi in the Hadoop Ecosystem
Bryan Bende7.9K vues
Les carnets de thèse Hypotheses.org : typologie, usages et fonctionnalités (n... par Françoise Gouzi
Les carnets de thèse Hypotheses.org : typologie, usages et fonctionnalités (n...Les carnets de thèse Hypotheses.org : typologie, usages et fonctionnalités (n...
Les carnets de thèse Hypotheses.org : typologie, usages et fonctionnalités (n...
Françoise Gouzi1.3K vues
DSpace-CRIS: new features and contribution to the DSpace mainstream par 4Science
DSpace-CRIS: new features and contribution to the DSpace mainstreamDSpace-CRIS: new features and contribution to the DSpace mainstream
DSpace-CRIS: new features and contribution to the DSpace mainstream
4Science1.4K vues
BigData_Chp5: Putting it all together par Lilia Sfaxi
BigData_Chp5: Putting it all togetherBigData_Chp5: Putting it all together
BigData_Chp5: Putting it all together
Lilia Sfaxi26.1K vues
BigData_Chp4: NOSQL par Lilia Sfaxi
BigData_Chp4: NOSQLBigData_Chp4: NOSQL
BigData_Chp4: NOSQL
Lilia Sfaxi41.3K vues

Similaire à Jabes 2021 - Session parallèle "Mécanique des alignements d'identifiants auteurs"

ResearcherID, ORCID, IdHAL... Enjeux et perspectives des identifiants chercheur par
ResearcherID, ORCID, IdHAL... Enjeux et perspectives des identifiants chercheurResearcherID, ORCID, IdHAL... Enjeux et perspectives des identifiants chercheur
ResearcherID, ORCID, IdHAL... Enjeux et perspectives des identifiants chercheurURFIST de Paris
2.8K vues138 diapositives
Jabes 2011 - Ateliers "Sudoc, Calames, thèses.fr et le web de données" par
Jabes 2011 - Ateliers "Sudoc, Calames, thèses.fr et le web de données"Jabes 2011 - Ateliers "Sudoc, Calames, thèses.fr et le web de données"
Jabes 2011 - Ateliers "Sudoc, Calames, thèses.fr et le web de données"ABES
209 vues56 diapositives
Sudoc, Calames, theses.fr et le Web de données par
Sudoc, Calames, theses.fr et le Web de donnéesSudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de donnéesY. Nicolas
1.2K vues56 diapositives
Métadonnées de thèse par
Métadonnées de thèseMétadonnées de thèse
Métadonnées de thèseY. Nicolas
694 vues61 diapositives
IdRef. Les référentiels comme services. Une politique de l'ABES par
IdRef. Les référentiels comme services. Une politique de l'ABESIdRef. Les référentiels comme services. Une politique de l'ABES
IdRef. Les référentiels comme services. Une politique de l'ABESY. Nicolas
1.5K vues52 diapositives

Similaire à Jabes 2021 - Session parallèle "Mécanique des alignements d'identifiants auteurs"(20)

ResearcherID, ORCID, IdHAL... Enjeux et perspectives des identifiants chercheur par URFIST de Paris
ResearcherID, ORCID, IdHAL... Enjeux et perspectives des identifiants chercheurResearcherID, ORCID, IdHAL... Enjeux et perspectives des identifiants chercheur
ResearcherID, ORCID, IdHAL... Enjeux et perspectives des identifiants chercheur
URFIST de Paris2.8K vues
Jabes 2011 - Ateliers "Sudoc, Calames, thèses.fr et le web de données" par ABES
Jabes 2011 - Ateliers "Sudoc, Calames, thèses.fr et le web de données"Jabes 2011 - Ateliers "Sudoc, Calames, thèses.fr et le web de données"
Jabes 2011 - Ateliers "Sudoc, Calames, thèses.fr et le web de données"
ABES209 vues
Sudoc, Calames, theses.fr et le Web de données par Y. Nicolas
Sudoc, Calames, theses.fr et le Web de donnéesSudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de données
Y. Nicolas1.2K vues
Métadonnées de thèse par Y. Nicolas
Métadonnées de thèseMétadonnées de thèse
Métadonnées de thèse
Y. Nicolas694 vues
IdRef. Les référentiels comme services. Une politique de l'ABES par Y. Nicolas
IdRef. Les référentiels comme services. Une politique de l'ABESIdRef. Les référentiels comme services. Une politique de l'ABES
IdRef. Les référentiels comme services. Une politique de l'ABES
Y. Nicolas1.5K vues
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'information par Antidot
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'informationMasterclasse i-expo 2011 : Pour un véritable accès unifié à l'information
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'information
Antidot880 vues
ORCID pour l'identité numérique du chercheur par Alain Marois
ORCID pour l'identité numérique du chercheurORCID pour l'identité numérique du chercheur
ORCID pour l'identité numérique du chercheur
Alain Marois928 vues
Une introduction au web de données par Yannick Prié
Une introduction au web de donnéesUne introduction au web de données
Une introduction au web de données
Yannick Prié3.2K vues
Isidore à l'interface de la rencontre des SHS et du Web de données par Antidot
Isidore à l'interface de la rencontre des SHS et du Web de donnéesIsidore à l'interface de la rencontre des SHS et du Web de données
Isidore à l'interface de la rencontre des SHS et du Web de données
Antidot2.7K vues
Jabes 2011 - Signalement des ressources électroniques - "Intégrer IdRef dans ... par ABES
Jabes 2011 - Signalement des ressources électroniques - "Intégrer IdRef dans ...Jabes 2011 - Signalement des ressources électroniques - "Intégrer IdRef dans ...
Jabes 2011 - Signalement des ressources électroniques - "Intégrer IdRef dans ...
ABES331 vues
Utiliser un identifiant chercheur pour gérer ses publications par Deboin
Utiliser un identifiant chercheur pour gérer ses publicationsUtiliser un identifiant chercheur pour gérer ses publications
Utiliser un identifiant chercheur pour gérer ses publications
Deboin1.1K vues
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d... par Y. Nicolas
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
Y. Nicolas2K vues
Intégrer IdRef dans les applications documentaires de votre université. Pourq... par Y. Nicolas
Intégrer IdRef dans les applications documentaires de votre université. Pourq...Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Y. Nicolas1.2K vues
Carrefour IST : Identifiants et référentiels dans HAL par OAccsd
Carrefour IST : Identifiants et référentiels dans HALCarrefour IST : Identifiants et référentiels dans HAL
Carrefour IST : Identifiants et référentiels dans HAL
OAccsd9.1K vues
metadata_pour_dirbu_mars2011 par Y. Nicolas
metadata_pour_dirbu_mars2011metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011
Y. Nicolas800 vues
Données liées et Web sémantique : quand le lien fait sens. par Fabien Gandon
Données liées et Web sémantique : quand le lien fait sens. Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens.
Fabien Gandon19K vues
Jabes 2012 - Autour des autorités par ABES
Jabes 2012 - Autour des autoritésJabes 2012 - Autour des autorités
Jabes 2012 - Autour des autorités
ABES51 vues
JABES 2017 - ISTEX et le web de données par ABES
JABES 2017 - ISTEX et le web de donnéesJABES 2017 - ISTEX et le web de données
JABES 2017 - ISTEX et le web de données
ABES220 vues

Plus de ABES

FOLIO_presentation_par_BibLibre par
FOLIO_presentation_par_BibLibreFOLIO_presentation_par_BibLibre
FOLIO_presentation_par_BibLibreABES
660 vues57 diapositives
Jabes 2021 - Session parallele "Etablissements experimentaux : quelles incide... par
Jabes 2021 - Session parallele "Etablissements experimentaux : quelles incide...Jabes 2021 - Session parallele "Etablissements experimentaux : quelles incide...
Jabes 2021 - Session parallele "Etablissements experimentaux : quelles incide...ABES
427 vues45 diapositives
JCR 2019 - Présentation : "Cidemis en amont, petits rappels" par
JCR 2019 - Présentation : "Cidemis en amont, petits rappels"JCR 2019 - Présentation : "Cidemis en amont, petits rappels"
JCR 2019 - Présentation : "Cidemis en amont, petits rappels"ABES
272 vues19 diapositives
Jabes 2021 - Poster "Initiation aux études historiques" par
Jabes 2021 - Poster "Initiation aux études historiques"Jabes 2021 - Poster "Initiation aux études historiques"
Jabes 2021 - Poster "Initiation aux études historiques"ABES
224 vues1 diapositive
JCR 2021 - Présentation "Et la boucle est bouclee" par
JCR 2021 - Présentation "Et la boucle est bouclee"JCR 2021 - Présentation "Et la boucle est bouclee"
JCR 2021 - Présentation "Et la boucle est bouclee"ABES
146 vues7 diapositives
JCR 2021 - Présentation "Les demandes Cidemis, c'est vraiment termine !" par
JCR 2021 - Présentation "Les demandes Cidemis, c'est vraiment termine !"JCR 2021 - Présentation "Les demandes Cidemis, c'est vraiment termine !"
JCR 2021 - Présentation "Les demandes Cidemis, c'est vraiment termine !"ABES
160 vues59 diapositives

Plus de ABES(20)

FOLIO_presentation_par_BibLibre par ABES
FOLIO_presentation_par_BibLibreFOLIO_presentation_par_BibLibre
FOLIO_presentation_par_BibLibre
ABES660 vues
Jabes 2021 - Session parallele "Etablissements experimentaux : quelles incide... par ABES
Jabes 2021 - Session parallele "Etablissements experimentaux : quelles incide...Jabes 2021 - Session parallele "Etablissements experimentaux : quelles incide...
Jabes 2021 - Session parallele "Etablissements experimentaux : quelles incide...
ABES427 vues
JCR 2019 - Présentation : "Cidemis en amont, petits rappels" par ABES
JCR 2019 - Présentation : "Cidemis en amont, petits rappels"JCR 2019 - Présentation : "Cidemis en amont, petits rappels"
JCR 2019 - Présentation : "Cidemis en amont, petits rappels"
ABES272 vues
Jabes 2021 - Poster "Initiation aux études historiques" par ABES
Jabes 2021 - Poster "Initiation aux études historiques"Jabes 2021 - Poster "Initiation aux études historiques"
Jabes 2021 - Poster "Initiation aux études historiques"
ABES224 vues
JCR 2021 - Présentation "Et la boucle est bouclee" par ABES
JCR 2021 - Présentation "Et la boucle est bouclee"JCR 2021 - Présentation "Et la boucle est bouclee"
JCR 2021 - Présentation "Et la boucle est bouclee"
ABES146 vues
JCR 2021 - Présentation "Les demandes Cidemis, c'est vraiment termine !" par ABES
JCR 2021 - Présentation "Les demandes Cidemis, c'est vraiment termine !"JCR 2021 - Présentation "Les demandes Cidemis, c'est vraiment termine !"
JCR 2021 - Présentation "Les demandes Cidemis, c'est vraiment termine !"
ABES160 vues
JCR 2021 - Présentation "Cidemis au-dela des frontieres" par ABES
JCR 2021 - Présentation "Cidemis au-dela des frontieres"JCR 2021 - Présentation "Cidemis au-dela des frontieres"
JCR 2021 - Présentation "Cidemis au-dela des frontieres"
ABES110 vues
JCR 2021 - Présentation "Cidemis au Cieps" par ABES
JCR 2021 - Présentation "Cidemis au Cieps"JCR 2021 - Présentation "Cidemis au Cieps"
JCR 2021 - Présentation "Cidemis au Cieps"
ABES106 vues
JCR 2021 - Présentation "Cidemis à la Bibliothèque nationale de France" par ABES
JCR 2021 - Présentation "Cidemis à la Bibliothèque nationale de France"JCR 2021 - Présentation "Cidemis à la Bibliothèque nationale de France"
JCR 2021 - Présentation "Cidemis à la Bibliothèque nationale de France"
ABES136 vues
JCR 2021 - Présentation "Cidemis en amont : petits rappels" par ABES
JCR 2021 - Présentation "Cidemis en amont : petits rappels" JCR 2021 - Présentation "Cidemis en amont : petits rappels"
JCR 2021 - Présentation "Cidemis en amont : petits rappels"
ABES110 vues
Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)" par ABES
Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"
Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"
ABES792 vues
Jabes 2021 - 26 ans après la création de l'Abes par ABES
Jabes 2021 - 26 ans après la création de l'AbesJabes 2021 - 26 ans après la création de l'Abes
Jabes 2021 - 26 ans après la création de l'Abes
ABES339 vues
Jabes 2021 - Les Actus de l'Abes, partie 2 par ABES
Jabes 2021 - Les Actus de l'Abes, partie 2Jabes 2021 - Les Actus de l'Abes, partie 2
Jabes 2021 - Les Actus de l'Abes, partie 2
ABES363 vues
Jabes 2021 - Les Actus de l'Abes, partie 1 par ABES
Jabes 2021 - Les Actus de l'Abes, partie 1Jabes 2021 - Les Actus de l'Abes, partie 1
Jabes 2021 - Les Actus de l'Abes, partie 1
ABES349 vues
Jabes 2021 - Poster "Expérimentation Sudoc FRBR" par ABES
Jabes 2021 - Poster "Expérimentation Sudoc FRBR"Jabes 2021 - Poster "Expérimentation Sudoc FRBR"
Jabes 2021 - Poster "Expérimentation Sudoc FRBR"
ABES261 vues
Jabes 2021 - Poster "Les données de la recherche à l'Université de Toulouse J... par ABES
Jabes 2021 - Poster "Les données de la recherche à l'Université de Toulouse J...Jabes 2021 - Poster "Les données de la recherche à l'Université de Toulouse J...
Jabes 2021 - Poster "Les données de la recherche à l'Université de Toulouse J...
ABES200 vues
Jabes 2021 - Poster "Utiliser des plugins pour améliorer la qualité de votre ... par ABES
Jabes 2021 - Poster "Utiliser des plugins pour améliorer la qualité de votre ...Jabes 2021 - Poster "Utiliser des plugins pour améliorer la qualité de votre ...
Jabes 2021 - Poster "Utiliser des plugins pour améliorer la qualité de votre ...
ABES334 vues
Jabes 2021 - Poster "Projet d'exposition documentaire et participative pour u... par ABES
Jabes 2021 - Poster "Projet d'exposition documentaire et participative pour u...Jabes 2021 - Poster "Projet d'exposition documentaire et participative pour u...
Jabes 2021 - Poster "Projet d'exposition documentaire et participative pour u...
ABES208 vues
Jabes 2021 - Poster "CorHAL, une voie pour les chercheurs : simplifier le dép... par ABES
Jabes 2021 - Poster "CorHAL, une voie pour les chercheurs : simplifier le dép...Jabes 2021 - Poster "CorHAL, une voie pour les chercheurs : simplifier le dép...
Jabes 2021 - Poster "CorHAL, une voie pour les chercheurs : simplifier le dép...
ABES215 vues
Jabes 2021 - Poster "Arabesques en ligne : une collaboration fructueuse" par ABES
Jabes 2021 - Poster "Arabesques en ligne : une collaboration fructueuse"Jabes 2021 - Poster "Arabesques en ligne : une collaboration fructueuse"
Jabes 2021 - Poster "Arabesques en ligne : une collaboration fructueuse"
ABES217 vues

Dernier

La dissertation par
La dissertationLa dissertation
La dissertationGabriel Gay-Para
33 vues19 diapositives
INCENDIE_New1.ppt par
INCENDIE_New1.pptINCENDIE_New1.ppt
INCENDIE_New1.pptAcadmieSecourisme
5 vues120 diapositives
La conscience d'être libre est-elle illusoire ? (G. Gay-Para) par
La conscience d'être libre est-elle illusoire ? (G. Gay-Para)La conscience d'être libre est-elle illusoire ? (G. Gay-Para)
La conscience d'être libre est-elle illusoire ? (G. Gay-Para)Gabriel Gay-Para
29 vues54 diapositives
Webinaire Cohésion - Vision Board par Lamia Rarrbo.pptx par
Webinaire Cohésion - Vision Board par Lamia Rarrbo.pptxWebinaire Cohésion - Vision Board par Lamia Rarrbo.pptx
Webinaire Cohésion - Vision Board par Lamia Rarrbo.pptxTechnologia Formation
54 vues21 diapositives
Formation M2i - Génération IA : Prenez le train de l'avenir par
Formation M2i - Génération IA : Prenez le train de l'avenirFormation M2i - Génération IA : Prenez le train de l'avenir
Formation M2i - Génération IA : Prenez le train de l'avenirM2i Formation
7 vues38 diapositives
Webinaire de formation sur les REL par
Webinaire de formation sur les RELWebinaire de formation sur les REL
Webinaire de formation sur les RELMokhtar Ben Henda
8 vues98 diapositives

Dernier(11)

La conscience d'être libre est-elle illusoire ? (G. Gay-Para) par Gabriel Gay-Para
La conscience d'être libre est-elle illusoire ? (G. Gay-Para)La conscience d'être libre est-elle illusoire ? (G. Gay-Para)
La conscience d'être libre est-elle illusoire ? (G. Gay-Para)
Formation M2i - Génération IA : Prenez le train de l'avenir par M2i Formation
Formation M2i - Génération IA : Prenez le train de l'avenirFormation M2i - Génération IA : Prenez le train de l'avenir
Formation M2i - Génération IA : Prenez le train de l'avenir
M2i Formation7 vues
Conception et développement d'une marketplace basée sur l'architecture micros... par Adem Amen Allah Thabti
Conception et développement d'une marketplace basée sur l'architecture micros...Conception et développement d'une marketplace basée sur l'architecture micros...
Conception et développement d'une marketplace basée sur l'architecture micros...
Téophile Alexandre Steinlen.Peintre anarchiste du XIXe sieècle. par Txaruka
Téophile Alexandre Steinlen.Peintre anarchiste du XIXe sieècle.Téophile Alexandre Steinlen.Peintre anarchiste du XIXe sieècle.
Téophile Alexandre Steinlen.Peintre anarchiste du XIXe sieècle.
Txaruka30 vues
Exercice de révision SE - IPSET.pdf par MedBechir
Exercice de révision SE - IPSET.pdfExercice de révision SE - IPSET.pdf
Exercice de révision SE - IPSET.pdf
MedBechir9 vues

Jabes 2021 - Session parallèle "Mécanique des alignements d'identifiants auteurs"

  • 1. « La récré est finie ! » : mécanique des alignements d’identifiants auteurs au service de la recherche et de la science ouverte Session parallèle Aline Le Provost Isabelle Mauger Perez François Mistral Service Autorités & Référentiels de l’Abes
  • 2. « La récré est finie ! » : réagissez en direct ! Framapad pour prise de notes collaboratives https://mensuel.framapad.org /p/jabes21_alignements- 9q5k?lang=fr Réagissez aussi sur twitter Hastag #jabes21 #alignements 2 Cette session est retransmise en direct : https://vimeo.com/event/1310665
  • 3. - Allez, les identifiants : la récré est finie ! Alignez-vous pour vous mettre en rang. Attention ORCID ! Tu marches sur les pieds d’ISNI ! - C’est pas ma faute, M’dame. C’est IdRef qui pousse ! - Mais non ! On compte nos billes communes avec ARK BnF A deux, on sera plus fort ! - Certainement. Dis-donc IdHAL (même si tu as un joli nom) il faut rentrer dans le rang toi aussi ! - Oui M’dame ! Je m’aligne tout de suite ! ttps://www.flickr.com/photos/jarchie/3809330833/ La maîtresse ORCID IdRef La maîtresse IdHAL Source: https://svgsilh.com/image/1294675.html 3
  • 4. Plan • Partie 1 : IdRef en 2021 • Nouveaux encarts bibliographiques • Nouveaux producteurs de données • Pourquoi aligner ? Comment aligner ? Les deux types d’alignements • Partie 2 : aligner des identifiants d’auteurs • Panorama des identifiants d’auteurs • Zoom sur les ambitions de l’Abes • Partie 3 : aligner des identifiants d’auteurs ne suffit pas • La preuve par l’exemple : HAL • Partie 4 : exploiter les alignements • Exposer • Améliorer 4
  • 6. Une notice d’autorité est un ensemble de poupées russes Crédits : Joe Lodge, 125/365 Dolls in the Rain, https://www.flickr.com/photos/joe57spike/5690570945/ un numéro PPN = un identifiant dont l’Abes fait en sorte qu’il soit un PID un contenu stocké dans une notice Unimarc = des métadonnées stockées et associées à l’identifiant • des appellations : une principale et des variantes • des notes biographiques • la source documentaire à l’origine de la création de la notice d’autorité • des identifiants dans d’autres systèmes des liens = des métadonnées associées à l’identifiant • vers une ou des notices Sudoc (souvent mais pas toujours) • vers des documents Calames • vers tous les gisements documentaires qui sont « branchés » à IdRef 6
  • 10. 10
  • 11. 11
  • 12. Base contenant les autorités Moteur de recherche URI pérennes Résultats www.idref.fr Une interface web, un moteur de recherche, une base de données 12
  • 13. Des liens Base contenant les autorités Moteur de recherche URI www.idref.fr 13
  • 14. Les filières de production dans IdRef 14 Base contenant les autorités Moteur de recherche www.idref.fr
  • 15. Aligner, préalable à la production dans IdRef 15
  • 18. 2 types d’alignement 18 Point d’accès / mention d’auteur dans une base bibliographique Identifiant IdRef Identifiant Orcid
  • 19. Aligner des identifiants d’auteurs 2ème partie. 19
  • 20. N’en déplaise à Tolkien, il n’y en aura pas un pour les gouverner tous. 20
  • 21. national Le paysage en 2000 Autorités Sudoc Autorités BnF catalogue BnF Sudoc 21
  • 22. Identifiants à vocation nationale Le paysage en 2010 Autorités BnF catalogue BnF IdRef Calames Sudoc theses.fr 22
  • 23. Identifiants à vocation globale Identifiants à vocation nationale Le paysage en 2012 IdRef VIAF ISNI ORCID catalogue BnF Autorités BnF Calames Sudoc theses.fr 23
  • 24. Identifiants à vocation globale Identifiants à vocation nationale Le paysage en 2014 IdRef ARK BnF catalogue BnF Calames Sudoc theses.fr HAL IdHAL VIAF ISNI ORCID 24
  • 25. Identifiants à vocation globale Identifiants à vocation nationale Calames Sudoc theses.fr Le paysage vers 2018 IdRef ARK BnF catalogue BnF Persée OATAO HAL IdHAL VIAF ISNI ORCID 25
  • 26. Identifiants à vocation globale Identifiants à vocation nationale Le paysage en 2020 IdRef ARK BnF HAL IdHAL catalogue BnF Calames Sudoc theses.fr Persée OATAO Didomena EHESS VIAF ISNI ORCID 26
  • 27. Identifiants à vocation globale Identifiants à vocation nationale Le paysage en 2021 Identifiants francophones IdRef ARK BnF catalogue BnF Suisse : RERO+, SLSP, Renouvaud Belgique : Université de Liège Calames Sudoc theses.fr Persée OATAO UnivOAK Toulouse Capitole Publications Canal-U CAIRN Didomena EHESS HAL IdHAL VIAF ISNI ORCID 27
  • 28. Types d’alignement 28 Point d’accès / mention d’auteur dans une base bibliographique Identifiant IdRef Identifiant Orcid
  • 29. Aligner de référentiel à référentiel tel ORCID 0000-0002-9361-5295 tel IdRef 139753753 = = tel ScopusID 6507898565 = = Source : https://www.lemonde.fr/m-le-mag/article/2020/03/27/marin-dacos-la-science-en- partage_6034640_4500055.html 29
  • 30. Aligner des identifiants chercheurs : ils l’ont fait et le font régulièrement ! A notre connaissance • Université de Pau et des Pays de l’Adour • Université Polytechnique Hauts-de-France • Réseau Toul’AO La collecte est manuelle mais l’injection dans IdRef peut être faite par l’Abes. 30 RDV sur Abesstp > IdRef > Données pour prendre contact !
  • 31. Etat des lieux au 1er octobre 2021 : identifiants de personnes stockés dans IdRef Identifiant VIAF ISNI ARK BnF ORCID IdHAL Volume 3 413 834 2 115 058 1 445 198 81 870 35 538 31 Tout IdRef est dans VIAF. - Toutes les notices communes IdRef-BnF devraient avoir dans IdRef un ARK Sur 186 000 comptes français (dont beaucoup sont vides). Sur 51 000.
  • 32. Pourquoi l’Abes s’intéresse à VIAF ? Pour les professionnels Aide au catalogage  Désambiguïsation Aide à la curation (AlgoDoublons)  dédoublonnage Pour les besoins internes Pour faire des alignements. 32
  • 33. Pourquoi l’Abes s’intéresse à ARK BnF ? Pour le grand public tendre à l’exhaustivité du signalement de la production d’une personne. => encart BnF Pour les professionnels Aide au catalogage => mécanisme de dérivation Pour les besoins internes Pour faire des alignements dans la perspective du Fichier National d’Entités (FNE). 33
  • 34. Pourquoi l’Abes s’intéresse à ORCID ? Pour le grand public tendre à l’exhaustivité du signalement de la production d’une personne. => encart ORCID Pour les professionnels L’Abes est avec Couperin le porteur du consortium ORCID France. Pour les besoins internes Pour faire des alignements. 34
  • 35. Pourquoi l’Abes s’intéresse à IdHAL ? Pour les professionnels Les établissements déploient beaucoup d’énergie à convaincre les chercheurs de se créer un IdHAL. 35
  • 36. Pourquoi l’Abes s’intéresse à ? Pour le grand public tendre à l’exhaustivité du signalement de la production d’une personne. L’usage des IdHAL est cependant trop limité dans HAL pour qu’il serve à générer les rebonds bibliographiques. L’Abes a une ambition modérée sur IdHAL mais très grande sur HAL (et les autres archives ouvertes). 36
  • 37. Aligner des identifiants d’auteurs ne suffit pas 3ème partie. 37
  • 38. Types d’alignement 38 Point d’accès / mention d’auteur dans une base bibliographique Identifiant IdRef Identifiant Orcid
  • 39. Aligner depuis les données bibliographiques vers un référentiel • De gisement documentaire vers référentiel une mention d’auteur dans un document = une entrée dans un référentiel 39
  • 40. Aligner leur portail HAL sur IdRef : ils l’ont fait ! • Bordeaux-Montaigne • Franche-Comté • Grenoble • INALCO • INRAE • La Réunion • Limoges • Lorraine • Normandie • Orléans • INSA Toulouse RDV sur Abesstp > IdRef > Données pour prendre contact ! 40
  • 41. Mettre plus de HAL dans IdRef : comment ça marche ? 41 Base contenant les autorités Moteur de recherche www.idref.fr data.idref.fr
  • 42. Le pipeline « HAL » : workflow complet 1. Récupération des documents en TEI à partir d’une requête à l’API de HAL 2. Conversion et chargement dans une base RDF interne 3. Calculs d’alignements suivant plusieurs méthodes 4. Propagation et normalisation des liens 5. Chargement dans data.idref.fr des liens entre les documents HAL et des identifiants IdRef 42
  • 43. 1/ Récupération des documents en TEI à partir d’une requête à l’API de HAL ex : https://api.archives-ouvertes.fr/search/?q=collCode_s:"UNIV-BORDEAUX-MONTAIGNE" 43
  • 44. 2/ Conversion et chargement dans une base RDF interne • Utilisation des URI HAL pour identifier les documents • Utilisation des URI AURéHAL pour identifier les structures • Création d’un identifiant (URI) par mention d’auteur (id document + halAuthorId) • Toutes les métadonnées utiles pour : • Les calculs • L’affichage dans data.idref.fr Titre Auteurs (nom, prénom, halAuthorid, structure, e-mail) Citation bibliographique Domaines Hal Sujets Date de dépôt 44
  • 45. 3/ Calculs d’alignements selon plusieurs méthodes 45 exemple : beaucoup de Dominique Breton
  • 46. 3/ Calculs d’alignements selon plusieurs méthodes 46 Clusterisation : même mail + nom identique ou proche exemple : beaucoup de Dominique Breton
  • 47. 3/ Calculs d’alignements selon plusieurs méthodes 47 Clusterisation : même mail + nom identique ou proche Clusterisation : même affiliation + nom et prénom identique exemple : beaucoup de Dominique Breton
  • 48. 3/ Calculs d’alignements selon plusieurs méthodes 48 Clusterisation : même mail + nom identique ou proche Clusterisation : même affiliation + nom et prénom identique Liage à ORCID exemple : beaucoup de Dominique Breton
  • 49. 3/ Calculs d’alignements selon plusieurs méthodes 49 Clusterisation : même mail + nom identique ou proche Clusterisation : même affiliation + nom et prénom identique Liage à ORCID exemple : beaucoup de Dominique Breton
  • 50. 3/ Calculs d’alignements selon plusieurs méthodes 50 Clusterisation : même mail + nom identique ou proche Clusterisation : même affiliation + nom et prénom identique Liage à ORCID Liage à IdRef exemple : beaucoup de Dominique Breton
  • 51. 3/ Calculs d’alignements selon plusieurs méthodes 51 Clusterisation : même mail + nom identique ou proche Clusterisation : même affiliation + nom et prénom identique Liage à ORCID exemple : beaucoup de Dominique Breton Liage à IdRef
  • 52. 3/ Calculs d’alignements selon plusieurs méthodes 52 Clusterisation : même mail + nom identique ou proche Clusterisation : même affiliation + nom et prénom identique Liage à ORCID exemple : beaucoup de Dominique Breton Liage à IdRef
  • 53. Liage à IdRef 53 Clusterisation : même mail + nom identique ou proche Clusterisation : même affiliation + nom et prénom identique Liage à ORCID « Propagation » des liens par inférence  Création de nouveaux liens : • entre mentions d’auteur HAL et IdRef • entre IDs ORCID et IdRef exemple : beaucoup de Dominique Breton 4/ Propagation et normalisation des liens
  • 54. 54 exemple : beaucoup de Dominique Breton « Normalisation » des liens Ordre de préférence : IdRef > ORCID > même Mail > même Affiliation Mémoire des liens précédents pour connaître la provenance (la méthode de calcul du liens) et pouvoir revenir en arrière 4/ Propagation et normalisation des liens
  • 55. 5/ Chargement des liens dans data.idref.fr et dans les notices IdRef 55
  • 56. 5/ Chargement des liens dans data.idref.fr et dans les notices IdRef 56
  • 59. Illustration data.idref.fr # 15 documents liés à Dominique Breton (IdRef 057735492) # 2 halAuthorId liés à Dominique Breton (IdRef 057735492) 59
  • 60. Volumes d’alignements dans data.idref.fr • Au total : • 468 372 documents HAL (17 % du corpus) • 1 619 381 liens document HAL-IdRef (vers 158 814 notices IdRef distinctes) • 8 750 liens IdRef-ORCID « trouvés » au cours des processus d’alignements des documents HAL • Focus sur un portail : « HAL-Université de Lorraine » • 60 % des auteurs alignés automatiquement • 750 000 triplets • 240 000 mentions d'auteur alignées • 40 000 auteurs identifiés. 60 Source data.idref.fr : 08/10/2021
  • 61. Exploiter les alignements 4ème partie. - Exposer - Améliorer 61
  • 62. 62
  • 66. 66 Contribuer au linked open data : data.idref.fr data.idref.fr
  • 67. 67 Contribuer au linked open data : data.idref.fr data.idref.fr +
  • 68. Donner à voir par les machines (1/2) 68 • Webservice « références » : Je te donne un IdRef, donne-moi toutes les références bibliographiques liées que tu connais. https://www.idref.fr/services/references/139753753
  • 69. Donner à voir par les machines (2/2) 69 • Webservice « idref2id » et ses déclinaisons : Je te donne un IdRef, donne-moi tous les IDs que tu connais. https://www.idref.fr/services/idref2id/139753753
  • 70. Donner à voir pour les humains 70
  • 71. 71 Fourniture de tableaux de bord des alignements (1/2) ? ? ? ?
  • 72. 72 ? ? ? ? Fourniture de tableaux de bord des alignements (2/2)
  • 73. Aligner par simple glisser-déposer : de Paprika… 73 +
  • 75. 75
  • 76. 76
  • 78. Aligner la production de leur établissement sur IdRef : ils l’ont fait ! • Catalogues des éditeurs : • ENS Lyon • Ecoles françaises à l’étranger • Bibliothèques patrimoniales : • Antilles : Manioc • Ecole des Chartes : Thenc@ • Revues en ligne : • Lyon 3 Prairial : Arabesques • Métopes • Entrepôt de données de la recherche : • EHESS : Didomena 78
  • 79. Et vous : par quoi êtes-vous concernés ? 79
  • 80. Sortez vos cahiers de texte. Pour la semaine prochaine, vous conjuguerez le verbe IDREFISER au présent de l’indicatif ; n’oubliez pas : j’idrefise sans accent tu iderefises avec un s etc. M’dame m’dame, y a deux « f » à idreffiser ? Pfffou, mais non banane ! I-d-R-e-f !! La sonnerie retentit « DRING DRING » - Le dernier dans la cour est une crotte ! Eh IdRef tu me pousses encore ! - Dis-donc IdHAL tu n’as pas entendu la cloche ! C’est l’heure de la récré. - Oui M’dame ! Mais je me suis déjà fait gagner toutes mes billes, wouin ! La maîtresse ORCID IdRef La maîtresse ARK BnF Source: https://svgsilh.com/image/1294675.html 80 IdHAL
  • 81. Source: https://svgsilh.com/image/1294675.html Merci de votre attention. leprovost@abes.fr mauger@abes.fr mistral@abes.fr 81

Notes de l'éditeur

  1. 16h – Orateur : Isabelle 16h05 le goûter est fini. La cloche a sonné ; la récré est finie.
  2. La classe compte une bonne vingtaine d’élèves, voire une petite trentaine. Nous allons focaliser notre attention sur 5 d’entre eux, non pas parce que la maitresse a ses chouchous mais parce que ces 5 là demandent en ce moment une attention particulière. ORCID ISNI IdRef ARK BnF IdHAL Dans l’heure, nous allons apprendre à conjuguer le verbe « aligner » au présent de l’indicatif.
  3. Voilà le pitch de cette session parallèle, pitch que nous avons conçu dans le monde d’avant, il y a presque 18 mois. Nous parlerons exclusivement d’identifiants auteur. Par contre nous irons au-delà de cette saynète. Nous parlerons alignements d’identifiants donc alignement entre référentiels mais nous parlerons aussi d’un autre type d’alignement où les identifiants d’auteurs jouent un rôle moindre. Présentation en 4 parties et à 3 voix.
  4. 16h10 Orateur : François jusqu’à la diapo de démarrage de la 2nde partie. 15mn. 13 diapos.
  5. https://www.idref.fr/139753753 Objectif : identification sans ambiguïté
  6. Objectif : identification sans ambiguïté (bis)
  7. Objectif : encore la même chose²
  8. La session d’aujourd’hui va être centrée sur ces deux rubriques que vous voyez dans les pages IdRef de personnes Dans la notice d’autorité (à gauche) : les autres identifiants stockés dans le format unimarc A dans les zones A010, A033 et A035. Dans cet exemple, beaucoup d’identifiants externes ont été collectés et sont stockés dans IdRef. Dans les liens (à droite de la diapo) : liens qui pointent vers des gisements documentaires divers Dans cet exemple : des liens Vers des catalogues de bibliothèques : Sudoc, Université de Liège, catalogue des bibliothèques universitaires francophones SLSP, catalogue général de la BnF D’autres gisements documentaires : La plateforme de revues en accès ouvert de Lyon 3 Prairial Le portail Persée L’archive ouverte HAL Les références bibliographiques des travaux référencés dans le compte ORCID de cette personne Ce que vous voyez affiché est le résultat d’alignements, soit que vous avez réalisé soit que l’Abes a réalisé.
  9. https://www.idref.fr/057735492 Autre exemple d’une chercheuse de Bordeaux Montaigne. Nom relativement commun, risque d’homonymie important, prénom non genré qui peut porter à confusion. Une liste d’identifiants externes moins fournie. Et malgré tout, des alignements ont été produits par l’Abes et il est possible notamment d’afficher les ressources HAL liées à cette personne.
  10. Tendance des dernières années : agréger autour de la notice d’autorités le maximum de liens quelle que soit la source de ces liens. Enrichissements bibliographiques d’IdRef qui va bien au-delà des applications gérées par l’Abes. Si ces encarts sont possibles c’est parce que soit des alignements ont eu lieu soit les partenaires sont devenus producteurs de données dans IdRef.
  11. Trois filières de production dans IdRef.
  12. Généré via https://nuagedemots.co/ coproduction coproduction coproduction coproduction coproduction coproduction coproduction mutualisation mutualisation mutualisation mutualisation francophone francophone francophone francophone national national national national national patrimoine patrimoine patrimoine ESR ESR ESR ESR souveraineté souveraineté souveraineté souveraineté souveraineté autonomie autonomie autonomie autonomie administration administration administration administration réseau réseau réseau réseau réseau expertise expertise expertise expertise collaboration collaboration collaboration collaboration
  13. Généré via https://nuagedemots.co/ agréger agréger enrichir enrichir rebondir pivot pivot pivot interopérabilité interopérabilité interopérabilité interopérabilité interopérabilité interopérabilité services services exhaustivité exhaustivité exhaustivité valoriser valoriser valoriser valoriser cataloguer cataloguer cataloguer cataloguer
  14. Généré via https://nuagedemots.co/ calculs calculs calculs calculs calculs calculs calculs calculs calculs collecte collecte collecte collecte collecte inférence inférence clusterisation clusterisation analyse analyse diagnostic diagnostic manuel automatique hommes hommes hommes machines machines machines
  15. De référentiel vers référentiel une entrée dans un référentiel = une entrée dans un autre référentiel 2ème partie de la présentation De gisement documentaire vers référentiel une mention d’auteur dans un document = une entrée dans un référentiel 3ème partie de la présentation
  16. 16h25 Orateur Isabelle jusqu’à la 3ème partie. 20 mn. 17 diapos.
  17. 20
  18. En 2000, il existe des catalogues de bibliothèques adossés à des fichiers d’autorités qui n’ont pas d’existence autonome ie indépendante du catalogue pour lequel ils ont été créés. En France, deux fichiers d’autorités, qui entretiennent des liens forts, puisque les autorités Sudoc sont à l’origine un miroir des autorités BnF avant leur divergence.
  19. En 2010 pour ses propres besoins, l’Abes rend les autorités Sudoc indépendantes du catalogue Sudoc. Les notices d’autorités sont désormais dotées d’une URL pérenne construite autour du numéro PPN de la notice d’autorité. L’identifiant IdRef apparait. Il peuple les bases de données Calames et theses.fr.
  20. En 2012, grandes manœuvres à l’échelle mondiale. On voit apparaitre : ISNI qui vise à recenser toutes les personnes impliquées dans la production littéraire, intellectuelle et artistique, dans une optique de gestion des droits d’auteur. ORCID qui vise à recenser les chercheurs. VIAF qui clusterise les fichiers d’autorités nationaux dont celui de la BnF et celui de l’Abes. Ces trois ID à vocation globale ont des liens entre eux. Une tranche d’ISNI est réservée à ORCID. Et ISNI est constitué à l’origine à partir des données de VIAF. La BnF se positionne rapidement comme agence d’attribution de l’ISNI.
  21. En 2014, la BnF commence à s’intéresser au système de liens permanents ARK et généralise l’usage de cet identifiant dans ses notices d’autorités. Le CCSD met en place l’IdHAL pour permettre aux déposants dans HAL de bénéficier d’un service d’affichage de CV. IdHAL est perçu comme un identifiant même si cette fonction est en réalité accessoire.
  22. Vers 2018, l’Abes et ses catalogueurs commencent à investir le champ des alignements d’identifiants d’une manière plus systématique, notamment vis-à-vis d’ORCID et des IdHAL. Parallèlement, de nouveaux producteurs rejoignent IdRef : Persée et l’archive institutionnelle OATAO des Ecoles d’Ingénieurs Toulousaines (dont INP Toulouse).
  23. En 2020, Nouvelle flèche entre VIAF et ORCID car les catalogueurs du monde entier saisissent des ORCID dans leurs fichiers d’autorités. L’EHESS devient producteur dans IdRef pour les besoins de son entrepôt des données de la recherche Didomena. l’Abes s’intéresse de plus en plus à HAL, au-delà de l’IdHAL. Nouvelle flèche qui vous sera présentée en détails tout à l’heure.
  24. En 2021, UnivOAK l’archive institutionnelle alsacienne, et Toulouse capitole Publications l’archive, ainsi que CAIRN et Canal-U deviennent des catalogueurs dans IdRef. Et IdRef devient un fichier d’autorités francophones avec les 3 réseaux distincts de la Suisse francophone et en Belgique l’Université de Liège. Au final ce sont peut-être entre 200 ou 300 personnes qui seront cette année devenues des catalogueurs dans IdRef. Nul doute que ce paysage évoluera encore.
  25. François vous a présenté ce schéma il y a quelques minutes. Je vais vous détailler la partie droite, à savoir les alignements de référentiel vers référentiel. De référentiel vers référentiel une entrée dans un référentiel = une entrée dans un autre référentiel 2ème partie de la présentation
  26. Dans le monde réel, il existe une personne. Vous aurez reconnu Marin Dacos. Aligner des référentiels revient à établir des égalités entre référentiels. Dire que tel ORCID, tel IdRef ou tel ScopusID désigne la même personne du mode réel
  27. https://svgsilh.com/image/1302161.html
  28. VIAF Des programmes poussent régulièrement les nouvelles notices IdRef dans VIAF et récupèrent les IDs VIAF correspondants. Tout IdRef est dans VIAF. ISNI 58% des notices de personnes physiques ont un ISNI. ARK BnF. L’objectif est que toutes les notices communes IdRef-BnF aient dans IdRef un ARK. Ce n’est pas le cas aujourd’hui sans que l’on sache exactement combien de notices IdRef sont passées au travers les mailles du filet. ORCID. 186 360 comptes ORCID ont le code pays France, selon ORCID. Mais attention beaucoup de comptes sont vides ! On a des doutes sur cette cible de 186 000 comptes. 44% de l’objectif est atteint. IdHAL 51 000 IdHAL. 69% de l’objectif est atteint.
  29. Exemple des Suisses francophones RERO+, SLSP, bientôt Renouvaud.
  30. 16h45 : Orateur Aline jusqu’à la partie 4. 20 mn. 15-20 diapos.
  31. De gisement documentaire vers référentiel une mention d’auteur dans un document = une entrée dans un référentiel 3ème partie de la présentation
  32. Workflow rôdé durant près d’un an avec plusieurs établissements cobayes
  33. Une requête pour circonscrire un périmètre documentaire Tout index
  34. https://hal.archives-ouvertes.fr/[id du document]/person/[halAuthorId de la personne] Par exemple : https://hal.archives-ouvertes.fr/hal-00000078/person/30    Travail dans une base rdf = Base interne de travail : modèle de données riches et flexible mécanismes d’inférence permis par base rdf => on peut déduire de nouvelles informations à partir d’informations existantes (utile pour propager des liens, comme je vais l’expliquer juste après) alimentation data.idref URI de person => id doc + halauthorId -> identification et contextualisation de l’auteur
  35. Notre système utilise différentes méthodes pour produire des liens des deux types dont François vous a parlé : Entre des référentiels différents (Orcid – IdRef) Entre des mentions d’auteurs et des référentiels (Hal-IdRef et Hal-Orcid)
  36. A la fin du processus on a un ensemble de liens
  37. On envoie : une partie vers data.idref.fr : les liens + qq infos (citation biblio, date, rôle ) une autre vers la base de données à laquelle s’adosse IdRef pour ajouter les liens Orcid-IdRef dans les notices d’autorité
  38. A partir d’une mention d’auteur HAL Regardons comment cela se présente dans HAL et dans AuréHAL -> pas d’idHal
  39. Pourtant, des références HAL sont visibles dans IdRef
  40. 17h05 : orateur François. 10 mn. 10 diapos. Fin à 17h15.
  41. Généré via https://nuagedemots.co/ exposer exposer exposer exposer curation curation curation curation paprika paprika webservice webservice LOD LOD Zotero Zotero machines hommes
  42. Contribuer à l’écosystème ESR
  43. Contribuer à l’écosystème ESR
  44. Contribuer à l’écosystème ESR
  45. Qu’est-ce que data.idref.fr ?
  46. Paprika est une application professionnelle de curation de données, dédiée au contrôle qualité des liens entre notices bibliographiques et notices d'autorité de type personne. Paprika utilise un service d'intelligence artificielle co-dévelopé par l'Abes et l'équipe de recherche GraphIK (LIRMM). Sa déclinaison avec les dépôts HAL, fonctionnelle dans les grandes lignes, est en cours de développement à l’Abes, et avec l’aide d’établissements pilotes (Orléans, Grenoble).
  47. Sa déclinaison avec les dépôts HAL, fonctionnelle dans les grandes lignes, est en cours de développement à l’Abes, et avec l’aide d’établissements pilotes (Orléans, Grenoble).
  48. Enregistrement dans data.idref Donc requêtable dans data.idref Et donc visible dans les notices IdRef ! Enregistrement dans HAL ?
  49. Les établissements reprennent le contrôle. Extension du domaine du signalement documentaire. La récré est finie. Vous êtes les acteurs de premier plan. Qu’allez-vous idrefiser en rentrant à la maison ? https://worditout.com/ presses~_universitaires presses~_universitaires Canal-U Canal-U Canal-U Canal-U pépinière~_de~_revues pépinière~_de~_revues portail~_HAL portail~_HAL portail~_HAL portail~_HAL archive~_institutionnelle base~_bibliométrique~_locale bibliothèque~_numérique~_patrimoniale bibliothèque~_numérique~_patrimoniale Frantiq Frantiq Frantiq entrepôt~_de~_données
  50. La sonnerie va bientôt retentir et les enfants s’égayer dans la cour.
  51. Fin à 17h15