SlideShare une entreprise Scribd logo
1  sur  128
Télécharger pour lire hors ligne
CONTRÔLE 
D’AUTORITÉ : 
ENJEUX ET OUTILS 
Modélisation des données et humanités numériques 
1er décembre 2014 
Vincent Boulet 
Expert en autorités, BnF 
http://viaf.org/viaf/196147503/ 
ISNI 0000 0003 5723 4556
sommaire 
• Le contrôle d’autorité : qu’est-ce que c’est ? 
• Données d’autorité / web de données / identifiants / ISNI 
• Des réservoirs de données d’autorité en évolution 
• BnF / VIAF 
• Les données d’autorité et les données prosopographiques 
• L’EAC-CPF : un format international structuré et extensible 
• Quelques réalisations en EAC-CPF dans des domaines variés: 
• SNAC (social network and archival context) 
• American numismatic society
LE CONTRÔLE 
D’AUTORITÉ
Partons d’un exemple : Jean Gerson 
Statue de Jean 
Gerson par Joseph 
Félon (1818-1896) 
dans une niche de la 
façade de la Chapelle 
de la Sorbonne à Paris 
http:// 
commons.wikimedia.or 
g/wiki/ 
File:Jean_Gerson_Sor 
bonne_statue.jpg
Jean Gerson à la BnF 
Tractatus Johannis Gersonis, 
Cancellarii Parisiensis, contra 
superstitiosam dierum observationem, 
praesertim innocentum 
Publié par Michael Hering, Hambourg, 
1624 
Numérisé dans Gallica 
http://gallica.bnf.fr/ark:/12148/ 
bpt6k10404880
Jean Gerson à la BnF 
Cy commence ung traictié compilé et fait 
par homme de grant science maistre Jehan Jarson, 
maistre en theologie, chancelier de Nostre Dame de Paris, 
contre aucunes erreurs et mauvaises doctrines et exemples 
qui sont contenues ou Roumant de la Rouse en plusieurs lieux 
comme cy aprés est contenu
Jean Gerson à la BnF 
Collection Michel Hennin. 
Estampes relatives à l'Histoire de France 
Portrait de J. Gerson 
http://gallica.bnf.fr/ark:/12148/btv1b8400155c
Jean Gerson à la BnF 
Collection Michel Hennin. 
Estampes relatives à l'Histoire de France 
Portrait de J. Gerson, en pied, 
se dirigeant vers la gauche 
et suivi d'un chien 
http://gallica.bnf.fr/ark:/12148/btv1b84001576
Besoins 
9 
• Identification de 
manière univoque 
des entités 
cataloguées : de qui, 
de quoi parle-t-on? 
• Explicitation de 
l’implicite des notices 
bibliographiques
Besoins 
10 
• Outil de navigation 
dans les ressources de 
la BnF, pour la 
recherche 
• Centralisation des 
différentes formes du 
nom
Besoins 
11 
• Outil de navigation dans les ressources de la 
BnF 
• Par les liens entre notices descriptives (bibliographiques, 
archivistiques) et les notices d’autorité
Une « notice d’autorité »
• Un « fichier d’autorité » 
Cocteau, Jean (1889-1963) 
Personne physique 
Hahn, Reynaldo (1874-1947) 
[le dieu bleu (ballet)] 
Titre musical 
La belle et la bête (film) 
Titre conventionnel 
Groupe des Six 
[Les mariés de la Tour Eiffel] 
Titre musical 
Groupe des Six 
Collectivité
17 
Les objectifs du contrôle d’autorité 
(FRAD : functional requirements for authority data) 
• trouver 
• des informations sur les entités décrites par les données d’autorité 
• identifier 
• confirmer que l’entité trouvée correspond bien à la recherche 
• distinguer entre des entités analogues 
• contextualiser 
• expliciter les relations entre les entités, ou entre une entité et un 
nom (par exemple : nom d’alliance, pseudonyme…) 
• justifier 
• les choix du catalogueur (par exemple : justifier par une source une 
forme rejetée) 
⇒ Une notice d’autorité n’est pas une notice biographique mais 
fournit des données « noyau », fondamentales, réutilisables pour 
des usages différents 
⇒ Importance des identifiants pérennes (ARK) 
⇒ Importance des identifiants internationaux (ISNI)
FRBR : le rôle central des autorités 
19 
OEuvre 
Expression 
Manifestation 
Item 
Personne 
Collectivité 
Concept 
Objet 
Événement 
Lieu 
réalisée dans 
matérialisée dans 
exemplifiée par 
Famille 
Entités 
Groupe 1 
Entités 
Groupe 2 
Entités 
Groupe 3
FRBR : le rôle central des autorités 
20 
OEuvre 
Expression 
Manifestation 
Item 
Personne 
Collectivité 
Concept 
Objet 
Événement 
Lieu 
réalisée dans 
matérialisée dans 
exemplifiée par 
Famille 
Entités 
Groupe 1 
Entités 
Groupe 2 
Entités 
Groupe 3
21 
Les relations dans le modèle FRBR 
OEuvre 
Expression 
Manifestation 
Item 
Personne 
Famille 
Collectivité 
Concept 
Objet 
Événement 
Lieu 
créée par 
réalisée par 
produite par 
possédé par 
Entités 
Groupe 1 
Entités 
Groupe 2 
Entités 
Groupe 3 
Relations Groupe 1 / Groupe 2 
Relations de responsabilité
DEV 10 - 2013 22 
Après le modèle FRBR 
• 1999 : création d’un autre groupe de travail pour étendre 
le modèle FRBR aux données d’autorité 
• 2009 : publication du 
Rapport final sur les fonctionnalités requises des données 
d’autorité (FRAD, Functional requirements for authority 
data) 
• le modèle FRAD n’en est qu’une partie
DEV 10 - 2013 23 
Le Rapport final FRAD 
• Objectifs : 
• Définir les fonctionnalités requises des données 
indispensables au contrôle d’autorité 
• gestion des points d’accès dans un catalogue 
• identification des entités représentées par ces points d’accès 
• pour permettre 
• de répondre aux besoins des utilisateurs des données d’autorité 
• de partager et de réutiliser les données d’autorité 
• Le modèle met l’accent sur les données, non sur leur 
organisation dans des notices
FRAD : un « modèle 
Conceptuel » 
⇒ Que met-on dans 
une notice d’autorité 
⇒ Avec quelles 
données? 
Notion de données 
d’autorité
Personne/nom/point d’accès contrôlé 
Entité bibliographique 
personne / collectivité 
Nom 
et/ou 
Identifiant 
Point d’accès contrôlé 
Gerson, Jean (1363-1429) 
Connue 
par 
Base 
pour 
Jean Gerson 
ISNI : 
0000 0001 2145 048X
De la notice aux données (FRAD) : 
les attributs d’une personne 
26 
Date Titre Sexe Lieu de 
Une personne 
naissance 
Lieu de 
mort Pays Lieu de 
résidence 
Affiliation Adresse Langue 
Domaine 
d’activité 
Professio 
n/ 
occupatio 
n 
Biographie 
/histoire 
Autre 
informatio 
n
Les données d’autorité après FRBR et 
FRAD 
• Des données d’autorité acquièrent une importance 
nouvelle 
• Pas simplement une notice d’autorité fournissant un point d’accès 
à une notice bibliographique 
• La « notice » est un assemblage de données 
• Les données circulent et sont visibles par tous : enjeu du Web 
• FRBR et FRAD sont des documents de référence 
internationaux : une première pour les autorités 
• Ce ne sont pas des normes mais des modèles 
conceptuels 
• Appellent à la rédaction de nouvelles normes, portant sur 
l’ensemble des données d’autorité et pas uniquement sur les 
formes retenues
Les enjeux posés par le Web et le Web de données
Le contexte du Web : les autorités 
et les moteurs de recherche
Importance des référentiels 
• Désambiguisation 
• Panachage 
31
• Découverte 
• Importance 
des entités : 
informations 
regroupées 
autour d’un 
concept
Le lecteur souhaite accéder à des… 
33 
auteurs 
éditeurs 
organisations 
notions 
oeuvres personnes 
à des contenus 
et des informations 
objets 
événements 
lieux 
livres 
films 
oeuvres musicales 
sites web… 
www
L’économie appliquée au web : 
le modèle de la longue traîne 
Le web a ouvert l’ère des marchés de niche et des « non-succès 
34 
» 
Article Chris Anderson The Wire 
http://www.internetactu.net/2005/04/12/la-longue-traine/
Dépasser une contradiction 
D’une part… 
Les catalogues constituent des silos : 
pour trouver les ressources liées à un centre 
d’intérêt 
L’usager souhaite s’en servir pour fiabiliser sa 
recherche
Mais…. 
Les métadonnées : un trésor sur le web 
• Des données validées 
• Créées par un professionnel de la 
description de ressources 
• Des données contextualisées 
• Les informations sont précisées par 
une source et une date 
• Pérennité des accès et citations 
• ARK, autres identifiants 
• Généralement l’identifiant est envisagé 
sur le très long terme 
• Utilisateurs tiers 
• Tradition d’une offre de services 
• Désintéressement financier
Le projet data.bnf.fr
Des pages web 
pour les moteurs de recherche 
et pour les humains 
Collections numérisées (2,4 M) Des pages web 
Catalogue général (15,3 
M) 
pour les humains 
Des données structurées 
pour les machines 
BnF Archives et 
manuscrits 
Traitements automatiques : 
alignements, regroupements
Ouverture technique et juridique des 
données
1/ Des données visibles sur le web 
Ø Rendre visibles ces données en les rendant indexables 
par les moteurs du Web 
+80 % des visiteurs viennent des moteurs de recherche 
Ø Une porte d’entrée vers les applications existantes 
60 % des visiteurs de data.bnf.fr vont ensuite vers Gallica 
et les catalogues 
Recherche : exemple Baldus de Ubaldis, Exquemelin, 
stanze de politien, proverbes mandingues, cesare beccaria 
des delits et des peines ed 1821 
christine de pisan
2/ Regrouper les données sur des pages 
simples 
> Organiser des 
pages « pivots » sur 
les oeuvres, les 
auteurs, les thèmes 
/
http://data.bnf.fr/ark:/12148/cb11970307j
3/Se lier sur le web 
§ Lier ces données à d’autres jeux de 
données du Web
http://data.bnf.fr/ark:/12148/cb11888473k
4/Encourager les utilisations 
§ Par les bibliothèques 
§ et bien au-delà : recherche, tourisme, 
édition… 
grâce à l’ouverture juridique et technique 
des métadonnées.
• 
Ils récupèrent nos données 
http://www.ifverso.com/fr/content/robur-le-conquerant-14 
http://www.rechercheisidore.fr/ 
http://data.abuledu.org 
Fédération 
Des ensembles 
Vocaux et 
Instrumentaux 
Spécialisés
De l’échange de notices au partage des 
données 
• Ouverture technique et juridique des données => 
évolution dans le partage international du travail 
• Éviter la redondance du travail 
• Plus facile d’identifier les entités nationales (proximité des sources) 
= mais cette notion est à revoir dans le contexte du Web 
• => notion de confiance, de champ d’expertise 
• De la normalisation des notices pour pouvoir les 
échanger à la structuration des données pour pouvoir 
les partager 
• Non, la normalisation et l’expertise ne sont pas mis à mort par le 
Web
Données existantes : des liens, des autorités 
et des identifiants
ISO 27729 International Standard Name Identifier 
Identités publiques 
pour 
Personnes et collectivités 
Permet d’identifier au niveau international « les individus et les organismes qui contribuent 
aux oeuvres de création, notamment les écrivains, artistes , créateurs, interprètes, 
chercheurs, producteurs, éditeurs etc. » 
e.g.: ISNI 0000 0001 2133 4104 
§ Périmètre universel 
§ Unique 
§ Pérenne 
§ Administré de manière centralisée 
§ Exprimé comme une URI : http://isni.org/isni/0000000121334104 
www.isni.org
Les notices de VIAF 
constituent le socle de 
la base ISNI. 
Elles sont confrontées 
aux données des autres 
contributeurs d’ISNI 
41 institutions partenaires 
En France : la BnF et le 
SUDOC 
Les notices sur les 
personnes et les 
collectivités des 
partenaires sont 
regroupées en grappes 
LA BASE ISNI, 
CONSTRUITE À PARTIR DE VIAF 
Autres 
contributeurs Novembre 2013 
50 
http://www.isni.org/
Périmètre 
de 
VIAF 
et 
d’ISNI 
6,74 millions 
Clusters VIAF 
contiennent un ISNI 
7,98 millions ISNI assignés 
- Clusters VIAF ne remplissant pas les critères 
d’assignation des ISNI 
(clusters avec une seule source…)
IdenGtés 
publiques 
1 
personne, 
2 
idenGtés 
publiquesº 
2 
ISNI 
séparés 
Cornwell, 
David 
John 
Le 
Carré, 
John 
(pseudonyme) 
Moore 
(vrai 
nom) 
ISNI Quality Team 
Image from: http://kids.britannica.com/comptons/art-149833/John-le-Carre 
La relation est 
publique 
Pour les 
personnes 
décédées 
après 1900
Les contributeurs d’ISNI : un croisement de 
multiples domaines (liste non exhaustive) 
Bibliothèques 
Droits 
textes 
Droits 
Musique 
Sources 
commerciales 
Encyclopédies 
Recherche 
Autres 
sources 
domaine 
culture 
(archives, 
art 
contemporain, 
etc.)
IDs 
Internationaux 
Communités 
spécifiqus 
d’utilisateurs 
IDs locaux 
(chaque 
institution – 
son ID 
système, 
en local) 
GND 
(Allemagne 
DNB + 
cooperative 
) 
IdRef 
(ABES 
Universités 
françaises) 
International 
Standard 
Mondial 
Inter-domaine 
IPI 
Internationa 
l CISAC 
auteurs/ 
compositeu 
rs 
IPD 
Internation 
al 
interprètes 
Les 
différents 
types 
d’idenGfiants 
/ 
pont 
entre 
les 
données 
IDs operant 
au niveau 
regional/ 
consortium 
DAI 
Pays Bas 
Chercheur 
s 
VIAF ID 
Bibliothèqu 
es et + 
Gestion droits 
(interprètes) 
Universités 
françaises 
bibliothèques 
Institutions de 
recherche 
ARK ID 
(fichiers 
autorité) 
Bibliothèques 
publiques 
France 
NACO 
(LC + 
cooperative) 
Institutions 
danoises 
Gestion droits 
(auteurs, 
Allemagne compositeurs) 
bibliothèques + Editeurs 
Gestion droits 
(textes) 
NACO 
bibliothèque 
s 
membres 
E 
X 
E 
M 
P 
L 
E 
S 
(ARK ID) 
Archives 
(US+) 
z 
Archives
55
L’ÉVOLUTION DES 
FICHIERS D’AUTORITÉ
Un fichier évolutif : 
avoir des données fiables et sourcées 
• Mises à jour, corrections incessantes 
• Importance des sources primaires, y compris 
archivistiques
58 
Que veut-on faire dire à une notice 
d’autorité du catalogue? 
+ Contexte … etc. 
+ Contexte 
Archives 
+ Contexte 
Enluminures 
+ Contexte 
Manuscrits 
+ Contexte 
Reliures 
Info 
noyau
Ou bien, si besoin … 
59 
Info 
noyau 
+ 
Contexte 
Archives 
+ Contexte 
… etc. 
+ Contexte 
Enluminures 
+ Contexte 
Manuscrits 
+ 
Contexte 
Objet 
+ Contexte 
Reliures 
+ Contexte 
Archives 
sonores 
+ 
Contexte 
Médailles
60 
Contexte 
Reliures 
François Ier (roi de France ; 1494-1547) 
forme internationale français 
Informations 
« noyau », 
valables pour 
tout contexte 
Lien 
ARK spécifique
Données d’autorité 
contextuelles en réseau 
BnF Autorités 
Info « noyau » 
(MARC) 
Monnaies 
??? 
Reliures 
Autorités 
Contextuelles 
<XML TEI> 
Globes 
contexte 
MARC 
<MARC-XML> 
BnF archives 
institutionelles 
Autorités 
Contextuelles 
<EAC-CPF>?? 
Reseau 
bibliophilie 
Autres bases 
Reliures 
et autres 
archives
, " & # " 
Entités nommées: 
Personnes 
Collectivités 
Familles 
… 
noeuds communs 
entre ressources
Un nouveau contexte normatif 
international 
• Nouveau code de 
catalogage : 
• Ambition de prendre en 
compte FRBR, FRAD et 
enjeux du Web 
• Pas seulement la 
construction des noms 
mais l’ensemble des 
données d’autorité 
• RDA comme référence 
hors du monde des 
bibliothèques 
• Un code unique : 
traite de toutes les 
entités FRBR et de 
leurs relations 
• Entités du Groupe 2 
FRBR (les Agents) 
en font partie 
intégrante
Contexte 
normaGf 
-­‐ 
internaGonal 
Archives 
• Normalisation 
ISAAR (CPF) : Norme Internationale sur les notices 
d’autorité utilisées pour les Archives relatives aux 
collectivités, aux personnes ou aux familles, 2e éd 
– 2004 (1e éd 1996) 
• Norme sur le contenu des notices d’autorité 
• Pour la structuration des points d’accès à 
renvoie vers les normes et bonnes pratiques 
spécifiques appliquées dans des contextes 
locaux 
• Modélisation 
– travaux en cours ICA par 
Groupe d’experts sur la description archivistique 
(EGAD) 
– But : appréhender l’information archivistique 
dans son ensemble (y compris les producteurs 
et autres « acteurs »)
Contexte 
normaGf 
-­‐ 
internaGonal 
Communauté 
documentaGon 
et 
KOS 
(Knowledge 
OrganizaGon 
Systems) 
• Norme sur les Thésaurus ISO 25964 
Thésaurus et interopérabilité avec d'autres 
vocabulaires 
• cadre englobant – fait référence aux entités nommées et 
listes d’autorités (y compris personnes, collectivités, 
familles) dans la partie sur l’interopérabilité 
• Mais aussi … 
codes de catalogage et bonnes pratiques 
utilisés par de producteurs de données d’autorité 
sur les personnes et les collectivités 
Ex : 
– ULAN (Union List of Artists’ Names) de Getty
Au 
niveau 
naGonal 
: 
iniGaGves 
en 
cours 
• Groupe technique AFNOR GC 46 CN46-9/GE 6 
RDA en France 
• Projet de norme en cours 
porte sur le Groupe 2 des entités FRBR 
(Personnes, Collectivités, Familles) 
• But : faire évoluer les règles de catalogage 
• Les adapter au nouveau contexte 
• Favoriser la FRBRisation des catalogues 
• Porter les données des bibliothèques sur le Web 
Sémantique 
Bibliothèques
Au 
niveau 
naGonal 
: 
iniGaGves 
en 
cours 
Archives 
• Groupe de travail AAF/SIAF 
Notices d’autorité Producteurs 
ISAAR(CPF) 
depuis 2010 
But : Réaliser un Référentiel national 
proposant 
– des formes autorisées du nom pour 
l’administration territoriale (1800 à nos jours) 
– des descriptions normalisées des organismes 
types, selon la norme ISAAR(CPF) 
http://www.archivistes.org/Notices-d-autorite-producteurs- 
1781
Au 
niveau 
naGonal 
: 
iniGaGves 
en 
cours 
Ministère 
de 
la 
Culture 
et 
de 
la 
CommunicaGon 
• Cadre: programme HADOC 
(Harmonisation des données culturelles) 
• Modèle harmonisé pour la production des données 
culturelles 
(références: Norme ISO 25964, modèles CRM et 
FRBRoo) 
• Comprend : Modèle « Acteur » 
• Cadre d’action: 
« Référentiel des acteurs historiques »
Briatte, Katell. Atelier « Passées dans le présents », 10 avril 2014 
http://passes-present.eu/sites/default/files/projets/intervention_hadoc_briatte.pdf
Vers 
une 
norme 
française 
des 
« 
agents 
» 
? 
oui, 
c’est 
possible 
ü Parce que les normes existantes sont obsolètes 
besoin de les réviser 
ü Parce qu’il y a besoin d’une démarche globale 
sur tout ce qui a trait aux Agents (Personnes, 
Collectivités, Familles) 
ü Pour faire le lien avec le contexte international 
« Agir local – Penser global » 
ü Parce que l’environnement technologique le permet 
ü Parce qu’il y a besoin de rassembler l’ensemble de 
la profession info doc pour répondre aux besoins 
d’interopérabilité 
Agents – point commun entre jeux de données
Virtual 
internaGonal 
authority 
file 
• 1978 : premières discussions sur 
un fichier d’autorité international 
• 2003 : Research 
prototype (LC, DNB) 
• 2007 : BnF rejoint VIAF 
• 2012 : Nouvelle organisation 
• service 
• VIAF Council 
• 2012 : Open data 
• 2014 : Nouveaux critères 
d’adhésion 
www.viaf.org 
41 
insGtuGons 
et 
projets 
26 
millions 
de 
clusters 
Tout 
est 
gratuit 
!
Les partenaires VIAF : les BN
Les réseaux nationaux et régionaux
DES DONNEES 
DE NICHE
La « philosophie » de viaf 
« Car aucune chose ne 
devient ni ne périt, mais elle se 
mêle ou se sépare de choses 
qui sont. 
Ainsi on dirait à bon droit « se 
composer » au lieu de « 
devenir » et « se décomposer 
» au lieu de « périr » 
Fragments d’Anaxagore, « sur 
la nature », 17 
http://viaf.org/viaf/294235617 
Ἀναξαγόρας 
http://viaf.org/viaf/24645587
• Aucune donnée n’est créée dans VIAF 
• Toutes les données traitées par VIAF proviennent des partenaires de 
VIAF 
• VIAF c’est un appariement de données 
• On parle de grappe ou de « cluster » VIAF : rapprochement entre 
les différentes notices des différents partenaires 
• Les données viennent du fichier d’autorité et du fichier 
bibliographique qui y est lié 
• VIAF ne choisit pas entre les « bonnes » et les « mauvaises » 
données, il reste neutre entre les différents partenaires (sauf cas 
particuliers) 
• Plus les données sont complètes et justes, plus les algorithmes 
de VIAF sont performants 
• Importance du travail sur les données à la source
Récupération des données de VIAF 
• En gros : 
• Au détail : 
- Un dump RDF 
• RDF/XML « neutre »/ 
- Marc 21 XML 
Marc 21 XML / JSON 
- Un service SRU 
- Possibilité de 
construire de petites 
applications web 
d’interrogation
Le RDF de VIAF 
• Elaboré en 2011, 
totalement revu 
• Parti pris de la 
simplicité 
• Pour une interopérabilité très 
large 
• Deux parties : 
• Chaque contibuteur 
distingué (skos) 
• Le cluster en soit 
(schema.org)
Bilan 
: 
VIAF 
et 
le 
contrôle 
d’autorité 
interna9onal 
- Fédère et compare les données 
Toutes les données 
sont visibles 
Interconnecte 
- Visibilité sur le Web 
- Linked Open Data 
- Partage de la 
connaissance 
- Partage de 
l’expertise 
La qualité des données 
est aussi visible 
☛ Question centrale de la qualité des données 
☛ Les partenaires sont responsables de ce qu’ils fournissent
Un exemple d’utilisation de VIAF
DONNÉES D’AUTORITÉ ET 
DONNÉES 
PROSOPOGRAPHIQUES
Prosopographie 
• Définition : 
« La prosopographie est l’étude d’une micro-population à 
partir des biographies des membres qui la composent. Il ne 
s’agit donc pas d’une simple étude statistique, car cette 
méthode consiste à mettre en relation tous les parcours 
biographiques, sans faire de ces individus des anonymes » 
Site du Laboratoire de Médiévistique Occidentale de Paris, 
Université Paris-I Panthéon Sorbonne
Prosopographie 
• Définition : 
« La prosopographie est l’étude d’une micro-population à 
partir des biographies des membres qui la composent. Il ne 
s’agit donc pas d’une simple étude statistique, car cette 
méthode consiste à mettre en relation tous les parcours 
biographiques, sans faire de ces individus des anonymes » 
Site du Laboratoire de Médiévistique Occidentale de Paris, 
Université Paris-I Panthéon Sorbonne
Données d’autorité et prosopographie 
Données d’autorité 
contrôlées « noyau » 
Noms, identifiants, 
sources 
Identifiants 
(ISNI) 
Réservoirs de 
données 
nationaux et 
internationaux 
(BnF, VIAF...)
Données d’autorité et prosopographie 
Données d’autorité 
contrôlées « noyau » 
Noms, identifiants, 
sources 
Identifiants 
(ISNI) 
Réservoirs de 
données 
nationaux et 
internationaux 
(BnF, VIAF...) 
Individus 
Micro-population 
Biographies 
Relations 
Description des 
individus dans 
un contexte 
particulier, selon 
un angle 
particulier 
Relations
L’EAC-CPF 
Un format international, documenté, ouvert
Données d’autorité contextuelles 
• Un projet de données d’autorité de type archivistiques 
• Norme de contenu des notices : 
ISAAR(CPF) – Norme internationale sur 
les Autorités archivistiques: collectivités, personnes, familles 
• Modèle de données et format de saisie : 
EAC-CPF Contexte archivistique encodé : collectivités, personnes et 
familles (un schéma XML) 
• S’inscrit dans la réflexion sur le périmètre des données 
d’autorité 
• Notion de « contexte » 
Projet « Bibliothèque 1368-2015 » 
88
http://eac.staatsbibliothek-berlin.de 
Conçu comme une étape vers le web de 
données 
• ISAAR-CPF est centré sur la notion de provenance (producteur de 
fonds d’archives) 
• EAC-CPF s’applique à toutes les personnes mentionnées dans les 
instruments de recherche 
(information contextuelle nécessaire à la compréhension du 
contexte) 
• Deux points majeurs: 
• La question de l’identité (identifier correctement les personnes) 
• Rendre explicites les relations (dans un contexte donné) 
• Orienté données 
• Identifiants 
• Autres espaces de noms 
89
Site officiel hébergé par la 
Staatsbibliothek zu Berlin 
http://eac.staatsbibliothek-berlin.de/ 
Publication le 5 mars 2010 : 
• Schéma 
• (téléchargeable en 3 
syntaxes) 
• Dictionnaire des balises 
• Documentation vivante 
• Sera traduit dans d’autres 
langues (sur des bases 
volontaires) 
• Intégrable dans les outils de 
production
EAC-CPF et le contexte archivistique 
• 2010 à redéfinition du contexte archivistique (EAC) 
= circonstances entourant la production et l’utilisation des archives 
Information sur : les Producteurs, les Fonctions, les Sujets, les Lieux, 
etc. 
EAC 
- CPF 
- F 
- ? 
- ? 
- ? 
• EAC-CPF = se concentre seulement dans 
la description des Collectivités, Personnes et Familles 
• en tant que producteurs d’archives 
• mais aussi en tant que sujets ou ayant d’autres relations avec les documents 
d’archives
Schéma EAC-CPF 2010 
• Rigoureux mais « élégant », souple et simple d’utilisation 
• Architecture de base conforme à ISAAR(CPF) 
• Respectueux de la nature des informations (approche « ontologique ») 
• Soucieux de la cohérence interne 
• Outil de fédération de ressources existantes 
• Permet une approche « bottom-up » 
peut accueillir des informations provenant de sources extérieures 
peut inclure des segments de documents XML
93 
eac-cpf 
control 
cpfDescription 
multipleIdentities 
identity 
http://eac.staatsbibliothek-berlin.de 
description 
relations 
alternativeSet 
entityID 
entityType 
nameEntry 
nameEntryParallel 
descriptiveNote 
existDates 
localDescriptions 
place 
places 
legalStatus 
legalStatuses 
functions 
languageUsed 
languagesUsed 
occupation 
occupations 
mandate 
mandates 
structureOrGenealogy 
generalcontext 
biogHist 
cfpRelation 
resourceRelation 
functionRelation 
place 
place 
place 
legalStatus 
legalStatus 
legalStatus 
languageUsed 
languageUsed 
occupation 
occupation 
mandate 
mandate 
chronList 
function 
function 
function
EAC-CPF 
Architecture de base 
Approche « identitaire » de l’entité décrite : 
Ø Une « entité physique » peut avoir une ou plusieurs « Identités publiques » 
Ø Chacune décrite séparément dans des éléments <cpfDescription> distincts 
Ø Contenues dans l’élément englobant <multipleIdentities> 
<multipleIdentities> 
entityType 
entityType
Identités multiples • Deux identités pour 
une même personne 
• Une personne / une 
collectivité 
Vincenzo 
Gioacchino Raffaele 
Luigi Pecci 
Léon XIII 
Sébastien Cramoisy 
(1584?-1669) 
Sébastien Cramoisy 
(1584?-1669) 
imprimeur- libraire
EAC-CPF 
dans le respect d’ISAAR(CPF) 
schéma EAC-CPF ISAAR(CPF) 
5.4 Zone 
du contrôle 
5.1 Zone 
de l’identification 
5.2 Zone 
de la description 
5.3 Zone 
des relations
<nameEntryParallel> 
<nameEntry> 
ISAAR (CPF) 
5 ZONE D’IDENTIFICATION 
5.1.1 Type d’entité 
5.1.2 Forme(s) autorisée(s) du nom 
5.1.3 Formes parallèles du nom 
5.1.4 Formes du nom normalisées selon d’autres 
conventions 
5.1.5 Autres formes du nom 
5.1.6 Numéro d’immatriculation des collectivités
ISAAR(CPF) 
ZONE DE LA DESCRIPTION 
5.2.1 Dates 
d’existence 
5.2.3 Lieux 
5.2.4 Statut juridique 
5.2.5 Fonctions et 
activités 
5.2.6 Textes de 
référence 
5.2.7 Organisation 
interne/ 
généalogie 
5.2.8 Contexte 
général 
5.2.2 Histoire 
<description>
Les fonctions dans EAC-CPF 
Éléments de description 
Éléments de liens avec des 
vocabulaires contrôlés 
Articulation avec le futur 
EAC-F
Les relations dans EAC-CPF 
<relations>
Typer les relations
EAC-CPF : cohérence sémantique 
• Généralisation de l’utilisation d’un certain nombre d’éléments et 
d’attributs 
Exemple de la Note descriptive descriptiveNote 
Disponible dans : 
conventionDeclaration, cpfRelation, existDates, function, functionRelation, functions, identity, 
languageDeclaration, languageUsed, languagesUsed, legalStatus, legalStatuses, 
localDescription, localDescriptions, localTypeDeclaration, maintenanceAgency, mandate, 
mandates, occupation, occupations, place, places, resourceRelation, setComponent, source
EAC-CPF : les dates 
• L’usage des dates : 
• est généralisé (auprès de chaque élément pour 
lequel une information datée est à donner) 
• est réglementé 
Date simple 
Fourchette de dates 
Série de dates comportant 
des dates simples et/ou des 
fourchettes de dates 
Un élément <date> admet de l’information 
non normalisée 
La forme normalisée est donnée dans les 
attributs ci-contre 
Modèle des dates 
Attributs de <date>
EAC-CPF : les lieux 
• Structure de 
l’élément 
<place>
EAC-CPF : 
outil de fédération de notices d’autorité 
de provenances diverses 
<alternativeSet> 
<alternativeSet> 
<setComponent xlink:href="http://authorities.loc.gov/" xlink:type="simple"> 
<componentEntry>Bright Sparcs Record</componentEntry> 
</setComponent> 
<setComponent xlink:href="http://nla.gov.au/anbd.aut-an35335937" xlink:type="simple"> 
<componentEntry>NLA record.</componentEntry> 
</setComponent> 
<setComponent lastDateTimeVerified="2009-08-02" xlink:href="mawsonBS.xml" 
xlink:type="simple"> 
<objectXMLWrap/> 
</setComponent> 
</alternativeSet>
EAC-CPF : permet d’importer des informations 
d’autres schémas XML 
<objectXMLWrap> <objectBinWrap>
Intégrer et interconnecter l’information 
Que veut-on faire avec l’EAC-CPF ? 
ses archives 
des oeuvres sur… 
des émissions sur… 
ses amis ses lieux de vie, de passage… 
ses romans 
ses enregistrements 
ses compositions 
ses interprétations 
des images sur… 
des adaptations de ses oeuvres 
des critiques de ses oeuvres 
les textes de ses chansons 
les interprétations de 
ses compositions 
ses peintures 
…etc.
Toiles d’informations 
bibliothèques et musées oeuvrent pour: 
l’intégration, la médiation et l’échange de l’information bibliographique et muséale 
réalisation d’un modèle orienté-objet "FRBRoo" 
archives se préoccupent de mettre: 
les relations 
au coeur des systèmes d’information 
Documents 
d’archives 
Personnes 
Collectivité 
s 
Familles 
Fonctions 
sont produits et 
gérés par 
exercent 
sont créés en 
exerçant des 
Intégrant toute l’Information sur le patrimoine culturel 
souci d’interopérabilité interdomaine 
…mais sans renoncer à l’originalité de chaque domaine !
110 
Complémentarité d’informations 
Mise en regard d’une notice « noyau » et d’une notice EAC-CPF 
Note 
générale 
sur l’entité 
Identité 
Description 
contextuelle 
de l’entité 
Relations 
avec 
d’autres 
ressources 
Projet « Bibliothèque 1368-2015 » 
Lien ARK vers la 
notice du 
catalogue général
EXEMPLES D’UTILISATION
Une application 
Description EAD 
contenant des notes 
biographiques 
VIAF 
Fichier d’autorité 
international 
40 institutions 
25 millions de notices 
Notices biographiques 
dans SNAC 
Données disponibles en 
RDF 
Web de données
EAD 
(données décrivant 
le producteur d’un 
fonds) 
Autorités 
(formes du 
nom)
American numismatic society
American numismatic society
American numismatic society 
Export en RDF : 
- Ontologie archivistique par défaut 
- CIDOC-CRM 
- Ontologie SNAP (description de textes, images et videos ainsi 
que des personnes, collectivités et familles apparaissant dans 
leur contenu)
Le Projet “Bibliothèque 1368-2015”
Objectifs du projet 
• La BnF, ses entités successives, ses unités constitutives 
ont une histoire 
• à mettre en lumière 
• à rendre accessible aux chercheurs 
• à relier avec d’autres ressources/projets à la BnF et à l’extérieur 
(national, international) 
• Réaliser un outil d’aide 
• à la gestion de la production documentaire 
• et à son archivage à la BnF 
Projet « Bibliothèque 1368-2015 » 
122
La Bibliothèque 
• La « Bibliothèque » héritière de 8 siècles d’histoire 
• Une activité riche, une vie mouvementée 
• Des missions nationales 
• Une production documentaire considérable 
• Documents d’archives, pour le passé (en partie déjà dans BAM) 
• Production documentaire courante 
• Un organigramme vivant, en évolution 
• Des entités productrices de contenus (documents) 
• La Bibliothèque nationale de France aujourd’hui 
• établissement public 
• 60 départements, 2500 agents 
• Porteur de missions nationales 
Projet « Bibliothèque 1368-2015 » 
123
124 
Des missions multiples évolutives 
• Missions 
• dépôt légal et autres acquisitions 
• conservation, communication des documents 
• services et produits bibliographiques 
• expositions 
• renseignements au public 
• Tête de réseau national pour 
• l’échange de données bibliothéconomiques 
• le traitement, la description et la conservation des données numériques 
(archivage du web, Gallica, Europeana, dépôt légal numérique…) 
• S’inscrit dans des réseaux d’information nationaux et 
internationaux 
• Encyclopédiques 
• Spécialisés
Méthodologie 
• Retracer l’histoire de de la Bibliothèque à travers l’histoire de 
ses entités 
• Dimension temporelle : l’évolution de l’organigramme 
• Documenter quel service réalisait telle fonction, où, quand, 
comment, de quelle autorité et avec quels partenaires de travail. 
• Rendre compte des missions/fonctions de la Bibliothèque 
• Missions fondamentales 
• Autres fonctions organiques nécessaires à son fonctionnement 
• Dimension collaborative 
• Alimentation des notices par les acteurs eux mêmes 
• Appel à contribution déjà lancé 
Projet « Bibliothèque 1368-2015 » 
125
Les autorités en réseau autour 
de l’EAC-CPF 
Missions / 
Fonctions 
Fiches 
d’autorités 
riches 
contextualisées 
Dépôt légal 
Conservation Numérisation 
… 
Sites 
Richelieu 
Tolbiac 
Bussy 
… 
Autorités 
Collectivités 
DSR 
• IBN 
• DL 
• … 
DCO 
• DEP 
• DAV 
• … 
Délégation … 
DAP 
• … 
Autorités 
Personnes 
Jean Favier 
Jean-Noël 
Jeanneney 
Julien Cain 
… 
Projet « Bibliothèque 1368-2015 » 126
Une première réalisation : le dictionnaire 
de la BnF
MERCI !

Contenu connexe

Tendances

3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
3 focus catalogues-et_bibliothequesnumeriquespatrimoniales3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
ABES
 
Methodologie Recherche Je 15 Dec
Methodologie Recherche Je 15 DecMethodologie Recherche Je 15 Dec
Methodologie Recherche Je 15 Dec
Bibliolab
 
DBpedia - Un hub de liens dans le web des données
DBpedia - Un hub de liens dans le web des donnéesDBpedia - Un hub de liens dans le web des données
DBpedia - Un hub de liens dans le web des données
christianhbecker
 

Tendances (20)

Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"
Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"
Jabes 2021 - Session "Repenser le SI de l'Abes en période de transition(s)"
 
Anne-Violaine Szabados : L’expérience LIMC & CLAROS : pour l’élévation des do...
Anne-Violaine Szabados : L’expérience LIMC & CLAROS : pour l’élévation des do...Anne-Violaine Szabados : L’expérience LIMC & CLAROS : pour l’élévation des do...
Anne-Violaine Szabados : L’expérience LIMC & CLAROS : pour l’élévation des do...
 
Les référentiels Biblissima : épine dorsale du portail Biblissima et de IIIF-...
Les référentiels Biblissima : épine dorsale du portail Biblissima et de IIIF-...Les référentiels Biblissima : épine dorsale du portail Biblissima et de IIIF-...
Les référentiels Biblissima : épine dorsale du portail Biblissima et de IIIF-...
 
Web sémantique
Web sémantiqueWeb sémantique
Web sémantique
 
3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
3 focus catalogues-et_bibliothequesnumeriquespatrimoniales3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
 
L'évolution des catalogues
L'évolution des cataloguesL'évolution des catalogues
L'évolution des catalogues
 
L'évolution des catalogues
L'évolution des cataloguesL'évolution des catalogues
L'évolution des catalogues
 
Methodologie Recherche Je 15 Dec
Methodologie Recherche Je 15 DecMethodologie Recherche Je 15 Dec
Methodologie Recherche Je 15 Dec
 
Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...
Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...
Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...
 
Les « Données de la recherche » : définitions, enjeux et perspectives pour...
Les « Données de la recherche » : définitions, enjeux et perspectives pour...Les « Données de la recherche » : définitions, enjeux et perspectives pour...
Les « Données de la recherche » : définitions, enjeux et perspectives pour...
 
Du bon usage de google : la recherche d'information sur le Web
Du bon usage de google : la recherche d'information sur le WebDu bon usage de google : la recherche d'information sur le Web
Du bon usage de google : la recherche d'information sur le Web
 
JABES 2017 - Intégrer IdRef à l'exemple de Persée
JABES 2017 - Intégrer IdRef à l'exemple de PerséeJABES 2017 - Intégrer IdRef à l'exemple de Persée
JABES 2017 - Intégrer IdRef à l'exemple de Persée
 
Parcours Sudoc - Quelle trajectoire pour les catalogues français dans le web ...
Parcours Sudoc - Quelle trajectoire pour les catalogues français dans le web ...Parcours Sudoc - Quelle trajectoire pour les catalogues français dans le web ...
Parcours Sudoc - Quelle trajectoire pour les catalogues français dans le web ...
 
Open data & linked data
Open data & linked dataOpen data & linked data
Open data & linked data
 
DBpedia - Un hub de liens dans le web des données
DBpedia - Un hub de liens dans le web des donnéesDBpedia - Un hub de liens dans le web des données
DBpedia - Un hub de liens dans le web des données
 
Baromètre d’accessibilité des bibliothèques
Baromètre d’accessibilité des bibliothèques Baromètre d’accessibilité des bibliothèques
Baromètre d’accessibilité des bibliothèques
 
Les catalogues sur le Web
Les catalogues sur le WebLes catalogues sur le Web
Les catalogues sur le Web
 
Nouveaux catalogues de bibliothèques
Nouveaux catalogues de bibliothèquesNouveaux catalogues de bibliothèques
Nouveaux catalogues de bibliothèques
 
Abes Adbs2411
Abes Adbs2411Abes Adbs2411
Abes Adbs2411
 
Open Data portals Global Review 2013
Open Data portals Global Review 2013Open Data portals Global Review 2013
Open Data portals Global Review 2013
 

En vedette

Voeux 2013
Voeux 2013Voeux 2013
Voeux 2013
jlgardie
 
Responsabilite du transporteur pendant l'expedition maritime
Responsabilite du transporteur pendant l'expedition maritimeResponsabilite du transporteur pendant l'expedition maritime
Responsabilite du transporteur pendant l'expedition maritime
Rabah HELAL
 
ámbito social
ámbito socialámbito social
ámbito social
moronad45
 
Chapitre 2 cours 3eme
Chapitre 2 cours 3emeChapitre 2 cours 3eme
Chapitre 2 cours 3eme
Hanfi Akram
 
Manualde Mantenimiento
Manualde MantenimientoManualde Mantenimiento
Manualde Mantenimiento
Miki Alexander
 
Navidad presentación
Navidad presentaciónNavidad presentación
Navidad presentación
pacozamora1
 
Pale 2010 propuesta educacion infantil
Pale 2010  propuesta  educacion infantilPale 2010  propuesta  educacion infantil
Pale 2010 propuesta educacion infantil
Nieves Tricio
 
Tarea1­ auxiliadora matas
Tarea1­ auxiliadora matasTarea1­ auxiliadora matas
Tarea1­ auxiliadora matas
auximh
 

En vedette (20)

Dossier presse Etude Efficacité Energétique UFE
Dossier presse Etude Efficacité Energétique UFEDossier presse Etude Efficacité Energétique UFE
Dossier presse Etude Efficacité Energétique UFE
 
Marketing y difusión cultural de los archivos
Marketing y difusión cultural de los archivosMarketing y difusión cultural de los archivos
Marketing y difusión cultural de los archivos
 
rapportDigital-TV
rapportDigital-TVrapportDigital-TV
rapportDigital-TV
 
Assistance technique sur le lieu de vie des personnes âgées dépendantes - Agn...
Assistance technique sur le lieu de vie des personnes âgées dépendantes - Agn...Assistance technique sur le lieu de vie des personnes âgées dépendantes - Agn...
Assistance technique sur le lieu de vie des personnes âgées dépendantes - Agn...
 
Voeux 2013
Voeux 2013Voeux 2013
Voeux 2013
 
Responsabilite du transporteur pendant l'expedition maritime
Responsabilite du transporteur pendant l'expedition maritimeResponsabilite du transporteur pendant l'expedition maritime
Responsabilite du transporteur pendant l'expedition maritime
 
ámbito social
ámbito socialámbito social
ámbito social
 
Chapitre 2 cours 3eme
Chapitre 2 cours 3emeChapitre 2 cours 3eme
Chapitre 2 cours 3eme
 
Résumé deloitte tmt predictions 2013 ci
Résumé deloitte tmt predictions 2013 ciRésumé deloitte tmt predictions 2013 ci
Résumé deloitte tmt predictions 2013 ci
 
Manualde Mantenimiento
Manualde MantenimientoManualde Mantenimiento
Manualde Mantenimiento
 
My Health Journal Spa
My Health Journal  SpaMy Health Journal  Spa
My Health Journal Spa
 
Compu training relay
Compu training relayCompu training relay
Compu training relay
 
Frases de..[2]
Frases de..[2]Frases de..[2]
Frases de..[2]
 
Navidad presentación
Navidad presentaciónNavidad presentación
Navidad presentación
 
P. A L. E F I
P. A L. E  F IP. A L. E  F I
P. A L. E F I
 
Pale 2010 propuesta educacion infantil
Pale 2010  propuesta  educacion infantilPale 2010  propuesta  educacion infantil
Pale 2010 propuesta educacion infantil
 
Platon.pptx
 Platon.pptx  Platon.pptx
Platon.pptx
 
Guide 70e
Guide 70eGuide 70e
Guide 70e
 
Itesm liderazgo-herramienta
Itesm  liderazgo-herramientaItesm  liderazgo-herramienta
Itesm liderazgo-herramienta
 
Tarea1­ auxiliadora matas
Tarea1­ auxiliadora matasTarea1­ auxiliadora matas
Tarea1­ auxiliadora matas
 

Similaire à Contrôle d'autorité : enjeux et outils (Vincent Boulet)

Quelques repères sur le Web sémantique / Web de données
Quelques repères sur le Web sémantique / Web de donnéesQuelques repères sur le Web sémantique / Web de données
Quelques repères sur le Web sémantique / Web de données
Be_Sa
 
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
olivier
 

Similaire à Contrôle d'autorité : enjeux et outils (Vincent Boulet) (20)

Jabes 2010 - Session plénière "Des autorités aux autorités enrichies : vers u...
Jabes 2010 - Session plénière "Des autorités aux autorités enrichies : vers u...Jabes 2010 - Session plénière "Des autorités aux autorités enrichies : vers u...
Jabes 2010 - Session plénière "Des autorités aux autorités enrichies : vers u...
 
Anila Angjeli : ISNI - Les enjeux d’un identifiant international pour les per...
Anila Angjeli : ISNI - Les enjeux d’un identifiant international pour les per...Anila Angjeli : ISNI - Les enjeux d’un identifiant international pour les per...
Anila Angjeli : ISNI - Les enjeux d’un identifiant international pour les per...
 
Au dela des autorites du Sudoc
Au dela des autorites du SudocAu dela des autorites du Sudoc
Au dela des autorites du Sudoc
 
Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...Données de la recherche : quel positionnement et quels rôles pour les bibliot...
Données de la recherche : quel positionnement et quels rôles pour les bibliot...
 
Retour d’expérience sur l’implémentation des identifiants ISNI à la BnF - 2 o...
Retour d’expérience sur l’implémentation des identifiants ISNI à la BnF - 2 o...Retour d’expérience sur l’implémentation des identifiants ISNI à la BnF - 2 o...
Retour d’expérience sur l’implémentation des identifiants ISNI à la BnF - 2 o...
 
Formation à la recherche documentaire Master SACIM
Formation à la recherche documentaire Master SACIMFormation à la recherche documentaire Master SACIM
Formation à la recherche documentaire Master SACIM
 
Quelques repères sur le Web sémantique / Web de données
Quelques repères sur le Web sémantique / Web de donnéesQuelques repères sur le Web sémantique / Web de données
Quelques repères sur le Web sémantique / Web de données
 
Formation documentaire doctorants-fev-15
Formation documentaire doctorants-fev-15Formation documentaire doctorants-fev-15
Formation documentaire doctorants-fev-15
 
Ina-formation-collecter-temoignages-2016_12_05
Ina-formation-collecter-temoignages-2016_12_05Ina-formation-collecter-temoignages-2016_12_05
Ina-formation-collecter-temoignages-2016_12_05
 
Collecter, produire et enregistrer des témoignages _ INA Juin 2016
Collecter, produire et enregistrer des témoignages _ INA Juin 2016Collecter, produire et enregistrer des témoignages _ INA Juin 2016
Collecter, produire et enregistrer des témoignages _ INA Juin 2016
 
Veille et production de la norme juridique
Veille et production de la norme juridiqueVeille et production de la norme juridique
Veille et production de la norme juridique
 
Production, diffusion et traitements documentaires du droit français
Production, diffusion et traitements documentaires du droit françaisProduction, diffusion et traitements documentaires du droit français
Production, diffusion et traitements documentaires du droit français
 
Présentation du web de données
Présentation du web de donnéesPrésentation du web de données
Présentation du web de données
 
Evolution de la place de l'usager en bibliothèque
Evolution de la place de l'usager en bibliothèqueEvolution de la place de l'usager en bibliothèque
Evolution de la place de l'usager en bibliothèque
 
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
 
Cersic: culture informationnelle et institutions
Cersic: culture informationnelle et institutionsCersic: culture informationnelle et institutions
Cersic: culture informationnelle et institutions
 
Profil ertzscheid - copie
Profil ertzscheid - copieProfil ertzscheid - copie
Profil ertzscheid - copie
 
Information Scientifique et Technique : pour des moteurs efficaces, liberez l...
Information Scientifique et Technique : pour des moteurs efficaces, liberez l...Information Scientifique et Technique : pour des moteurs efficaces, liberez l...
Information Scientifique et Technique : pour des moteurs efficaces, liberez l...
 
Formation à la recherche documentaire - Master 1 SACIM
Formation à la recherche documentaire - Master 1 SACIMFormation à la recherche documentaire - Master 1 SACIM
Formation à la recherche documentaire - Master 1 SACIM
 
Veille juridique et production informatique du droit 2016
Veille juridique et production informatique du droit 2016Veille juridique et production informatique du droit 2016
Veille juridique et production informatique du droit 2016
 

Plus de Equipex Biblissima

Plus de Equipex Biblissima (20)

Da Biblissima a Biblissima+ : per un osservatorio delle culture scritte
Da Biblissima a Biblissima+ : per un osservatorio delle culture scritteDa Biblissima a Biblissima+ : per un osservatorio delle culture scritte
Da Biblissima a Biblissima+ : per un osservatorio delle culture scritte
 
eScriptorium: An Open Source Platform for Historical Document Analysis
eScriptorium: An Open Source Platform for Historical Document AnalysiseScriptorium: An Open Source Platform for Historical Document Analysis
eScriptorium: An Open Source Platform for Historical Document Analysis
 
Annotate (E-ReColNat) : annotation rapide d’images et de vidéos en sciences n...
Annotate (E-ReColNat) : annotation rapide d’images et de vidéos en sciences n...Annotate (E-ReColNat) : annotation rapide d’images et de vidéos en sciences n...
Annotate (E-ReColNat) : annotation rapide d’images et de vidéos en sciences n...
 
Appliquer les techniques d'apprentissage profond pour détecter les enluminure...
Appliquer les techniques d'apprentissage profond pour détecter les enluminure...Appliquer les techniques d'apprentissage profond pour détecter les enluminure...
Appliquer les techniques d'apprentissage profond pour détecter les enluminure...
 
Représentations du chant du Moyen Âge dans les images IIIF
Représentations du chant du Moyen Âge dans les images IIIFReprésentations du chant du Moyen Âge dans les images IIIF
Représentations du chant du Moyen Âge dans les images IIIF
 
Réflexions et explorations croisées autour de IIIF, Omeka-s et NumaHOP à la B...
Réflexions et explorations croisées autour de IIIF, Omeka-s et NumaHOP à la B...Réflexions et explorations croisées autour de IIIF, Omeka-s et NumaHOP à la B...
Réflexions et explorations croisées autour de IIIF, Omeka-s et NumaHOP à la B...
 
Mise en œuvre de IIIF pour la reconnaissance automatique de documents
Mise en œuvre de IIIF pour la reconnaissance automatique de documentsMise en œuvre de IIIF pour la reconnaissance automatique de documents
Mise en œuvre de IIIF pour la reconnaissance automatique de documents
 
Nakala et IIIF
Nakala et IIIFNakala et IIIF
Nakala et IIIF
 
Actualités et perspectives de IIIF
Actualités et perspectives de IIIFActualités et perspectives de IIIF
Actualités et perspectives de IIIF
 
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIF
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIFMieux diffuser et valoriser ses images sur le Web grâce aux standards IIIF
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIF
 
Digital Manuscripts Without Borders: A Discovery Platform of Manuscripts and ...
Digital Manuscripts Without Borders: A Discovery Platform of Manuscripts and ...Digital Manuscripts Without Borders: A Discovery Platform of Manuscripts and ...
Digital Manuscripts Without Borders: A Discovery Platform of Manuscripts and ...
 
IIIF360: A Service to Support and Promote IIIF in France
IIIF360: A Service to Support and Promote IIIF in FranceIIIF360: A Service to Support and Promote IIIF in France
IIIF360: A Service to Support and Promote IIIF in France
 
The Biblissima Authority File of Geographical Names
The Biblissima Authority File of Geographical NamesThe Biblissima Authority File of Geographical Names
The Biblissima Authority File of Geographical Names
 
Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)
Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)
Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)
 
Biblissima: Connecting Manuscripts Collections
Biblissima: Connecting Manuscripts CollectionsBiblissima: Connecting Manuscripts Collections
Biblissima: Connecting Manuscripts Collections
 
IIIF et Biblissima
IIIF et BiblissimaIIIF et Biblissima
IIIF et Biblissima
 
A la recherche du patrimoine écrit avec le portail Biblissima
A la recherche du patrimoine écrit avec le portail BiblissimaA la recherche du patrimoine écrit avec le portail Biblissima
A la recherche du patrimoine écrit avec le portail Biblissima
 
Browse and Visualize Manuscripts Illuminations with IIIF
Browse and Visualize Manuscripts Illuminations with IIIFBrowse and Visualize Manuscripts Illuminations with IIIF
Browse and Visualize Manuscripts Illuminations with IIIF
 
Les descripteurs des bases iconographiques Mandragore (BnF) et Initiale (IRHT...
Les descripteurs des bases iconographiques Mandragore (BnF) et Initiale (IRHT...Les descripteurs des bases iconographiques Mandragore (BnF) et Initiale (IRHT...
Les descripteurs des bases iconographiques Mandragore (BnF) et Initiale (IRHT...
 
A la recherche du patrimoine écrit avec le portail Biblissima
A la recherche du patrimoine écrit avec le portail BiblissimaA la recherche du patrimoine écrit avec le portail Biblissima
A la recherche du patrimoine écrit avec le portail Biblissima
 

Contrôle d'autorité : enjeux et outils (Vincent Boulet)

  • 1. CONTRÔLE D’AUTORITÉ : ENJEUX ET OUTILS Modélisation des données et humanités numériques 1er décembre 2014 Vincent Boulet Expert en autorités, BnF http://viaf.org/viaf/196147503/ ISNI 0000 0003 5723 4556
  • 2. sommaire • Le contrôle d’autorité : qu’est-ce que c’est ? • Données d’autorité / web de données / identifiants / ISNI • Des réservoirs de données d’autorité en évolution • BnF / VIAF • Les données d’autorité et les données prosopographiques • L’EAC-CPF : un format international structuré et extensible • Quelques réalisations en EAC-CPF dans des domaines variés: • SNAC (social network and archival context) • American numismatic society
  • 4. Partons d’un exemple : Jean Gerson Statue de Jean Gerson par Joseph Félon (1818-1896) dans une niche de la façade de la Chapelle de la Sorbonne à Paris http:// commons.wikimedia.or g/wiki/ File:Jean_Gerson_Sor bonne_statue.jpg
  • 5. Jean Gerson à la BnF Tractatus Johannis Gersonis, Cancellarii Parisiensis, contra superstitiosam dierum observationem, praesertim innocentum Publié par Michael Hering, Hambourg, 1624 Numérisé dans Gallica http://gallica.bnf.fr/ark:/12148/ bpt6k10404880
  • 6. Jean Gerson à la BnF Cy commence ung traictié compilé et fait par homme de grant science maistre Jehan Jarson, maistre en theologie, chancelier de Nostre Dame de Paris, contre aucunes erreurs et mauvaises doctrines et exemples qui sont contenues ou Roumant de la Rouse en plusieurs lieux comme cy aprés est contenu
  • 7. Jean Gerson à la BnF Collection Michel Hennin. Estampes relatives à l'Histoire de France Portrait de J. Gerson http://gallica.bnf.fr/ark:/12148/btv1b8400155c
  • 8. Jean Gerson à la BnF Collection Michel Hennin. Estampes relatives à l'Histoire de France Portrait de J. Gerson, en pied, se dirigeant vers la gauche et suivi d'un chien http://gallica.bnf.fr/ark:/12148/btv1b84001576
  • 9. Besoins 9 • Identification de manière univoque des entités cataloguées : de qui, de quoi parle-t-on? • Explicitation de l’implicite des notices bibliographiques
  • 10. Besoins 10 • Outil de navigation dans les ressources de la BnF, pour la recherche • Centralisation des différentes formes du nom
  • 11. Besoins 11 • Outil de navigation dans les ressources de la BnF • Par les liens entre notices descriptives (bibliographiques, archivistiques) et les notices d’autorité
  • 12. Une « notice d’autorité »
  • 13.
  • 14.
  • 15.
  • 16. • Un « fichier d’autorité » Cocteau, Jean (1889-1963) Personne physique Hahn, Reynaldo (1874-1947) [le dieu bleu (ballet)] Titre musical La belle et la bête (film) Titre conventionnel Groupe des Six [Les mariés de la Tour Eiffel] Titre musical Groupe des Six Collectivité
  • 17. 17 Les objectifs du contrôle d’autorité (FRAD : functional requirements for authority data) • trouver • des informations sur les entités décrites par les données d’autorité • identifier • confirmer que l’entité trouvée correspond bien à la recherche • distinguer entre des entités analogues • contextualiser • expliciter les relations entre les entités, ou entre une entité et un nom (par exemple : nom d’alliance, pseudonyme…) • justifier • les choix du catalogueur (par exemple : justifier par une source une forme rejetée) ⇒ Une notice d’autorité n’est pas une notice biographique mais fournit des données « noyau », fondamentales, réutilisables pour des usages différents ⇒ Importance des identifiants pérennes (ARK) ⇒ Importance des identifiants internationaux (ISNI)
  • 18.
  • 19. FRBR : le rôle central des autorités 19 OEuvre Expression Manifestation Item Personne Collectivité Concept Objet Événement Lieu réalisée dans matérialisée dans exemplifiée par Famille Entités Groupe 1 Entités Groupe 2 Entités Groupe 3
  • 20. FRBR : le rôle central des autorités 20 OEuvre Expression Manifestation Item Personne Collectivité Concept Objet Événement Lieu réalisée dans matérialisée dans exemplifiée par Famille Entités Groupe 1 Entités Groupe 2 Entités Groupe 3
  • 21. 21 Les relations dans le modèle FRBR OEuvre Expression Manifestation Item Personne Famille Collectivité Concept Objet Événement Lieu créée par réalisée par produite par possédé par Entités Groupe 1 Entités Groupe 2 Entités Groupe 3 Relations Groupe 1 / Groupe 2 Relations de responsabilité
  • 22. DEV 10 - 2013 22 Après le modèle FRBR • 1999 : création d’un autre groupe de travail pour étendre le modèle FRBR aux données d’autorité • 2009 : publication du Rapport final sur les fonctionnalités requises des données d’autorité (FRAD, Functional requirements for authority data) • le modèle FRAD n’en est qu’une partie
  • 23. DEV 10 - 2013 23 Le Rapport final FRAD • Objectifs : • Définir les fonctionnalités requises des données indispensables au contrôle d’autorité • gestion des points d’accès dans un catalogue • identification des entités représentées par ces points d’accès • pour permettre • de répondre aux besoins des utilisateurs des données d’autorité • de partager et de réutiliser les données d’autorité • Le modèle met l’accent sur les données, non sur leur organisation dans des notices
  • 24. FRAD : un « modèle Conceptuel » ⇒ Que met-on dans une notice d’autorité ⇒ Avec quelles données? Notion de données d’autorité
  • 25. Personne/nom/point d’accès contrôlé Entité bibliographique personne / collectivité Nom et/ou Identifiant Point d’accès contrôlé Gerson, Jean (1363-1429) Connue par Base pour Jean Gerson ISNI : 0000 0001 2145 048X
  • 26. De la notice aux données (FRAD) : les attributs d’une personne 26 Date Titre Sexe Lieu de Une personne naissance Lieu de mort Pays Lieu de résidence Affiliation Adresse Langue Domaine d’activité Professio n/ occupatio n Biographie /histoire Autre informatio n
  • 27. Les données d’autorité après FRBR et FRAD • Des données d’autorité acquièrent une importance nouvelle • Pas simplement une notice d’autorité fournissant un point d’accès à une notice bibliographique • La « notice » est un assemblage de données • Les données circulent et sont visibles par tous : enjeu du Web • FRBR et FRAD sont des documents de référence internationaux : une première pour les autorités • Ce ne sont pas des normes mais des modèles conceptuels • Appellent à la rédaction de nouvelles normes, portant sur l’ensemble des données d’autorité et pas uniquement sur les formes retenues
  • 28. Les enjeux posés par le Web et le Web de données
  • 29. Le contexte du Web : les autorités et les moteurs de recherche
  • 30.
  • 31. Importance des référentiels • Désambiguisation • Panachage 31
  • 32. • Découverte • Importance des entités : informations regroupées autour d’un concept
  • 33. Le lecteur souhaite accéder à des… 33 auteurs éditeurs organisations notions oeuvres personnes à des contenus et des informations objets événements lieux livres films oeuvres musicales sites web… www
  • 34. L’économie appliquée au web : le modèle de la longue traîne Le web a ouvert l’ère des marchés de niche et des « non-succès 34 » Article Chris Anderson The Wire http://www.internetactu.net/2005/04/12/la-longue-traine/
  • 35. Dépasser une contradiction D’une part… Les catalogues constituent des silos : pour trouver les ressources liées à un centre d’intérêt L’usager souhaite s’en servir pour fiabiliser sa recherche
  • 36. Mais…. Les métadonnées : un trésor sur le web • Des données validées • Créées par un professionnel de la description de ressources • Des données contextualisées • Les informations sont précisées par une source et une date • Pérennité des accès et citations • ARK, autres identifiants • Généralement l’identifiant est envisagé sur le très long terme • Utilisateurs tiers • Tradition d’une offre de services • Désintéressement financier
  • 38. Des pages web pour les moteurs de recherche et pour les humains Collections numérisées (2,4 M) Des pages web Catalogue général (15,3 M) pour les humains Des données structurées pour les machines BnF Archives et manuscrits Traitements automatiques : alignements, regroupements
  • 39. Ouverture technique et juridique des données
  • 40. 1/ Des données visibles sur le web Ø Rendre visibles ces données en les rendant indexables par les moteurs du Web +80 % des visiteurs viennent des moteurs de recherche Ø Une porte d’entrée vers les applications existantes 60 % des visiteurs de data.bnf.fr vont ensuite vers Gallica et les catalogues Recherche : exemple Baldus de Ubaldis, Exquemelin, stanze de politien, proverbes mandingues, cesare beccaria des delits et des peines ed 1821 christine de pisan
  • 41. 2/ Regrouper les données sur des pages simples > Organiser des pages « pivots » sur les oeuvres, les auteurs, les thèmes /
  • 43. 3/Se lier sur le web § Lier ces données à d’autres jeux de données du Web
  • 45. 4/Encourager les utilisations § Par les bibliothèques § et bien au-delà : recherche, tourisme, édition… grâce à l’ouverture juridique et technique des métadonnées.
  • 46. • Ils récupèrent nos données http://www.ifverso.com/fr/content/robur-le-conquerant-14 http://www.rechercheisidore.fr/ http://data.abuledu.org Fédération Des ensembles Vocaux et Instrumentaux Spécialisés
  • 47. De l’échange de notices au partage des données • Ouverture technique et juridique des données => évolution dans le partage international du travail • Éviter la redondance du travail • Plus facile d’identifier les entités nationales (proximité des sources) = mais cette notion est à revoir dans le contexte du Web • => notion de confiance, de champ d’expertise • De la normalisation des notices pour pouvoir les échanger à la structuration des données pour pouvoir les partager • Non, la normalisation et l’expertise ne sont pas mis à mort par le Web
  • 48. Données existantes : des liens, des autorités et des identifiants
  • 49. ISO 27729 International Standard Name Identifier Identités publiques pour Personnes et collectivités Permet d’identifier au niveau international « les individus et les organismes qui contribuent aux oeuvres de création, notamment les écrivains, artistes , créateurs, interprètes, chercheurs, producteurs, éditeurs etc. » e.g.: ISNI 0000 0001 2133 4104 § Périmètre universel § Unique § Pérenne § Administré de manière centralisée § Exprimé comme une URI : http://isni.org/isni/0000000121334104 www.isni.org
  • 50. Les notices de VIAF constituent le socle de la base ISNI. Elles sont confrontées aux données des autres contributeurs d’ISNI 41 institutions partenaires En France : la BnF et le SUDOC Les notices sur les personnes et les collectivités des partenaires sont regroupées en grappes LA BASE ISNI, CONSTRUITE À PARTIR DE VIAF Autres contributeurs Novembre 2013 50 http://www.isni.org/
  • 51. Périmètre de VIAF et d’ISNI 6,74 millions Clusters VIAF contiennent un ISNI 7,98 millions ISNI assignés - Clusters VIAF ne remplissant pas les critères d’assignation des ISNI (clusters avec une seule source…)
  • 52. IdenGtés publiques 1 personne, 2 idenGtés publiquesº 2 ISNI séparés Cornwell, David John Le Carré, John (pseudonyme) Moore (vrai nom) ISNI Quality Team Image from: http://kids.britannica.com/comptons/art-149833/John-le-Carre La relation est publique Pour les personnes décédées après 1900
  • 53. Les contributeurs d’ISNI : un croisement de multiples domaines (liste non exhaustive) Bibliothèques Droits textes Droits Musique Sources commerciales Encyclopédies Recherche Autres sources domaine culture (archives, art contemporain, etc.)
  • 54. IDs Internationaux Communités spécifiqus d’utilisateurs IDs locaux (chaque institution – son ID système, en local) GND (Allemagne DNB + cooperative ) IdRef (ABES Universités françaises) International Standard Mondial Inter-domaine IPI Internationa l CISAC auteurs/ compositeu rs IPD Internation al interprètes Les différents types d’idenGfiants / pont entre les données IDs operant au niveau regional/ consortium DAI Pays Bas Chercheur s VIAF ID Bibliothèqu es et + Gestion droits (interprètes) Universités françaises bibliothèques Institutions de recherche ARK ID (fichiers autorité) Bibliothèques publiques France NACO (LC + cooperative) Institutions danoises Gestion droits (auteurs, Allemagne compositeurs) bibliothèques + Editeurs Gestion droits (textes) NACO bibliothèque s membres E X E M P L E S (ARK ID) Archives (US+) z Archives
  • 55. 55
  • 57. Un fichier évolutif : avoir des données fiables et sourcées • Mises à jour, corrections incessantes • Importance des sources primaires, y compris archivistiques
  • 58. 58 Que veut-on faire dire à une notice d’autorité du catalogue? + Contexte … etc. + Contexte Archives + Contexte Enluminures + Contexte Manuscrits + Contexte Reliures Info noyau
  • 59. Ou bien, si besoin … 59 Info noyau + Contexte Archives + Contexte … etc. + Contexte Enluminures + Contexte Manuscrits + Contexte Objet + Contexte Reliures + Contexte Archives sonores + Contexte Médailles
  • 60. 60 Contexte Reliures François Ier (roi de France ; 1494-1547) forme internationale français Informations « noyau », valables pour tout contexte Lien ARK spécifique
  • 61. Données d’autorité contextuelles en réseau BnF Autorités Info « noyau » (MARC) Monnaies ??? Reliures Autorités Contextuelles <XML TEI> Globes contexte MARC <MARC-XML> BnF archives institutionelles Autorités Contextuelles <EAC-CPF>?? Reseau bibliophilie Autres bases Reliures et autres archives
  • 62. , " & # " Entités nommées: Personnes Collectivités Familles … noeuds communs entre ressources
  • 63. Un nouveau contexte normatif international • Nouveau code de catalogage : • Ambition de prendre en compte FRBR, FRAD et enjeux du Web • Pas seulement la construction des noms mais l’ensemble des données d’autorité • RDA comme référence hors du monde des bibliothèques • Un code unique : traite de toutes les entités FRBR et de leurs relations • Entités du Groupe 2 FRBR (les Agents) en font partie intégrante
  • 64. Contexte normaGf -­‐ internaGonal Archives • Normalisation ISAAR (CPF) : Norme Internationale sur les notices d’autorité utilisées pour les Archives relatives aux collectivités, aux personnes ou aux familles, 2e éd – 2004 (1e éd 1996) • Norme sur le contenu des notices d’autorité • Pour la structuration des points d’accès à renvoie vers les normes et bonnes pratiques spécifiques appliquées dans des contextes locaux • Modélisation – travaux en cours ICA par Groupe d’experts sur la description archivistique (EGAD) – But : appréhender l’information archivistique dans son ensemble (y compris les producteurs et autres « acteurs »)
  • 65. Contexte normaGf -­‐ internaGonal Communauté documentaGon et KOS (Knowledge OrganizaGon Systems) • Norme sur les Thésaurus ISO 25964 Thésaurus et interopérabilité avec d'autres vocabulaires • cadre englobant – fait référence aux entités nommées et listes d’autorités (y compris personnes, collectivités, familles) dans la partie sur l’interopérabilité • Mais aussi … codes de catalogage et bonnes pratiques utilisés par de producteurs de données d’autorité sur les personnes et les collectivités Ex : – ULAN (Union List of Artists’ Names) de Getty
  • 66. Au niveau naGonal : iniGaGves en cours • Groupe technique AFNOR GC 46 CN46-9/GE 6 RDA en France • Projet de norme en cours porte sur le Groupe 2 des entités FRBR (Personnes, Collectivités, Familles) • But : faire évoluer les règles de catalogage • Les adapter au nouveau contexte • Favoriser la FRBRisation des catalogues • Porter les données des bibliothèques sur le Web Sémantique Bibliothèques
  • 67. Au niveau naGonal : iniGaGves en cours Archives • Groupe de travail AAF/SIAF Notices d’autorité Producteurs ISAAR(CPF) depuis 2010 But : Réaliser un Référentiel national proposant – des formes autorisées du nom pour l’administration territoriale (1800 à nos jours) – des descriptions normalisées des organismes types, selon la norme ISAAR(CPF) http://www.archivistes.org/Notices-d-autorite-producteurs- 1781
  • 68. Au niveau naGonal : iniGaGves en cours Ministère de la Culture et de la CommunicaGon • Cadre: programme HADOC (Harmonisation des données culturelles) • Modèle harmonisé pour la production des données culturelles (références: Norme ISO 25964, modèles CRM et FRBRoo) • Comprend : Modèle « Acteur » • Cadre d’action: « Référentiel des acteurs historiques »
  • 69. Briatte, Katell. Atelier « Passées dans le présents », 10 avril 2014 http://passes-present.eu/sites/default/files/projets/intervention_hadoc_briatte.pdf
  • 70. Vers une norme française des « agents » ? oui, c’est possible ü Parce que les normes existantes sont obsolètes besoin de les réviser ü Parce qu’il y a besoin d’une démarche globale sur tout ce qui a trait aux Agents (Personnes, Collectivités, Familles) ü Pour faire le lien avec le contexte international « Agir local – Penser global » ü Parce que l’environnement technologique le permet ü Parce qu’il y a besoin de rassembler l’ensemble de la profession info doc pour répondre aux besoins d’interopérabilité Agents – point commun entre jeux de données
  • 71. Virtual internaGonal authority file • 1978 : premières discussions sur un fichier d’autorité international • 2003 : Research prototype (LC, DNB) • 2007 : BnF rejoint VIAF • 2012 : Nouvelle organisation • service • VIAF Council • 2012 : Open data • 2014 : Nouveaux critères d’adhésion www.viaf.org 41 insGtuGons et projets 26 millions de clusters Tout est gratuit !
  • 73. Les réseaux nationaux et régionaux
  • 74. DES DONNEES DE NICHE
  • 75.
  • 76. La « philosophie » de viaf « Car aucune chose ne devient ni ne périt, mais elle se mêle ou se sépare de choses qui sont. Ainsi on dirait à bon droit « se composer » au lieu de « devenir » et « se décomposer » au lieu de « périr » Fragments d’Anaxagore, « sur la nature », 17 http://viaf.org/viaf/294235617 Ἀναξαγόρας http://viaf.org/viaf/24645587
  • 77. • Aucune donnée n’est créée dans VIAF • Toutes les données traitées par VIAF proviennent des partenaires de VIAF • VIAF c’est un appariement de données • On parle de grappe ou de « cluster » VIAF : rapprochement entre les différentes notices des différents partenaires • Les données viennent du fichier d’autorité et du fichier bibliographique qui y est lié • VIAF ne choisit pas entre les « bonnes » et les « mauvaises » données, il reste neutre entre les différents partenaires (sauf cas particuliers) • Plus les données sont complètes et justes, plus les algorithmes de VIAF sont performants • Importance du travail sur les données à la source
  • 78. Récupération des données de VIAF • En gros : • Au détail : - Un dump RDF • RDF/XML « neutre »/ - Marc 21 XML Marc 21 XML / JSON - Un service SRU - Possibilité de construire de petites applications web d’interrogation
  • 79. Le RDF de VIAF • Elaboré en 2011, totalement revu • Parti pris de la simplicité • Pour une interopérabilité très large • Deux parties : • Chaque contibuteur distingué (skos) • Le cluster en soit (schema.org)
  • 80. Bilan : VIAF et le contrôle d’autorité interna9onal - Fédère et compare les données Toutes les données sont visibles Interconnecte - Visibilité sur le Web - Linked Open Data - Partage de la connaissance - Partage de l’expertise La qualité des données est aussi visible ☛ Question centrale de la qualité des données ☛ Les partenaires sont responsables de ce qu’ils fournissent
  • 82. DONNÉES D’AUTORITÉ ET DONNÉES PROSOPOGRAPHIQUES
  • 83. Prosopographie • Définition : « La prosopographie est l’étude d’une micro-population à partir des biographies des membres qui la composent. Il ne s’agit donc pas d’une simple étude statistique, car cette méthode consiste à mettre en relation tous les parcours biographiques, sans faire de ces individus des anonymes » Site du Laboratoire de Médiévistique Occidentale de Paris, Université Paris-I Panthéon Sorbonne
  • 84. Prosopographie • Définition : « La prosopographie est l’étude d’une micro-population à partir des biographies des membres qui la composent. Il ne s’agit donc pas d’une simple étude statistique, car cette méthode consiste à mettre en relation tous les parcours biographiques, sans faire de ces individus des anonymes » Site du Laboratoire de Médiévistique Occidentale de Paris, Université Paris-I Panthéon Sorbonne
  • 85. Données d’autorité et prosopographie Données d’autorité contrôlées « noyau » Noms, identifiants, sources Identifiants (ISNI) Réservoirs de données nationaux et internationaux (BnF, VIAF...)
  • 86. Données d’autorité et prosopographie Données d’autorité contrôlées « noyau » Noms, identifiants, sources Identifiants (ISNI) Réservoirs de données nationaux et internationaux (BnF, VIAF...) Individus Micro-population Biographies Relations Description des individus dans un contexte particulier, selon un angle particulier Relations
  • 87. L’EAC-CPF Un format international, documenté, ouvert
  • 88. Données d’autorité contextuelles • Un projet de données d’autorité de type archivistiques • Norme de contenu des notices : ISAAR(CPF) – Norme internationale sur les Autorités archivistiques: collectivités, personnes, familles • Modèle de données et format de saisie : EAC-CPF Contexte archivistique encodé : collectivités, personnes et familles (un schéma XML) • S’inscrit dans la réflexion sur le périmètre des données d’autorité • Notion de « contexte » Projet « Bibliothèque 1368-2015 » 88
  • 89. http://eac.staatsbibliothek-berlin.de Conçu comme une étape vers le web de données • ISAAR-CPF est centré sur la notion de provenance (producteur de fonds d’archives) • EAC-CPF s’applique à toutes les personnes mentionnées dans les instruments de recherche (information contextuelle nécessaire à la compréhension du contexte) • Deux points majeurs: • La question de l’identité (identifier correctement les personnes) • Rendre explicites les relations (dans un contexte donné) • Orienté données • Identifiants • Autres espaces de noms 89
  • 90. Site officiel hébergé par la Staatsbibliothek zu Berlin http://eac.staatsbibliothek-berlin.de/ Publication le 5 mars 2010 : • Schéma • (téléchargeable en 3 syntaxes) • Dictionnaire des balises • Documentation vivante • Sera traduit dans d’autres langues (sur des bases volontaires) • Intégrable dans les outils de production
  • 91. EAC-CPF et le contexte archivistique • 2010 à redéfinition du contexte archivistique (EAC) = circonstances entourant la production et l’utilisation des archives Information sur : les Producteurs, les Fonctions, les Sujets, les Lieux, etc. EAC - CPF - F - ? - ? - ? • EAC-CPF = se concentre seulement dans la description des Collectivités, Personnes et Familles • en tant que producteurs d’archives • mais aussi en tant que sujets ou ayant d’autres relations avec les documents d’archives
  • 92. Schéma EAC-CPF 2010 • Rigoureux mais « élégant », souple et simple d’utilisation • Architecture de base conforme à ISAAR(CPF) • Respectueux de la nature des informations (approche « ontologique ») • Soucieux de la cohérence interne • Outil de fédération de ressources existantes • Permet une approche « bottom-up » peut accueillir des informations provenant de sources extérieures peut inclure des segments de documents XML
  • 93. 93 eac-cpf control cpfDescription multipleIdentities identity http://eac.staatsbibliothek-berlin.de description relations alternativeSet entityID entityType nameEntry nameEntryParallel descriptiveNote existDates localDescriptions place places legalStatus legalStatuses functions languageUsed languagesUsed occupation occupations mandate mandates structureOrGenealogy generalcontext biogHist cfpRelation resourceRelation functionRelation place place place legalStatus legalStatus legalStatus languageUsed languageUsed occupation occupation mandate mandate chronList function function function
  • 94. EAC-CPF Architecture de base Approche « identitaire » de l’entité décrite : Ø Une « entité physique » peut avoir une ou plusieurs « Identités publiques » Ø Chacune décrite séparément dans des éléments <cpfDescription> distincts Ø Contenues dans l’élément englobant <multipleIdentities> <multipleIdentities> entityType entityType
  • 95. Identités multiples • Deux identités pour une même personne • Une personne / une collectivité Vincenzo Gioacchino Raffaele Luigi Pecci Léon XIII Sébastien Cramoisy (1584?-1669) Sébastien Cramoisy (1584?-1669) imprimeur- libraire
  • 96. EAC-CPF dans le respect d’ISAAR(CPF) schéma EAC-CPF ISAAR(CPF) 5.4 Zone du contrôle 5.1 Zone de l’identification 5.2 Zone de la description 5.3 Zone des relations
  • 97. <nameEntryParallel> <nameEntry> ISAAR (CPF) 5 ZONE D’IDENTIFICATION 5.1.1 Type d’entité 5.1.2 Forme(s) autorisée(s) du nom 5.1.3 Formes parallèles du nom 5.1.4 Formes du nom normalisées selon d’autres conventions 5.1.5 Autres formes du nom 5.1.6 Numéro d’immatriculation des collectivités
  • 98. ISAAR(CPF) ZONE DE LA DESCRIPTION 5.2.1 Dates d’existence 5.2.3 Lieux 5.2.4 Statut juridique 5.2.5 Fonctions et activités 5.2.6 Textes de référence 5.2.7 Organisation interne/ généalogie 5.2.8 Contexte général 5.2.2 Histoire <description>
  • 99. Les fonctions dans EAC-CPF Éléments de description Éléments de liens avec des vocabulaires contrôlés Articulation avec le futur EAC-F
  • 100. Les relations dans EAC-CPF <relations>
  • 101.
  • 103. EAC-CPF : cohérence sémantique • Généralisation de l’utilisation d’un certain nombre d’éléments et d’attributs Exemple de la Note descriptive descriptiveNote Disponible dans : conventionDeclaration, cpfRelation, existDates, function, functionRelation, functions, identity, languageDeclaration, languageUsed, languagesUsed, legalStatus, legalStatuses, localDescription, localDescriptions, localTypeDeclaration, maintenanceAgency, mandate, mandates, occupation, occupations, place, places, resourceRelation, setComponent, source
  • 104. EAC-CPF : les dates • L’usage des dates : • est généralisé (auprès de chaque élément pour lequel une information datée est à donner) • est réglementé Date simple Fourchette de dates Série de dates comportant des dates simples et/ou des fourchettes de dates Un élément <date> admet de l’information non normalisée La forme normalisée est donnée dans les attributs ci-contre Modèle des dates Attributs de <date>
  • 105. EAC-CPF : les lieux • Structure de l’élément <place>
  • 106. EAC-CPF : outil de fédération de notices d’autorité de provenances diverses <alternativeSet> <alternativeSet> <setComponent xlink:href="http://authorities.loc.gov/" xlink:type="simple"> <componentEntry>Bright Sparcs Record</componentEntry> </setComponent> <setComponent xlink:href="http://nla.gov.au/anbd.aut-an35335937" xlink:type="simple"> <componentEntry>NLA record.</componentEntry> </setComponent> <setComponent lastDateTimeVerified="2009-08-02" xlink:href="mawsonBS.xml" xlink:type="simple"> <objectXMLWrap/> </setComponent> </alternativeSet>
  • 107. EAC-CPF : permet d’importer des informations d’autres schémas XML <objectXMLWrap> <objectBinWrap>
  • 108. Intégrer et interconnecter l’information Que veut-on faire avec l’EAC-CPF ? ses archives des oeuvres sur… des émissions sur… ses amis ses lieux de vie, de passage… ses romans ses enregistrements ses compositions ses interprétations des images sur… des adaptations de ses oeuvres des critiques de ses oeuvres les textes de ses chansons les interprétations de ses compositions ses peintures …etc.
  • 109. Toiles d’informations bibliothèques et musées oeuvrent pour: l’intégration, la médiation et l’échange de l’information bibliographique et muséale réalisation d’un modèle orienté-objet "FRBRoo" archives se préoccupent de mettre: les relations au coeur des systèmes d’information Documents d’archives Personnes Collectivité s Familles Fonctions sont produits et gérés par exercent sont créés en exerçant des Intégrant toute l’Information sur le patrimoine culturel souci d’interopérabilité interdomaine …mais sans renoncer à l’originalité de chaque domaine !
  • 110. 110 Complémentarité d’informations Mise en regard d’une notice « noyau » et d’une notice EAC-CPF Note générale sur l’entité Identité Description contextuelle de l’entité Relations avec d’autres ressources Projet « Bibliothèque 1368-2015 » Lien ARK vers la notice du catalogue général
  • 112. Une application Description EAD contenant des notes biographiques VIAF Fichier d’autorité international 40 institutions 25 millions de notices Notices biographiques dans SNAC Données disponibles en RDF Web de données
  • 113.
  • 114. EAD (données décrivant le producteur d’un fonds) Autorités (formes du nom)
  • 115.
  • 116.
  • 117.
  • 120. American numismatic society Export en RDF : - Ontologie archivistique par défaut - CIDOC-CRM - Ontologie SNAP (description de textes, images et videos ainsi que des personnes, collectivités et familles apparaissant dans leur contenu)
  • 121. Le Projet “Bibliothèque 1368-2015”
  • 122. Objectifs du projet • La BnF, ses entités successives, ses unités constitutives ont une histoire • à mettre en lumière • à rendre accessible aux chercheurs • à relier avec d’autres ressources/projets à la BnF et à l’extérieur (national, international) • Réaliser un outil d’aide • à la gestion de la production documentaire • et à son archivage à la BnF Projet « Bibliothèque 1368-2015 » 122
  • 123. La Bibliothèque • La « Bibliothèque » héritière de 8 siècles d’histoire • Une activité riche, une vie mouvementée • Des missions nationales • Une production documentaire considérable • Documents d’archives, pour le passé (en partie déjà dans BAM) • Production documentaire courante • Un organigramme vivant, en évolution • Des entités productrices de contenus (documents) • La Bibliothèque nationale de France aujourd’hui • établissement public • 60 départements, 2500 agents • Porteur de missions nationales Projet « Bibliothèque 1368-2015 » 123
  • 124. 124 Des missions multiples évolutives • Missions • dépôt légal et autres acquisitions • conservation, communication des documents • services et produits bibliographiques • expositions • renseignements au public • Tête de réseau national pour • l’échange de données bibliothéconomiques • le traitement, la description et la conservation des données numériques (archivage du web, Gallica, Europeana, dépôt légal numérique…) • S’inscrit dans des réseaux d’information nationaux et internationaux • Encyclopédiques • Spécialisés
  • 125. Méthodologie • Retracer l’histoire de de la Bibliothèque à travers l’histoire de ses entités • Dimension temporelle : l’évolution de l’organigramme • Documenter quel service réalisait telle fonction, où, quand, comment, de quelle autorité et avec quels partenaires de travail. • Rendre compte des missions/fonctions de la Bibliothèque • Missions fondamentales • Autres fonctions organiques nécessaires à son fonctionnement • Dimension collaborative • Alimentation des notices par les acteurs eux mêmes • Appel à contribution déjà lancé Projet « Bibliothèque 1368-2015 » 125
  • 126. Les autorités en réseau autour de l’EAC-CPF Missions / Fonctions Fiches d’autorités riches contextualisées Dépôt légal Conservation Numérisation … Sites Richelieu Tolbiac Bussy … Autorités Collectivités DSR • IBN • DL • … DCO • DEP • DAV • … Délégation … DAP • … Autorités Personnes Jean Favier Jean-Noël Jeanneney Julien Cain … Projet « Bibliothèque 1368-2015 » 126
  • 127. Une première réalisation : le dictionnaire de la BnF