1. Vers une indexation efficace
en EAD ?
https://francearchives.fr/file/6686af73e52bd3dd7d56cbad92228977cbe576f5/Guide
Indexation_Web_v202108.pdf
10/2021
2. Les types d’entités pour l’indexation
L’EAD distingue trois types d’entités pour l’indexation :
Les agents, noms propres, servent à décrire les collectivités, personnes,
familles, etc., (producteur, auteur, destinataire…) figurant dans les
archives décrites.
Les lieux décrivent un territoire géographique (montagne, cours
d’eau...) ou des infrastructures réalisées par l’homme (route, canal…).
Les sujets, noms communs, correspondent à des mots-clefs matière.
3. Les éléments d’indexation
Ces éléments d’indexation peuvent être englobés soit
directement dans le corps du texte soit dans un élément
englobant <controlaccess>…
<archdesc>
</archdesc>
<did>
<unitid>
<unittitle>
<unitdate>
</did>
<physdesc>
<custodhist>
<bioghist>
<scopecontent>
<acqinfo>
<accessrestrict>
<userestrict>
<relatedmaterial>
<separatedmaterial>
<controlaccess>
<subject>
<persname>
</controlaccess>
EAD donne la possibilité d’indexer
• les collectivités <corpname>
• les noms de personnes <persname>
• les noms de famille <famname>
• les fonctions <occupation>
• les activités <function>
• les noms géographiques <geogname>
• les titres d’oeuvres <title>
• les mot-matières <subject> …
5. Pourquoi et comment indexer ?
Pour indexer en EAD, toujours penser à utiliser des
référentiels pour garantir l’intéropérabilité.
Une bonne indexation doit en effet être contrôlée et
normalisée. L’avantage étant de pouvoir regrouper des
instruments de recherche autour des entités déjà identifiées.
L’indexation d’un instrument de recherche dite « contrôlée »
s’oppose à l’indexation « libre » qui présente des risques pour
la qualité et l’intéropérabilité.
L’indexation contrôlée consiste à utiliser des listes d’autorités
et repose sur un travail préalable de définition des descripteurs
grâce à des règles d’écriture et à des référentiels normalisés.
6. Comment indexer ?
L’indexation se fait au niveau le plus pertinent, mais il est
nécessaire d’adapter le niveau de précision du vocabulaire.
Exemple :
Sous-série 4 T
Hommages publics aucun descripteur
Monuments aux morts descripteur « commémoration »
Guerre de 1914-1948 – Érection de monuments aux morts pour la
France
Dossiers communaux
4 T 70 – Abilly à Bets-le-Château un descripteur lieu pour
chaque commune
7. Exemple aux Archives nationales
Robert Billecard
Le fonds Billecard (EAD) et sa notice ISAAR (CPF)
https://www.siv.archives-
nationales.culture.gouv.fr/siv/rechercheconsultation/consultation/ir/cons
ultationIR.action?formCaller=GENERALISTE&irId=FRAN_IR_00346
3&gotoArchivesNums=false&defaultResultPerPage=&frontIr=&option
FullText=&fullText=&udId=&consIr=&details=false&page=&auSeinIR
=false
https://public.sia.culture.fr./siv/rechercheconsultation/consultation/produ
cteur/consultationProducteur.action?notProdId=FRAN_NP_050089
8. Les attributs pour qualifier les termes d’indexation
Pour qualifier le contenu des éléments d’indexation on dispose de différents attributs : normal, id,
role, rules, audience, alrender, encodinganalog, authfilenumber, etc.
• normal fournit la forme de référence pour le contenu des éléments afin de faciliter la recherche.
• id la plupart des éléments ont un attribut id qui permet de leur affecter un identifiant unique.
• audience pour s'assurer que l'information contenue dans l'élément sera mise à disposition de tous
ou réservée en interne (l'institution responsable de l'accès intellectuel par exemple).
• altrender pour afficher un élément d'une autre manière que celle établie par une feuille de style.
• authfilenumber utilisé pour donner le numéro d’une notice dans un fichier d'autorité.
• source source du terme de vocabulaire contrôlé contenu dans les éléments comme corpname,
famname, function, genreform, geogname, occupation, persname, etc.
• encodinganalog permet de construire une interface utilisateur pour indexer et interroger des
informations de même nature.
• role permet de préciser dans les éléments le rôle ou le contexte d'intervention.
• rules pour préciser les règles de descriptions suivies pour former le descripteur (exemple AFNOR)
• type disponible dans de nombreux éléments mais bien utilisé pour genreform
<genreform source="sceaux" type="image-sceau" authfilenumber="d3ntb7ykjq--tck4tl4rnvai"></genreform>
• etc.
9. Attribut AUTHFILENUMBER
On peut aussi utiliser en EAD l’attribut AUTHFILENUMBER pour
établir des liens vers des notices d’autorité. Exemples :
<origination>
<persname authfilenumber="FRAN_NP_050089">Billecard, Robert (1886-
1953)</persname>
</origination>
<unittitle>
<persname
authfilenumber="https://catalogue.bnf.fr/ark:/12148/cb11096013z">Billecard,
Robert (1886-1953)</persname>
</unittitle>
10. Autre exemple de AUTHFILENUMBER
<origination>
<corpname authfilenumber="FRAN_NP_010141">Etude XIV</corpname>
<persname authfilenumber="FRAN_NP_010944">Pitaux, Marie-Louis-Ernest</persname>
</origination>
11. Autres exemples d’utilisation des attributs
Utilisation de l’attribut ROLE
Peut être utilisé pour les éléments <corpname> <famname> <geogname> <name> <persname>
pour choisir des valeurs comme « producteur », « auteur », « collectionneur », etc. pour les
noms de personnes, de collectivités ou des noms géographiques, etc.
<origination>
<corpname role="producteur">Conseil général</corpname>
</origination>
Utilisation de AUDIENCE, FINDAIDSTATUS et COUNTRYENCODING
Peut être utilisé pour l’élément <eadheader> pour indiquer l'état d’achèvement de l’instrument
de recherche encodé à des fins de gestion sur une plateforme de production mais il peut l’être
aussi pour le public. On lui donne les valeurs souhaitées, telles que “provisoire”, “achevé”,
“validé”,
COUNTRYENCODING pour représenter le nom du pays selon la norme ISO 3166-1
<ead audience="external">
<eadheader findaidstatus="provisoire" countryencoding="FR">
<eadid>AN_001</eadid>
12. L’apport de l’EAC
Voir exemple du fonds Billecard (EAD) et sa notice ISAAR
(CPF)
ISAAR(CPF) et EAC permettent de produire des notices
d’autorité indépendamment des instruments de recherche
pour pouvoir les mettre à jour plus facilement. Elles sont
plus élaborées que celles produites par l’EAD : possibilité
de décrire des formes alternatives du nom, de relier un agent
personne à un autre. Ce sont des éléments EAC tels que
<nameEntry>, <nameEntryParallel>, <alternativeForm> ou
<authorizedForm> pour les formes alternatives ou autorisées
des noms qui n’existent pas dans EAD.
13. L’apport de l’EAC
L’élément <biogHist> est plus riche que celui de l’EAD : il
comprend un élément <abstract> pour un bref résumé, un
élément <chronList> pour ajouter une liste chronologique,
des informations sur les lieux, etc.
L’extension de l’EAC-CPF permettrait donc d'améliorer la
qualité de l'indexation des agents dans les instruments de
recherche, en identifiant précisément la personne physique
ou morale indexée. De plus, les notices d'agents, même les
plus simples (forme normalisée du nom, dates d'existence,
court historique ou biographie) pourraient être publiées et
réutilisées par d'autres services.
14. Contrôle de l’indexation
La normalisation de l’indexation est primordiale faire un
contrôle de l’indexation et des référentiels :
• Valider, modifier ou rejeter les nouveaux descripteurs
candidats proposés par les indexeurs.
• Vérifier que les éléments d'indexation sont bien renseignés et
doté des bons attributs.
• Si les référentiels partagés ne suffisent pas pour indexer un
type de fonds (des microtoponymes pour un territoire donné)
alors constituer une liste d’autorité locale mais qui n’offrira
pas de garantie d’interopérabilité.
15. Préconisations pour un SIA
Un outil peu adapté à l’indexation aurait pour effet de rendre celle-ci ardue
pour l’indexeur, freinant de fait les opérations d’indexation.
Au minimum le système d’information archivistique doit proposer la
possibilité d’indexer les notices directement dans l’instrument de recherche
sans qu’il soit par exemple nécessaire de naviguer entre deux écrans ou de
retaper l’entrée.
Le SIA doit comporter plusieurs fonctionnalités d’indexation :
• sélectionner un terme dans un référentiel interne ou les indexations déjà
existantes en proposant une liste de valeurs dès qu’on commence à taper
quelques lettres.
• ajouter des attributs, en particulier @role, @authfilenumber, @source,
@normal.
• interroger un référentiel externe pour en récupérer des informations
(géolocalisation pour les lieux, dates pour un agent par exemple).
16. • permettre d’indexer les analyses aussi bien dans le corps du texte que dans la
balise <controlaccess>.
• gérer l’héritage de l’indexation des niveaux parents de description vers les
niveaux enfants.
• autoriser ou non la saisie d’entrée d’index libre si le champ n’est pas associé
à un thésaurus ou une liste d’autorité.
• les attributs utilisés doivent être exploités lors de la recherche et,
éventuellement, à l’affichage (par exemple, pour une personne physique,
pouvoir distinguer lorsqu’elle est auteur du document ou sujet).
• pour la maintenance, les descripteurs doivent pouvoir être mis à jour
facilement soit de manière unitaire soit par des traitements par lots.
• le référentiel doit pouvoir être exporté avec une documentation sur les
conditions de création et de maintenance sous différents formats réutilisables
par les machines : SKOS, csv, Json.
17. Outils pour indexer les agents et les lieux
• data.bnf.fr ; http://viaf.org/ ; https://www.idref.fr/ , ISNI, Wikidata
• Code Officiel Géographique (INSEE)
• Geonames
• Base Adresse Nationale (BAN)
• Noms des pays étrangers et leurs subdivisions conformes à la norme ISO
3166 : il faut cliquer sur le nom du pays dans la liste des résultats pour obtenir les
noms et les codes des subdivisions dans la langue locale sous forme translittérée.
• Règles typographiques de la Commission nationale de toponymie.
• DicoTopo
• Geoportail (IGN)
• Service d’administration nationale des référentiels de l’eau (SANDRE)