Implémentation de la norme Records in Contexts par la Fondation SAPA, Archives suisses des arts de la scène
1. Forum des archivistes genevois
Implémentation de la norme Records in Contexts
par la Fondation SAPA, Archives suisses des arts de la scène
Baptiste de Coulon, Fondation SAPA
4 mars 2024 (Archives de l’État de Genève)
2. Préambule
Un grand MERCI au Forum, à la Fondation SAPA, à mon prédécesseur
Birk Weiberg, et à Roberta Padlina.
Le compte-rendu qui va suivre est le fait d’un archiviste à partir de son terrain.
Il ne s’agit pas d’informations officielles ou de jugements définitifs.
Un flou sur les concepts des sciences de l’information est à prévoir.
Les aspects strictement informatiques ne sont communiqués que dans la
compréhension qui en a été acquise. Ils ne peuvent pas servir de références au-delà
de cette présentation.
3. Plan
● Questions de départ
● Fondation SAPA
● Article de bilan (2023)
● Bilan (2024)
● Réponses
4. Questions de départ
1. Quelles différences entre ISAD(G), publiée en 1994,
et Records in Contexts (RiC), publiée en 2023 ?
2. Est-ce que la norme RiC ne peut être mise en oeuvre
qu’uniquement au travers du langage RDF?
3. Est-ce que la pratique archivistique va devoir changer?
4. Est-ce que la description d’archives est “ontologisable”?
5. Y auraient-ils un avantage pour nos publics au passage à RiC?
6. Fondation SAPA
1978 : Fondation Collection
suisse du théâtre (Berne)
2011 : Collection suisse de la danse (Zurich / Lausanne)
2017 : Fondation SAPA, Archives suisses des arts de la scène (Berne, Zurich, Lausanne)
2005 : Mediathektanz (Zürich)
1995 : Archives suisse de la danse
(Lausanne)
1944-1979 : dépôt à la
Bibliothèque nationale
1927 : Société suisse du théâtre -
> Collection (Berne)
12. Article de bilan (2023)
DE COULON, B. (2024). Déploiement de la norme Records in Contexts pour la gestion des collections de
la Fondation SAPA. Revue électronique Suisse de Science de l’information (RESSI), (24).
https://doi.org/10.55790/journals/ressi.2024.e1511
● Introduction
● Fondation SAPA
● Les arts de la scène en RDF
● Records in Contexts
● Besoins identifiés
● Premiers bilans
○ Bilan du point de vue technique
○ Bilan du point de vue de l’archiviste
● Perspectives
● Conclusions
● Remerciements
13. Article de bilan (2023)
En conclusion, on donnait trois critères pour mesurer la réussite
d’un passage à la norme Records in Contexts sous forme RDF :
● documentation à disposition (->SHACL)
● SPARQL Endpoint
● URI
14. Bilan (2024)
● données vs textes
● précision vs archives
● contextes vs archives
● ontologie vs archives
● RiC AIS vs RiC AIP
15. Bilan (2024)
Données vs textes (I)
Avec RiC, on bascule (largement) dans le monde des données. On
quitte le monde des textes et une certaine tradition
littéraire/scientifique.
Il y a des gains, il y a des pertes : ce n’est pas sans conséquence.
● les données sont des entités plus des literals (ex: Lapzeson)
● Les données sont autonomes des outils
● Les données sont parcellaires
● On doit se confronter à la question de la Single Source of Truth (SSOT)
voir : https://polylogue.org/les-illusions-de-la-source-unique/
16. Bilan (2024)
Données vs textes (II)
Avec RiC, on ne travaille plus directement pour les humains mais
pour des ordinateurs qui sont pilotés par des humains.
Les ordinateurs sont “aveugles” et “sans passé”. Ils ne savent lire
(dans un premier temps) que des données, pas des informations.
On crée pour eux des données et non des textes.
● On perd petit-petit l’idée de fonds, comme une entité née de la fusion
point de vue de l’archiviste et l’information
● Les imports se font par tableurs (ou directement via un versement
depuis une GID/GED). Perte d’importance des formulaires de saisie.
● l’objectif du machine reasoning (raisonnement automatisé) doit encore
être testé avec RiC
● Source d’espoir : le choix initial de SGML par le DHS
17. Bilan (2024)
précision vs archives
En travaillant à modéliser en RDF les informations archivistiques, il
apparaît qu’elles sont remplies d’implicite, de flou (constat déjà du
projet aLOD en 2017) et elle sont parfois même polysémiques. C’est
à priori contradictoire avec une “ontologisation” de nos pratiques.
● Ce flou nous facilite-t-il le travail?
● Ce flou est-il compréhensible par nos publics?
● Ce flou est-il insurmontable?
● Le passage à RiC demande de se confronter à ces questions, comme
ISAD(G) l’avait déjà fait en partie.
18. Bilan (2024)
contextes vs archives
Les archivistes ont décrit jusqu’ici principalement les documents
d’archives. Leurs efforts vont avec la nouvelle norme se tourner vers
les contextes de productions / de réception de ces dernières.
● Est-ce que RiC-O est suffisante pour décrire les contextes. A priori, non
(c’est débattu) et ce n’est pas grave
● Il s’agit ici de réaliser le programme que visait la norme ISDF (Norme
internationale pour la description des fonctions, 2008) de l’ICA
● Il y a un potentiel très motivant de mutualisation des efforts
● mais aussi certaines limites, comment se mettre d’accord entre
institutions sur des définitions communes
19. Bilan (2024)
Ontologie vs archives (I)
Pour créer des données interrogeables “à l’aveugle” par des
ordinateurs, il faut documenter précisément le modèle de données
(SHACL).
Pour documenter précisément, il faut être précis dans notre
utilisation des propriétés de description.
● Sommes-nous précis dans nos travaux? Quelle institution dispose d’un
manuel de saisie complet et précis qui pourrait être modéliser
directement en RDF?
● Les travaux de définition au sein de groupes de travail internes ne sont
pas à minimiser
● Le recours à des groupes de travail thématiques/inter-institutionnels
serait à privilégier
20. Bilan (2024)
Ontologie vs archives (II)
Il semble exister deux types d’”ontologisation”.
La première serait un idéal avec des définitions précises. C’est ce
qui est exploré par exemple dans le monde de l’édition par les
recherches académiques.
La seconde, celle envisagée par les archivistes de l’EGAD dans la
tradition du “flou archivistique”. Elle laisserait une grande marge de
manoeuvre à la mise en oeuvre de l’ontologie.
● un album photo est-il un Record Set ou un Record? Les photos qu’il
contient sont-elles des Record ou des Record Part? Chaque institution
est libre de faire des choix différents. Il est même possible qu’un Record
contiennent d’autres Records.
21. Bilan (2024)
RiC AIS vs RiC AIP
Quels liens entre le RDF/RiC que l’on pourrait mettre en oeuvre
dans un AIS (ex: RDF SAPA) et les RDF/RiC pour la description des
AIP (ex:Matterhorn RDF) ?
● Il est important de bien dissocier les étapes RDF AIS->SIP->RDF AIP
● Il n’existe pas d’homologie obligatoire
● La synchronisation RDF AIS et RDF AIP est théoriquement envisagée
mais n’a pas encore été mise en production
23. Réponses (I)
Oui, il existe des différences entre les normes RiC et ISAD(G).
Sont-elles contradictoires? C’est possible.
Seule une analyse plus fouillée nous le dira.
Deux pistes :
● contextes/provenances (vs fonds)
● données vs textes
Voir travaux du groupe de travail de l’AAS “Normes et Standards”.
24. Réponses (II)
La norme RiC est indépendante de sa formalisation RDF.
Elle s’exprime plus naturellement et complètement dans une
langage de graphe (comme RDF ou labeled property graph),
mais il est possible d’envisager une “RiCification” des
descriptions avec les outils en place.
En particulier, le principe de l’Instanciation pourrait être repris
partout avec bénéfice, comme le serait l’usage des URI.
voir : https://neo4j.com/blog/rdf-triple-store-vs-labeled-property-graph-difference/
25. Réponses (III)
Il n’y a évidemment pas d’obligation de passage à la norme RIC.
Il est fort possible que ISAD(G) reste valable.
Il y aurait plutôt une nécessité de changements pour mettre en
oeuvre :
● open data/open content : intégration aux web des données
● archivage numérique de grande ampleur
26. Réponses (IIII)
Oui, la description d’archives est “ontologisables” mais cela
demande un effort conséquent de formalisation à l’interne (et
donc les ressources nécessaires pour le faire).
Les premières personnes victimes bénéficiaires sont les
archivistes elles-mêmes.
27. Réponses (IV)
Est-ce les publics obtiendraient un gain par le passage à RiC et
à RDF? Il faudrait bien préciser cette question pour pouvoir y
répondre.
La mise en oeuvre des instanciations et des URI amélioreraient
certainement la consultation à distance.
Par ailleurs, il est fort possible que les publics de demain ne
soient pas les mêmes que ceux d’aujourd’hui. Le passage sous
forme de données permet aux informations archivistiques d’être
disponibles dans des interfaces qui ne sont pas dédiées aux
archives (ex: GID/GED, plateformes Wikimedia, etc.)