Pré-traitement du vrac
numérique des
archives de la Villa
Méditerranée
Traitement commencé
en 2018, première
expérience de traitement
d’un vrac numérique
Objectif : rendre
exploitable cet ensemble
d’arborescences pour la
recherche et rentrer les
dossiers dans le futur
SAE
Ressource de dossiers
de travail qui sera
complémentaire aux
dossiers mieux
organisés dans le
papier.
Les arborescences
étaient déjà cotées en W
Des archives vierges de
tout traitement. Par
manque de temps lors
de la collecte, il n’y a
pas eu de pré-tri.
Arborescences mêlant le
travail et le privé
(permis de conduire,
diplôme, fiche de paie
etc…).
Grande variété de
formats
Volumétrie initiale :
115Go
42091 fichiers
4249 dossiers
10 sous-niveaux de dossiers
dans les cas extrêmes
Volumétrie après traitement
automatisé :
85,3Go
16344 fichiers
1735 dossiers
1. Présentation du vrac numérique
1. Présentation du vrac numérique
Sous la mer de dossiers… un monde!
Outils testés Outils utilisés Outils non retenus
Outils d’exploration
d’arborescence
Archifiltre Windirstat
Adapté aux très gros volumes,
mais fonctionnalités réduites et
processus d’analyse très lent
Outils de renommage Bulk Rename Vrenamer
L’appli a du mal à renommer en
masse, elle bugge beaucoup
Outils de détection des
dossiers vides
Remove Empty Directories X
Outils de
dédoublonnage
Duplicate Cleaner
Attention, appli payante avec une
version test gratuite de 15 jours
Dupfinder
Ce dernier propose une sélection
manuelle des doublons à
supprimer…
Outil de listing des
formats de
fichiers/Dates extrêmes
Archifiltre - Bulk Rename -
Windirstat
Suppressions AxCrypt = outil non utilisé à l’époque
En 2018, les outils
à notre disposition
étaient déjà divers
et variés.
+ Depuis, le
SIAF a mis à
disposition
« Octave » qui
condense
plusieurs de ces
solutions.
+ Amélioration
notable des
fonctionnalités
d’Archifiltre.
2 Un tri virtuel…bien réel!
Titre
Comment acter et suivre toutes les décisions liées au
traitement ?
Un dossier de traitement par versement :
1. Fichier de suivi (tableur) pour gérer un traitement au long
cours :
Volume avant et après copie – volume après dédoublonnage,
volume après suppression des dossiers vides, volume après
suppressions manuelles en cas de formats inouvrables, etc.
2. Fichier de prises de notes
3. Rapports de dédoublonnage, extractions archifiltre
Documenter la période de pré-tri est essentielle pour ne pas
perdre le fil.
Permet également de documenter le bordereau d’élimination.
2 Un tri virtuel…bien réel!
Une série de problèmes liés à
l’environnement numérique :
1. Problèmes d’ouverture des fichiers et
problèmes de copie = perte d’information
(trop de sous-niveaux, noms de fichiers
trop longs, fichiers inouvrables…)
2. Renommage en masse = perte
d’informations possibles
3. Allègement des niveaux de dossiers afin
de réduire l’abondance des niveaux =
risques de perte d’information, mais
amélioration de la lisibilité des archives
Ce traitement nous a conduit à instaurer une politique de record management au sein de l’institution via le projet « Production de
référence » (charte de nommage, formations, mise en œuvre d’arborescences de pré archivage numérique, création de plans de
classement pour toutes les directions, etc.)
3 Mise en valeur du fonds
La communicabilité du fonds numérique en question
- Attribution d’une « contrainte » dans la règle de communicabilité au sein de notre SIA
- Examen minutieux du contenu des dossiers d’archives demandées avant la communication à un
lecteur.
Situation des archives numériques et physiques dans les bases de données
- Bordereaux de versement en W. Description du premier niveau de dossiers seulement pour le
numérique en raison d’un nombre élevé de sous-dossiers. Ajout d’un commentaire sur le pré-
traitement opéré.
- Intégration prochaine des versements numériques dans le SAE
Comment mettre en valeur ce fonds hybride?
- Future double cotation « W » et « EW » à résoudre (mention de la cote EW dans la fiche
descriptive du SIA)
- Réalisation d’un instrument de recherche organique dans notre SIA Ligéo : le bordereau des
archives physiques dans le SIA est plus présentable que le bordereau SEDA qui sera issu du
SAE (description au fichier dans le bordereau SEDA). Comment entremêler les descriptions de
manière intelligible à l’avenir et établir un connecteur entre les deux bases?
3 Mise en valeur du fonds
2021_EW_70 Coordination générale 2012, suivi : notes, rapports, comptes-rendus, conventions, correspondance, photographies
L’instrument de recherche organique mixant les sources papier et numérique attendu :
Récupération de la description de l’objet
d’archives?
Formalisation de
l’instrument de recherche
dans le SIA
Cote SAE
3 Mise en valeur du fonds
4 Conclusion
Retour d’expérience de ce traitement d’un vrac numérique :
- Des solutions sont à imaginer pour la valorisation du fonds hybride ce qui est très stimulant
(description, forme de l’instrument de recherche, etc.)
- Le rapport à l’archive n’est pas le même dans le numérique que dans le papier :
Connaissance imparfaite du vrac numérique au cours de ce pré-traitement contrairement au cas
d’un tri d’un vrac papier que l’on fini par connaitre à peu près par cœur au bout de quelques jours.
En cause, l’impossibilité de compulser les documents, de les survoler d’un regard. Le vrac
numérique n’est pas un volume physique, un ensemble « matériel » que l’on visualise, que l’on
feuillette. La série de clics que constitue le pré-traitement d’un vrac numérique n’est qu’une étape
qui ne peut pas se substituer au tri et qui reste assez en surface du contenu.

20211126 traitement vrac_numerique_ar_sud

  • 1.
    Pré-traitement du vrac numériquedes archives de la Villa Méditerranée
  • 2.
    Traitement commencé en 2018,première expérience de traitement d’un vrac numérique Objectif : rendre exploitable cet ensemble d’arborescences pour la recherche et rentrer les dossiers dans le futur SAE Ressource de dossiers de travail qui sera complémentaire aux dossiers mieux organisés dans le papier. Les arborescences étaient déjà cotées en W Des archives vierges de tout traitement. Par manque de temps lors de la collecte, il n’y a pas eu de pré-tri. Arborescences mêlant le travail et le privé (permis de conduire, diplôme, fiche de paie etc…). Grande variété de formats Volumétrie initiale : 115Go 42091 fichiers 4249 dossiers 10 sous-niveaux de dossiers dans les cas extrêmes Volumétrie après traitement automatisé : 85,3Go 16344 fichiers 1735 dossiers 1. Présentation du vrac numérique
  • 3.
    1. Présentation duvrac numérique Sous la mer de dossiers… un monde!
  • 4.
    Outils testés Outilsutilisés Outils non retenus Outils d’exploration d’arborescence Archifiltre Windirstat Adapté aux très gros volumes, mais fonctionnalités réduites et processus d’analyse très lent Outils de renommage Bulk Rename Vrenamer L’appli a du mal à renommer en masse, elle bugge beaucoup Outils de détection des dossiers vides Remove Empty Directories X Outils de dédoublonnage Duplicate Cleaner Attention, appli payante avec une version test gratuite de 15 jours Dupfinder Ce dernier propose une sélection manuelle des doublons à supprimer… Outil de listing des formats de fichiers/Dates extrêmes Archifiltre - Bulk Rename - Windirstat Suppressions AxCrypt = outil non utilisé à l’époque En 2018, les outils à notre disposition étaient déjà divers et variés. + Depuis, le SIAF a mis à disposition « Octave » qui condense plusieurs de ces solutions. + Amélioration notable des fonctionnalités d’Archifiltre. 2 Un tri virtuel…bien réel!
  • 5.
    Titre Comment acter etsuivre toutes les décisions liées au traitement ? Un dossier de traitement par versement : 1. Fichier de suivi (tableur) pour gérer un traitement au long cours : Volume avant et après copie – volume après dédoublonnage, volume après suppression des dossiers vides, volume après suppressions manuelles en cas de formats inouvrables, etc. 2. Fichier de prises de notes 3. Rapports de dédoublonnage, extractions archifiltre Documenter la période de pré-tri est essentielle pour ne pas perdre le fil. Permet également de documenter le bordereau d’élimination. 2 Un tri virtuel…bien réel! Une série de problèmes liés à l’environnement numérique : 1. Problèmes d’ouverture des fichiers et problèmes de copie = perte d’information (trop de sous-niveaux, noms de fichiers trop longs, fichiers inouvrables…) 2. Renommage en masse = perte d’informations possibles 3. Allègement des niveaux de dossiers afin de réduire l’abondance des niveaux = risques de perte d’information, mais amélioration de la lisibilité des archives Ce traitement nous a conduit à instaurer une politique de record management au sein de l’institution via le projet « Production de référence » (charte de nommage, formations, mise en œuvre d’arborescences de pré archivage numérique, création de plans de classement pour toutes les directions, etc.)
  • 8.
    3 Mise envaleur du fonds La communicabilité du fonds numérique en question - Attribution d’une « contrainte » dans la règle de communicabilité au sein de notre SIA - Examen minutieux du contenu des dossiers d’archives demandées avant la communication à un lecteur. Situation des archives numériques et physiques dans les bases de données - Bordereaux de versement en W. Description du premier niveau de dossiers seulement pour le numérique en raison d’un nombre élevé de sous-dossiers. Ajout d’un commentaire sur le pré- traitement opéré. - Intégration prochaine des versements numériques dans le SAE Comment mettre en valeur ce fonds hybride? - Future double cotation « W » et « EW » à résoudre (mention de la cote EW dans la fiche descriptive du SIA) - Réalisation d’un instrument de recherche organique dans notre SIA Ligéo : le bordereau des archives physiques dans le SIA est plus présentable que le bordereau SEDA qui sera issu du SAE (description au fichier dans le bordereau SEDA). Comment entremêler les descriptions de manière intelligible à l’avenir et établir un connecteur entre les deux bases?
  • 9.
    3 Mise envaleur du fonds 2021_EW_70 Coordination générale 2012, suivi : notes, rapports, comptes-rendus, conventions, correspondance, photographies L’instrument de recherche organique mixant les sources papier et numérique attendu : Récupération de la description de l’objet d’archives? Formalisation de l’instrument de recherche dans le SIA Cote SAE
  • 10.
    3 Mise envaleur du fonds
  • 11.
    4 Conclusion Retour d’expériencede ce traitement d’un vrac numérique : - Des solutions sont à imaginer pour la valorisation du fonds hybride ce qui est très stimulant (description, forme de l’instrument de recherche, etc.) - Le rapport à l’archive n’est pas le même dans le numérique que dans le papier : Connaissance imparfaite du vrac numérique au cours de ce pré-traitement contrairement au cas d’un tri d’un vrac papier que l’on fini par connaitre à peu près par cœur au bout de quelques jours. En cause, l’impossibilité de compulser les documents, de les survoler d’un regard. Le vrac numérique n’est pas un volume physique, un ensemble « matériel » que l’on visualise, que l’on feuillette. La série de clics que constitue le pré-traitement d’un vrac numérique n’est qu’une étape qui ne peut pas se substituer au tri et qui reste assez en surface du contenu.