SlideShare une entreprise Scribd logo
1  sur  10
Séance « L’archivage numérique pérenne,
retours d’expérience »
vendredi 22 mars 2013
• Les bases de données constituent la mémoire
organisée de l’information
• Tendance : la disparition du fichier
• L’archivage des bases de données va au-delà de la
problématique classique liée aux fichiers numériques,
parce qu’il s’agit d’un objet complexe
• Nécessité d’une double compétence : archiviste /
informaticien

2
• Différents types d’organisation de l’information :

relationnelle

hiérarchique

RDF

entrepôt de
données

• Une description à plusieurs niveaux
– Conceptuel / Logique / Physique

• Des caractéristiques propres liées à l’usage qu’il en est fait
– BDD vivante / figée
– BDD cumulative / dynamique

3
4
5
Analyser l’existant

6
Caractéristiques de la base
Nom courant

Description
Nom usuel utilisé dans l’entreprise pour identifier la
base

Application utilisant la base

Liste de tous les logiciels ou programmes informatique
en interaction avec la base de données. Il peut s’agir
par exemple d’un site web utilisant la base ou d’une
application spécifique à l’établissement.

Liste des utilisateurs

Liste des utilisateurs ou des groupes d’utilisateurs de la
base et des droits associés.
Pour chacun on notera l’application utilisée pour
interagir avec la base.

Système informatique

Identification et localisation des SGBD.
Information sur les paramétrages particuliers, les
sauvegardes etc.

Date de mise en service
Date de fin d’utilisation

Depuis quand utilise-t-on la base ?
Le SGBD est-il en fin de vie ou a-t-il une fin d’utilisation
programmée ?

Taille de la base

Nombre d’enregistrements
Mo/Go/To ?

Objectifs et fonctionnalités
Type de contenu

A quoi sert la base ? Que permet-elle de faire ?
Que contient la base : des données, des documents ? Y
a-t-il des données confidentielles ? Ces données sontelles également disponibles sur papier ? Y a t-il eu des
récupérations de données d’anciennes bases ? Y a-t-il
des contenus à valeur probante ?

Cycle de vie global des données (DUA)

Fréquence des mises à jour ? Y a-t-il des contraintes
juridiques qui nécessitent de conserver les données un
certain temps ?

ou

volume

total

en

Questions diverses
Voyez-vous un intérêt à l’archivage de tout ou partie de la base ?
Qu’est-ce qui motive l’archivage de cette base de données ?

7
Analyser l’existant
Choisir

Stratégie
d’archivage

SAE

Prioritiser
Evaluer

8
Pour plus d’infos :
« Guide méthodologique pour l’archivage des bases de données », mars 2013
téléchargeable ici : http://www.cines.fr/pac/download/GM_archivage_BDD-v1.0.pdf
En savoir plus sur l’archivage électronique au CINES :
« La gazette du CINES – spécial Archivage numérique pérenne », mars 2013
téléchargeable ici :
http://www.cines.fr/pac/download/CINES_GAZETTE_Special_Archivage.pdf
Pour plus d’infos :
« Guide méthodologique pour l’archivage des bases de données », mars 2013
téléchargeable ici : http://www.cines.fr/pac/download/GM_archivage_BDD-v1.0.pdf
En savoir plus sur l’archivage électronique au CINES :
« La gazette du CINES – spécial Archivage numérique pérenne », mars 2013
téléchargeable ici :
http://www.cines.fr/pac/download/CINES_GAZETTE_Special_Archivage.pdf

Contenu connexe

Tendances

Présentation genève 20130617
Présentation genève 20130617Présentation genève 20130617
Présentation genève 20130617
Tobias Wildi
 

Tendances (19)

Présentation genève 20130617
Présentation genève 20130617Présentation genève 20130617
Présentation genève 20130617
 
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physiqueVisite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
 
Big data
Big dataBig data
Big data
 
Big data
Big dataBig data
Big data
 
Visite guidée au pays de la donnée - Introduction et tour d'horizon
Visite guidée au pays de la donnée - Introduction et tour d'horizonVisite guidée au pays de la donnée - Introduction et tour d'horizon
Visite guidée au pays de la donnée - Introduction et tour d'horizon
 
Catalogage de données : notions enjeux et initiatives
Catalogage de données : notions enjeux et initiativesCatalogage de données : notions enjeux et initiatives
Catalogage de données : notions enjeux et initiatives
 
Un modèle de données unique pour les collections de l'Ina, pourquoi ? Comment ?
Un modèle de données unique pour les collections de l'Ina, pourquoi ? Comment ?Un modèle de données unique pour les collections de l'Ina, pourquoi ? Comment ?
Un modèle de données unique pour les collections de l'Ina, pourquoi ? Comment ?
 
Aaf oct2 governance and metadata v2
Aaf oct2   governance and metadata v2Aaf oct2   governance and metadata v2
Aaf oct2 governance and metadata v2
 
Linked Enterprise Data ou comment disposer d'une vue consolidée des données
Linked Enterprise Data ou comment disposer d'une vue consolidée des donnéesLinked Enterprise Data ou comment disposer d'une vue consolidée des données
Linked Enterprise Data ou comment disposer d'une vue consolidée des données
 
Antidot Information Factory - AIF
Antidot Information Factory - AIFAntidot Information Factory - AIF
Antidot Information Factory - AIF
 
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...
L'ouverture des données de la recherche en 2015 : définitions, enjeux, dynami...
 
Les professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesLes professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de données
 
Mise en place d'archives ouvertes: mesures pratiques
Mise en place d'archives ouvertes: mesures pratiquesMise en place d'archives ouvertes: mesures pratiques
Mise en place d'archives ouvertes: mesures pratiques
 
Stage pgd 2021-04-07
Stage pgd 2021-04-07Stage pgd 2021-04-07
Stage pgd 2021-04-07
 
Fiche pratique IST Agropolis : L'Open Access et les données de la recherche
Fiche pratique IST Agropolis : L'Open Access et les données de la rechercheFiche pratique IST Agropolis : L'Open Access et les données de la recherche
Fiche pratique IST Agropolis : L'Open Access et les données de la recherche
 
Bases de donnees fondamentaux
Bases de donnees fondamentauxBases de donnees fondamentaux
Bases de donnees fondamentaux
 
Documation 2011 : de la recherche fédérée à l'accès unifié
Documation 2011 : de la recherche fédérée à l'accès unifiéDocumation 2011 : de la recherche fédérée à l'accès unifié
Documation 2011 : de la recherche fédérée à l'accès unifié
 
L'Open Access et les Données de la Recherche dans le cadre du Programme Horiz...
L'Open Access et les Données de la Recherche dans le cadre du Programme Horiz...L'Open Access et les Données de la Recherche dans le cadre du Programme Horiz...
L'Open Access et les Données de la Recherche dans le cadre du Programme Horiz...
 
Les entrepôts de données ou comment rendre les données trouvables accessibles...
Les entrepôts de données ou comment rendre les données trouvables accessibles...Les entrepôts de données ou comment rendre les données trouvables accessibles...
Les entrepôts de données ou comment rendre les données trouvables accessibles...
 

Similaire à Présentation de Philippe Prat et Lorène Béchard

Archivage, sauvegarde et restauration pour une virtualisation réussie
Archivage, sauvegarde et restauration pour une virtualisation réussieArchivage, sauvegarde et restauration pour une virtualisation réussie
Archivage, sauvegarde et restauration pour une virtualisation réussie
Aquastar Consulting
 
java BDD jdbc
java BDD jdbcjava BDD jdbc
java BDD jdbc
vangogue
 

Similaire à Présentation de Philippe Prat et Lorène Béchard (20)

Ecosystème Big Data
Ecosystème Big DataEcosystème Big Data
Ecosystème Big Data
 
Cours Base de données relationnelles
Cours Base de données relationnellesCours Base de données relationnelles
Cours Base de données relationnelles
 
Intro SQL
Intro SQL Intro SQL
Intro SQL
 
introNoSQL.pdf
introNoSQL.pdfintroNoSQL.pdf
introNoSQL.pdf
 
Introduction au big data
Introduction au big dataIntroduction au big data
Introduction au big data
 
Système de recommandations de films
Système de recommandations de filmsSystème de recommandations de films
Système de recommandations de films
 
Hadoop Hbase - Introduction
Hadoop Hbase - IntroductionHadoop Hbase - Introduction
Hadoop Hbase - Introduction
 
20211126 traitement vrac_numerique_ar_sud
20211126 traitement vrac_numerique_ar_sud20211126 traitement vrac_numerique_ar_sud
20211126 traitement vrac_numerique_ar_sud
 
Si bdd
Si bddSi bdd
Si bdd
 
Big data
Big dataBig data
Big data
 
Archivage, sauvegarde et restauration pour une virtualisation réussie
Archivage, sauvegarde et restauration pour une virtualisation réussieArchivage, sauvegarde et restauration pour une virtualisation réussie
Archivage, sauvegarde et restauration pour une virtualisation réussie
 
java BDD jdbc
java BDD jdbcjava BDD jdbc
java BDD jdbc
 
base de données -note de cours
base de données -note de cours base de données -note de cours
base de données -note de cours
 
4 Solutions Linux Spar
4 Solutions Linux Spar4 Solutions Linux Spar
4 Solutions Linux Spar
 
Emna borgi mabroukachraita-datawarehouse
Emna borgi mabroukachraita-datawarehouseEmna borgi mabroukachraita-datawarehouse
Emna borgi mabroukachraita-datawarehouse
 
Gestion organisationnelle données géospatiales
Gestion organisationnelle données géospatialesGestion organisationnelle données géospatiales
Gestion organisationnelle données géospatiales
 
BD_Decisionnel_fin-2020tjtgenieindustriel.ppt
BD_Decisionnel_fin-2020tjtgenieindustriel.pptBD_Decisionnel_fin-2020tjtgenieindustriel.ppt
BD_Decisionnel_fin-2020tjtgenieindustriel.ppt
 
Cours_BD_M1-EAI-2023.pdf
Cours_BD_M1-EAI-2023.pdfCours_BD_M1-EAI-2023.pdf
Cours_BD_M1-EAI-2023.pdf
 
Bd relationnelles
Bd relationnellesBd relationnelles
Bd relationnelles
 
BDRO.pdf
BDRO.pdfBDRO.pdf
BDRO.pdf
 

Plus de AssociationAF

RASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - SupportsRASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - Supports
AssociationAF
 
RASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - SupportsRASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - Supports
AssociationAF
 
RASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - SupportsRASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - Supports
AssociationAF
 
RASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - SupportsRASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - Supports
AssociationAF
 
Presentation_RASAD_AMICHI_V1_20230126.pdf
Presentation_RASAD_AMICHI_V1_20230126.pdfPresentation_RASAD_AMICHI_V1_20230126.pdf
Presentation_RASAD_AMICHI_V1_20230126.pdf
AssociationAF
 
20231019.1.2_TransitionDroitsCulturels_Conference.pdf
20231019.1.2_TransitionDroitsCulturels_Conference.pdf20231019.1.2_TransitionDroitsCulturels_Conference.pdf
20231019.1.2_TransitionDroitsCulturels_Conference.pdf
AssociationAF
 
Les archives de AIDES militer agir transformer
Les archives de AIDES militer agir transformerLes archives de AIDES militer agir transformer
Les archives de AIDES militer agir transformer
AssociationAF
 
Chacun cherche son SAE table ronde colloque
Chacun cherche son SAE table ronde colloqueChacun cherche son SAE table ronde colloque
Chacun cherche son SAE table ronde colloque
AssociationAF
 
Quand sobriété rencontre archives table ronde
Quand sobriété rencontre archives table rondeQuand sobriété rencontre archives table ronde
Quand sobriété rencontre archives table ronde
AssociationAF
 
20231018.1_RecolerLogicielsApplis_Conference.pptx
20231018.1_RecolerLogicielsApplis_Conference.pptx20231018.1_RecolerLogicielsApplis_Conference.pptx
20231018.1_RecolerLogicielsApplis_Conference.pptx
AssociationAF
 
Le fabuleux destin des archivistes communiquants : les archives de la MEL
Le fabuleux destin des archivistes communiquants : les archives de la MELLe fabuleux destin des archivistes communiquants : les archives de la MEL
Le fabuleux destin des archivistes communiquants : les archives de la MEL
AssociationAF
 
Les archives municipales et métropolitaines d'Orléans
Les archives municipales et métropolitaines d'OrléansLes archives municipales et métropolitaines d'Orléans
Les archives municipales et métropolitaines d'Orléans
AssociationAF
 
la valorisation des archives sur les réseaux sociaux, l'exemple du CDG24
la valorisation des archives sur les réseaux sociaux, l'exemple du CDG24la valorisation des archives sur les réseaux sociaux, l'exemple du CDG24
la valorisation des archives sur les réseaux sociaux, l'exemple du CDG24
AssociationAF
 
table ronde j'archive bien ne t'en fais pas
table ronde j'archive bien ne t'en fais pastable ronde j'archive bien ne t'en fais pas
table ronde j'archive bien ne t'en fais pas
AssociationAF
 
20231017_ArchivesWallonie_Conference.ppt
20231017_ArchivesWallonie_Conference.ppt20231017_ArchivesWallonie_Conference.ppt
20231017_ArchivesWallonie_Conference.ppt
AssociationAF
 
A la poursuite de l'intelligence artificielle
A la poursuite de l'intelligence artificielleA la poursuite de l'intelligence artificielle
A la poursuite de l'intelligence artificielle
AssociationAF
 
2023_Valenciennes_2023OdysseeTransTer_V2.pptx
2023_Valenciennes_2023OdysseeTransTer_V2.pptx2023_Valenciennes_2023OdysseeTransTer_V2.pptx
2023_Valenciennes_2023OdysseeTransTer_V2.pptx
AssociationAF
 
DUBOIS_Presentation_cyberattaque_Bondy_vf.pdf
DUBOIS_Presentation_cyberattaque_Bondy_vf.pdfDUBOIS_Presentation_cyberattaque_Bondy_vf.pdf
DUBOIS_Presentation_cyberattaque_Bondy_vf.pdf
AssociationAF
 
MEIGNEN_Presentation-AAF-SAE-sécurité.pdf
MEIGNEN_Presentation-AAF-SAE-sécurité.pdfMEIGNEN_Presentation-AAF-SAE-sécurité.pdf
MEIGNEN_Presentation-AAF-SAE-sécurité.pdf
AssociationAF
 
SEGURET_presentation_secur_Lyon_seguret.pdf
SEGURET_presentation_secur_Lyon_seguret.pdfSEGURET_presentation_secur_Lyon_seguret.pdf
SEGURET_presentation_secur_Lyon_seguret.pdf
AssociationAF
 

Plus de AssociationAF (20)

RASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - SupportsRASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - Supports
 
RASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - SupportsRASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - Supports
 
RASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - SupportsRASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - Supports
 
RASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - SupportsRASAD du 9 et 10 mars 2023 Nancy - Supports
RASAD du 9 et 10 mars 2023 Nancy - Supports
 
Presentation_RASAD_AMICHI_V1_20230126.pdf
Presentation_RASAD_AMICHI_V1_20230126.pdfPresentation_RASAD_AMICHI_V1_20230126.pdf
Presentation_RASAD_AMICHI_V1_20230126.pdf
 
20231019.1.2_TransitionDroitsCulturels_Conference.pdf
20231019.1.2_TransitionDroitsCulturels_Conference.pdf20231019.1.2_TransitionDroitsCulturels_Conference.pdf
20231019.1.2_TransitionDroitsCulturels_Conference.pdf
 
Les archives de AIDES militer agir transformer
Les archives de AIDES militer agir transformerLes archives de AIDES militer agir transformer
Les archives de AIDES militer agir transformer
 
Chacun cherche son SAE table ronde colloque
Chacun cherche son SAE table ronde colloqueChacun cherche son SAE table ronde colloque
Chacun cherche son SAE table ronde colloque
 
Quand sobriété rencontre archives table ronde
Quand sobriété rencontre archives table rondeQuand sobriété rencontre archives table ronde
Quand sobriété rencontre archives table ronde
 
20231018.1_RecolerLogicielsApplis_Conference.pptx
20231018.1_RecolerLogicielsApplis_Conference.pptx20231018.1_RecolerLogicielsApplis_Conference.pptx
20231018.1_RecolerLogicielsApplis_Conference.pptx
 
Le fabuleux destin des archivistes communiquants : les archives de la MEL
Le fabuleux destin des archivistes communiquants : les archives de la MELLe fabuleux destin des archivistes communiquants : les archives de la MEL
Le fabuleux destin des archivistes communiquants : les archives de la MEL
 
Les archives municipales et métropolitaines d'Orléans
Les archives municipales et métropolitaines d'OrléansLes archives municipales et métropolitaines d'Orléans
Les archives municipales et métropolitaines d'Orléans
 
la valorisation des archives sur les réseaux sociaux, l'exemple du CDG24
la valorisation des archives sur les réseaux sociaux, l'exemple du CDG24la valorisation des archives sur les réseaux sociaux, l'exemple du CDG24
la valorisation des archives sur les réseaux sociaux, l'exemple du CDG24
 
table ronde j'archive bien ne t'en fais pas
table ronde j'archive bien ne t'en fais pastable ronde j'archive bien ne t'en fais pas
table ronde j'archive bien ne t'en fais pas
 
20231017_ArchivesWallonie_Conference.ppt
20231017_ArchivesWallonie_Conference.ppt20231017_ArchivesWallonie_Conference.ppt
20231017_ArchivesWallonie_Conference.ppt
 
A la poursuite de l'intelligence artificielle
A la poursuite de l'intelligence artificielleA la poursuite de l'intelligence artificielle
A la poursuite de l'intelligence artificielle
 
2023_Valenciennes_2023OdysseeTransTer_V2.pptx
2023_Valenciennes_2023OdysseeTransTer_V2.pptx2023_Valenciennes_2023OdysseeTransTer_V2.pptx
2023_Valenciennes_2023OdysseeTransTer_V2.pptx
 
DUBOIS_Presentation_cyberattaque_Bondy_vf.pdf
DUBOIS_Presentation_cyberattaque_Bondy_vf.pdfDUBOIS_Presentation_cyberattaque_Bondy_vf.pdf
DUBOIS_Presentation_cyberattaque_Bondy_vf.pdf
 
MEIGNEN_Presentation-AAF-SAE-sécurité.pdf
MEIGNEN_Presentation-AAF-SAE-sécurité.pdfMEIGNEN_Presentation-AAF-SAE-sécurité.pdf
MEIGNEN_Presentation-AAF-SAE-sécurité.pdf
 
SEGURET_presentation_secur_Lyon_seguret.pdf
SEGURET_presentation_secur_Lyon_seguret.pdfSEGURET_presentation_secur_Lyon_seguret.pdf
SEGURET_presentation_secur_Lyon_seguret.pdf
 

Présentation de Philippe Prat et Lorène Béchard

  • 1. Séance « L’archivage numérique pérenne, retours d’expérience » vendredi 22 mars 2013
  • 2. • Les bases de données constituent la mémoire organisée de l’information • Tendance : la disparition du fichier • L’archivage des bases de données va au-delà de la problématique classique liée aux fichiers numériques, parce qu’il s’agit d’un objet complexe • Nécessité d’une double compétence : archiviste / informaticien 2
  • 3. • Différents types d’organisation de l’information : relationnelle hiérarchique RDF entrepôt de données • Une description à plusieurs niveaux – Conceptuel / Logique / Physique • Des caractéristiques propres liées à l’usage qu’il en est fait – BDD vivante / figée – BDD cumulative / dynamique 3
  • 4. 4
  • 5. 5
  • 7. Caractéristiques de la base Nom courant Description Nom usuel utilisé dans l’entreprise pour identifier la base Application utilisant la base Liste de tous les logiciels ou programmes informatique en interaction avec la base de données. Il peut s’agir par exemple d’un site web utilisant la base ou d’une application spécifique à l’établissement. Liste des utilisateurs Liste des utilisateurs ou des groupes d’utilisateurs de la base et des droits associés. Pour chacun on notera l’application utilisée pour interagir avec la base. Système informatique Identification et localisation des SGBD. Information sur les paramétrages particuliers, les sauvegardes etc. Date de mise en service Date de fin d’utilisation Depuis quand utilise-t-on la base ? Le SGBD est-il en fin de vie ou a-t-il une fin d’utilisation programmée ? Taille de la base Nombre d’enregistrements Mo/Go/To ? Objectifs et fonctionnalités Type de contenu A quoi sert la base ? Que permet-elle de faire ? Que contient la base : des données, des documents ? Y a-t-il des données confidentielles ? Ces données sontelles également disponibles sur papier ? Y a t-il eu des récupérations de données d’anciennes bases ? Y a-t-il des contenus à valeur probante ? Cycle de vie global des données (DUA) Fréquence des mises à jour ? Y a-t-il des contraintes juridiques qui nécessitent de conserver les données un certain temps ? ou volume total en Questions diverses Voyez-vous un intérêt à l’archivage de tout ou partie de la base ? Qu’est-ce qui motive l’archivage de cette base de données ? 7
  • 9. Pour plus d’infos : « Guide méthodologique pour l’archivage des bases de données », mars 2013 téléchargeable ici : http://www.cines.fr/pac/download/GM_archivage_BDD-v1.0.pdf En savoir plus sur l’archivage électronique au CINES : « La gazette du CINES – spécial Archivage numérique pérenne », mars 2013 téléchargeable ici : http://www.cines.fr/pac/download/CINES_GAZETTE_Special_Archivage.pdf
  • 10. Pour plus d’infos : « Guide méthodologique pour l’archivage des bases de données », mars 2013 téléchargeable ici : http://www.cines.fr/pac/download/GM_archivage_BDD-v1.0.pdf En savoir plus sur l’archivage électronique au CINES : « La gazette du CINES – spécial Archivage numérique pérenne », mars 2013 téléchargeable ici : http://www.cines.fr/pac/download/CINES_GAZETTE_Special_Archivage.pdf

Notes de l'éditeur

  1. Des applications d’entreprises aux sites web en passant par les réseaux sociaux et les applications pour les systèmes nomades, les bases de données sont partout et constituent une mémoire organisée de l’information. Ces évolutions tendent à remplacer la forme du fichier au profit de bases de données exploitables de partout et de différentes façons. Cette interdépendance rend alors très complexe le processus d’archivage. Il faut prendre en compte la problématique classique liée à l’archivage électronique, tout en considérant la complexité des objets à archiver. Les enjeux doivent être connus et cette question doit être traitée par une double compétence informatique et archivistique. Quelle donnée archiver ? sous quelle forme ? celle rendue lisible par une application comme une page web ou celle qui est en est la source ? La première option sera peut-être plus simple mais réduira l’archivage à un simple snapshot d’un état donné. L’autre sera plus complexe mais permettra dans l’avenir de retrouver le système avec une grande partie de ses fonctionnalités. C’est à ces questions que Philippe Prat et moi-même avons essayé de répondre. (excuse pour son absence) Le travail que je vais vous présenter est issu d’un guide méthodologique sur l’archivage des bases de données que nous venons de réaliser dans le cadre de notre activité au CINES - (le CINES, pour ceux d’entre vous qui ne le connaîtrait pas est le Centre…, expertise dans le domaine de l’archivage électronique). Travail rédigé à 4 mains afin d’allier les compétences informatique et archivistique. L’objectif est de proposer un support aux acteurs confrontés à la problématique de l’archivage des bases de données. Il s’adresse aussi bien aux archivistes, qu’aux informaticiens ou aux décideurs et plus généralement à toute personne intéressée par cette question. Pour les non-informaticiens, il va présenter ce que sont les bases de données, les SGBD et plus largement les systèmes d’information. Pour les non-archivistes, il va préciser le contexte législatif de l’archivage, de la protection des données confidentielles, la notion de cycle de vie et les méthodes d’archivage (ce que je vous épargnerai dans ma présentation !). Ce socle de connaissances étant posé, nous vous proposons une méthodologie pour la sélection des données et leur archivage, que nous verrons en fin de présentation. A noter : Ce travail est une porte ouverte à une réflexion commune sur le sujet et ne demande qu’à être enrichi des retours des uns et des autres.
  2. Une BDD est un ensemble de données organisées de façon cohérente. Cette organisation peut être de plusieurs types. En voici quelques uns : BDD relationnelles : la majeure partie des BDD actuelles. Organisation des données sous forme d’entités, de « tables » reliés les uns aux autres par des relations. BDD hiérarchiques : association de données uniquement via des relations de composition de type « parent-enfants ». Ex : un livre est composé de chapitres, eux-mêmes composés de plusieurs paragraphes qui sont composés de plusieurs phrases, mots et enfin de lettres. RDF : Formalisme très utilisé dans web sémantique, pour positionner des informations sur un objet au moyen d’un triplet : sujet, prédicat, objet. Le sujet permet d’identifier la ressource, le prédicat d’attribuer une propriété ou une relation à la ressource et l’objet de donner une valeur à cette relation. Par exemple : L’archive x (sujet) a été produite par (prédicat) l’administration y (objet). L’objet d’un triplet peut devenir le sujet d’un nouveau triplet et ainsi créer tout un réseau d’information. Entrepôt de données : bases de données de bases de données. Permet de rassembler au sein d’un même système d’information, des données hétérogènes issues d’entités ou de métiers très différents, généralement afin de faire des recoupements de ces données. Les données concernées sont souvent peu volatiles car elles n’ont pas ou plus vocation à être modifiées. Elles ont été préalablement homogénéisées pour entrer dans un cadre normatif et être exploitable dans l’entrepôt. Une BDD se caractérise aussi par ses niveaux de représentation : Niveau conceptuel : c’est la traduction du monde réel : quels sont les principes que l’on a voulu représenter ? Cela va décrire des entités (càd, un ensemble d’objets ayant des attributs identiques) et des relations entre les entités (association ou actions). Niveau logique : c’est la manière d’organiser ces entités afin qu’elles puissent être intégrables dans un système d’information. Par exemple, dans le cas d’un SGBD, les entités deviennent des tables et les relations à des associations entre tables. Niveau physique : c’est l’écriture du modèle logique pour qu’il soit compréhensible par le SI dans lequel on va l’intégrer : en quelque sorte c’est un langage de programmation. Pour un SGBD, on parlera de SQL. L’intérêt du modèle conceptuel des données est de voir quels sont les concepts de haut niveau auxquels la base doit répondre. La séparation entre le MLD et le MPD permet entre autres le portage d’une base de données d’un SGBD vers un autre. Par exemple, on peut traduire un MPD MySQL en un MLDR puis traduire ce MLDR en un autre MPD, postgres par exemple. Enfin, une BDD possède des caractéristiques propres, liées à son usage : Une base de données est dite « vivante » si les éléments qui la constituent sont modifiés ou que de nouveaux éléments sont ajoutés. On parlera de base de données « figée » si aucune modification, ajout ou effacement n’ont été effectués récemment. Une base de données est dite « cumulative » si on ne fait qu’ajouter de nouveaux éléments sans en modifier et sans en effacer. De manière inverse, on parlera de base de données « dynamique » si l’ajout et la modification sont autorisés et utilisés.
  3. Les bases de données sont au cœur des systèmes d’information. Schéma 1 : Les doubles flèches représentent les interactions possibles entre les données et l’utilisateur. Ces interactions peuvent se faire en lecture et modification, ce qui explique le double sens. Dans le cas où l’utilisateur n’interagit pas directement avec la base (au moyen du langage SQL), l’application sera un élément essentiel pour comprendre les données. Schéma 2: L’architecture 3-tiers est très utilisée dans les systèmes d’information. - La couche présentation met à disposition un résultat et une interface permettant à un utilisateur final (personne(s) ou application(s)) d’effectuer des actions et de modifier ainsi les données. - La couche application va gérer les transactions entre l’utilisateur et les données selon certaines fonctionnalités métiers (spécifications fonctionnelles). La couche données est représentée par les données elles-mêmes et aussi par le Système de gestion de base de données. C’est ici que réside la donnée primaire/brute. CMS web par exemple : Utilisateur est l’internaute. Il accède à l’interface du site web (couche présentation) à l’aide d’une application particulière (un navigateur). Les opérations qu’il effectuera seront traitées par la couche métier qui ira effectuer des transactions en lecture/écriture dans la BDD. En regardant cette organisation on peut se poser la question de ce que l’on va archiver et se rendre compte de la complexité de cette problématique.
  4. Les bases de données sont au cœur des systèmes d’information. Schéma 1 : Les doubles flèches représentent les interactions possibles entre les données et l’utilisateur. Ces interactions peuvent se faire en lecture et modification, ce qui explique le double sens. Dans le cas où l’utilisateur n’interagit pas directement avec la base (au moyen du langage SQL), l’application sera un élément essentiel pour comprendre les données. Schéma 2: L’architecture 3-tiers est très utilisée dans les systèmes d’information. - La couche présentation met à disposition un résultat et une interface permettant à un utilisateur final (personne(s) ou application(s)) d’effectuer des actions et de modifier ainsi les données. - La couche application va gérer les transactions entre l’utilisateur et les données selon certaines fonctionnalités métiers (spécifications fonctionnelles). La couche données est représentée par les données elles-mêmes et aussi par le Système de gestion de base de données. C’est ici que réside la donnée primaire/brute. CMS web par exemple : Utilisateur est l’internaute. Il accède à l’interface du site web (couche présentation) à l’aide d’une application particulière (un navigateur). Les opérations qu’il effectuera seront traitées par la couche métier qui ira effectuer des transactions en lecture/écriture dans la BDD. En regardant cette organisation on peut se poser la question de ce que l’on va archiver et se rendre compte de la complexité de cette problématique.
  5. Pourquoi archiver une base de données ? Il est crucial de bien identifier en amont de toute action les raisons qui poussent à l’archivage. D’une part parce qu’elles auront certainement un impact sur la manière d’archiver la base de données, et d’autre part parce que la complexité et le nombre des bases de données peuvent représenter un frein. Dans ce cas, les motivations qui conduisent à la mise en place d’un tel projet seront autant d’arguments pour convaincre les réticences que ce soit aussi bien vis-à-vis de la hiérarchie que du service informatique / Identifier les raisons sont autant d’arguments pour convaincre les sponsors Ces raisons peuvent être de plusieurs types : Données publiques / à valeur probante / fin de maintenance du SGBD / politique générale de l’organisme Faire un état des lieux de l’existant Il est préférable de mener une réflexion générale, en prenant en compte l’ensemble des bases de données utilisées par une structure plutôt que de se focaliser, souvent dans l’urgence et au cas par cas, sur une seule base de données, parce qu’elle risque de disparaître par exemple. Cela permettra d’identifier plus facilement les redondances d’informations. Cartographie des SI
  6. Faire un état des lieux de l’existant Il est préférable de mener une réflexion générale, en prenant en compte l’ensemble des bases de données utilisées par une structure plutôt que de se focaliser, souvent dans l’urgence et au cas par cas, sur une seule base de données, parce qu’elle risque de disparaître par exemple. Cela permettra d’identifier plus facilement les redondances d’informations. Cartographie des SI Moyens disponibles : financier / humain / compétences informatiques / archivistiques / matériel / partenaires possibles (mutualisation) Identifier les rôles de chacun des acteurs : archiviste / informaticien / producteur / utilisateur Sélectionner la ou les bases de données à archiver Analyser l’état des lieux réalisé afin de sélectionner les bases de données nécessitant un archivage. Pour cela, on peut identifier plusieurs critères pertinents (SGBD en fin de vie, beaucoup de données sont figées, données uniques, données à valeur probante, intérêt historique ou scientifique, etc.) Cela revient aussi à se poser la question du moment de l’archivage : quand décider d’archiver une base de données ? A l’issue de cette étape, on dispose d’une liste de BDD retenues pour l’archivage mais on ne sait pas forcément par laquelle commencer… Affecter des priorités Il faut analyser les résultats en regard des contraintes que l’on a, en termes de délais et de complexité de la base de données, et prioritiser les actions à entreprendre. Par exemple en attribuant un coefficient d’importance à chacun des critères identifiés. Si temps : Prenons l’exemple d’une base de données de gestion du personnel dont le logiciel arrive en fin de vie et pour laquelle seules les données encore actives (dossiers des personnels encore en poste) ont été migrées vers le nouveau SGBD. Elle doit être traitée en priorité au vu des délais de conservation légaux pour ce type de données (90 ans à partir de la naissance de l’employé), d’autant plus que souvent le sort de l’ancienne base de données n’est pas très bien défini (déplacement vers un serveur inutilisé, diminution de la fréquence d’utilisation jusqu’à la perte de la connaissance de son fonctionnement, ou même la suppression complète). De la même manière, il peut être utile d’évaluer l’intérêt historique de l’archivage au regard de la complexité de la base de données, selon la logique de « la fin justifie-t-elle les moyens ? ». Au vu des structures actuelles de SGBD de plus en plus complexes, il est possible que la mise en œuvre de la conservation ne soit pas en adéquation avec les moyens dont on dispose à tel point qu’elle devienne inenvisageable malgré l’intérêt historique des données. Evaluer la BDD La granularité sur laquelle doit se pencher l’archivage n’est pas celle de la BDD dans sa globalité mais celle des éléments qui la composent. Lorsque l’on a identifié la base de données que l’on va archiver, il est important d’évaluer précisément son contenu afin de sélectionner ce que l’on va archiver (toutes les données ne sont pas forcément candidates à un archivage) et la solution la plus adaptée pour le faire. Identifier tous les cycles de vie des données : L’étape de l’état des lieux de l’existant a permis de dresser un aperçu du cycle de vie global des données de la base. Il convient maintenant de reprendre cette analyse plus en détail : Toutes les données suivent-elles le même cycle de vie ? ont-elles la même DUA ? Certaines sont-elles figées dès leur création ? ou au contraire constamment modifiées ? La base fonctionne-t-elle de manière cumulative ou au contraire dynamique ? Quel est le risque de non-disponibilité de l’information ? - Evaluer la confidentialité des données : Une base de données contient généralement des informations confidentielles, soit parce qu’elles relèvent de la vie privée (identification de personnes), soit parce qu’il s’agit d’identifiants et de mots de passe utilisés pour l’accès notamment. Sélectionner les éléments de la base à conserver : données / traitements / application…. (dépend de l’utilisation que l’on veut en faire notamment) et préciser le moment et la fréquence de l’archivage de ces données. Choisir la stratégie d’archivage Se choisit en fonction de ce que l’on veut archiver et des moyens dont on dispose pour cela. Par exemple :….. (cf. tableau des stratégies d’archivage) Assurer la conservation numérique du contenu dans un SAE, un coffre-fort électronique ou tout autre dispositif permettant de garantir une conservation sur la durée souhaitée.