Présentation de PAC la plateforme d'archivage pérenne  du CINES O.Rouchon  Journées d’étude Couperin AO – 3 Avril 2009
Sommaire <ul><li>La mission d’archivage du CINES </li></ul><ul><li>Le contexte, la problématique et les constats </li></ul...
<ul><li>Centre Informatique National de l’Enseignement Supérieur </li></ul><ul><li>Basé en Montpellier (Hérault, France) <...
<ul><li>Depuis 2004, le CINES travaille sur la mise en place d’un service pour l’archivage pérenne du patrimoine scientifi...
Le service d’archivage pérenne du CINES <ul><li>Objectifs : la mise en place d’une solution </li></ul><ul><ul><li>Performa...
<ul><li>L’archivage pérenne des documents électroniques consiste à conserver le document et l’information qu’il contient :...
Les défis, orientations et choix pour l’archivage au CINES Présentation PAC - Journées d'étude Couperin Archives ouvertes ...
Les normes et standards utilisés <ul><li>OAIS - ISO 14721 : Reference model for an Open Archival Information System  </li>...
L’archivage et le cycle de vie des documents Présentation PAC - Journées d'étude Couperin Archives ouvertes 03/04/2009
Les types  de documents à archiver de façon pérenne <ul><ul><li>Format publié </li></ul></ul><ul><ul><li>Format largement ...
La structure du document à archiver <ul><li>Document à archiver composé de deux pièces </li></ul><ul><li>La description de...
L’architecture logique de la plateforme PAC Présentation PAC - Journées d'étude Couperin Archives ouvertes 03/04/2009
Les principes de fonctionnement <ul><li>Trois serveurs logiques : transfert, stockage, accès </li></ul>Présentation PAC - ...
Les étapes du versement d’archives Présentation PAC - Journées d'étude Couperin Archives ouvertes 03/04/2009
L’état des lieux (Mars 2009) <ul><li>PAC - Plateforme d’archivage au CINES - pérenne capable de gérer de larges volumes (2...
Les projets en cours <ul><li>Deux projets pilotes en exploitation </li></ul><ul><ul><li>Archivage des thèses électroniques...
L’initiation d’un projet d’archives <ul><li>Qui ? Tout organisme </li></ul><ul><li>Produisant ou collectant en grande quan...
<ul><li>Au niveau national : </li></ul><ul><li>Groupe de travail PIN (pérennisation de l’information numérique) au sein de...
La participation à des groupes de travail <ul><li>Au niveau international :   </li></ul><ul><li>wePreserve ( http://www.we...
Les perspectives <ul><li>Le CINES est maintenant un acteur reconnu du domaine de la préservation à long terme des document...
<ul><li>Questions / Réponses </li></ul><ul><li>[email_address] </li></ul>Présentation PAC - Journées d'étude Couperin Arch...
Annexes
Le modèle fonctionnel OAIS (rappel) Présentation PAC - Journées d'étude Couperin Archives ouvertes 03/04/2009
Les acteurs <ul><li>Le producteur </li></ul><ul><ul><li>Personne physique ou morale, publique ou privée, qui a produit, re...
Prochain SlideShare
Chargement dans…5
×

L'archivage pérenne au CINES

3 209 vues

Publié le

Publié dans : Formation
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

L'archivage pérenne au CINES

  1. 1. Présentation de PAC la plateforme d'archivage pérenne du CINES O.Rouchon Journées d’étude Couperin AO – 3 Avril 2009
  2. 2. Sommaire <ul><li>La mission d’archivage du CINES </li></ul><ul><li>Le contexte, la problématique et les constats </li></ul><ul><li>Les orientations et choix pour l’archivage au CINES </li></ul><ul><li>Les types de documents à archiver </li></ul><ul><li>Les acteurs </li></ul><ul><li>L’architecture logique de la plateforme </li></ul><ul><li>Le principe de fonctionnement </li></ul><ul><li>L’état des lieux et les perspectives </li></ul>Présentation PAC - Journées d'étude Couperin Archives ouvertes 03/04/2009
  3. 3. <ul><li>Centre Informatique National de l’Enseignement Supérieur </li></ul><ul><li>Basé en Montpellier (Hérault, France) </li></ul><ul><li>Créé en 1999, succédant au CNUSC (Centre National Universitaire Sud de Calcul) – créé en 1980 </li></ul><ul><li>Placé sous la tutelle de la DGRI (Direction Générale de la Recherche et de l’Innovation) du Ministère de l’Enseignement Supérieur </li></ul>La présentation du CINES Présentation PAC - Journées d'étude Couperin Archives ouvertes 03/04/2009 <ul><li>Principales missions </li></ul><ul><ul><li>Calcul numérique intensif, </li></ul></ul><ul><ul><li>Archivage pérenne de documents électroniques, </li></ul></ul><ul><ul><li>Hébergement et suivi de serveurs d’applications. </li></ul></ul><ul><li>Plus d’information : http://www.cines.fr/ </li></ul>
  4. 4. <ul><li>Depuis 2004, le CINES travaille sur la mise en place d’un service pour l’archivage pérenne du patrimoine scientifique. </li></ul><ul><li>Cette mission a été confirmée par plusieurs décisions des organismes de tutelle : </li></ul><ul><ul><li>Arrêté du 7 août 2006 relatif aux modalités de dépôt, de signalement, de reproduction, de diffusion et de conservation des thèses ou des travaux présentés en soutenance en vue d’un doctorat </li></ul></ul><ul><ul><li>Convention du 2 mai 2007 (faisant suite à celle du 15 octobre 2003) relative à la mise en ligne et l’archivage pérenne de données numérisées dans le cadre du programme Persée </li></ul></ul><ul><ul><li>Lettre de cadrage du 12 février 2008 recentrant les activités du CINES autour de deux missions stratégiques : le calcul intensif et l’archivage pérenne </li></ul></ul><ul><li>Pour la remplir, le CINES a mis en place le projet PAC, qui vise à doter le CINES d’une plate-forme et d’un service d’archivage numérique pérenne </li></ul>La mission d’archivage du CINES Présentation PAC - Journées d'étude Couperin Archives ouvertes 03/04/2009
  5. 5. Le service d’archivage pérenne du CINES <ul><li>Objectifs : la mise en place d’une solution </li></ul><ul><ul><li>Performante pour la conservation à long terme du patrimoine numérique des établissements </li></ul></ul><ul><ul><li>Economique et sécurisée </li></ul></ul><ul><li>Contraintes </li></ul><ul><ul><li>Besoin d’une solution générique, basée sur les normes du domaine </li></ul></ul><ul><ul><li>Facilité de veille technologique et de migration </li></ul></ul><ul><li>Les données concernées sont : </li></ul><ul><ul><li>Les données scientifiques – résultats d’observations ou de calcul </li></ul></ul><ul><ul><li>Les données patrimoniales – pédagogiques, publications, etc. </li></ul></ul><ul><ul><li>Les données administratives – archives intermédiaires </li></ul></ul><ul><li>Dans le respect du contexte législatif archivistique français </li></ul>Présentation PAC - Journées d'étude Couperin Archives ouvertes 03/04/2009
  6. 6. <ul><li>L’archivage pérenne des documents électroniques consiste à conserver le document et l’information qu’il contient : </li></ul><ul><li>Dans son aspect physique comme dans son aspect intellectuel, </li></ul><ul><li>Sur le très long terme soit 30 ans et au-delà, </li></ul><ul><li>De manière à pouvoir le rendre accessible et compréhensible. </li></ul><ul><li>Or, la plupart des fichiers informatiques de plus de 10 ans sont aujourd’hui illisibles : </li></ul><ul><li>Connaissance perdue du contenu des fichiers, </li></ul><ul><li>Format de fichier inconnu, </li></ul><ul><li>Support physique détérioré, </li></ul><ul><li>Logiciel ou matériel de lecture disparu </li></ul>Le contexte, la problématique et les constats Présentation PAC - Journées d'étude Couperin Archives ouvertes 03/04/2009
  7. 7. Les défis, orientations et choix pour l’archivage au CINES Présentation PAC - Journées d'étude Couperin Archives ouvertes 03/04/2009 <ul><li>Besoin d’une solution générique, basée sur les standards émergeants en matière d’archivage, d’où l’adhésion : </li></ul><ul><ul><li>au modèle OAIS, aux normes ISO, etc. </li></ul></ul><ul><ul><li>au protocole standard d’échange de données pour l’archivage </li></ul></ul>Contrainte Solutions Connaissance du contenu <ul><li>Utilisation de métadonnées </li></ul><ul><li>Identification unique et pérenne des documents archivés </li></ul>Format de fichier inconnu <ul><li>Privilégier les formats durables </li></ul><ul><li>Identification, validation des formats </li></ul><ul><li>Migration logique </li></ul>Support physique détérioré <ul><li>Gestion du vieillissement des médias </li></ul><ul><li>Migration physique </li></ul>Logiciel ou matériel de lecture disparu <ul><li>Veille technologique et anticipation </li></ul>
  8. 8. Les normes et standards utilisés <ul><li>OAIS - ISO 14721 : Reference model for an Open Archival Information System </li></ul><ul><ul><li>Modèle purement conceptuel, ne fait aucune recommandation technique </li></ul></ul><ul><li>P2A Politique et pratiques d’archivage (sphère publique) </li></ul><ul><ul><li>Recommandations en termes d’architecture, moyens, sécurité, etc. </li></ul></ul><ul><li>Standard d’échanges de données pour l’archivage électronique, versement, communication, élimination </li></ul><ul><ul><li>DAF, DGME, version 1.0, mars 2006. </li></ul></ul><ul><li>Normes internationales de description archivistique </li></ul><ul><ul><li>ISAD-G – international standard for archival description, general </li></ul></ul><ul><ul><li>ISAAR-CPF – international standard archival authority record, corporate bodies, persons & families </li></ul></ul><ul><li>Métadonnées descriptives de l’archive </li></ul><ul><ul><li>DCMI – Dublin Core Metadata Initiative </li></ul></ul><ul><li>Identifiant unique et pérenne </li></ul><ul><ul><li>Interne, séquentiel, couplé à un identifiant persistant externe de type ARK </li></ul></ul><ul><li>Empreintes numériques </li></ul><ul><ul><li>Hashing MD5, SHA-256 </li></ul></ul>Présentation PAC - Journées d'étude Couperin Archives ouvertes 03/04/2009
  9. 9. L’archivage et le cycle de vie des documents Présentation PAC - Journées d'étude Couperin Archives ouvertes 03/04/2009
  10. 10. Les types de documents à archiver de façon pérenne <ul><ul><li>Format publié </li></ul></ul><ul><ul><li>Format largement utilisé (ou promis à l’être) </li></ul></ul><ul><ul><li>Format normalisé si possible </li></ul></ul>Présentation PAC - Journées d'étude Couperin Archives ouvertes 03/04/2009 <ul><li>Présentant une valeur patrimoniale scientifique ou technique </li></ul><ul><li>De préférence des objets dits « primaires » </li></ul><ul><ul><li>Documents originaux, </li></ul></ul><ul><ul><li>Bruts de scan, etc. </li></ul></ul><ul><li>Issus d’archives définitives </li></ul><ul><li>Dans un format identifié et vérifiable : </li></ul><ul><li>Le système PAC est interfacé avec les outils Jhove, ImageMagick (et bientôt DROID) pour </li></ul><ul><ul><li>Identifier, Valider, Caractériser, </li></ul></ul><ul><li>Le format des fichiers transférés </li></ul>Type Format Texte HTML, PDF, TXT, XML, ODT Image GIF, JPEG, TIFF, PNG, SVG Audio WAV, AIFF, AAC, VORBIS Vidéo MJPEG2000, MPEG4, THEORA
  11. 11. La structure du document à archiver <ul><li>Document à archiver composé de deux pièces </li></ul><ul><li>La description de l’archive </li></ul><ul><ul><li>Fichier sip.xml (schéma http://www.cines.fr/pac/sip.xsd ) </li></ul></ul><ul><ul><li>3 sections décrivant : </li></ul></ul><ul><ul><ul><li>Le document dans son projet d’archives </li></ul></ul></ul><ul><ul><ul><li>Le document proprement dit </li></ul></ul></ul><ul><ul><ul><li>Les fichiers du document </li></ul></ul></ul><ul><li>Le dossier contenant les documents électroniques à archiver </li></ul><ul><ul><li>Répertoire « DEPOT » </li></ul></ul><ul><ul><li>Sous-arborescence autorisée </li></ul></ul><ul><ul><li>Tout fichier présent doit être décrit dans le fichier sip.xml </li></ul></ul>Présentation PAC - Journées d'étude Couperin Archives ouvertes 03/04/2009
  12. 12. L’architecture logique de la plateforme PAC Présentation PAC - Journées d'étude Couperin Archives ouvertes 03/04/2009
  13. 13. Les principes de fonctionnement <ul><li>Trois serveurs logiques : transfert, stockage, accès </li></ul>Présentation PAC - Journées d'étude Couperin Archives ouvertes 03/04/2009 Serveur Fonctions Transfert réception des SIP détection d’un nouveau transfert envoi d’un accusé de réception contrôle des SIP structure informatique conformité des métadonnées sip.xml par rapport au schéma sip.xsd correspondance entre la description sip.xml et les fichiers qui composent le document contrôle et validation du format des fichiers calcul de l’empreinte numérique de chaque fichier création des AIP création de l’identifiant du document archivé mise à jour des métadonnées : sip.xml > aip.xml transfert de l’AIP au serveur de stockage Stockage archivage des AIP copie multiple de l’AIP sur les différents médias ou supports envoi du certificat d’archivage vérification périodique de l’intégrité des AIP archivés migration technologique fourniture d’états et de statistiques Accès contrôle de l’authentification de l’utilisateur consultation du catalogue des AIP archivés communication d’une copie d’un document archivé
  14. 14. Les étapes du versement d’archives Présentation PAC - Journées d'étude Couperin Archives ouvertes 03/04/2009
  15. 15. L’état des lieux (Mars 2009) <ul><li>PAC - Plateforme d’archivage au CINES - pérenne capable de gérer de larges volumes (20 To extensibles à 40To) – PAC v2.0 </li></ul><ul><li>Basée sur les standards du domaine </li></ul><ul><ul><li>Modèle OAIS, protocole standard d’échange de données pour l’archivage, métadonnées Dublin Core </li></ul></ul><ul><li>Liste des formats de fichier acceptés volontairement limitée </li></ul><ul><ul><li>Formats publiés, largement utilisés, normalisés si possible </li></ul></ul><ul><li>Architecture basée sur du matériel SUN, le logiciel Arcsys et des logiciels libres </li></ul><ul><ul><li>Java, MySQL, Jhove, ImageMagick </li></ul></ul><ul><li>Début de l’exploitation en production Mai 2008 </li></ul>Présentation PAC - Journées d'étude Couperin Archives ouvertes 03/04/2009
  16. 16. Les projets en cours <ul><li>Deux projets pilotes en exploitation </li></ul><ul><ul><li>Archivage des thèses électroniques </li></ul></ul><ul><ul><ul><li>Documents nativement au format électronique versés par l’ABES </li></ul></ul></ul><ul><ul><ul><li>Fait suite à l’arrêté du 7 Août 2006 </li></ul></ul></ul><ul><ul><li>Archivage des revues SHS du portail Persée </li></ul></ul><ul><ul><ul><li>Documents issus de la numérisation de revues au format papier dans le cadre du programme Persée </li></ul></ul></ul><ul><li>Deux projets en cours de réalisation </li></ul><ul><ul><li>Archivage de documents sonores issus de la recherche dans le domaine de l’oral </li></ul></ul><ul><ul><ul><li>Projet pilote CRDO dans le cadre du programme SHS du TGE-Adonis </li></ul></ul></ul><ul><ul><li>Archivage de cours universitaires de Canal-U </li></ul></ul><ul><ul><ul><li>Documents vidéos produits par le CERIMES </li></ul></ul></ul><ul><li>Un projet à l’étude </li></ul><ul><ul><li>Archivage des documents déposés dans les archives ouvertes </li></ul></ul><ul><ul><ul><li>HAL – Hyper Article en Ligne du CCSD </li></ul></ul></ul>Présentation PAC - Journées d'étude Couperin Archives ouvertes 03/04/2009
  17. 17. L’initiation d’un projet d’archives <ul><li>Qui ? Tout organisme </li></ul><ul><li>Produisant ou collectant en grande quantité des documents électroniques dont le contenu possède une valeur patrimoniale scientifique ou technique, </li></ul><ul><li>Doté d’un système informatique pouvant être interfacé avec la plateforme PAC </li></ul><ul><li>Comment ? Deux phases </li></ul><ul><li>Phase préliminaire durant laquelle les points suivants sont abordés : </li></ul><ul><ul><li>l’identification des informations à pérenniser </li></ul></ul><ul><ul><li>la liste des données et métadonnées transmises au CINES (format, taille, nombre…) </li></ul></ul><ul><ul><li>l’analyse de faisabilité (sécurité, aspects légaux, coûts et risques…) ; </li></ul></ul><ul><ul><li>l’évaluation de la volumétrie et des ressources requises. </li></ul></ul><ul><li>Phase dite de définition </li></ul><ul><ul><li>la définition précise des objets à transférer </li></ul></ul><ul><ul><li>les termes et conditions du protocole de transfert (restrictions d’accès, communicabilité au public) </li></ul></ul><ul><ul><li>la planification des transferts physiques ; </li></ul></ul><ul><ul><li>la formation du personnel du service versant à l’utilisation du système PAC </li></ul></ul>Présentation PAC - Journées d'étude Couperin Archives ouvertes 03/04/2009
  18. 18. <ul><li>Au niveau national : </li></ul><ul><li>Groupe de travail PIN (pérennisation de l’information numérique) au sein de l’association Aristote </li></ul><ul><ul><li>Lieu de rencontre et d’échanges entre informaticiens, archivistes et bibliothécaires, animé par le CNES, la BnF, la DAF et le CINES </li></ul></ul><ul><ul><li>Réunions trimestrielles (environ 30 participants réguliers) </li></ul></ul><ul><ul><li>Un site web : http://www.aristote.asso.fr/PIN/index.html </li></ul></ul><ul><ul><li>Une formation spécialisée (2 sessions par an) </li></ul></ul><ul><li>Sous-groupe de travail « conservation numérique » au sein du SNB (schéma numérique des bibliothèques) </li></ul><ul><ul><li>Lieu de rencontre d’experts et d’acteurs de la conservation de documents numériques </li></ul></ul><ul><ul><li>Réunions mensuelles </li></ul></ul><ul><ul><li>Les recommandations du groupe alimenteront un rapport commandé à la BnF par la Ministre de la Culture </li></ul></ul>La participation à des groupes de travail Présentation PAC - Journées d'étude Couperin Archives ouvertes 03/04/2009
  19. 19. La participation à des groupes de travail <ul><li>Au niveau international : </li></ul><ul><li>wePreserve ( http://www.wepreserve.eu/ ) </li></ul><ul><ul><li>Synergie européenne de plusieurs projets : </li></ul></ul><ul><ul><ul><li>DPE (Digital Preservation Europe) </li></ul></ul></ul><ul><ul><ul><li>CASPAR (Cultural, Artistic and Scientific knowledge for Preservation, Access and Retrieval) </li></ul></ul></ul><ul><ul><ul><li>PLANETS (Preservation and Long-term Access through NETworked Services) </li></ul></ul></ul><ul><ul><li>Le CINES référencé Centre de Compétences pour l’archivage par la DPE </li></ul></ul><ul><ul><li>Participation aux séminaires et formations (PLATO, DRAMBORA) </li></ul></ul><ul><ul><li>Traduction française d’articles pour la DPE </li></ul></ul><ul><li>Alliance for Permanent Access </li></ul><ul><ul><li>Initiative européenne pour la coordination de la mise en place d’une infrastructure européenne pour l’archivage pérenne des données scientifiques </li></ul></ul>Présentation PAC - Journées d'étude Couperin Archives ouvertes 03/04/2009
  20. 20. Les perspectives <ul><li>Le CINES est maintenant un acteur reconnu du domaine de la préservation à long terme des documents numériques. </li></ul><ul><li>Fort de la mission nationale que lui a confiée le MESR </li></ul><ul><li>Il est appelé à jouer un rôle clé dans la réussite au niveau national d’une stratégie pour l’archivage pérenne des documents électroniques produits par la communauté Université-Recherche. </li></ul><ul><li>Il reçoit aujourd’hui de nombreuses sollicitations émanant d’universités, de bibliothèques ou de laboratoires, pour divers services dans ce domaine </li></ul><ul><ul><li>l’aide et le conseil à la construction de projets d’archivage à long terme, </li></ul></ul><ul><ul><li>les retours d’expérience </li></ul></ul><ul><ul><li>des propositions de mise en place en partenariat de nouveaux projets d’archives. </li></ul></ul><ul><li>Objectifs 2009-2010 : </li></ul><ul><li>La poursuite et le développement de tous ces projets, </li></ul><ul><li>La consolidation et la professionnalisation du service </li></ul><ul><li>La mise en place démarche de certification du service d’archives à la fin 2010 </li></ul>Présentation PAC - Journées d'étude Couperin Archives ouvertes 03/04/2009
  21. 21. <ul><li>Questions / Réponses </li></ul><ul><li>[email_address] </li></ul>Présentation PAC - Journées d'étude Couperin Archives ouvertes 03/04/2009
  22. 22. Annexes
  23. 23. Le modèle fonctionnel OAIS (rappel) Présentation PAC - Journées d'étude Couperin Archives ouvertes 03/04/2009
  24. 24. Les acteurs <ul><li>Le producteur </li></ul><ul><ul><li>Personne physique ou morale, publique ou privée, qui a produit, reçu et conservé des archives dans l’exercice de son activité. </li></ul></ul><ul><li>Le service versant </li></ul><ul><ul><li>Organisation qui transfère une archive à un service d’archives </li></ul></ul><ul><li>Le service de contrôle </li></ul><ul><ul><li>Personne physique ou morale qui effectue le contrôle scientifique, juridique et technique des documents archivés, et éventuellement valide les demandes de communication d’archives </li></ul></ul><ul><li>Le service d’archives </li></ul><ul><ul><li>Organisation recevant le document à archiver transféré et chargée de la conserver pour permettre à une communauté d’utilisateurs/un service demandeur d’y accéder et de l’utiliser </li></ul></ul><ul><li>L’utilisateur </li></ul><ul><ul><li>Toute personne ou système client en relation avec le service d’archives pour trouver les informations archivées présentant un intérêt, et pour accéder au détail de ces informations, dans le respect de la législation applicable en matière de communication des archives. </li></ul></ul>Présentation PAC - Journées d'étude Couperin Archives ouvertes 03/04/2009

×