Les défis de l'archivage numérique (Fr)

4 327 vues

Publié le

Chaque citoyen mauricien, le secteur public (Gouvernement, Administration et Enseignement) et les compagnies du secteur privé se sont habitués depuis longtemps aux documents papier. L’émergence de l’informatique et des technologies de l’information connexes a révolutionné notre manière de nous exprimer, de penser et de travailler au quotidien.

Publié dans : Technologie
0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
4 327
Sur SlideShare
0
Issues des intégrations
0
Intégrations
8
Actions
Partages
0
Téléchargements
226
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive
  • Plus de la moitié des entreprises possédant, plus ou moins de 100 serveurs, constatent un accroissement de leurs données compris entre 11% et 30%
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6 numérisation rétrospective
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • 6 6
  • Les défis de l'archivage numérique (Fr)

    1. 1. Les défis de l’archivage numérique du 31 juillet au 1er juin 2012 Durée : 45 minutes
    2. 2. Agenda o Introduction o Concepts de base o Cycle de vie de la donnée o Les différentes formes d’archivage o Les solutions disponibles o Conclusion Présentation Atempo Live Backup ™Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 2
    3. 3. Du papier au numérique Chaque citoyen mauricien, le secteur public (Gouvernement, Administration et Enseignement) et les compagnies du secteur privé se sont habitués depuis longtemps aux documents papier. L’émergence de l’informatique et des technologies de l’information connexes a révolutionné notre manière de nous exprimer, de penser et de travailler au quotidien.Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 3
    4. 4. Maurice à l’ère du numérique À l’instar des autres pays dans le monde, Maurice évolue aujourd’hui dans l’ère du numérique et est de plus en plus enclin aux nouvelles technologies. Depuis plusieurs décennies, de grands projets technologiques ont été initiés par les politiques afin de stimuler le développement des compagnies du secteur BPO-TIC et des autres secteurs industriels et de favoriser les échanges internationaux.Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 4
    5. 5. Une ouverture vers le monde… Quelques dates clés : o 2002 Câble sous-marin SAT3/ WASC/SAFE (South Africa Far-East) 340 Gigabits/sec. o fin 2009 Câble sous-marin LION 1,28 Terabits/sec. Situation en 2012Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 5
    6. 6. une couverture Internet nationale… o 2012 (projet) « Faire de l’accès à l’Internet un droit basique » (Tassarajen Pillay Chedumbrum, Ministre des TCI) o 2014 (objectif) très haut débit pour 60 % des foyers mauriciensLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 6
    7. 7. Un flux d’informations quotidien À titre personnel ou professionnel, nous reçevons, générons et diffusons au quotidien, un flux de données et d’informations qu’il convient de gérer et de conserver.Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 7
    8. 8. Des informations de toute nature o email ou courrier papier o newsletter & journaux de presse o fichiers informatiques divers o films, vidéo clips o photos o musiques o SMS, MMS, téléphone o fax, photocopie, scanLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 8
    9. 9. Technologie & e-services Toutes ces technologies de communication et d’information ont les conséquences suivantes : Citoyen : accès simplifié à l’information, à la communication et à la culture grâce à Internet (e-commerce, e-banking, e- learning, réseaux sociaux, VOD, etc.) Secteur public : création d’emplois, optimisation du fonctionnement de ses différents organes (évolution vers le e- government / e-administration) pour un meilleur service envers le citoyen Secteur privé : amélioration de la productivité et de l’efficacité contribuant à une meilleure image et compétitivité à l’international (e-business)Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 9
    10. 10. Un défi pour les secteurs privé & publicQu’il s’agisse d’informations financières, d’emails ouencore de fichiers issus de la production quotidienne,ces informations ou données numériques doivent être : o conservées pour respecter la politique de protection des données de la compagnie et les réglementations en vigueur o disponibles à la demande pour les utilisateurs (respect des SLA*…) o accessibles sans pour autant être disponibles sur le stockage primaire… le tout en maintenant le coût du stockage à unniveau minimum. * Service Level AgreementLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 10
    11. 11. Explosion du volume des donnéesLes compagnies actuelles connaissent en revanche unecroissance exponentielle de leurs données numériques.Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 11
    12. 12. Gestion des données numériquesPour faire face à cet accroissement du volume dedonnées, le citoyen véritable “ consommateur detechnologie numérique ”, les secteurs public ou privéde plus en plus sollicités, doivent mettre en place dessolutions pour conserver et préserver leur patrimoinenumérique selon des critères qui leur sont propres. o sauvegarde o archivageLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 12
    13. 13. Agenda o Introduction o Concepts de base o Cycle de vie de la donnée o Les différentes formes d’archivage o Les solutions disponibles o Conclusion Présentation Atempo Live Backup ™Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 13
    14. 14. Définition de la sauvegarde Sauvegarde : (n. f.) procédure de protection des informations contenues dans un système informatique, par copie de ces informations sur disque ou bande magnétique. (Définition du dictionnaire Larousse).Une politique de sauvegarde doit tenir compte des questions suivantes :o Quelles sont les données à sauvegarder ?o Quand doit-on sauvegarder les données ?o Où doit-on sauvegarder les données ?o Combien de temps dois-je conserver une copie des données sauvegardées ?Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 14
    15. 15. Définition de l’archivage Archivage : (n. m.) action de conserver et de classer des documents ne présentant plus un intérêt immédiat (Définition du dictionnaire Larousse).Une politique d’archivage doit tenir compte des questions suivantes :o Quelles sont les données à archiver ?o Quelle organisation logique adopter ?o Qui peux accéder à quoi ?o Comment puis-je retrouver facilement les données ?Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 15
    16. 16. Distincts mais complémentaires… La sauvegarde et l’archivage sont deux processus distincts avec des objectifs de gestion de la donnée différents. Ils doivent par conséquent être traités différemment : o le processus de sauvegarde stocke de multiples copies de la donnée active dans le but de pouvoir les restaurer en cas de désastre. Il s’agit d’une copie distante d’une donnée, stockée sur le stockage primaire, changeant fréquemment et nécessitant au minimum une sauvegarde quotidienne. o le processus d’archivage est au contraire à l’opposé de la sauvegarde. Le but est de disposer d’une copie unique d’une donnée jugée inactive pour préserver et conserver l’intégrité de son contenu.Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 16
    17. 17. Copie primaire ou secondaire Donnée dynamique Donnée statique Donnée de production Stockage Sauvegarde primaire Archivage Copie(s) secondaire(s) Copie primaire de fichiers ou de fichiers, base de d’emails (dossier comptables, données, emails, rapports financiers, fichiers audio & machines virtuelles… vidéo, projets achevés, etc.) avec indexation éventuelle du contenu.Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 17
    18. 18. Comparatif sauvegarde & archivage SAUVEGARDE ARCHIVAGE Stockage planifié de données Déplacement de données sélectionnées Restauration Préservation et restitution Création d’une copie secondaire du contenu Création d’une copie primaire du contenu statique dynamique d’une donnée d’une donnée de référence Rétention du contenu à court terme Stockage du contenu sur le long terme Supports performants et réinscriptibles Supports permanents, inaltérables Formats d’écriture propriétaires sur le support Formats d’écriture normalisés sur le support Conformité au contexte d’origine uniquement Conformité sur le long terme (organisation logique, (mémorisation des chemins et attributs) absence de chemin, saisie de métadonnées) Toutes les données sont potentiellement À l’issu de la préparation, seule une sélection des concernées (fichiers ou base de données) données est concernée Hétérogénéité des plateformes et applications, Plus faible diversité de plateformes et fenêtres de sauvegardes imparties, besoin de d’applications, absence de planification, moindre performance en sauvegarde et en restauration criticité des performancesLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 18
    19. 19. Conclusion : la sauvegarde La sauvegarde est un processus planifié de collecte, d’acheminement et de stockage sur le court terme d’un ensemble de données dynamiques en vue d’une restauration.Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 19
    20. 20. Conclusion : l’archivage L’archivage est un processus ponctuel de sélection, de classification et de conservation sur le long terme d’un ensemble de données statiques en vue d’une restitution ou d’une exploitation de leur contenu.Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 20
    21. 21. Agenda o Introduction o Concepts de base o Cycle de vie de la donnée o Les différentes formes d’archivage o Les solutions disponibles o Conclusion Présentation Atempo Live Backup ™Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 21
    22. 22. La donnée et son écosystème La donnée est par conséquent au cœur des préoccupations de tout un chacun, qu’il s’agisse de préserver : Citoyen : les photos de famille, vidéos ou musiques préférées ou encore des documents personnels Secteur public : les données personnelles des citoyens, des différentes administrations, militaires ou encore celles issues d’un processus de dématérialisation Secteur privé : les données stratégiques, vitales et confidentielles de la compagnie (financières, juridiques et commerciales)Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 22
    23. 23. Mieux connaître et maîtriser la donnéeSi nous savons parfaitement générer de la donnée etla diffuser grâce aux infrastructures actuelles, unegestion et une préservation de la donnée reposentsur… o une meilleure compréhension de son cycle de vie o une estimation de sa valeur fondée sur des critères à caractère juridique ou économique.Ces points sont indispensables, et ce, principalementpour le secteur public et les compagnies privées.Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 23
    24. 24. Information Life Cycle Management (ILM) Le cycle de vie de la donnée et la valeur économique ou juridique peuvent être appréhendés au moyen de l’ILM. Information Lifecycle Management (ILM) : stratégie comportant un ensemble de directives, de processus, de meilleures pratiques, de technologies logicielles et matérielles destinée à pouvoir disposer d’une donnée, selon un critère économique ou juridique, depuis sa génération jusquà son classement final.Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 24
    25. 25. ILM Framework e ne ni er ag Ex t Clients C om p Besoins Fournisseurs Définition Exigences Conformité Exigences Activité Exigences ILM • Sauvegarde • Archivage • DRP • Procédure & processus Conformité IT Réglementations Staff • Automatisme Organisme de régulation Génère Exploite Logiciels Applications I LM Gestion de l’information Gestion de la donnée InfrastructureLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 25
    26. 26. Agenda o Introduction o Concepts de base o Cycle de vie de la donnée o Les différentes formes d’archivage o Les solutions disponibles o Conclusion Présentation Atempo Live Backup ™Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 26
    27. 27. Trois motifs d’archivage des données Compte-tenu des différentes contraintes et obligations qui pèsent sur les données, l’archivage peut être classifié comme suit : Archivage Réduire les coûts de la donnée en hiérarchique optimisant les ressources de ( HSM *) l’entreprise Archivage Préserver, valoriser et organiser patrimonial l’historique des données sur le long terme Archivage Conserver, sécuriser et garantir l’intégrité légal de la donnée pour se conformer aux réglementations en vigueur * Hiérarchical Storage ManagementLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 27
    28. 28. Archivage hiérarchique (HSM*)« Trouver un compromis entreles coûts d’exploitation et laperformance du systèmed’information. » * Hiérarchical Storage ManagementLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 28
    29. 29. Les défis de l’archivage hiérarchique (HSM*) o La préoccupation première est la maîtrise des coûts associés à l’augmentation des volumes de données sur le stockage primaire o Le processus de sauvegarde est inopérant et la fenêtre de sauvegarde impartie n’est plus respectée o La donnée (copie primaire) est migrée selon sa fréquence d’accès ou de modification sur un support secondaire ou tertiaire (Tiered Storage Management) selon des critères économiques ou de performance o Ce processus est transparent pour l’utilisateur, la donnée migrée est restituée à la demande depuis le support d’archivage * Hiérarchical Storage ManagementLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 29
    30. 30. Principe et constatation o L’optimisation des ressources du système d’information induite par la mise en place d’un archivage hiérarchique (ou économique) est obtenue par une analyse de la fréquence d’accès (atime) ou de modification (mtime) de la donnée sur le stockage primaire o Face à l’accroissement des volumes de données, il devient nécessaire de trouver un compromis entre le coût d’exploitation et la performance d’accès à la donnée et son utilisation quotidienne par les utilisateursLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 30
    31. 31. Statique ou dynamique ? o Le système différencie ainsi les données rarement consultées (en lecture/écriture) de celles utilisées au quotidien, autrement dit « statiques » ou « dynamiques » respectivement o la taxonomie de donnée suivante peut être définie : o Active consultée fréquemment dans le cadre de la production o Récente consultée depuis peu ou régulièrement, doit être conservée en ligne o Archive doit être conservée, mais n’est consultée qu’exceptionnellementLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 31
    32. 32. Cycle de vie de la donnéeLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 32
    33. 33. Tiered Storage Management Création d’un Stub RÉPLICATION SNAPSHOT CDP SAUVEGARDE ARCHIVAGELes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 33
    34. 34. Quelques chiffres clés… o statistiquement les données de production, dites « actives », ne représentent qu’entre 20% et 30% du volume total sauvegardé o entre 40% et 60% des données sauvegardées quotidiennement n’ont pas été consultées depuis plus de 2 années o les données statiques présentent sur le stockage primaire représentent entre 20% et 40% du volume totalLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 34
    35. 35. Bénéfices de l’archivage hiérarchique o La sauvegarde et l’archivage hiérarchique sont étroitement liés ce dernier apportant rapidement les bénéfices suivants : o réduction du volume de données sur le stockage primaire (données de production) o diminution du temps de sauvegarde o réduction du volume de données sur le stockage secondaire (données sauvegardées)Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 35
    36. 36. Conclusion o L’archivage hiérarchique permet de réduire le volume de données sauvegardées quotidiennement et de diminuer le nombre de bandes Avant… Après… sans HSM avec HSMLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 36
    37. 37. Archivage patrimonial« Organiser, hiérarchiser etindexer la donnée pour unemeilleure valorisation de sonpatrimoine numérique. »Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 37
    38. 38. Les défis de l’archivage patrimonial o L’objectif est de recenser, hiérarchiser et d’indexer, grâce à des métadonnées, un ensemble de données non structurées afin d’en préserver le contenu et la présentation pour une exploitation future o Les formats de données éligibles pour l’archivage sont hétérogènes (généralement propriétaires) et ils doivent être normalisés afin de garantir dans le temps la pérennité de restitution et de diffusion du contenu des données archivées o Les supports destinés à l’archivage doivent être à même de suivre les évolutions technologiques les concernant o Les formats utilisés par les solutions d’archivage doivent impérativement être ouverts pour garantir, sur le long terme, une parfaite indépendance de la donnée archivéeLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 38
    39. 39. Les médias, acteurs du patrimoine numériqueLa presse audio-visuelle, les journaux, la télévision, la radiosont des acteurs majeurs dans la génération de contenusmultimédia pour le grand public et les compagnies privées :o reportages culturels TV et radioo revue de presseo interview radio et téléviséeo sondages d’opiniono retransmission d’évènements publicsAvec les artistes, les conservateurs et écrivains, ilscontribuent à alimenter la principale mémoire papier etaudio-visuelle d’un pays. Au même titre que le secteur public,ils sont également d’excellents candidats dans un projetd’archivage patrimonial.Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 39
    40. 40. Patrimoine numérique du citoyen (1/2)o Une réelle stratégie de sauvegarde est complexe à mettre en œuvre et onéreuse par rapport à la valeur « réelle » des donnéeso Aucune distinction entre un processus de sauvegarde et d’archivageo Une copie des données jugées utiles est réalisée ponctuellement sur un support amovible bon marché (clé ou disque USB)o Il n’y a aucune gestion des versions de fichier : la dernière version du fichier remplace « généralement » la précédenteLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 40
    41. 41. Patrimoine numérique du citoyen (2/2)o Le patrimoine numérique « maison » est constitué majoritairement de fichiers multimédia (titres musicaux, photo et vidéo) et de fichiers bureautiques pour la correspondance o appareil photo numérique, caméra vidéo o numérisation de CD audio (ou téléchargement iTunes) o problèmes liés aux formats propriétaires compressés ou nono La préservation des emails reste un « casse-tête » : o utilisation de webmails (pas forcément de copie locale) o exotisme des formats de stockage des messagesLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 41
    42. 42. Patrimoine numérique dans une SMB* (1/2)o Utilisation de logiciels avec des formats propriétaires etnon documentés de type Microsoft pour les bases dedonnées (MS SQL Server), les applications (MS Exchange)et de suite bureautique (MS Office)o Une politique de sauvegarde élémentaire estopérationnelleo Les données de production s’accumulent sur le stockageprimaire, même en fin de vie : o Aucune gestion du cycle de vie des données : « On garde tout ! » o Aucune politique d’archivage : les données statiques coexistent avec les données dynamiques de production (longues sauvegardes) * Small Medium BusinessLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 42
    43. 43. Patrimoine numérique dans une SMB* (2/2)o Une copie papier est conservée « en lieu sûr » par chaque servicepour les documents les plus importants ou sur un support amovible(ex. clé ou disque USB)o Les formats de données sont migrés à chaque changement deversion majeure (par ex. fin de support de la suite bureautique)o Les données sont regroupées sur un ou plusieurs serveurs defichiers. Chaque service ou utilisateur possède sa méthode declassement (création en règle générale d’une arborescence defichiers constitués de répertoires)o Il est possible de définir des métadonnées correspondant àl’activité de la compagnie pour chaque application métier * Small Medium BusinessLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 43
    44. 44. Problèmes humains et techniques (1/2)o Absence d’outil standard pour classer et indexer les documents (ajout de métadonnées)o Réticences concernant l’adhésion à la politique d’archivage : o définition de règles strictes bouleversant les habitudes des utilisateurs o absence de décision de la part des personnes concernées (utilisateurs et/ou décideurs)o Nécessité de convertir les documents éligibles, utilisant des formats propriétaires, dans un format documenté et sans restriction d’utilisation (PDF/A, TIFF, XML, Texte)Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 44
    45. 45. Problèmes humains et techniques (2/2)o Nécessité de sélectionner, d’exporter les données destinées à l’archivage d’une base de données et de les stocker dans un format structuré (type XML)o Définition de règles conditionnant l’archivage d’un document (déclencheur)o Désuétude des supports secondaires de données archivées, nécessitant une recopie des données pour suivre leur évolution (absence parfois de compatibilité ascendante)Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 45
    46. 46. Solutions apportées aux formats L’utilisation de formats propriétaires, au niveau de la donnée de production, compromet la pérennité de son exploitation sur le long terme.o Des formats de fichiers destinés à la diffusion et à l’archivage ont été élaborés conformément à des normes internationales (ISO)o De la même manière, le format d’écriture sur le support d’archivage doit être indépendant et normalisé Tous les formats de fichier et d’écriture doivent être parfaitement documentés et accessibles à tous !Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 46
    47. 47. Formats d’écriture La solution visant à archiver les données, sous forme d’assemblage de fichiers, sur un support de type bande physique doit utiliser les formats d’écriture suivants : o tar ou cpio* Standardisé par les normes POSIX 1-1988 puis POSIX 1-2001 o SIDF Standardisé par la norme ECMA-208, puis ISO/IEC 14863:1996 Information technology -- System-Independent Data Format (SIDF) * abandonné par des versions ultérieures de la norme à partir de POSIX.1-2001, en raison de sa limitation aux fichiers de 8 GoLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 47
    48. 48. Formats destinés à l’archivage / à la diffusion Le document papier est fixé au terme de sa production et ne change plus pour toutes les autres étapes de son cycle d’utilisation. A contrario, le document électronique issu de la production (format généralement propriétaire) se voit converti en un format de fichier différent pour : o la diffusion (web, consultation à l’écran, impression papier) o l’archivage (préservation et conservation)Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 48
    49. 49. Etapes Production, Diffusion et Archivage Un document peut être archivé ou diffusé dans deux situations distinctes, selon le support de production à disposition (la source) : o document papier exclusivement o document numérique exclusivement Dans un projet de numérisation, incluant un processus de conservation à long terme, doit prévoir la génération de ces deux jeux de données. Chaque document « post- production » peut être enrichi et indexé grâce à des métadonnées pour une exploitation future (e-discovery).Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 49
    50. 50. Numérisation rétrospective : papier Quand la source est un support papier,Manuscrit livres anciens ou manuscrits par papier exemple, ils doivent être numérisés (scannés sans OCR*) pour pouvoir être Numérisation diffusés et/ou archivés. Métadonnées + Structuré XML Fichier format Archivage TIFF long termeConversion Image Consultation, recherche… Diffusion * Optical Character Recognition Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 50
    51. 51. Numérisation rétrospective : numérique Quand la source est un support Fichier numérique, fichier Word produit par unnumériqu e utilisateur par exemple, ils doivent être convertis pour pouvoir être diffusés Conversion et/ou archivés. Métadonnées + Structuré XML Fichier format Archivage TIFF long terme Consultation, rechercheConversion Texte « Full- Text »… Diffusion Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 51
    52. 52. Formats d’archivage : image Format TIFF_6 (Tagged Image File Format, révision 6) Développé par Aldus (puis racheté par adobe et Microsoft) Standard ISO/IEC 12639:2004 Permet la création d’images de grande taille, sans perte de qualité, indépendamment des plateformes et des périphériques, documentation des images (tag) o idéal pour de l’archivage à long terme o pleinement documenté o gestion de couleur étendue (RVB et quadrichromie) o couramment utilisé dans les imprimeries o consultable par le web sous certaines réservesLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 52
    53. 53. Formats d’archivage : audio Format WAVE (Broadcast Wave Format BWAV) Développé par l’European Broadcasting Union depuis le format WAVE de Microsoft, s’appuyant sur les spécifications génériques du Resource Interchange File Format (RIFF) développé par Microsoft et IBM. Recommandé par l’IASA (International Association of Sound and Audiovisual archives) Permet la création de fichiers son de grande taille et est adapté à la diffusion indépendamment du périphérique utilisé o pleinement documenté o qualité sonore de type CD o largement répandu dans le secteur public et privéLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 53
    54. 54. Formats d’archivage : vidéo Format MPEG-4_FF_2 (version 2) Développé par Motion Picture Experts Group Standard ISO/IEC 14496-14:2003 Permet la création de vidéo de grande taille, sans perte de qualité et est adapté à la diffusion indépendamment du périphérique utilisé o pleinement documenté o bonne qualité de l’image et du son (dépend cependant du processus d’encodage) o largement répandu dans le secteur public et privéLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 54
    55. 55. Formats d’archivage : texte Format PDF/A (PDF Archive) Développé par un comité technique ISO/IEC JTC, en collaboration avec l’Union internationale des Télécommunications Standard ISO 19005-1:2005 Permet de générer un fichier assurant la conservation à long terme des fichiers PDF, il s’appuie sur la version PDF 1.4. Il est employé dans darchivage électronique des documents et la constitution de bibliothèques numériques.Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 55
    56. 56. Formats d’archivage Format PDF/A (PDF Archive) Ce format possède quelques contraintes : o interdiction d’avoir un contenu audio/vidéo o utilisation obligatoire de métadonnées standardisées o nécessité d’encapsuler les polices de caractères afin d’obtenir un rendu universel o fichiers exécutables et Javascript déconseillésLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 56
    57. 57. Bénéfices de l’archivage patrimonial L’archivage patrimonial permet de valoriser et d’enrichir le contenu d’une donnée dans le but de le restituer à l’identique. Il permet de préserver un contenu de données multimédia (audio et vidéo) et texte. Il ouvre les perspectives suivantes : o création d’une médiathèque offrant un accès à la culture à chaque citoyen et étudiant, possédant un rayonnement international grâce à l’Internet o consultation d’anciens journaux, articles de presse et reportages télévisés o immortalisation d’une partie du patrimoine national culturelLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 57
    58. 58. Archivage légal« Préserver, sécuriser etgarantir l’intégrité de la donnéepour se conformer auxréglementations en vigueur. »Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 58
    59. 59. Les défis de l’archivage légal (1/2) o L’objectif est de recenser et de conserver électroniquement un document dématérialisé, afin d’en garantir la pérennité, la sécurité, l’intégrité et la non-répudiation pour une restitution à l’identique. o Les formats de données éligibles pour l’archivage sont hétérogènes et l’on est souvent confronté à des documents papiers manuscrits, notamment dans les différentes administrations du gouvernement (informations sur l’état civil, informations cadastrales, actes notariés, etc.).Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 59
    60. 60. Les défis de l’archivage légal (2/2) o L’accès au document archivé doit être restreint pour en garantir sa sécurité. o La probité d’un document archivé repose sur son intégrité au moyen d’une signature électronique, incontestable par le législateur, permettant d’identifier son auteur et de protéger le contenu. o Les formats utilisés par les solutions d’archivage doivent impérativement être ouverts pour garantir, sur le long terme, une parfaite indépendance de la donnée archivéeLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 60
    61. 61. Contrefaçon Chaque citoyen signant un document papier peut se citoyen voir confronté au problème de la contrefaçon. Une personne mal intentionnée peut tenter d’imiter votre signature ou pire votre écriture et l’apposer sur un autre document pour vous accuser. o vous devez par conséquence vous défendre face à la justice afin de prouver votre bonne foie. faussaire o le juge peut demander une expertise en écriture afin de viser l’authenticité du document en question. Les résultats ne sont pas toujours probants et l’expert doit observer une indépendance absolue.Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 61
    62. 62. Chiffrage d’un document D’un point de vue numérique, il est possible de chiffrer un document, afin que son contenu ne soit exploitable (lisible) que par la (les) personne(s) possédant la clé. propriétaire document original chiffré Format chiffrage PDF/A La clé de chiffrage est communément appelée « clé publique » (Whitfield Diffie et Martin Hellman, 1976).Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 62
    63. 63. Déchiffrage d’un document Lors du chiffrage, le propriétaire du document s’est vu remette une clé, différente de celle ayant permis de chiffrer l’original. Cette clé est communément appelée « clé privée ». propriétaire document chiffré original personne de déchiffrage confiance La clé de déchiffrage peut être distribuée à plusieurs personnes de confiance et conservée en lieu sûr.Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 63
    64. 64. Autorité de certification L’Autorité de certification (Certificat Autority - CA) est une instance ayant pour mission de signer, CA d’émettre et de maintenir à jour : o les certificats (CSR : Certificate Signing Request) o les listes de révocation (CRL : Certificate Revocation List) Le CA recense les clés publiques associées et leurs propriétaires légitimes pour garantir une communication en toute confiance. D’un point de vue organisationnel, à Maurice, le candidat éligible, pourrait être : o ICTA (Information and Communication Technologies Authority)Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 64
    65. 65. Organisation propriétaire personne de confiance original document chiffré chiffrage Demande de Certification du document distribution distribution faussaire CA Génération clés publiques / privées(s) Enregistrement des CSRLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 65
    66. 66. Dématérialisation La dématérialisation permet de transformer des documents papier en documents électroniques. En s’appuyant sur un principe de chiffrement, les applications sont multiples : o citoyen : achat par Internet avec facture à l’appui (e-commerce), accès à des services publics (déclaration d’impôts, vote, etc.) o service public : recentrage des fonctionnaires sur leur activité principale, le service au citoyen o service privé : e-business, échange de données électroniquesLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 66
    67. 67. Principales réglementations en vigueur Finance Government Healthcare Distribution Industrial Life Sciences Basel II DOD 5015.2 HIPAA UCC net Tread Act Patriot Act UK-Pro FDA 21 CFR 11 RFID Security Standards Anti-Money Gov. Paperwork FDA Drug Barcode Bar-code Motor Vehicle Elimination Act regulation modification Block Exemption Act Laundering GCI (Global Commerce Init) Gramm-Leach- Chip and Pin Bliley Act SEC 17-a-4 Sarbanes-Oxley International Accounting standards Data Protection Act Freedom of Information Act ISO 17799 Information Security Standards California State Bill – SB 1386 Several Privacy regulationsLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 67
    68. 68. Pénalités en cas de non conformité Selon les réglementations en vigueur, tout contrevenant (personne ou compagnie) s’expose à : o une responsabilité pénale civile (en cas de négligence) ou criminelle (en cas de fraude) avec de fortes amendes o une perte de réputation et de crédibilité o une perte de confiance des principaux intéressés (clients, fournisseurs, citoyens)Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 68
    69. 69. Data Protection Act 2004 Toutes les compagnies incorporées à Maurice et manipulant des données informatiques tierces sont soumises aux règles du DPA. o Les compagnies s’engagent à n’exploiter à titre commercial aucunes données personnelles ou professionnelles sous quelle que forme que ce soit o Aucune information ne stipule, à l’heure actuelle, les obligations de conservation dans le temps des données à caractère légal traitées par les compagniesLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 69
    70. 70. Bénéfices de l’archivage légal La mise en place d’une politique d’archivage légal consiste principalement à se prémunir des fortes amendes susceptibles d’être appliquées aux compagnies ne respectant pas les réglementations locales et internationales (en vertu de l’application de l’extraterritorialité). o Les données susceptibles d’être auditées peuvent en revanche constituer des preuves à charge à l’encontre des compagnies privées (email litigieux). o Cet outil peut s’avérer utile pour tous les organes visant à lutter contre la corruption (ICAC)Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 70
    71. 71. Agenda o Introduction o Concepts de base o Cycle de vie de la donnée o Les différentes formes d’archivage o Les solutions disponibles o Conclusion Présentation Atempo Live Backup ™Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 71
    72. 72. Choix du support d’archivage Chaque support d’archivage, numérique ou non, possède des avantages et des inconvénients. Il convient de se poser les questions suivantes. o À quel usage est destiné le support ? o Quelle est sa durée de vie, dans quelles conditions ? o Quelle est la nature de la donnée : économique, patrimoniale ou légale ?Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 72
    73. 73. Autres facteurs importants o Quelle est le coût lié au support : o achat o conservation et manipulation dans des conditions idéales, dans le temps conformément aux spécifications du constructeur o maintenance logicielle & matérielle éventuelle o valeur probante du support (d’un point de vue légal) o risques humains et environnementaux liés à sa destruction ou un endommagement physique support (inondation, incendie, manipulation, virus, malveillance…)Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 73
    74. 74. Perte de données : causes principales Source: Dr. David M Smith, Pepperdine University, 2003Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 74
    75. 75. Durée de vie par support* disque optique disque dur bande magnétique microfilm papier5 ans 15 ans 30 ans 75 ans 10 ans 50 ans 100 ans 200 ans 500 ans * Sous réserve d’être manipulé et conservé dans des conditions optimales Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 75
    76. 76. Durée de vie & compatibilité ascendante Technologie de LTO Gen 4 (WORM) bandes magnétiques LTO Gen 3 LTO Gen 5 (WORM+AES-GCM 256) Compatibilité ascendante (2 générations) LTO Gen 2 LTO Gen 1 10 ans durée de vie du support 30 ans 2000 2004 2010 2020 2030 2002 2006Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 76
    77. 77. Archivage sur disque Les deux supports prédominants utilisés pour l’archivage restent le disque et la bande magnétique. o Avantages : grande capacité d’extension, redondance pour une plus grande sécurité, grande rapidité d’accès, possibilité de répliquer les données, déduplication o Inconvénients : coût, consommation énergétique élevée, non transportable (externalisation), faible durée de vie comparée à la bande magnétique (MTBF*), assujetti aux virus * Mean Time Between FailureLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 77
    78. 78. Archivage sur bande magnétique Les deux supports prédominants utilisés pour l’archivage restent le disque et la bande magnétique. o Avantages : fiabilité, faible consommation énergétique, encryptage, probité du support (fonctionnalité WORM*), transportable sous condition, non affecté par les virus, meilleures performances de restauration pour les fichiers volumineux o Inconvénients : lenteur d’accès comparé au disque, fragilité, sensible aux conditions climatiques, capacité fixe * Write Once Read ManyLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 78
    79. 79. Archive as a Service (AaaS - Cloud) Les restrictions budgétaires mettent de plus en plus de pression sur les services IT. Certaines compagnies, parfois d’envergure internationale, ont déjà pris la peine d’externaliser leur service IT ou une partie de celui-ci, associée à un centre de coût, jugé trop onéreux. Certains prestataires du marché proposent désormais d’archiver vos données sur le Cloud.Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 79
    80. 80. Définition du Cloud Cloud : « modèle pratique, à la demande, pour établir un accès par le réseau à un réservoir partagé de ressources informatiques configurables (réseau, serveur, stockage, applications et services), pouvant être rapidement mobilisées et mises à disposition, en minimisant les efforts de gestion ou les contacts avec le fournisseur de service. » (Définition du National Institute of Standards and Technology)Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 80
    81. 81. Les bonnes questions à se poser En externalisant une partie de vos données archivées et en déléguant leur gestion, vous confiez probablement au prestataire ce qu’il y a de plus important et de plus coûteux en cas de désastre : la donnée ou « votre patrimoine numérique ». Les questions suivantes ne sont pas exhaustives, mais il est vital de se les poser. o Quelle est la nature des données stockées ? o S’agit-il de données personnelles non chiffrées ? o Quelle est la localisation géographique des données ? o Qui aura accès aux données ? o L’accès aux données est-il audité ? o Quelle est la garantie de service fournie (SLA) ? o Dans quel format les données sont-elles restituées ?Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 81
    82. 82. Le Cloud public… pour qui et pour quoi ? Le Cloud public implique une mutualisation des données chez le fournisseur de service et les réponses découlant des questions précédentes, d’une manière générale : o citoyen : la donnée archivée sur le Cloud possède ici la « valeur du cœur » o secteur public : l’emploi d’un Cloud public est extrêmement périlleux. Les données publiques étant stockées sur des équipements privés appartenant au fournisseur de service. o secteur privé : l’éligibilité des données doit se faire en toute connaissance de cause (exclusion des données sensibles).Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 82
    83. 83. Et le Cloud privé…? Autre alternative, le Cloud privé : o interne : le client conserve la maîtrise de son infrastructure et des services et applications associés , car il en reste propriétaire, tout en profitant de la souplesse d’un approvisionnement de ressources automatisé. o externe : les ressources physiques (infrastructure) ne sont pas mutualisées avec celles des autres clients, les services et applications associés restent à la charge du fournisseur.Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 83
    84. 84. Logiciel d’archivage L’archivage est un processus complexe quelle que soit sa forme (économique, patrimoniale ou légale) impliquant de se doter d’un logiciel performant et répondant à ces défis : o support multiplateforme, multi support o format d’archivage indépendant du logiciel o création de stub (HSM) o injection automatique des métadonnées pour (archivage audio-vidéo) o gestion centralisée des droits d’accès aux archives o organisation logique des archives o moteur de recherche full text (e-discovery) o destination d’archives multiplesLes défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 84
    85. 85. Agenda o Introduction o Concepts de base o Cycle de vie de la donnée o Les différentes formes d’archivage o Les solutions disponibles o Conclusion Présentation Atempo Live Backup ™Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 85
    86. 86. Anecdote (1/2) Le 27 juillet 2001, l’agence Reuters rapporta le fait suivant concernant le cas du neurobiologiste de l’Université de Californie du Sud, Joseph Miller… Celui-ci avait demandé à la NASA de pouvoir consulter certaines données anciennes que les sondes Viking avaient envoyées de Mars au milieu des années 1970. L’Agence spatiale américaine sortit des bandes magnétiques pour ordinateur vieilles de 25 ans qui étaient dans un format illisible.Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 86
    87. 87. Anecdote (2/2) « La NASA avait oublié depuis longtemps ce logiciel ou, selon les mots de M. Miller, « les programmeurs qui le connaissaient étaient morts ». Joseph Miller cherchait dans ces données des preuves de vie microbienne sur Mars, traces qui avaient été classées à l’origine comme signes d’« activité chimique sans intérêt ». Il dut finalement se contenter des documents imprimés que l’équipe de la NASA de l’époque avait sauvés et qui ne contenaient qu’un tiers des données numériques d’origine.Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 87
    88. 88. « Préserver les données sur lelong terme n’est pas unemince affaire… »Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 88
    89. 89. Pour conclure… il est indispensable que les techniques etpolitiques spécifiques d’archivage numériquesoient élaborées, testées et éprouvées, …Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 89
    90. 90. Terminons sur une note d’humour … sous peine de voir disparaître un pan entierde notre patrimoine culturel que l’on croyaitpréservé grâce à la technologie… » Plug and Pray!Les défis de l’archivage numérique © CABSIS Consulting Ltd - 2012 90
    91. 91. Merci pour votre attention Questions / réponses CABSIS Consulting Ltd Angle des rues Shakespeare & Herschell | Champ de Mars | Port Louis | Mauritius VAT No : VAT20469111 | BRN : C08083351

    ×