Diaporama autour des enjeux de la conservation et de l’archivage du patrimoine numérique, des efforts de normalisation et des actions réalisées par la BNF sur ce sujet ainsi que les perspectives et vecteurs d’attention.
Quelle(s) mémoire(s) pour demain ?
5 tendances actuelles
- la mémoire en ligne atteind un statut de légitimité
- les données s’effacent mais sans une réelle maîtrise
- les designers se posent la question de la visualisation
des données de masses personnelles
- l’accumulation de données dans le temps dessine
des tendances dans l’avenir
- la mémoire sort du web et devient objet
Cours de bibliothéconomie : actualité et missions des bibliothèques, en France et à l'étranger. Préparation concours des bibliothèques. CRFCB - CNFPT Toulouse Midi-Pyrénées Languedoc-Roussillon
Compte de rendu de sessions du 80ème congrès mondial des bibliothèques IFLA 2014 : le dépôt légal des ebooks, la fouille de données (Text&Data Mining), les posters scientifiques, l'IdeasBox (médiathèque mobile pour camps de réfugiés)
Quelle(s) mémoire(s) pour demain ?
5 tendances actuelles
- la mémoire en ligne atteind un statut de légitimité
- les données s’effacent mais sans une réelle maîtrise
- les designers se posent la question de la visualisation
des données de masses personnelles
- l’accumulation de données dans le temps dessine
des tendances dans l’avenir
- la mémoire sort du web et devient objet
Cours de bibliothéconomie : actualité et missions des bibliothèques, en France et à l'étranger. Préparation concours des bibliothèques. CRFCB - CNFPT Toulouse Midi-Pyrénées Languedoc-Roussillon
Compte de rendu de sessions du 80ème congrès mondial des bibliothèques IFLA 2014 : le dépôt légal des ebooks, la fouille de données (Text&Data Mining), les posters scientifiques, l'IdeasBox (médiathèque mobile pour camps de réfugiés)
Présentation réalisée par Lionel Maurel et Thomas Fourmeux lors de la journée d'étude sur les biens communs organisée par le groupe régional ABF Franche-Comté.
L'association BrailleNet a mis en service la plateforme Helene 3.0. Cette plateforme Web permet de stocker des fichiers de livres numériques dans un format standard défini par le consortium Daisy, de les convertir dans des formats adaptés aux besoins des personnes handicapées visuelles (braille, audio, gros caractères), de gérer un catalogue accessible, de sécuriser les fichiers et de les distribuer à des utilisateurs authentifiés. Helene 3.0 sert de support aux différents partenaires du projet francophone de la Bibliothèque Numérique Francophone Accessible qui mutualisent ainsi leurs outils et leurs méthodes de production et réduisent leurs coûts de fonctionnement. Pour plus d'information on pourra se reporter aux sites français http://www.bnfa.fr
Helene 3.0 a été développée par trois organismes de recherche publique, UPMC, INRIA, INSERM, avec le soutien de programmes de recherche français et européens et de partenaires privés.
Présenté dans le cadre du 7e Congrès des milieux documentaires. Montréal 2015
Projet de diffusion numérique à l'aide d'un petit boîtier (routeur Wi-Fi modifié)
présentation des Bibliobox lors de la journée Mettre en œuvre des pratiques innovantes en bibliothèque organisée par Savoie Biblio le 10/12/2015
Pour la diapo avec R2D2, je présente un livre numérique réalisé à partir d'articles Wikipédia compilant une présentation de l'univers de Star Wars à télécharger ici :
Présentation réalisée par Lionel Maurel et Thomas Fourmeux lors de la journée d'étude sur les biens communs organisée par le groupe régional ABF Franche-Comté.
L'association BrailleNet a mis en service la plateforme Helene 3.0. Cette plateforme Web permet de stocker des fichiers de livres numériques dans un format standard défini par le consortium Daisy, de les convertir dans des formats adaptés aux besoins des personnes handicapées visuelles (braille, audio, gros caractères), de gérer un catalogue accessible, de sécuriser les fichiers et de les distribuer à des utilisateurs authentifiés. Helene 3.0 sert de support aux différents partenaires du projet francophone de la Bibliothèque Numérique Francophone Accessible qui mutualisent ainsi leurs outils et leurs méthodes de production et réduisent leurs coûts de fonctionnement. Pour plus d'information on pourra se reporter aux sites français http://www.bnfa.fr
Helene 3.0 a été développée par trois organismes de recherche publique, UPMC, INRIA, INSERM, avec le soutien de programmes de recherche français et européens et de partenaires privés.
Présenté dans le cadre du 7e Congrès des milieux documentaires. Montréal 2015
Projet de diffusion numérique à l'aide d'un petit boîtier (routeur Wi-Fi modifié)
présentation des Bibliobox lors de la journée Mettre en œuvre des pratiques innovantes en bibliothèque organisée par Savoie Biblio le 10/12/2015
Pour la diapo avec R2D2, je présente un livre numérique réalisé à partir d'articles Wikipédia compilant une présentation de l'univers de Star Wars à télécharger ici :
Open source opendata, socle de la documentation de l'avenirVincent Mabillot
Diaporama présenté lors du symposium koha 2011 (Lyon) : Proposition pour penser les opportunités et la pertinences des modèles de l'open source et de l'open data pour penser la documentation de l'avenir
Que restera-t-il de nos archives personnelles en 2030 ? (2009)Ardesi Midi-Pyrénées
Diaporama sur la définition des archives numériques personnelles et les conseils et méthodes pour en assurer une conservation et un archivage durable dans le temps.
Intervention de Clément Oury de la Bibliothèque Nationale de France (Service dépôt légal numérique), à l'occasion du colloque AEC/ECLA "Patrimoine numérisation et accès au savoir", le 22 octobre à Bordeaux.
www.aecom.org
Naturopédia : Publication multi-supports et animation communautaire augmenté...SemWebPro
Ce projet consiste à réaliser une plate-forme technologique communautaire permettant la valorisation et l’exploitation d’un fonds documentaire construit autour d’un domaine d’expertise. Dans le cadre du projet Naturopédia, le corpus valorisé est dédié à la naturopathie et à l’agro-écologie. Il est composé d’une cinquantaine d’ouvrages soit théoriques soit techniques, ainsi que d’une large documentation annexe. L’objectif de ce projet est de s’appuyer sur ce corpus d’une richesse rare, pour fédérer une communauté de pratique aujourd’hui mal outillée, de favoriser la diffusion de ce savoir et le partage d’expérience entre les acteurs du domaine, professionnels ou amateurs. L’objectif des équipes rassemblées dans le projet Naturopedia est de mettre à disposition des pouvoirs publics, des multiples ONG du secteur, des entreprises de l’Economie Sociale et Solidaire, des technologies de diffusion innovantes, de nouveaux services de collecte et propagation de la connaissance, leur permettant d’amplifier leurs actions et d’œuvrer pour le bien public.
L’originalité de ce projet réside dans l’intégration de différentes approches, théoriques et techniques, issues de l’ingénierie documentaire (séparation fond-forme, publication multi-supports,...) et de l’ingénierie des connaissances (annotation sémantique des contenus par ontologie de domaine) pour la création d’une chaîne éditoriale hybride et innovante. Pour cela, Mnémotix, en partenariat avec Kelis, la société en charge du développement de la chaine éditoriale libre SCENARI, prendra à sa charge le processus d’annotation semi-automatique du corpus Naturopédia, ainsi que l’exploitation de ces annotations dans le processus de génération multi-supports SCENARI.
La souplesse des modèles documentaires conçus pour le projet, la granularité de la structuration des contenus ainsi que la pertinence des annotations sémantiques devront permettre à terme de publier à la volée des compilations de type “livre de recettes” destinés soit aux professionnels du domaine soit au grand public, sous la forme de modules pédagogiques compatibles SCORM, d’ebooks ou d’applications mobiles.
Dans le cadre de notre intervention, nous présenterons tout d’abord l’architecture globale du projet, telle qu’elle a été conçue. Nous détaillerons ensuite la phase de sémantisation et de transformation du corpus documentaire. Nous aborderons également les verrous technologiques que nous avons identifiés ainsi que les stratégies envisagées pour les lever, notamment dans l’intégration des technologies Mnémotix au sein de l'environnement d'édition open-source SCENARI. Enfin, nous parlerons des contraintes liées aux formats d’export : applications mobiles, livres électroniques ou bien formations en ligne et leur intégration avec la plate-forme collaborative destinée à fédérer les communautés Naturopathie
Publications scientifiques en sciences humaines et sociales à l'ère du numéri...verdeil
présentation dans le cadre de la formation doctorale de l'université de Lyon (février 2014)
Support de cours mis à disposition dans le cadre d’une licence Creative Commons BY-NC
Les archives RTBF - de la documentation à la gestion de l'information Florian Delabie
Présentation effectuée le 12 mars 2015 à la Fédération Wallonie Bruxelles dans le cadre des téléconférences Québec-Belgique sur la Gestion de l'information
Construire un espace culturel numérique commun (exposé de 2004)Jpsd consultant
Document d'archive (destiné à des historiens et à des étudiants)
Cet exposé a été présenté en 2004 par Jean-Pierre Dalbéra à Marrakech dans le cadre du projet euroméditerranéen STRABON. Il décrit les objectifs des programmes de numérisation et de valorisation du patrimoine menés de 1996 à 2004 par le ministère français de la culture.
Le nomadisme en éducation : Web 2.0 et logiciels portablesnomad-e-learning
Le nomadisme permet de se connecter depuis différents lieux sans toutefois pourvoir maintenir la connexion pendant un déplacement; la mobilité permet de rester connecté même pendant un déplacement (en train, en voiture...).
Gestion d'archives audiovisuelles et les principes archivistiques. Florian Delabie
Présentation effectuée le 01er juillet 2014 aux Archives Générales du Royaume dans le cadre de la visite des archivistes des Archives Nationales de France.
L'informatique et le numérique à la médiathèque de berre l'étangCasse2
Présentation pratique de l'informatisation d'une bibliothèque et de l'introduction des usages du numérique pour le personnel et pour le public. Présentation dans le cadre du Master Métiers des archives, des bibliothèques, de la documentation et des médias, Université de Provence. Novembre 2015.
Les 23 sites des Pays de Midi-Pyrénées ont été analysés en 2011 selon 56 critères répartis en 4 blocs : visibilité du site / ergonomie et navigation / contenus du site/ contenu marketing.
Web Public Intercommunal : grille d'analyse 2011 des sites InternetArdesi Midi-Pyrénées
Les 116 sites des Intercommunalités de Midi-Pyrénées ont été analysés en 2011 selon 57 critères répartis en 4 blocs : visibilité du site / ergonomie et navigation / contenus du site/ contenu marketing.
Web Public Communal : grille d'analyse 2011 des sites InternetArdesi Midi-Pyrénées
Les 847 sites des Communes de Midi-Pyrénées ont été analysés en 2011 selon 57 critères répartis en 4 blocs : visibilité du site / ergonomie et navigation / contenus du site/ contenu marketing.
Citoyen 2.0 - Déjeuner sur le web - 16 décembre 2011
La conservation du patrimoine culturel numérique (2009)
1. La conservation du patrimoine
culturel numérique
Catherine Dhérent
Bibliothèque nationale de France
2. Concerne tous les secteurs patrimoniaux
(bibliothèques, archives, musées)
• Les premiers à s’y être intéressés dès les années 1980 : les
responsables d’archives pour les grandes bases de données
structurées (Archives nationales françaises, NARA aux USA)
• Pour les bibliothèques de dépôt légal, l’obligation de conserver jeux
et audiovisuel numériques était au même moment un nouveau défi,
renforcé depuis 1995-2000, avec l’explosion de l’internet et la
publication parfois exclusive sur ce média (par ex. revues
scientifiques)
• Depuis le début des années 1990, s’y ajoutent gros programmes de
numérisation des collections physiques qui coûtent cher (moyens
financiers et humains)
• De plus en plus d’œuvres existent d’abord sous forme numérique
voire n’existent plus que sous cette forme
Conservation des données numériques, 13 octobre 2009 2
3. Le numérique a de
nombreux avantages
• Se diffuse mieux
• Se multiplie plus facilement
• Et donc permet d’assurer plus de garantie
pour sa conservation
• Est dans certains cas, la seule solution
pour prolonger la vie d’une information
(par ex. pour les supports audiovisuels les
plus fragiles ou la presse du XIXe siècle)
Conservation des données numériques, 13 octobre 2009 3
4. Mais il est difficile à
conserver
• Nécessite une grande expérience, des budgets
conséquents, des duplications, des garanties pour la
sécurité et la confidentialité de certaines données
• Est volatil et les supports s’autodétruisent
inéluctablement
• Nécessite donc une attention constante
• Le coût de sa conservation ne décroît pas. Il faudrait
tenter de le stabiliser.
• Mais vu le volume des informations et son inflation
constante, il est difficile à trier et sélectionner
Conservation des données numériques, 13 octobre 2009 4
5. Archiver n’est pas
stocker
• Différence entre stockage
– On retrouve le vrac qu’on a déposé
– Les documents restent dans le format de données du
versement et peuvent être illisibles quelques années
plus tard
• Et archivage
– Les documents sont organisés, gérés avec des
métadonnées dont leur identifiant pérenne
– Leur vie est réglée selon des processus et des
services de qualité attachés à chaque étape des
processus (entrée, gestion dans le magasin virtuel y
compris migration, élimination, accès avec gestion
des droits)
– Une veille est faite sur les formats
Conservation des données numériques, 13 octobre 2009 5
6. Convergence des efforts
• Mutualisation nécessaire
– Entre secteurs patrimoniaux
– Au sein d’un pays
– Au niveau international
• Initiatives fortement encouragées par des
organisations internationales ou
intergouvernementales
– UNESCO : Charte sur la conservation du patrimoine
numérique, 15 octobre 2003
– Commission européenne : Recommandation sur la
numérisation et l’accessibilité en ligne du matériel
culturel et la conservation numérique, 24 août 2006
Conservation des données numériques, 13 octobre 2009 6
7. Enjeux principaux
• Conserver de façon intègre, fiable, une information
volumineuse, protéiforme
• Permettre l’accès pérenne à cette information pour la
garantie des droits en 1er lieu, à fins de mémoire ensuite
• Assurer l’indépendance et la sécurité des données
• Répondre à des prescriptions légales comme celle de
conservation du dépôt légal ou celles concernant les
archives publiques
• Maîtriser les coûts et les maintenir supportables par la
collectivité
• Utiliser le plus possible des technologies réexploitables
(rôle de l’open-source)
Conservation des données numériques, 13 octobre 2009 7
8. Mesures à prendre
• Produire les données sur des systèmes qui
garantissent leur authenticité et leur stabilité,
grâce à des :
– Standards et procédures communs
– Des logiciels open-source
– Des infrastructures partagées qui réduisent aussi les
coûts
• Créer des dépôts de confiance
• Former des équipes qui aient les compétences
nécessaires
Conservation des données numériques, 13 octobre 2009 8
9. Recherche et normalisation
internationale
• Internet Archive : http://www.archive.org/index.php
– Association « non-profit », fondée en 1996, San Francisco
– Construire une « internet library » pour les chercheurs universitaires, pour éviter
ce que Danny Hillis a appelé le « digital dark age »
• International internet preservation consortium (IIPC)
– Fondé en 2003, 10 BN, Internet Archive
– Pour développements technologiques (opensource), lobbying politique et
juridique, coopération documentaire
– France y est présente avec BnF et INA
– Recherche sur moissonnage (Héritrix), recherche et navigation par url (Wayback
machine), indexation plein texte (Nutchwax), gestion et conservation (WarcTools)
– Collections : élections européennes, US End of term, JO 2012
• Des normes internationales
– OAIS (ISO 14721:2003 )
– Formats des documents (XML, JPEG2000 à la place du TIFF pour les images ?,
PDF/A et E…)
Conservation des données numériques, 13 octobre 2009 9
10. Programmes nationaux
• National Digital Information Infrastructure and
Preservation Program, NDIIPP (Library of Congress,
USA)
– Projet Duracloud lancé en juillet 2009 (avec DuraSpace, New-
York Public Library, Biodiversity Heritage Library) : test de cloud
computing, fourniture de fichier JPEG2000, cloud storage
• Schéma numérique des bibliothèques en France,
mission confiée au président de la BnF, Bruno Racine
– Rapport pour novembre 2009
– Idée de mutualisation des moyens pour la conservation du
numérique, pour l’acquisition également
Conservation des données numériques, 13 octobre 2009 10
11. Bibliothèque nationale
de France
• Objets : dépôt légal numérique dont web, documents numérisés,
archives administratives, tiers-archivage
• Jusqu’en 2003, seulement supports de sauvegarde
• 2004 : lancement du Système de Préservation et d’archivage réparti
(SPAR) avec un magasin virtuel vivant permettant :
– Stockage de grande capacité (StorageTek puis SUN)
• Un site principal, un site de secours
• 412 To de données en 2009, 2 274 en 2013
• Baies de disques ou bandes selon l’usage
• Coût total : 8,5 M€ 2005-2008 ; 12 M€ 2009-2013
– Préservation à long terme des données
• Grande variété de formats
– Gestion des accès et des droits
• Tiers-archivage à partir de 2011
Conservation des données numériques, 13 octobre 2009 11
12. Des points positifs…
• La recherche et la collaboration internationales
évitent les erreurs du passé
• Des quantités importantes de Po sont
aujourd’hui correctement conservées
• Elles sont aussi communiquées et sont de plus
en plus utilisées
– Y compris les archives du web (à la BnF une
quarantaine de demandes par mois pour un service
lancé il y a un an dans toutes les salles de recherche)
Conservation des données numériques, 13 octobre 2009 12
13. …Encore des sujets
d’inquiétude
• Le coût très important. La collectivité continuera-t-elle à le supporter ? Quand la BnF
numérise pour 10 M € des documents, la conservation et diffusion lui coûte
aujourd’hui à peu près le double pour les 5 ans suivants
• Si certaines institutions ont aujourd’hui la possibilité de conserver, ce n’est pas le cas
des particuliers qui produisent beaucoup de documents numériques (texte, image,
son, audiovisuel).
– Des sociétés de stockage commencent à faire de la publicité (Webarchive)
– Équivaut à la location de quelques mètres carrés dans un hangar (on ne se préoccupe pas
de la moisissure de vos papiers, cuirs, les objets sont entassés, on les oublie)
– La publication sur des sites communautaires n’est pas la panacée. Les serveurs sont
nettoyés, les sociétés peuvent les fermer du jour au lendemain : perte de blogs, de vidéos…
• Les bibliothèques de dépôt légal du web prennent alors le relais mais n’existent pas dans tous les
pays
– Combien de particuliers organisent bien leurs données : indexation, copies et recopies sur
plusieurs disques durs, vérification régulière des formats lorsqu’on change de logiciels ou de
versions, migrations longues …)
• Société du jetable. De plus, il est beaucoup plus difficile d’envisager la « propriété »
d’un bien dématérialisé, comme un e-book par exemple, d’où les expériences de
location. Le « digital dark age » est malgré tous les efforts institutionnels toujours le
nôtre.
Conservation des données numériques, 13 octobre 2009 13
14. Merci de votre attention
Conservation des données numériques, 13 octobre 2009 14