Jabes 2011 - Patrimoine : numériser et mutualiser - "CNRS : L'institut de recherche et d'histoire des textes", Gilles Kagan, institut de recherche et d'histoire des textes - CNRS, dans le cadre des Journées Abes 2011
Jabes 2011 - Patrimoine : numériser et mutualiser - "CNRS : L'institut de recherche et d'histoire des textes"
1. L’IRHT est un laboratoire de recherche du CNRS qui est rattaché à l’Institut
des sciences humaines et sociales.
Il est implanté sur Orléans et sur Paris :
§ 31 chercheurs
§ 48 ingénieurs, techniciens et administratifs
§ 21 chercheurs associés
L’IRHT est composé :
§ de 13 équipes de recherches (thématiques et linguistiques )
§ d’une grande bibliothèque
§ d’un pôle numérique composé de trois services :
- le service Informatique
- le service Images
- le service Publication
L’Institut de recherche et d’histoire des textes
2. L’IRHT existe depuis 1937, son fondateur est Félix Grat.
L’institut est consacré à l’étude du manuscrit au Moyen Âge.
Les manuscrits sont les témoins
essentiels des textes de l’Antiquité
(Aristote, Platon, Cicéron,…) du monde
occidental et du bassin méditerranéen
Les programmes de recherche de l’unité
3. Archéologie du manuscrit
La page et l’écriture
Les manuscrits enluminés
Histoire du livre, des archives
et des bibliothèques
Histoire et transmission des textes
Les thèmes de recherches portent sur la
globalité du manuscrit :
4. Un exemple de mutualisation au service de la recherche et
des bibliothèques
La politique documentaire de l’IRHT
§ la MISTRD (Ministère de l’Enseignement supérieur et de la Recherche).
§ le Service du livre et de la lecture (Ministère de la Culture et de la Communication)
§ les bibliothèques
Forte collaboration avec les conservateurs :
§ inventaires des corpus
§ actions de valorisation à travers des expositions
Un programme national :
Reproduction des manuscrits médiévaux conservés dans les BM et les BU depuis 1976.
Conduit avec les bibliothèques et nos partenaires :
5. Une documentation unique au monde
La politique documentaire de l’IRHT
§ Les premiers microfilms datent de 1937
§ Microfilmage systématique des manuscrits médiévaux depuis 1974
§ Numérisation intégrale HD couleur des documents depuis 2006
La filmothèque-photothèque de l’IRHT contient plus de:
§ 76 500 enregistrements (reproductions tous supports).
§ 44 000 manuscrits proviennent des bibliothèques françaises.
§ 203 000 reproductions d’enluminures et de reliures.
§ 1200 manuscrits numérisation intégrale couleur HD.
§ 4500 manuscrits numérisés en niveaux de gris à partir des
microfilms.
fin des campagnes dans les prochaines années
(environ 2400 ms. à faire)
Mise en place de campagnes thématiques dès 2012.
6. Des moyens techniques importants et innovants
La politique documentaire de l’IRHT
§ des résolutions supérieures à 22 méga pixels,
§ un éclairage de faible intensité qui préserve les documents précieux,
§ rapide : 2 images/seconde,
§ conformité des couleurs avec le document original (IT8 - GRETAG),
§ conserve les données brutes des acquisitions numériques.
§ privilégie des formats bruts non compressés :
- RAW
- DNG
- TIF
§ Insertion des métadonnées dès la création des images:
- IPTC
- EXIF 2.2
- XMP
Dos Phase One P 25 et P30 +
Dos Imacon Hasselblad H2D39mo
Station de travail dédié à la numérisation
des manuscrits brûlés de Chartres 2009 – 2011)
Charte de couleurs Gretag Macbeth
(Profil couleurs Srvb)
5 systèmes d’acquisition numérique de type matriciel
7. Des objectifs d’exploitation qui sont complémentaires:
La politique documentaire de l’IRHT
Dépouillements des sources anciennes.
Obligations patrimoniales et de conservation.
Exigences documentaires dans le référencement et l’indexation.
Mise à disposition des ressources pour différentes communautés:
§ chercheurs
§ enseignements chercheurs
§ étudiants en thèses, master etc.
Diffusion des données
§ Medium (2009) http://medium.irht.cnrs.fr
§ BVMM (2011) http://bvm.irht.cnrs.fr
§ Bases scientifiques, Jonas, Initiale etc…IRHT (2011)
Ouverture à un plus large public
§ Enluminures SLL http://www.enluminures.culture.fr
§ Liber floridus MISTRD http://liberfloridus.cines.fr
8. La politique documentaire de l’IRHT
Liens entre ces ressources (BVMM-Medium) et les notices des catalogues de
§ Calames http://www.calames.abes.fr
§ Ccfr. (Catalogue collectif de France)
La mutualisation:
9. Le rôle des CRN
La politique documentaire de l’IRHT
Telma (IRHT- TGE ADONIS) http://www.cn-telma.fr
§ édition électronique des corpus,
§ encodage des données en TEI P5.
10. De l’argentique au numérique: vers le full numérique
Une mutation difficile et longue…..
La politique documentaire de l’IRHT
§ études et recommandations techniques (dès 1994 en collaboration avec la MRT et la BNF),
§ nombreuses formations (photographes, documentalistes, conservateurs, chercheurs),
§ mise en place de protocoles, cahiers des charges (numérisation, prise de vue et SGBD),
§ respect des standards (formats – identifiants des fichiers),
§ normes de catalogage, 15 champs du Dublin-Core,
§ guide des bonnes pratiques dans le domaine
des systèmes de l’information.
L’Irht en 1978, avenue d’Iéna, les fiches papier permettent aux lecteurs de
consulter les catalogues de manuscrits (prémisses des métadonnées)
11. Des choix informatiques…
La politique documentaire de l’IRHT
De nouvelles collaborations en cours pour l’archivage pérenne des images:
§ IN2P3 de Lyon TGE-ADONIS – SLL (modèle OAIS) 20 To de données.
§ CINES de Montpellier – MISTRD (modèle OAIS )
6 To de données.
A l’IRHT des systèmes d’informations ouverts :
§ logiciels libres (Open source) (bases de données développées en Php MySql)
§ interopérabilité (évolution vers le RDF)
§ export des notices abrégées en OAI PMH
§ Ajout des métadonnées dès la création des images (XML-XMP-IPTC)
12. http://bvm.irht.cnrs.fr (démo)
Doit réunir toutes les reproductions numériques des campagnes de l’IRHT réalisées
dans les BM et les BU : la BVMM permet de consulter à ce jour….
§ 11680 cotes
§ 388 795 vues
§ Numérisation intégrale couleur 1125 mss en ligne
§ La décoration 230 000 clichés
§ La numérisation des microfilms 450 mss en ligne
L’utilisateur dispose de nombreux outils :
- Visualisation HD (5 niveaux de Zoom)
- Possibilité de consulter en taille réelle
- Visionneuse en plein écran
- Liste des vues et des folios
- Panier (export Excel et PDF)
- Module comparaison
- Chemin de fer
BVMM Bibliothèque virtuelle des manuscrits médiévaux
Une application full web totalement ouverte
13. 3 sources d’accroissement:
§ Les campagnes de numérisation intégrale couleur HD (500 nouveaux manuscrits par an).
§ Les vues provenant du décor : (Initiale-BVMM) (4000 nouveaux clichés par an).
§ La numérisation des microfilms :
4455 manuscrits déjà numérisés (fonds de Champagne-Ardenne, Chantilly, etc.)
Intégration en cours dans BVMM programmée entre 2011-2013.
§ Programme de numérisation à venir des microfilms (2011-2012) :
BM de Bordeaux et région Aquitaine (436 manuscrits), BM de Caen…….
BVMM Bibliothèque virtuelle des manuscrits médiévaux
14. Choix techniques :
§ Cahier des charges rédigé en 2007 – développement interne (2008-2009)
§ Pas de module de visualisation propriétaire (format JPG classique)
§ Identifiant unique code RCR comme principe de nommage : 75105510_MS0254_0001.Jpg
Ce numéro est formé de plusieurs séquences :
les 2 chiffres du département
les 3 chiffres de la commune
un code à deux chiffres indiquant le type de bibliothèque
un numéro à 2 chiffres, séquentiel, allant de 01 à 99 :
23 Bibliothèque d’enseignement supérieur et de recherche ne faisant pas partie de l’Université.
61 Bibliothèque municipale classée
62 Bibliothèque municipale non classée ……
§ Le site web utilise les technologies les plus récentes et préconisées par le consortium W3C
(XHTML strict). Il utilise les feuilles de styles (CSS) pour la mise en page et la typographie.
§ Librairies JQuery framework développé en javascript qui permet d'utiliser AJAX, de créer des animations….
1- Un serveur SGBDR développé en MySql sous linux par Cyril Masset (Service informatique)
2- Un serveur de fichier « Images » qui est alimenté par tous les photographes du Service Images.
3- Un serveur Web de type Apache mis en place par Thomas Nodimar responsable du Service
Informatique de l’IRHT.
BVMM Bibliothèque virtuelle des manuscrits médiévaux
15. BVMM Bibliothèque virtuelle des manuscrits médiévaux
Architecture et description du processus:
Medium
Recensement des reproductions de
manuscrits conservées à l’IRHT
Gestion des commandes
Gestion des stockages
Préparation des campagnes
Réunion de programme
Bilan annuel et perspectives
Mise en place du planning
Bibliothèques
Contacts avec les bibliothèques
Dépouillement des sources
Mise en place technique
Prises de vue HD
Traitements
Contrôle des folios
Traitement des images (Raw-Tif-JPG)
Contrôle des fichiers
Insertion des métadonnées
Sauvegarde sur serveur (12 To)
BVMM
Contrôle des identifiants (RCR)
Traitement des niveaux (V-I-P-Zoom et TR)
Référencement des vues: liste des folios...
Encodage et import des données en UTF8
Contrôle des vues dans BVMM
Export OAI PMH
Envoi des fichiers JPG aux bibliothèques.
Archivage (Tif) IN2P3 de Lyon (BM) et le Cines (BU)
Envoi des fichiers Jpg au SLL
Liens vers les bases catalogues
Calames
Ccfr.
Liens vers les bases scientifiques
Initiale
Jonas
Pinakes
16. Les modes d’accès sont modulables:
§ accès sécurisé placé sous le contrôle des conservateurs qui pourront personnaliser l’accès de
BVMM et de leur fonds dans une page d’accueil vierge :
BVMM Bibliothèque virtuelle des manuscrits médiévaux
17. Les outils: Visualisation HD (5 niveaux de Zoom)
BVMM Bibliothèque virtuelle des manuscrits médiévaux
18. Les outils: Liste folios
BVMM Bibliothèque virtuelle des manuscrits médiévaux
19. Les outils:Panier (export Excel et PDF) limité aux administrateurs et aux conservateurs
BVMM Bibliothèque virtuelle des manuscrits médiévaux
22. Les outils:Module comparaison (taille réelle : comparer des écritures)
BVMM Bibliothèque virtuelle des manuscrits médiévaux
23. Conclusion
Mutualiser les outils et les ressources :
§ Partager nos expertises dans le domaine des techniques de numérisation.
§ Veiller à l’interopérabilité des données.
§ Mettre en relation des équipes techniques de différentes institutions.
§ Favoriser le développement des wiki et les logiciels Open source.
§ Eviter les doublons et recenser les programmes de numérisation.
24. Conclusion
Avantages du numérique :
Plus grande conformité avec les couleurs du document original, gestion de la couleur.
Une meilleure restitution des images (portabilité des couleurs d’un périphérique à un
autre y compris en édition, grâce au profil ICC).
Une diffusion full Web et des améliorations sur le plan des images : plus de gestion
physique des documents photographiques, diapositives etc.
Facilite l’indexation, les études comparatives, l’indexation par lots, les listes d’index, etc.
Une approche plus précise du manuscrit en tant qu’objet archéologique: grande précision
dans la restitution des matériaux (encres, pigments, supports d’écriture, ais des reliures,
etc.).
25. Conclusion
Intervention journées de l’Abes – Montpellier 17 mai 2011
Gilles Kagan et Paul Bertrand
IRHT-CNRS
Pôle numérique – Service Images
3 b, avenue de la recherche scientifique 45071 Orléans cedex 2 - tél : 02.38.25.53.21 - http://www.irht.cnrs.fr
Inconvénients :
La conservation des données binaires reste incertaine et réclame une grande prudence
quant à la pérennité des données, des supports de stockage et des appareils de lecture.
La précision des technologies numériques pose également la question de la perception
de l’objet, qui n’est plus conforme à la perception empirique.
D’une part, l’image émise à partir d’un moniteur fournit une luminosité et un rapport de
contraste beaucoup plus important que l’image réfléchie que nous percevons à partir du
document original sous un éclairage naturel et de faible luminosité.
D’autre part, avec la résolution des capteurs HD nous pouvons voir un détail de 1 cm avec
une échelle dix fois supérieure à la normale.
Institut de recherche et d’histoire des textes