2. LE CORPUS
300 ouvrages sélectionnés par GT selon critères :
• Éditions publiées en Bretagne et dans les pays celtiques
• Antérieurs au 20e siècle
• Fonds spécifiques (fonds Loth, Dottin, Duine)
• Unica (à l’exception des périodiques et manuscrits)
mercredi 5 juin 13
3. NUMÉRISATION
Crédits obtenus pour mise en place d’un atelier de numérisation
• Achat d’un scanner copibook
• Constitution d’une équipe (1 Bibliothécaire + 4
Magasiniers pour 1/2 j. par sem.)
• Achat logiciels (BookRestorer, Abbyy FineReader,
Pix2PDF, Acrobat pro, etc.)
• PC / Serveur de stockage pour les fichiers de prod.
mercredi 5 juin 13
6. FORCES
• Métadonnées / Standards
• Ouverture / Intéropérabilité
• Scalabilité / Modularité
• Multi-formats
• Simplicité
• Maintenable facilement
• Conçu pour des nons-développeurs
• Orienté collections/Expositions numériques
• Open Source
mercredi 5 juin 13
7. LES DÉFAUTS DE SES QUALITÉS
Livré brut ≠ outil clés en main
Mais nombreux plugins et thèmes pour enrichir
l’expérience utilisateur + communauté réactive
Dublin Core par défaut mais possibilité d’étendre
les métadonnées via les types de contenu ou
création/importation de nouveaux schémas
mercredi 5 juin 13
8. PLUGINS UTILISÉS
Atom => flux RSS
COinS => compatibilité Zotero
CSV Import => Importation à partir de fichiers csv
DropBox => Importation par lots de fichiers
Dublin Core Extended => étendre les métadonnées de base
Geolocation => géolocalisation des items
PDF Search => extraction du texte des fichiers PDF pour la recherche
Simple Vocab => construction de listes de vocabulaires
OAI-PMH Repository => exposition des données via protocole OAI-PMH
mercredi 5 juin 13
9. PLUGINS BONUS
Open BookReader => visionneuse d’images open source
PDF TOC (Sylvain Machefert) => extraction signets des fichiers PDF
Extract OCR (Sylvain Machefert) => extraction de l’OCR (format xml)
IdRef => écupération des autorités SUDOC pour la saisie des items
mercredi 5 juin 13
10. Intégration d’Internet Archive Open BookReader dans Omeka
• Visionneuse (html5)
• Vue plein écran sur simple, double page ou vignettes
• Zoom
• Recherche plein texte (de type KWIC)
• Table des matières
• Ajustement auto en fonction de la fenêtre du navigateur
• Navigation possible à l’aide des touches du clavier
(accessibilité)
• Permaliens
• Lecteur embarquable (= dissémination possible)
• Compatibilité avec les tablettes (iPad, etc)
mercredi 5 juin 13
11. WORKFLOW
• Acquisition des images (niveaux de gris/300 DPI)
• Retraitement / Contrôle qualité - BookRestorer
• Renommage des fichiers (convention BNF) - AntRenamer
• Océrisation / Contrôle qualité - Abbyy FineReader
• Conversion vers PDF + JPEGs pour diffusion - Abbyy + IrFanView
• Création table des matières dans PDF - JPdfBookmarks
• Dépôt des JPEGs + PDF sur OMEKA - Plugin DropBox/FTP
• Saisie des métadonnées et Publication
mercredi 5 juin 13
12. SCRIPTO + OMEKA :
Vers une transcription
collaborative/
crowdsourcée ?
mercredi 5 juin 13
13. DISSÉMINATION*
* Comment favoriser la découverte, l’exploitation, la réutilisation de contenus issus du domaine public
mercredi 5 juin 13
22. QUELQUES FAIBLESSES
• Gestion/édition des fichiers déposés assez rigide
• Gestion utilisateurs/rôles/droits/workflows simpliste
• Gestion des collections limitative
• Manque de plugins pour gérer affichage de certains formats
• Migration v1 à v2...
Parfois, il est nécessaire de mettre les mains dans cambouis
mercredi 5 juin 13