CONCEVOIR UNE
BIBLIOTHÈQUE NUMÉRIQUE
AVEC OMEKA*
* Avec un petit budget, une petite équipe et presque sans compétences techniques
mercredi 5 juin 13
LE CORPUS
300 ouvrages sélectionnés par GT selon critères :
• Éditions publiées en Bretagne et dans les pays celtiques
• Antérieurs au 20e siècle
• Fonds spécifiques (fonds Loth, Dottin, Duine)
• Unica (à l’exception des périodiques et manuscrits)
mercredi 5 juin 13
NUMÉRISATION
Crédits obtenus pour mise en place d’un atelier de numérisation
• Achat d’un scanner copibook
• Constitution d’une équipe (1 Bibliothécaire + 4
Magasiniers pour 1/2 j. par sem.)
• Achat logiciels (BookRestorer, Abbyy FineReader,
Pix2PDF, Acrobat pro, etc.)
• PC / Serveur de stockage pour les fichiers de prod.
mercredi 5 juin 13
PROBLÉMATIQUE
DE LA DIFFUSION
VALORISATION ?*
* Nécessité de dépasser la simple fonction de réservoir de documents
mercredi 5 juin 13
mercredi 5 juin 13
FORCES
• Métadonnées / Standards
• Ouverture / Intéropérabilité
• Scalabilité / Modularité
• Multi-formats
• Simplicité
• Maintenable facilement
• Conçu pour des nons-développeurs
• Orienté collections/Expositions numériques
• Open Source
mercredi 5 juin 13
LES DÉFAUTS DE SES QUALITÉS
Livré brut ≠ outil clés en main
Mais nombreux plugins et thèmes pour enrichir
l’expérience utilisateur + communauté réactive
Dublin Core par défaut mais possibilité d’étendre
les métadonnées via les types de contenu ou
création/importation de nouveaux schémas
mercredi 5 juin 13
PLUGINS UTILISÉS
Atom => flux RSS
COinS => compatibilité Zotero
CSV Import => Importation à partir de fichiers csv
DropBox => Importation par lots de fichiers
Dublin Core Extended => étendre les métadonnées de base
Geolocation => géolocalisation des items
PDF Search => extraction du texte des fichiers PDF pour la recherche
Simple Vocab => construction de listes de vocabulaires
OAI-PMH Repository => exposition des données via protocole OAI-PMH
mercredi 5 juin 13
PLUGINS BONUS
Open BookReader => visionneuse d’images open source
PDF TOC (Sylvain Machefert) => extraction signets des fichiers PDF
Extract OCR (Sylvain Machefert) => extraction de l’OCR (format xml)
IdRef => écupération des autorités SUDOC pour la saisie des items
mercredi 5 juin 13
Intégration d’Internet Archive Open BookReader dans Omeka
• Visionneuse (html5)
• Vue plein écran sur simple, double page ou vignettes
• Zoom
• Recherche plein texte (de type KWIC)
• Table des matières
• Ajustement auto en fonction de la fenêtre du navigateur
• Navigation possible à l’aide des touches du clavier
(accessibilité)
• Permaliens
• Lecteur embarquable (= dissémination possible)
• Compatibilité avec les tablettes (iPad, etc)
mercredi 5 juin 13
WORKFLOW
• Acquisition des images (niveaux de gris/300 DPI)
• Retraitement / Contrôle qualité - BookRestorer
• Renommage des fichiers (convention BNF) - AntRenamer
• Océrisation / Contrôle qualité - Abbyy FineReader
• Conversion vers PDF + JPEGs pour diffusion - Abbyy + IrFanView
• Création table des matières dans PDF - JPdfBookmarks
• Dépôt des JPEGs + PDF sur OMEKA - Plugin DropBox/FTP
• Saisie des métadonnées et Publication
mercredi 5 juin 13
SCRIPTO + OMEKA :
Vers une transcription
collaborative/
crowdsourcée ?
mercredi 5 juin 13
DISSÉMINATION*
* Comment favoriser la découverte, l’exploitation, la réutilisation de contenus issus du domaine public
mercredi 5 juin 13
AUCUNE RESTRICTION
mercredi 5 juin 13
CITABILITÉ / CODE EMBARQUÉ
mercredi 5 juin 13
CATALOGUE RENNES 2
mercredi 5 juin 13
SUDOC
mercredi 5 juin 13
/Users/jsicot/Desktop/gallica.png
GALLICA
mercredi 5 juin 13
ISIDORE
mercredi 5 juin 13
WIKIPEDIA
mercredi 5 juin 13
WIKISOURCE
mercredi 5 juin 13
QUELQUES FAIBLESSES
• Gestion/édition des fichiers déposés assez rigide
• Gestion utilisateurs/rôles/droits/workflows simpliste
• Gestion des collections limitative
• Manque de plugins pour gérer affichage de certains formats
• Migration v1 à v2...
Parfois, il est nécessaire de mettre les mains dans cambouis
mercredi 5 juin 13
OMEKA 2.0*
* Objectif à court terme
mercredi 5 juin 13
DÉMO*
*http://bibnum.univ-rennes2.fr
mercredi 5 juin 13

Concevoir une bibliothèque numérique avec Omeka

  • 1.
    CONCEVOIR UNE BIBLIOTHÈQUE NUMÉRIQUE AVECOMEKA* * Avec un petit budget, une petite équipe et presque sans compétences techniques mercredi 5 juin 13
  • 2.
    LE CORPUS 300 ouvragessélectionnés par GT selon critères : • Éditions publiées en Bretagne et dans les pays celtiques • Antérieurs au 20e siècle • Fonds spécifiques (fonds Loth, Dottin, Duine) • Unica (à l’exception des périodiques et manuscrits) mercredi 5 juin 13
  • 3.
    NUMÉRISATION Crédits obtenus pourmise en place d’un atelier de numérisation • Achat d’un scanner copibook • Constitution d’une équipe (1 Bibliothécaire + 4 Magasiniers pour 1/2 j. par sem.) • Achat logiciels (BookRestorer, Abbyy FineReader, Pix2PDF, Acrobat pro, etc.) • PC / Serveur de stockage pour les fichiers de prod. mercredi 5 juin 13
  • 4.
    PROBLÉMATIQUE DE LA DIFFUSION VALORISATION?* * Nécessité de dépasser la simple fonction de réservoir de documents mercredi 5 juin 13
  • 5.
  • 6.
    FORCES • Métadonnées /Standards • Ouverture / Intéropérabilité • Scalabilité / Modularité • Multi-formats • Simplicité • Maintenable facilement • Conçu pour des nons-développeurs • Orienté collections/Expositions numériques • Open Source mercredi 5 juin 13
  • 7.
    LES DÉFAUTS DESES QUALITÉS Livré brut ≠ outil clés en main Mais nombreux plugins et thèmes pour enrichir l’expérience utilisateur + communauté réactive Dublin Core par défaut mais possibilité d’étendre les métadonnées via les types de contenu ou création/importation de nouveaux schémas mercredi 5 juin 13
  • 8.
    PLUGINS UTILISÉS Atom =>flux RSS COinS => compatibilité Zotero CSV Import => Importation à partir de fichiers csv DropBox => Importation par lots de fichiers Dublin Core Extended => étendre les métadonnées de base Geolocation => géolocalisation des items PDF Search => extraction du texte des fichiers PDF pour la recherche Simple Vocab => construction de listes de vocabulaires OAI-PMH Repository => exposition des données via protocole OAI-PMH mercredi 5 juin 13
  • 9.
    PLUGINS BONUS Open BookReader=> visionneuse d’images open source PDF TOC (Sylvain Machefert) => extraction signets des fichiers PDF Extract OCR (Sylvain Machefert) => extraction de l’OCR (format xml) IdRef => écupération des autorités SUDOC pour la saisie des items mercredi 5 juin 13
  • 10.
    Intégration d’Internet ArchiveOpen BookReader dans Omeka • Visionneuse (html5) • Vue plein écran sur simple, double page ou vignettes • Zoom • Recherche plein texte (de type KWIC) • Table des matières • Ajustement auto en fonction de la fenêtre du navigateur • Navigation possible à l’aide des touches du clavier (accessibilité) • Permaliens • Lecteur embarquable (= dissémination possible) • Compatibilité avec les tablettes (iPad, etc) mercredi 5 juin 13
  • 11.
    WORKFLOW • Acquisition desimages (niveaux de gris/300 DPI) • Retraitement / Contrôle qualité - BookRestorer • Renommage des fichiers (convention BNF) - AntRenamer • Océrisation / Contrôle qualité - Abbyy FineReader • Conversion vers PDF + JPEGs pour diffusion - Abbyy + IrFanView • Création table des matières dans PDF - JPdfBookmarks • Dépôt des JPEGs + PDF sur OMEKA - Plugin DropBox/FTP • Saisie des métadonnées et Publication mercredi 5 juin 13
  • 12.
    SCRIPTO + OMEKA: Vers une transcription collaborative/ crowdsourcée ? mercredi 5 juin 13
  • 13.
    DISSÉMINATION* * Comment favoriserla découverte, l’exploitation, la réutilisation de contenus issus du domaine public mercredi 5 juin 13
  • 14.
  • 15.
    CITABILITÉ / CODEEMBARQUÉ mercredi 5 juin 13
  • 16.
  • 17.
  • 18.
  • 19.
  • 20.
  • 21.
  • 22.
    QUELQUES FAIBLESSES • Gestion/éditiondes fichiers déposés assez rigide • Gestion utilisateurs/rôles/droits/workflows simpliste • Gestion des collections limitative • Manque de plugins pour gérer affichage de certains formats • Migration v1 à v2... Parfois, il est nécessaire de mettre les mains dans cambouis mercredi 5 juin 13
  • 23.
    OMEKA 2.0* * Objectifà court terme mercredi 5 juin 13
  • 24.