SlideShare une entreprise Scribd logo
1  sur  90
Télécharger pour lire hors ligne
numérisation et bibliothèque numérique

Luc Bellier, BnF
École de bibliothécaires documentalistes, Septembre-Octobre
Travaux pratiques : manipuler un
document numérique


Objectif : appréhender les différents composant le document
numérique


Télécharger un document PDF sur Gallica


http://gallica.bnf.fr/ark:/12148/bpt6k145269m



Le manipuler (mode texte et mode image, appréhender les méta-données et
les qualifier)



Consulter le document sur Gallica et retrouver les éléments du document
numérique



Télécharger un ePub et le manipuler retrouver les mêmes éléments (
http://fr.feedbooks.com/book/16/bel-ami ou
http://gallica.bnf.fr/ark:/12148/bpt6k145269m)



A la maison : consulter un document sur Google Books, athi trust ou autre
et décrire les services proposés par la bibliothèque numérique



Prendre quelques images et les passer à l’OCR (presse, patrimonial, illustré,
moderne) => préparer le dossier avec images concernées
Travaux pratiques : manipuler un
document numérique
•TéléchargerPDF
•Trouver le mode texte
•Télécharger l’ePub
•Changer le .ePub en .zip
•Ouvrir le dossier
Travaux pratiques : manipuler un
document numérique
•Le titre = métadonnées descriptives
•Les pages = métadonnées de structure
•
Les métadonnées

•Un document
numérique / électronique,
c’est une suite de fichiers
sans lien entre eux

• identifiant unique (localisation /
identification)

•?

•Métadonnées
descriptives

•rattacher le
document à
l’original /
différentes versions
d’un document
•donner accès à la
copie numérique /
électronique

•Métadonnées
de structure

•Métadonnées administratives

•rattacher les
fichiers entre eux

•gérer les droits d’accès

•reconstituer la
structure du
document

•gérer la collection, c’est-à-dire
•préserver les informations techniques
nécessaires à la lecture des fichiers
•garantir l ’intégrité des fichiers et le suivi
de leurs éventuelles modifications
Travaux pratiques : manipuler un
document numérique
•Le contenu d’un ePub
Travaux pratiques : manipuler un
document numérique
•Le manifeste *.opf
Travaux pratiques : manipuler un
document numérique

•Toc.ncx
•J
PG

•X
HT
M

L

•O
PF

•N
CX

Produire et décrire le
document numérique

»

Le cas des livres numériques ePub
•Métadonnées
•Descriptives?

Métadonnées de
structure ?
•
Les métadonnées

•Un document
numérique / électronique,
c’est une suite de fichiers
sans lien entre eux

• identifiant unique (localisation /
identification)

•?

•Métadonnées
descriptives

•rattacher le
document à
l’original /
différentes versions
d’un document
•donner accès à la
copie numérique /
électronique

•Métadonnées
de structure

•Métadonnées administratives

•rattacher les
fichiers entre eux

•gérer les droits d’accès

•reconstituer la
structure du
document

•gérer la collection, c’est-à-dire
•préserver les informations techniques
nécessaires à la lecture des fichiers
•garantir l ’intégrité des fichiers et le suivi
de leurs éventuelles modifications
Travaux pratiques : manipuler un
document numérique
Travaux pratiques : manipuler un
document numérique
Travaux pratiques : manipuler un
document numérique
Travaux pratiques : manipuler un
document numérique
Fiche à faire à la maison


À compléter et à envoyer à lbellier@gmail.com



Présentation du site





Nom de la bibliothèque numérique
Nom de l’institution éditrice

Présentation des collections



Quantité estimée des documents





Nature des collections proposées par la bibliothèque
Autres informations

Services proposés par la bibliothèque numérique


Quels accès aux documents ?



Quels type de lecture est proposée ?



Autres informations
•
Les métadonnées

•Un document
numérique / électronique,
c’est une suite de fichiers
sans lien entre eux

• identifiant unique (localisation /
identification)

•?

•Métadonnées
descriptives

•rattacher le
document à
l’original /
différentes versions
d’un document
•donner accès à la
copie numérique /
électronique

•Métadonnées
de structure

•Métadonnées administratives

•rattacher les
fichiers entre eux

•gérer les droits d’accès

•reconstituer la
structure du
document

•gérer la collection, c’est-à-dire
•préserver les informations techniques
nécessaires à la lecture des fichiers
•garantir l ’intégrité des fichiers et le suivi
de leurs éventuelles modifications
2013 bibnum ebd
2013 bibnum ebd
Qu’est-ce qu’une bibliothèque
numérique?

Luc Bellier, BnF
École de bibliothécaires documentalistes, octobre-novembre
2010
Plan


Qu’est-ce qu’une bibliothèque numérique?



Des collections de documents





Sélectionner
Numériser
Décrire et organiser
Conserver et stocker



Un espace



Des publics



Des services
Qu’est-ce qu’une bibliothèque?

…qui ont besoin de
confort,
de lumière, d’espace,
d’outils pour lire,
écrire, discuter,
travailler etc...

un espace…

des outils de
référence

des livres
(sélectionnés
et classés)

des publics…
un public
La bibliothèque numérique : visite
Entrée
accès

services

Votre place

Le bureau de

Accès au moteur
accès
de recherche

La sélection
du
valorisation
bibliothécaire

accès
renseignements

Les actualités
valorisation

de la bibliothèque

La liste des nouveautés

valorisation

services
Les outils de fidélisation
et de communication

accès
Les rayonnages en libreaccès pour le butinage
Une collection de documents
La chaîne de numérisation : qu’est-ce que numériser ?


Sélectionner



Scanner :



72 dpi ? 300 ? 600 ?





Couleurs, niveaux de gris ou noir et blanc ?
Quels formats ? Tiff, jpeg etc.

Océriser



Pour afficher (faire correspondre texte et image => métadonnées)



Pour vocaliser (qualité optimum ou garantie => comment évaluer la qualité?)





Pour chercher (texte uniquement)

Pour transférer (le texte sans l’image , mais que le texte, sur un format portable)

Décrire et organiser


Le document (signalement)



Les images constituant le document



Les fichiers textes issus de l’ocr
1- La chaîne de numérisation :
sélectionner
•Estimation et analyse de
besoins
•Recherche et collecte
d’informations
•Sélection, acquisition des
documents
•Traitement des
documents
•Traitement matériel :
•Enregistrement du document
•Équipement, reproduction,
conservation (reliure etc.)

•Traitement intellectuel :
•Catalogage et
indexation
•Analyse, résumé etc.
•Enregistrement de
l’information

•Classemen
t

•Diffusion de l’information :
•Prêt
•Mise à disposition des produits
secondaires (catalogue,
bibliographies, revue de presse
etc.)
La chaîne de numérisation

Sélection
Sélection
Relecture
Relecture

Acquisition
Acquisition
Signalement
Signalement
Prestataire

encodage
encodage

En mode texte
En mode texte
Indexation
Indexation

Numérisation
Numérisation

Mise en
Mise en
ligne
ligne

En mode image
En mode image
structuration
structuration

Compétences
bibliothéconomiques

Compétences
techniques

Contrôle
Contrôle

transformation
transformation

Pas de compétences
particulières
La chaîne de numérisation, 1 : « sélection- acquisition»
Politique documentaire de la bibliothèque
Organisation logistique

Sélection
Sélection
Relecture
Relecture

Acquisition
Acquisition
Signalement
Signalement

encodage
encodage

En mode texte
En mode texte
Indexation
Indexation

Numérisation
Numérisation
En mode image
En mode image
structuration
structuration

Contrôle
Contrôle

transformation
transformation

Mise en
Mise en
ligne
ligne
« Sélection » : la politique documentaire

Numérisation de sauvegarde : les documents
fragiles, en danger?

Objectifs &
missions

Collections de la
bibliothèque

Numérisation à la demande des utilisateurs?
Numérisation pour la diffusion

Politique
documentaire

Public visé

Public de la bibliothèque?
Collection encyclopédique?

Public à distance?

Collection spécialisée?

Grand public, chercheurs, étudiants?

Types de supports
Types de documents

Contraintes
juridiques
et
techniques

Droits d’auteur
État physique des
documents

Programmes de numérisation
Les programmes de numérisation à la BnF


Collection encyclopédique



Documents libres de droits



Tout support




Pour un public de





Monographies, périodiques, images, son

Chercheurs, étudiants, érudits, « médiateurs » (enseignants, journalistes, associations)
Grand public de plus en plus ciblé

Grands axes :


le patrimoine national (somme des œuvres et des connaissances dans toutes les disciplines,
philosophie, histoire, littérature, religion, sciences,…),



des programmes à vocation internationale (rapprochement et confrontation de corpus
patrimoniaux portant sur le même sujet mais issus d’autres nationalités : presse quotidienne,
documentation juridique, histoire et sciences auxiliaires telles que la généalogie, les langues
et leur apprentissage,…)



un corpus d’œuvres et de documents consacrés spécifiquement à l’Europe dans tout ses
aspects (philosophie politique, identités nationales, histoire, économie, commerce, le travail,
les métiers les sciences et techniques, les questions sociales, les grands évènements culturels,
…).
La question des droits : considérer le contenu
auteur

Robert Doisneau (1912-1994)
Epouvantails, 1964

oeuvre
personne

auteur

Robert Doisneau (1912-1994)
SAVIGNAC aux échecs. Paris, 1950
La question des droits (http://print.google.com)

Recherche dans l’ensemble du texte, visualisation d’extraits
La question des droits (http://www.persee.fr)

Blocage des images
« Acquisition » : mettre à disposition les originaux?


Une fois la sélection faite, il faut se procurer les documents



C’est en partie une question technique et financière





Achat de document pour la numérisation
Ou numérisation des documents originaux

Numériser le papier ou le microfilm ?





Différence de prix, de rapidité et de qualité
Question de préservation du document original

Numériser des originaux


Le scanner tourne page ?
Dérelier ou massicoter ?



Différences de prix et de qualité





Problèmes logistiques liés à la numérisation patrimoniale


Sortir les ouvrages des magasins
Problèmes d’indisponibilité pour les lecteurs



Le transport et la livraison (conditions de conservation)



La numérisation sur site (coût)


« Acquisition » : mettre à disposition les originaux?

Filière Papier

Filière Microformes
Films

Reliés

Massicots

Fiches
« Acquisition » : mettre à disposition les originaux?
Les « objets » sont transportés dans des caisses scellées
2- La chaîne de numérisation :
signaler
La chaîne de numérisation, 2 : « signalement »

Sélection
Sélection
Relecture
Relecture

Acquisition
Acquisition
Signalement
Signalement

encodage
encodage

En mode texte
En mode texte
Indexation
Indexation

Numérisation
Numérisation
En mode image
En mode image
structuration
structuration

Contrôle
Contrôle

transformation
transformation

Mise en
Mise en
ligne
ligne
La chaîne de numérisation, 2 : « signalement »
La chaîne de numérisation, 2 : « signalement »
« Signalement » : la notion de métadonnées
Des données sur les données ...
– qui servent à organiser la connaissance et à utiliser et exploiter le
document
• Métadonnées descriptives, contextuelles et structurelles
–

Ex. : Notice bibliographique, indexation

–

Ex. : Date et formats de numérisation

–

Ex. : Données sur les fichiers pour reconstituer l’ouvrage (Cf. plus loin)

• initiales et ajoutées tout au long du cycle de vie du document numérisé

–

qui servent à le maintenir accessible dans le temps et à garantir et
contrôler cet accès
• Métadonnées administratives et techniques
–

Ex. : Droits de lecture en interne seulement ou droit sur Internet

• initiales et ajoutées tout au long du cycle de vie du document numérisé
–

Ex. : passage d’un document protégé dans le domaine public
Pourquoi a-t-on besoin de métadonnées?
La déconstruction du document numérique
« Signalement » : les métadonnées

Un livre numérisé, c’est une suite de
fichiers sans lien entre eux : la
numérisation déconstruit le livre

identifiant unique

?
Métadonnées
de structure

Métadonnées
descriptives

•rattacher les
fichiers entre eux

•rattacher le
document à
l’original

•reconstituer la
structure du
document

•donner accès à la
copie numérisée

Métadonnées
administratives
•gérer les droits d ’accès
•préserver les informations
techniques nécessaires à la
lecture des fichiers
Le document : notion de granularité

•

Notion de document complexe

•

Un document peut avoir plusieurs niveaux d’accès

•

Par ex. les périodiques :

Collection

Document
(notice
bibliographique)

Volume, tome,
fascicule...

Page

Vue de
détail
(article)
3- La chaîne de numérisation :
numériser
La chaîne de numérisation, 3 : « Numérisation »

Sélection
Sélection
Relecture
Relecture

Acquisition
Acquisition
Signalement
Signalement

encodage
encodage

En mode texte
En mode texte
Indexation
Indexation

Numérisation
Numérisation
En mode image
En mode image
structuration
structuration

Contrôle
Contrôle

transformation
transformation

Mise en
Mise en
ligne
ligne
Numériser en mode image


La numérisation en mode image
s’intéresse à la forme et donc à la
structure physique



Avantages :





un fac-similé
préserve l’intégrité de l’original

Inconvénients :


un seul point d ’accès : la notice
bibliographique



pas de possibilités de manipulation du
texte



poids des images > stockage, temps
de téléchargement



mise en place de chaînes de
numérisation complexes
Numériser en mode texte


La numérisation en mode texte
s’intéresse directement au
contenu et donc à la structure
logique



Avantages




souplesse et portabilité





recherche plein texte et autres
manipulations
Accessibilité pour les personnes
en situation de handicap visuel

Inconvénients


lourdeur de réalisation



coût
Numériser en mode texte



Il y a deux techniques de création du mode texte…



La reconnaissance automatique de caractères ou OCR



problèmes : caractères anciens, mal formés, caractères spéciaux, titres,
documents en mauvais état…



recherches en cours, amélioration des logiciels





fortement conditionnée par la qualité de numérisation

mais correction manuelle obligatoire pour une qualité à 100%

La saisie


saisie manuelle : coût en termes de ressources humaines



« double saisie manuelle comparée »
Numériser en texte et image


Il existe des solutions qui combinent les deux modes



Avantage




Combiner les avantages du texte et de l’image

Inconvénients


Difficulté de réalisation et de contrôle



Globalement, cela revient à numériser deux fois… donc deux fois plus
de travail, et coûts élevés
Numériser en texte et image
(http://www.bium.univ-paris5.fr/histmed/medica.htm)
Liste des chapitres en
mode texte

Pages en mode image
Numériser en texte et image
(http://www.persee.fr)

Mode image

Mode texte (OCR de très
bonne qualité,
documents récents)
Numériser en texte et image
Visualisation du mode image uniquement, mode texte
issu d’OCR en sous-couche permettant la recherche
plein texte et le surlignage des résultats de la
recherche

(http://books.google.fr/)
L’OCR



L’OCR est un processus automatique



La qualité comme la reconnaissance sont calculés
par des machines



C’est le nombre de caractères suspects divisés par le
nombre total de caractères sur une page.



Une page de dix caractères vaut autant qu’une page
de 10000 caractères dans un même ouvrage.
Numériser : l’équipement
Les ouvrages de la filière « reliés » sont numérisés soit…. Automatiquement
Numérisation à 90°

Kirtas APT 2400
Numériser : l’équipement
Les ouvrages de la filière « reliés » sont numérisés soit…. manuellement sur des scanners de livres
Numérisation à plat

Digibook 2000LC
Suprascan A0

Copybook
Numériser : l’équipement
Les microformes sont numérisées sur des scanners de microfilms et de microfiches

Microfiches

Microfilms
Numériser : l’équipement
Les ouvrages de la filière « massicots » sont numérisés sur des scanners de production grande vitesse

Docuscan 6000

Plus de 6000 pages/heure
Numériser : un exemple de traitement d’image
Un opérateur contrôle le traitement des images sur le logiciel SpiFactory

Redressement
Recadrage des pages
Illustrations
Binarisation

(transformation des images de
niveau de gris et couleur en
noir et blanc)

Filtrage des formes

(redressement des blancs, des
lignes, des caractères à l’intérieur
d’une image)
4- La chaîne de numérisation :
décrire et organiser
La chaîne de numérisation, 4 : « indexation - mise en ligne »

Sélection
Sélection
Relecture
Relecture

Acquisition
Acquisition
Signalement
Signalement

encodage
encodage

En mode texte
En mode texte
Indexation
Indexation

Numérisation
Numérisation
En mode image
En mode image
structuration
structuration

Contrôle
Contrôle

transformation
transformation

Mise en
Mise en
ligne
ligne
« Indexation » : la création des accès


Le matériau indexable :





L’indexation permet de créer des accès aux documents





Via un catalogue
Via un moteur de recherche

le catalogue





les métadonnées – descriptives – structurées
le texte – en grande quantité – de qualité variable

adapté pour la recherche avancée
Classement par titre, auteur etc.

le moteur de recherche




recherche simple conforme aux habitudes du web
recherche fine (plein-texte)
classement des résultats par pertinence
« Mise en ligne » : la salle de lecture virtuelle


La « salle de lecture virtuelle » est un espace où l’on consulte les
collections






Elle met à disposition des lecteurs les instruments d’accès et de renseignement
bibliographique
Elle propose des outils de présentation des collections (mise en contexte,
valorisation) : pages éditoriales
Elle constitue un espace convivial (rencontres, expositions)
Elle constitue un espace de confort pour travailler (lecture du document)
Elle offre des services de valeur ajoutée pour aider les lecteurs dans leur travail



1. faire aussi bien que le livre



2. faire mieux que le livre
5- La chaîne de numérisation :
stocker et conserver
La conservation



Une fois les documents numérisés, sont-il
vraiment en sécurité ? Pour combien de
temps ?
Sauvegarder n’est pas archiver



Surveiller et renouveler régulièrement les
supports (de façon préventive)



Collecter toutes les informations nécessaires
pour maîtriser le document (métadonnées)



Transformer le document dans une forme
plus facile à conserver dans le temps («
migration »)



Collecter des environnements et des
plateformes de références pour l’avenir («
émulation »)
6- les services
Le partage des données : OAI et coopération


Interopérabilité des données (OAI-PMH, Entrepôts OAI)





Initiative OAI : Open Archive Initiative (1999)
 Objectif : améliorer le signalement des e-prints, des publications
scientifiques et l’interopérabilité des bases d’archives ouvertes
 Moyen : création d’un protocole technique de diffusion et de collecte de
métadonnées
OAI-PMH : Protocol for Metadata Harvesting
Intérêt dans le domaine culturel et patrimonial



Collections partagées dans des architectures réparties



Interrogation centralisée
Fournisseurs de données

Fournisseurs de services
OAI et coopération : Gallica
serveur OAI

serveur OAI
serveur OAI

serveur OAI

serveur OAI

CNUM

Syndicat
national de
l’édition

Library of
Congress
363 notices

Universités de
Strasbourg

5546 notices

435 notices

91 notices

serveur OAI

Bibliothèques
virtuelles
humanistes

186 notices

BIUM

3970 notices

Base de données
site SICD
Strasbourg

site LOC

Editeurs
site CNUM
site BIUM

Consultation de ces
documents sur les autres
sites
serveur OAI

site BVH
Bibliothèques numériques :
actualités, gallica
Hathi trust
L’actualité en 2004-2005


Oct. 2004 : annonce du lancement de Google Print à la Foire de
Francfort (Google), rebaptisé Google Book Search/ Google Recherche
de livres en nov. 2005



Janv. 2005 : article de JN Jeanneney dans Le Monde lance l’idée d’une
Bibliothèque numérique européenne (BnF, Commission européenne)



Oct. 2005 : création du consortium Open Content Alliance (Internet
Archive, Yahoo!, MSN, Bibliothèques, archives anglophones etc.)



Nov. 2005 : partenariat Microsoft-Bristish Library pour numérisation
de 25 millions de pages ($2,5 M) et annonce MSN Live Search



Nov. 2005 : lancement de la World Digital Library par James Billington
(Library of Congress + UNESCO) avec l’aide de Google ($3 M)
L’actualité en 2006-2007


Sept. 2006 : réalisation par la BnF d’une maquette (Europeana)
préfigurant des accès et services pour une bibliothèque numérique
européenne



Déc. 2006 : lancement de MSN Live Search



Mars 2007 : lancement par la BnF du prototype Europeana au Salon
du livre (hors ligne depuis fin 2007)



Juillet 2007 : reprise du projet Europeana au niveau européen (géré par
EDL Foundation)



Oct. 2007 : lancement de Gallica 2



Mars 2010 : 1 millions de documents accessibles dans Gallica
Que sont devenus ces projets en 2013?


Google recherche de livres en 2012:





30 bibliothèques partenaires pour la numérisation de leurs collections
10 000 éditeurs et auteurs partenaires
Interface dans 35 langues
Pas de communication sur le nombre de documents (20 Millions évoqués)



Arrêt du programme de numérisation de livres de MSN en mai 2008



Open Content Alliance en novembre 2008 :
Open Library
 Bibliothèques américaines (Boston Library consortium), canadiennes,
universités, Sociétés de l’Internet (une cinquantaine de partenaires)
 19,401,009 titres de livres numérisés dont 340,083 en plein-texte
 Documents également accessibles sur Internet Archive




http://www.hathitrust.org/ rassemble depuis 2008 les grandes
bibliothèques américaines (NYPL, Yale, Cornell, Columbia…)


10,556,750 volumes
5,556,767 livres
274,642 périodiques
3,694,862,850 pages
Dont
1 702 727 volumes dans le domaine public en 2010 et 1 437 886 en 2012
Google Recherche de Livres
Hathi Trust
Open Content Alliance
World Digital Library
Europeana
Principales différences entre
ces différents projets


Bibliothèque (Gallica, Europeana, WDL) versus Entrepôt (Google,
OCA)



Gouvernance centralisée (Google) versus Consortium ou Partenariats
(OCA, Europeana, WDL)



Financements majoritairement publics (Europeana, Gallica) versus
financements privés (Google, OCA)



Architecture centralisée (Google, OCA) versus architecture répartie
(Europeana)



L’utilisateur va vers la ressource (Gallica, Google, Europeana,
WDL) versus la ressource va vers l’utilisateur (OCA)



Modèles organisationnels et économiques différents
Les enjeux


Enjeux culturels





Enjeux technologiques






Le Web comme média principal pour la diffusion de l’information et de la
connaissance, enjeu de démocratisation culturelle
Nécessité de répondre aux attentes des utilisateurs, de s’adapter aux pratiques
des internautes (recherche plein texte)
Numérisation comme support de sauvegarde et de diffusion
machines pour la numérisation de masse
Mise en réseaux de ressources dispersées et nécessité d’interopérabilité
(coopération)

Enjeux économiques




Enjeu commercial : plus de contenu pour attirer plus d’internautes / Enjeu
culturel : mission de diffusion et de valorisation des institutions
Besoin de contenu/besoin de financement
Partenariats public/privé
Gallica
Conclusion :
que retenir de tout cela ?
Règle n° 1 : « Numériser, ce n’est pas éditer »



Numériser ce n’est pas



commenter





interpréter
améliorer

Numériser c’est


reproduire



donner à consulter



aider à lire
Règle n° 2 : « l’information n’est pas connaissance »



Une bibliothèque numérique ce n’est pas






Un entrepôt de données
Un moteur de recherche
Une librairie en ligne

Une bibliothèque numérique c’est





Un ensemble organisé
Des services
Des informations structurées et contextualisées
Un accès à toutes les informations contenues dans un
document
Règle n° 3 : « Numériser n’est pas seulement un acte technique »



Les choix techniques ne sont pas






Déterminés uniquement par les moyens financiers
Déterminés par le prestataire qui numérise
La première chose à décider

Les choix techniques sont




Déterminants pour les conditions de consultation
Déterminants pour l’interopérabilité
Déterminants pour la conservation à long terme
Sélection

Collecte / production

Préparation à la

Gestion d’une
collection

Acquisition

Description : Catalogage

00100000001000000010000000110001001100100011000000100000001
00000001000000010000000110101001110000010000000100000001101
01001000000010000000100000001100010011100100111000001100010
01011010011000000111001001011010011001100110000010101000011
00010011010000111010001100100011001000111010001100000011000
10010111000110110001100100011100101011010001000000010000000
10000000110011001110000011100100111000001011100011011100110
00000100000001000000010000000110010001100110011010100110010
00101110001101000011010100100000001000000010000000100000001
00000001011010011000100101110001101100011011000100000001000
00001000000010110100110111001011100110111001100100010000000
10000000101101001100010011100000101110001101100011000100100
00000100000001011010011100000110000001011000110000001100000
01000000010000000101101001110000011000000101110001100000011
00000010000000100000001000000011000100100000001000000011010
00011001100100000001000000010000000111001001000000010000000
10000000100000001110010011100000111001001011100011010000110
01000100000001000000010000000100000001000000011000100110110
00101110001100000011001000100000001000000010000000100000001
00000001101010011001100101110001110000011001100100000001000
00001000000010000000100000001101010011011000101110001101100
01100100010000000100000001000000010000000100000001000000011
01000010111000111000001100010010000000100000001000000010000
00011011100111001001100110010111000110101001110000010000000
10000000100000001000000010000000100000001100110010111000110
01100110100000010100010000000100000001000000011000100110010
00110000001000000010000000100000001000000011010100111000001
00000001000000011010100100000001000000010000000110001001110
01001110000011000100101101001100000011100100101101001100110
01100000101010000110001001101000011101000110010001100100011
10100011000000110101001011100011011100111000001110000101101
00010000000100000001000000011001100111000001110010011010000
10111000110110001101000010000000100000001000000011001000110
10100110100001101100010111000111000001110000010000000100000
00100000001000000010000001000000010110100111000001100000010

Sélection

consultation : Équipement

Description : Métadonnées /
indexation

Préparation à la

consultation : Empaquetage
Gestion

Magasinage

Conservation

Communication

Valorisation

Consultation
d’une collection

Rangement et
conserrvatopn
d’une collection

Constitution
d’une collection

Bibliothèque physique et bibliothèque numérique

Préservation
Accès

Valorisation
Le rôle du bibliothécaire numérique


Ce qui ne change pas :






Il travaille à la constitution des collections et à l’élaboration des instruments
de référence qui permettent d’y accéder
Il gère physiquement la collection, veille à son organisation, à son bon état de
conservation
Il sert d’interface (au sens propre) entre le public et les collections, fait
fonctionner les services au public et la collection

Ce qui change






Il acquiert des compétences techniques en informatique (architecture Web,
capacité à rédiger à cahier des charges – même si ce n’est pas lui qui met en
œuvre)
Il comprend ce qu’est un document numérique, et la différence avec un
document bibliographique et un document analogique, il connaît
l’environnement juridique de la propriété intellectuelle
Il est capable de traduire en termes ergonomiques ses compétences de service
public pour s’adapter à un public distant
Quelques sites


http://gallica.bnf.fr / http://gallica2.bnf.fr



http://www.europeana.eu



http://maquette.bnf.fr/labs/scenario/Europeana.demo.html



http://memory.loc.gov/ammem/index.html



http://www.gutenberg.org



http://cnum.cnam.fr/



www.bvh.univ-tours.fr



http://gdz.sub.uni-goettingen.de/de/index.html



http://www.persee.fr



http://elec.enc.sorbonne.fr/



http://books.google.fr/



http://www.openlibrary.org
Quelques sites

















http://www.wdl.org/fr/
http://bibliotheque-numerique.inha.fr
http://www.gutenberg.org/browse/languages/fr
http://www.europeana.eu/portal/
http://fr.wikipedia.org/wiki/Wikisource
http://www.archive.org
http://classiques.uqac.ca/
http://www.e-corpus.org
http://www.livres-et-ebooks.fr/
http://www.cairn.info
http://www.persee.fr
http://www.revues.org/
http://www.erudit.org
http://fr.wikisource.org/
http://web2.bium.univ-paris5.fr
http://expositions.bnf.fr/livres/
Quelques ressources


Sur le site Numérisation du patrimoine culturel du Ministère de la Culture :



La bibliographie : http://www.culture.gouv.fr/culture/mrt/numerisation/fr/f_06.htm,
Les fiches techniques : http://www.culture.gouv.fr/culture/mrt/numerisation/fr/f_04.htm



Figoblog http://www.figoblog.org/



Affordance : http://affordance.typepad.com/mon_weblog/



Silex : http://scinfolex.wordpress.com/



Tour de toile du BBF (bibliothèques numériques et numérisation) http://blogbbf.enssib.fr/?
Bib_num_numerisation



Bibliothèques sur le Web, BBF 2006 - Paris, t. 51, n° 3



Entretiens de la BnF, 7-8 décembre 2006 “Numérique et bibliothèques : le deuxième choc »
http://www.bnf.fr/pages/infopro/journeespro/jp_entretiens06.htm



Dico illustré du Web 2.0 http://www.journaldunet.com/diaporama/0610-dicoweb2/index.shtml



http://www.bnf.fr/pages/zNavigat/frame/infopro.htm : rubrique en cours de mise
à jour

Contenu connexe

Tendances

Introduction aux bibliothèques numériques : support de cours Anne Pajard
Introduction aux bibliothèques numériques : support de cours Anne PajardIntroduction aux bibliothèques numériques : support de cours Anne Pajard
Introduction aux bibliothèques numériques : support de cours Anne Pajardapajard
 
Recherche documentaire : premiers pas
Recherche documentaire : premiers pasRecherche documentaire : premiers pas
Recherche documentaire : premiers pasBUPMCformM
 
Restitution veille sur les portails de bibliotheque
Restitution veille sur les portails de bibliothequeRestitution veille sur les portails de bibliotheque
Restitution veille sur les portails de bibliothequeJulien Sicot
 
Le web sémantique : une nouvelle interopérabilité pour les bibliothèques
Le web sémantique : une nouvelle interopérabilité pour les bibliothèquesLe web sémantique : une nouvelle interopérabilité pour les bibliothèques
Le web sémantique : une nouvelle interopérabilité pour les bibliothèquesJasmin Hügi
 
Présentation de HAL - Sensibilisation aux Archives Ouvertes
Présentation de HAL - Sensibilisation aux Archives OuvertesPrésentation de HAL - Sensibilisation aux Archives Ouvertes
Présentation de HAL - Sensibilisation aux Archives OuvertesJulien Sicot
 
Restitution veille sur portails de bibliotheque
Restitution veille sur portails de bibliothequeRestitution veille sur portails de bibliotheque
Restitution veille sur portails de bibliothequeJulien Sicot
 
Place du document numérique dans les ENT
Place du document numérique dans les ENTPlace du document numérique dans les ENT
Place du document numérique dans les ENTClément Dussarps
 
Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013
Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013
Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013Bibliotheque Université de Provence
 
Portails, présentation de l'offre de logiciels
Portails, présentation de l'offre de logicielsPortails, présentation de l'offre de logiciels
Portails, présentation de l'offre de logicielsMarc Maisonneuve
 
Les Portails De BibliothèQue
Les Portails De BibliothèQueLes Portails De BibliothèQue
Les Portails De BibliothèQuecyberdoc
 
Cours 6 la coll multi supports de livres-diapo
Cours 6 la coll multi supports de livres-diapoCours 6 la coll multi supports de livres-diapo
Cours 6 la coll multi supports de livres-diapoVirginie Delaine
 
La recherche documentaire sur moteurs de recherche et bases de données
La recherche documentaire sur moteurs de recherche et bases de donnéesLa recherche documentaire sur moteurs de recherche et bases de données
La recherche documentaire sur moteurs de recherche et bases de donnéesLatour Marie
 

Tendances (17)

Introduction aux bibliothèques numériques : support de cours Anne Pajard
Introduction aux bibliothèques numériques : support de cours Anne PajardIntroduction aux bibliothèques numériques : support de cours Anne Pajard
Introduction aux bibliothèques numériques : support de cours Anne Pajard
 
Recherche documentaire : premiers pas
Recherche documentaire : premiers pasRecherche documentaire : premiers pas
Recherche documentaire : premiers pas
 
Outils de veille informationnelle - Hiver 2017
Outils de veille informationnelle - Hiver 2017Outils de veille informationnelle - Hiver 2017
Outils de veille informationnelle - Hiver 2017
 
Restitution veille sur les portails de bibliotheque
Restitution veille sur les portails de bibliothequeRestitution veille sur les portails de bibliotheque
Restitution veille sur les portails de bibliotheque
 
Le web sémantique : une nouvelle interopérabilité pour les bibliothèques
Le web sémantique : une nouvelle interopérabilité pour les bibliothèquesLe web sémantique : une nouvelle interopérabilité pour les bibliothèques
Le web sémantique : une nouvelle interopérabilité pour les bibliothèques
 
Atelier de recherche documentaire au bacc. en ingénierie - Automne 2016
Atelier de recherche documentaire au bacc. en ingénierie - Automne 2016Atelier de recherche documentaire au bacc. en ingénierie - Automne 2016
Atelier de recherche documentaire au bacc. en ingénierie - Automne 2016
 
Présentation de HAL - Sensibilisation aux Archives Ouvertes
Présentation de HAL - Sensibilisation aux Archives OuvertesPrésentation de HAL - Sensibilisation aux Archives Ouvertes
Présentation de HAL - Sensibilisation aux Archives Ouvertes
 
Restitution veille sur portails de bibliotheque
Restitution veille sur portails de bibliothequeRestitution veille sur portails de bibliotheque
Restitution veille sur portails de bibliotheque
 
Place du document numérique dans les ENT
Place du document numérique dans les ENTPlace du document numérique dans les ENT
Place du document numérique dans les ENT
 
Méthodologie de la recherche documentaire M1 Anglais
Méthodologie de la recherche documentaire M1 AnglaisMéthodologie de la recherche documentaire M1 Anglais
Méthodologie de la recherche documentaire M1 Anglais
 
Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013
Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013
Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013
 
Portails, présentation de l'offre de logiciels
Portails, présentation de l'offre de logicielsPortails, présentation de l'offre de logiciels
Portails, présentation de l'offre de logiciels
 
Atelier de veille informationnelle pour bacc. + 2e cycle - automne 2016
Atelier de veille informationnelle pour bacc. + 2e cycle - automne 2016Atelier de veille informationnelle pour bacc. + 2e cycle - automne 2016
Atelier de veille informationnelle pour bacc. + 2e cycle - automne 2016
 
Les Portails De BibliothèQue
Les Portails De BibliothèQueLes Portails De BibliothèQue
Les Portails De BibliothèQue
 
2016 formation documentaire_des2213
2016 formation documentaire_des22132016 formation documentaire_des2213
2016 formation documentaire_des2213
 
Cours 6 la coll multi supports de livres-diapo
Cours 6 la coll multi supports de livres-diapoCours 6 la coll multi supports de livres-diapo
Cours 6 la coll multi supports de livres-diapo
 
La recherche documentaire sur moteurs de recherche et bases de données
La recherche documentaire sur moteurs de recherche et bases de donnéesLa recherche documentaire sur moteurs de recherche et bases de données
La recherche documentaire sur moteurs de recherche et bases de données
 

Similaire à 2013 bibnum ebd

Traitement documentaire - Indexation
Traitement documentaire - IndexationTraitement documentaire - Indexation
Traitement documentaire - IndexationClément Dussarps
 
Formation à la recherche documentaire Master SACIM
Formation à la recherche documentaire Master SACIMFormation à la recherche documentaire Master SACIM
Formation à la recherche documentaire Master SACIMMagalie Le Gall
 
Sécuritém2
Sécuritém2Sécuritém2
Sécuritém2BAPS
 
Droit documentation electronique edshs
Droit documentation electronique edshsDroit documentation electronique edshs
Droit documentation electronique edshscarovalerie37
 
Documentation électronique. Ecole doctorale, droit
Documentation électronique. Ecole doctorale, droitDocumentation électronique. Ecole doctorale, droit
Documentation électronique. Ecole doctorale, droitcarovalerie37
 
Biblissima: Federating Research on the Written Heritage of the Middle Ages an...
Biblissima: Federating Research on the Written Heritage of the Middle Ages an...Biblissima: Federating Research on the Written Heritage of the Middle Ages an...
Biblissima: Federating Research on the Written Heritage of the Middle Ages an...Equipex Biblissima
 
Omeka, une plateforme pour les humanités numériques
Omeka, une plateforme pour les humanités numériquesOmeka, une plateforme pour les humanités numériques
Omeka, une plateforme pour les humanités numériquesPierre Couchet
 
Biblissima (Rencontre Ménestrel 2013)
Biblissima (Rencontre Ménestrel 2013)Biblissima (Rencontre Ménestrel 2013)
Biblissima (Rencontre Ménestrel 2013)Equipex Biblissima
 
Richard Walter (IRHT), "Chercheurs vos papiers", 26 novembre 2009, MMSH
Richard Walter (IRHT), "Chercheurs vos papiers", 26 novembre 2009, MMSHRichard Walter (IRHT), "Chercheurs vos papiers", 26 novembre 2009, MMSH
Richard Walter (IRHT), "Chercheurs vos papiers", 26 novembre 2009, MMSHPhonothèque MMSH
 
Le portail Biblissima. Explorer les ressources numériques sur le patrimoine é...
Le portail Biblissima. Explorer les ressources numériques sur le patrimoine é...Le portail Biblissima. Explorer les ressources numériques sur le patrimoine é...
Le portail Biblissima. Explorer les ressources numériques sur le patrimoine é...Equipex Biblissima
 
Panorama du numérique en bibliotheque
Panorama du numérique en bibliothequePanorama du numérique en bibliotheque
Panorama du numérique en bibliothequeFlora Gousset
 
Jabes 2007 - Conférence inaugurale, les bibliothèques, infrastructure globale...
Jabes 2007 - Conférence inaugurale, les bibliothèques, infrastructure globale...Jabes 2007 - Conférence inaugurale, les bibliothèques, infrastructure globale...
Jabes 2007 - Conférence inaugurale, les bibliothèques, infrastructure globale...ABES
 
Structuration de données, recherche et édition
Structuration de données, recherche et éditionStructuration de données, recherche et édition
Structuration de données, recherche et éditionEquipex Biblissima
 
Bibliotheques numeriques : contenus et mediation
Bibliotheques numeriques : contenus et mediationBibliotheques numeriques : contenus et mediation
Bibliotheques numeriques : contenus et mediationFleury Christine
 
Formation initiale informatique 2011
Formation initiale informatique 2011Formation initiale informatique 2011
Formation initiale informatique 2011pascaljh
 

Similaire à 2013 bibnum ebd (20)

Produits doc et services mai 2012
Produits doc et services mai 2012Produits doc et services mai 2012
Produits doc et services mai 2012
 
Traitement documentaire - Indexation
Traitement documentaire - IndexationTraitement documentaire - Indexation
Traitement documentaire - Indexation
 
Formation à la recherche documentaire Master SACIM
Formation à la recherche documentaire Master SACIMFormation à la recherche documentaire Master SACIM
Formation à la recherche documentaire Master SACIM
 
Sécuritém2
Sécuritém2Sécuritém2
Sécuritém2
 
Droit documentation electronique edshs
Droit documentation electronique edshsDroit documentation electronique edshs
Droit documentation electronique edshs
 
Documentation électronique. Ecole doctorale, droit
Documentation électronique. Ecole doctorale, droitDocumentation électronique. Ecole doctorale, droit
Documentation électronique. Ecole doctorale, droit
 
Biblissima: Federating Research on the Written Heritage of the Middle Ages an...
Biblissima: Federating Research on the Written Heritage of the Middle Ages an...Biblissima: Federating Research on the Written Heritage of the Middle Ages an...
Biblissima: Federating Research on the Written Heritage of the Middle Ages an...
 
Td3 ##support 2019 09-13
Td3 ##support 2019 09-13 Td3 ##support 2019 09-13
Td3 ##support 2019 09-13
 
Omeka, une plateforme pour les humanités numériques
Omeka, une plateforme pour les humanités numériquesOmeka, une plateforme pour les humanités numériques
Omeka, une plateforme pour les humanités numériques
 
Biblissima (Rencontre Ménestrel 2013)
Biblissima (Rencontre Ménestrel 2013)Biblissima (Rencontre Ménestrel 2013)
Biblissima (Rencontre Ménestrel 2013)
 
Richard Walter (IRHT), "Chercheurs vos papiers", 26 novembre 2009, MMSH
Richard Walter (IRHT), "Chercheurs vos papiers", 26 novembre 2009, MMSHRichard Walter (IRHT), "Chercheurs vos papiers", 26 novembre 2009, MMSH
Richard Walter (IRHT), "Chercheurs vos papiers", 26 novembre 2009, MMSH
 
Le portail Biblissima. Explorer les ressources numériques sur le patrimoine é...
Le portail Biblissima. Explorer les ressources numériques sur le patrimoine é...Le portail Biblissima. Explorer les ressources numériques sur le patrimoine é...
Le portail Biblissima. Explorer les ressources numériques sur le patrimoine é...
 
Panorama du numérique en bibliotheque
Panorama du numérique en bibliothequePanorama du numérique en bibliotheque
Panorama du numérique en bibliotheque
 
Jabes 2007 - Conférence inaugurale, les bibliothèques, infrastructure globale...
Jabes 2007 - Conférence inaugurale, les bibliothèques, infrastructure globale...Jabes 2007 - Conférence inaugurale, les bibliothèques, infrastructure globale...
Jabes 2007 - Conférence inaugurale, les bibliothèques, infrastructure globale...
 
L1 Anglais - recherche documentaire
L1 Anglais - recherche documentaireL1 Anglais - recherche documentaire
L1 Anglais - recherche documentaire
 
C2i2e Cours Recherche Doc
C2i2e Cours  Recherche DocC2i2e Cours  Recherche Doc
C2i2e Cours Recherche Doc
 
Structuration de données, recherche et édition
Structuration de données, recherche et éditionStructuration de données, recherche et édition
Structuration de données, recherche et édition
 
Bibliotheques numeriques : contenus et mediation
Bibliotheques numeriques : contenus et mediationBibliotheques numeriques : contenus et mediation
Bibliotheques numeriques : contenus et mediation
 
Formation initiale informatique 2011
Formation initiale informatique 2011Formation initiale informatique 2011
Formation initiale informatique 2011
 
L1 Ue Projet Parasitologie - recherche documentaire
L1 Ue Projet Parasitologie - recherche documentaireL1 Ue Projet Parasitologie - recherche documentaire
L1 Ue Projet Parasitologie - recherche documentaire
 

Dernier

Planning de la semaine du 25 mars au 2 avril 2024
Planning de la semaine du 25 mars au 2 avril 2024Planning de la semaine du 25 mars au 2 avril 2024
Planning de la semaine du 25 mars au 2 avril 2024frizzole
 
Présentation de lancement de la SAE203 - MMI S2
Présentation de lancement de la SAE203 - MMI S2Présentation de lancement de la SAE203 - MMI S2
Présentation de lancement de la SAE203 - MMI S2JeanLucHusson
 
Exercice de FLE pour enfants sur les transports et les prépositions
Exercice de FLE pour enfants sur les transports et les prépositionsExercice de FLE pour enfants sur les transports et les prépositions
Exercice de FLE pour enfants sur les transports et les prépositionslaetitiachassagne
 
La Projection orthogonale en dessin technique
La Projection orthogonale en dessin techniqueLa Projection orthogonale en dessin technique
La Projection orthogonale en dessin techniquessuser4dbdf2
 
Formation M2i - Femmes entrepreneures : soyez actrices du changement
Formation M2i - Femmes entrepreneures : soyez actrices du changementFormation M2i - Femmes entrepreneures : soyez actrices du changement
Formation M2i - Femmes entrepreneures : soyez actrices du changementM2i Formation
 
Rapport projet de fin d'études licence PFE
Rapport projet de fin d'études licence PFERapport projet de fin d'études licence PFE
Rapport projet de fin d'études licence PFEAhmam Abderrahmane
 
Semaine de la Passion de Jésus-Christ.pptx
Semaine de la Passion de Jésus-Christ.pptxSemaine de la Passion de Jésus-Christ.pptx
Semaine de la Passion de Jésus-Christ.pptxMartin M Flynn
 

Dernier (7)

Planning de la semaine du 25 mars au 2 avril 2024
Planning de la semaine du 25 mars au 2 avril 2024Planning de la semaine du 25 mars au 2 avril 2024
Planning de la semaine du 25 mars au 2 avril 2024
 
Présentation de lancement de la SAE203 - MMI S2
Présentation de lancement de la SAE203 - MMI S2Présentation de lancement de la SAE203 - MMI S2
Présentation de lancement de la SAE203 - MMI S2
 
Exercice de FLE pour enfants sur les transports et les prépositions
Exercice de FLE pour enfants sur les transports et les prépositionsExercice de FLE pour enfants sur les transports et les prépositions
Exercice de FLE pour enfants sur les transports et les prépositions
 
La Projection orthogonale en dessin technique
La Projection orthogonale en dessin techniqueLa Projection orthogonale en dessin technique
La Projection orthogonale en dessin technique
 
Formation M2i - Femmes entrepreneures : soyez actrices du changement
Formation M2i - Femmes entrepreneures : soyez actrices du changementFormation M2i - Femmes entrepreneures : soyez actrices du changement
Formation M2i - Femmes entrepreneures : soyez actrices du changement
 
Rapport projet de fin d'études licence PFE
Rapport projet de fin d'études licence PFERapport projet de fin d'études licence PFE
Rapport projet de fin d'études licence PFE
 
Semaine de la Passion de Jésus-Christ.pptx
Semaine de la Passion de Jésus-Christ.pptxSemaine de la Passion de Jésus-Christ.pptx
Semaine de la Passion de Jésus-Christ.pptx
 

2013 bibnum ebd

  • 1. numérisation et bibliothèque numérique Luc Bellier, BnF École de bibliothécaires documentalistes, Septembre-Octobre
  • 2. Travaux pratiques : manipuler un document numérique  Objectif : appréhender les différents composant le document numérique  Télécharger un document PDF sur Gallica  http://gallica.bnf.fr/ark:/12148/bpt6k145269m  Le manipuler (mode texte et mode image, appréhender les méta-données et les qualifier)  Consulter le document sur Gallica et retrouver les éléments du document numérique  Télécharger un ePub et le manipuler retrouver les mêmes éléments ( http://fr.feedbooks.com/book/16/bel-ami ou http://gallica.bnf.fr/ark:/12148/bpt6k145269m)  A la maison : consulter un document sur Google Books, athi trust ou autre et décrire les services proposés par la bibliothèque numérique  Prendre quelques images et les passer à l’OCR (presse, patrimonial, illustré, moderne) => préparer le dossier avec images concernées
  • 3. Travaux pratiques : manipuler un document numérique •TéléchargerPDF •Trouver le mode texte •Télécharger l’ePub •Changer le .ePub en .zip •Ouvrir le dossier
  • 4. Travaux pratiques : manipuler un document numérique •Le titre = métadonnées descriptives •Les pages = métadonnées de structure
  • 5. • Les métadonnées •Un document numérique / électronique, c’est une suite de fichiers sans lien entre eux • identifiant unique (localisation / identification) •? •Métadonnées descriptives •rattacher le document à l’original / différentes versions d’un document •donner accès à la copie numérique / électronique •Métadonnées de structure •Métadonnées administratives •rattacher les fichiers entre eux •gérer les droits d’accès •reconstituer la structure du document •gérer la collection, c’est-à-dire •préserver les informations techniques nécessaires à la lecture des fichiers •garantir l ’intégrité des fichiers et le suivi de leurs éventuelles modifications
  • 6. Travaux pratiques : manipuler un document numérique •Le contenu d’un ePub
  • 7. Travaux pratiques : manipuler un document numérique •Le manifeste *.opf
  • 8. Travaux pratiques : manipuler un document numérique •Toc.ncx
  • 9. •J PG •X HT M L •O PF •N CX Produire et décrire le document numérique » Le cas des livres numériques ePub •Métadonnées •Descriptives? Métadonnées de structure ?
  • 10. • Les métadonnées •Un document numérique / électronique, c’est une suite de fichiers sans lien entre eux • identifiant unique (localisation / identification) •? •Métadonnées descriptives •rattacher le document à l’original / différentes versions d’un document •donner accès à la copie numérique / électronique •Métadonnées de structure •Métadonnées administratives •rattacher les fichiers entre eux •gérer les droits d’accès •reconstituer la structure du document •gérer la collection, c’est-à-dire •préserver les informations techniques nécessaires à la lecture des fichiers •garantir l ’intégrité des fichiers et le suivi de leurs éventuelles modifications
  • 11. Travaux pratiques : manipuler un document numérique
  • 12. Travaux pratiques : manipuler un document numérique
  • 13. Travaux pratiques : manipuler un document numérique
  • 14. Travaux pratiques : manipuler un document numérique
  • 15. Fiche à faire à la maison  À compléter et à envoyer à lbellier@gmail.com  Présentation du site    Nom de la bibliothèque numérique Nom de l’institution éditrice Présentation des collections   Quantité estimée des documents   Nature des collections proposées par la bibliothèque Autres informations Services proposés par la bibliothèque numérique  Quels accès aux documents ?  Quels type de lecture est proposée ?  Autres informations
  • 16. • Les métadonnées •Un document numérique / électronique, c’est une suite de fichiers sans lien entre eux • identifiant unique (localisation / identification) •? •Métadonnées descriptives •rattacher le document à l’original / différentes versions d’un document •donner accès à la copie numérique / électronique •Métadonnées de structure •Métadonnées administratives •rattacher les fichiers entre eux •gérer les droits d’accès •reconstituer la structure du document •gérer la collection, c’est-à-dire •préserver les informations techniques nécessaires à la lecture des fichiers •garantir l ’intégrité des fichiers et le suivi de leurs éventuelles modifications
  • 19. Qu’est-ce qu’une bibliothèque numérique? Luc Bellier, BnF École de bibliothécaires documentalistes, octobre-novembre 2010
  • 20. Plan  Qu’est-ce qu’une bibliothèque numérique?  Des collections de documents     Sélectionner Numériser Décrire et organiser Conserver et stocker  Un espace  Des publics  Des services
  • 21. Qu’est-ce qu’une bibliothèque? …qui ont besoin de confort, de lumière, d’espace, d’outils pour lire, écrire, discuter, travailler etc... un espace… des outils de référence des livres (sélectionnés et classés) des publics… un public
  • 22. La bibliothèque numérique : visite Entrée accès services Votre place Le bureau de Accès au moteur accès de recherche La sélection du valorisation bibliothécaire accès renseignements Les actualités valorisation de la bibliothèque La liste des nouveautés valorisation services Les outils de fidélisation et de communication accès Les rayonnages en libreaccès pour le butinage
  • 23. Une collection de documents
  • 24. La chaîne de numérisation : qu’est-ce que numériser ?  Sélectionner  Scanner :   72 dpi ? 300 ? 600 ?   Couleurs, niveaux de gris ou noir et blanc ? Quels formats ? Tiff, jpeg etc. Océriser   Pour afficher (faire correspondre texte et image => métadonnées)  Pour vocaliser (qualité optimum ou garantie => comment évaluer la qualité?)   Pour chercher (texte uniquement) Pour transférer (le texte sans l’image , mais que le texte, sur un format portable) Décrire et organiser  Le document (signalement)  Les images constituant le document  Les fichiers textes issus de l’ocr
  • 25. 1- La chaîne de numérisation : sélectionner
  • 26. •Estimation et analyse de besoins •Recherche et collecte d’informations •Sélection, acquisition des documents •Traitement des documents •Traitement matériel : •Enregistrement du document •Équipement, reproduction, conservation (reliure etc.) •Traitement intellectuel : •Catalogage et indexation •Analyse, résumé etc. •Enregistrement de l’information •Classemen t •Diffusion de l’information : •Prêt •Mise à disposition des produits secondaires (catalogue, bibliographies, revue de presse etc.)
  • 27. La chaîne de numérisation Sélection Sélection Relecture Relecture Acquisition Acquisition Signalement Signalement Prestataire encodage encodage En mode texte En mode texte Indexation Indexation Numérisation Numérisation Mise en Mise en ligne ligne En mode image En mode image structuration structuration Compétences bibliothéconomiques Compétences techniques Contrôle Contrôle transformation transformation Pas de compétences particulières
  • 28. La chaîne de numérisation, 1 : « sélection- acquisition» Politique documentaire de la bibliothèque Organisation logistique Sélection Sélection Relecture Relecture Acquisition Acquisition Signalement Signalement encodage encodage En mode texte En mode texte Indexation Indexation Numérisation Numérisation En mode image En mode image structuration structuration Contrôle Contrôle transformation transformation Mise en Mise en ligne ligne
  • 29. « Sélection » : la politique documentaire Numérisation de sauvegarde : les documents fragiles, en danger? Objectifs & missions Collections de la bibliothèque Numérisation à la demande des utilisateurs? Numérisation pour la diffusion Politique documentaire Public visé Public de la bibliothèque? Collection encyclopédique? Public à distance? Collection spécialisée? Grand public, chercheurs, étudiants? Types de supports Types de documents Contraintes juridiques et techniques Droits d’auteur État physique des documents Programmes de numérisation
  • 30. Les programmes de numérisation à la BnF  Collection encyclopédique  Documents libres de droits  Tout support   Pour un public de    Monographies, périodiques, images, son Chercheurs, étudiants, érudits, « médiateurs » (enseignants, journalistes, associations) Grand public de plus en plus ciblé Grands axes :  le patrimoine national (somme des œuvres et des connaissances dans toutes les disciplines, philosophie, histoire, littérature, religion, sciences,…),  des programmes à vocation internationale (rapprochement et confrontation de corpus patrimoniaux portant sur le même sujet mais issus d’autres nationalités : presse quotidienne, documentation juridique, histoire et sciences auxiliaires telles que la généalogie, les langues et leur apprentissage,…)  un corpus d’œuvres et de documents consacrés spécifiquement à l’Europe dans tout ses aspects (philosophie politique, identités nationales, histoire, économie, commerce, le travail, les métiers les sciences et techniques, les questions sociales, les grands évènements culturels, …).
  • 31. La question des droits : considérer le contenu auteur Robert Doisneau (1912-1994) Epouvantails, 1964 oeuvre personne auteur Robert Doisneau (1912-1994) SAVIGNAC aux échecs. Paris, 1950
  • 32. La question des droits (http://print.google.com) Recherche dans l’ensemble du texte, visualisation d’extraits
  • 33. La question des droits (http://www.persee.fr) Blocage des images
  • 34. « Acquisition » : mettre à disposition les originaux?  Une fois la sélection faite, il faut se procurer les documents  C’est en partie une question technique et financière    Achat de document pour la numérisation Ou numérisation des documents originaux Numériser le papier ou le microfilm ?    Différence de prix, de rapidité et de qualité Question de préservation du document original Numériser des originaux  Le scanner tourne page ? Dérelier ou massicoter ?  Différences de prix et de qualité   Problèmes logistiques liés à la numérisation patrimoniale  Sortir les ouvrages des magasins Problèmes d’indisponibilité pour les lecteurs  Le transport et la livraison (conditions de conservation)  La numérisation sur site (coût) 
  • 35. « Acquisition » : mettre à disposition les originaux? Filière Papier Filière Microformes Films Reliés Massicots Fiches
  • 36. « Acquisition » : mettre à disposition les originaux? Les « objets » sont transportés dans des caisses scellées
  • 37. 2- La chaîne de numérisation : signaler
  • 38. La chaîne de numérisation, 2 : « signalement » Sélection Sélection Relecture Relecture Acquisition Acquisition Signalement Signalement encodage encodage En mode texte En mode texte Indexation Indexation Numérisation Numérisation En mode image En mode image structuration structuration Contrôle Contrôle transformation transformation Mise en Mise en ligne ligne
  • 39. La chaîne de numérisation, 2 : « signalement »
  • 40. La chaîne de numérisation, 2 : « signalement »
  • 41. « Signalement » : la notion de métadonnées Des données sur les données ... – qui servent à organiser la connaissance et à utiliser et exploiter le document • Métadonnées descriptives, contextuelles et structurelles – Ex. : Notice bibliographique, indexation – Ex. : Date et formats de numérisation – Ex. : Données sur les fichiers pour reconstituer l’ouvrage (Cf. plus loin) • initiales et ajoutées tout au long du cycle de vie du document numérisé – qui servent à le maintenir accessible dans le temps et à garantir et contrôler cet accès • Métadonnées administratives et techniques – Ex. : Droits de lecture en interne seulement ou droit sur Internet • initiales et ajoutées tout au long du cycle de vie du document numérisé – Ex. : passage d’un document protégé dans le domaine public
  • 42. Pourquoi a-t-on besoin de métadonnées? La déconstruction du document numérique
  • 43. « Signalement » : les métadonnées Un livre numérisé, c’est une suite de fichiers sans lien entre eux : la numérisation déconstruit le livre identifiant unique ? Métadonnées de structure Métadonnées descriptives •rattacher les fichiers entre eux •rattacher le document à l’original •reconstituer la structure du document •donner accès à la copie numérisée Métadonnées administratives •gérer les droits d ’accès •préserver les informations techniques nécessaires à la lecture des fichiers
  • 44. Le document : notion de granularité • Notion de document complexe • Un document peut avoir plusieurs niveaux d’accès • Par ex. les périodiques : Collection Document (notice bibliographique) Volume, tome, fascicule... Page Vue de détail (article)
  • 45. 3- La chaîne de numérisation : numériser
  • 46. La chaîne de numérisation, 3 : « Numérisation » Sélection Sélection Relecture Relecture Acquisition Acquisition Signalement Signalement encodage encodage En mode texte En mode texte Indexation Indexation Numérisation Numérisation En mode image En mode image structuration structuration Contrôle Contrôle transformation transformation Mise en Mise en ligne ligne
  • 47. Numériser en mode image  La numérisation en mode image s’intéresse à la forme et donc à la structure physique  Avantages :    un fac-similé préserve l’intégrité de l’original Inconvénients :  un seul point d ’accès : la notice bibliographique  pas de possibilités de manipulation du texte  poids des images > stockage, temps de téléchargement  mise en place de chaînes de numérisation complexes
  • 48. Numériser en mode texte  La numérisation en mode texte s’intéresse directement au contenu et donc à la structure logique  Avantages   souplesse et portabilité   recherche plein texte et autres manipulations Accessibilité pour les personnes en situation de handicap visuel Inconvénients  lourdeur de réalisation  coût
  • 49. Numériser en mode texte  Il y a deux techniques de création du mode texte…  La reconnaissance automatique de caractères ou OCR   problèmes : caractères anciens, mal formés, caractères spéciaux, titres, documents en mauvais état…  recherches en cours, amélioration des logiciels   fortement conditionnée par la qualité de numérisation mais correction manuelle obligatoire pour une qualité à 100% La saisie  saisie manuelle : coût en termes de ressources humaines  « double saisie manuelle comparée »
  • 50. Numériser en texte et image  Il existe des solutions qui combinent les deux modes  Avantage   Combiner les avantages du texte et de l’image Inconvénients  Difficulté de réalisation et de contrôle  Globalement, cela revient à numériser deux fois… donc deux fois plus de travail, et coûts élevés
  • 51. Numériser en texte et image (http://www.bium.univ-paris5.fr/histmed/medica.htm) Liste des chapitres en mode texte Pages en mode image
  • 52. Numériser en texte et image (http://www.persee.fr) Mode image Mode texte (OCR de très bonne qualité, documents récents)
  • 53. Numériser en texte et image Visualisation du mode image uniquement, mode texte issu d’OCR en sous-couche permettant la recherche plein texte et le surlignage des résultats de la recherche (http://books.google.fr/)
  • 54. L’OCR  L’OCR est un processus automatique  La qualité comme la reconnaissance sont calculés par des machines  C’est le nombre de caractères suspects divisés par le nombre total de caractères sur une page.  Une page de dix caractères vaut autant qu’une page de 10000 caractères dans un même ouvrage.
  • 55. Numériser : l’équipement Les ouvrages de la filière « reliés » sont numérisés soit…. Automatiquement Numérisation à 90° Kirtas APT 2400
  • 56. Numériser : l’équipement Les ouvrages de la filière « reliés » sont numérisés soit…. manuellement sur des scanners de livres Numérisation à plat Digibook 2000LC Suprascan A0 Copybook
  • 57. Numériser : l’équipement Les microformes sont numérisées sur des scanners de microfilms et de microfiches Microfiches Microfilms
  • 58. Numériser : l’équipement Les ouvrages de la filière « massicots » sont numérisés sur des scanners de production grande vitesse Docuscan 6000 Plus de 6000 pages/heure
  • 59. Numériser : un exemple de traitement d’image Un opérateur contrôle le traitement des images sur le logiciel SpiFactory Redressement Recadrage des pages Illustrations Binarisation (transformation des images de niveau de gris et couleur en noir et blanc) Filtrage des formes (redressement des blancs, des lignes, des caractères à l’intérieur d’une image)
  • 60. 4- La chaîne de numérisation : décrire et organiser
  • 61. La chaîne de numérisation, 4 : « indexation - mise en ligne » Sélection Sélection Relecture Relecture Acquisition Acquisition Signalement Signalement encodage encodage En mode texte En mode texte Indexation Indexation Numérisation Numérisation En mode image En mode image structuration structuration Contrôle Contrôle transformation transformation Mise en Mise en ligne ligne
  • 62. « Indexation » : la création des accès  Le matériau indexable :    L’indexation permet de créer des accès aux documents    Via un catalogue Via un moteur de recherche le catalogue    les métadonnées – descriptives – structurées le texte – en grande quantité – de qualité variable adapté pour la recherche avancée Classement par titre, auteur etc. le moteur de recherche    recherche simple conforme aux habitudes du web recherche fine (plein-texte) classement des résultats par pertinence
  • 63. « Mise en ligne » : la salle de lecture virtuelle  La « salle de lecture virtuelle » est un espace où l’on consulte les collections      Elle met à disposition des lecteurs les instruments d’accès et de renseignement bibliographique Elle propose des outils de présentation des collections (mise en contexte, valorisation) : pages éditoriales Elle constitue un espace convivial (rencontres, expositions) Elle constitue un espace de confort pour travailler (lecture du document) Elle offre des services de valeur ajoutée pour aider les lecteurs dans leur travail  1. faire aussi bien que le livre  2. faire mieux que le livre
  • 64. 5- La chaîne de numérisation : stocker et conserver
  • 65. La conservation  Une fois les documents numérisés, sont-il vraiment en sécurité ? Pour combien de temps ? Sauvegarder n’est pas archiver  Surveiller et renouveler régulièrement les supports (de façon préventive)  Collecter toutes les informations nécessaires pour maîtriser le document (métadonnées)  Transformer le document dans une forme plus facile à conserver dans le temps (« migration »)  Collecter des environnements et des plateformes de références pour l’avenir (« émulation »)
  • 67. Le partage des données : OAI et coopération  Interopérabilité des données (OAI-PMH, Entrepôts OAI)    Initiative OAI : Open Archive Initiative (1999)  Objectif : améliorer le signalement des e-prints, des publications scientifiques et l’interopérabilité des bases d’archives ouvertes  Moyen : création d’un protocole technique de diffusion et de collecte de métadonnées OAI-PMH : Protocol for Metadata Harvesting Intérêt dans le domaine culturel et patrimonial  Collections partagées dans des architectures réparties  Interrogation centralisée Fournisseurs de données Fournisseurs de services
  • 68. OAI et coopération : Gallica serveur OAI serveur OAI serveur OAI serveur OAI serveur OAI CNUM Syndicat national de l’édition Library of Congress 363 notices Universités de Strasbourg 5546 notices 435 notices 91 notices serveur OAI Bibliothèques virtuelles humanistes 186 notices BIUM 3970 notices Base de données site SICD Strasbourg site LOC Editeurs site CNUM site BIUM Consultation de ces documents sur les autres sites serveur OAI site BVH
  • 71. L’actualité en 2004-2005  Oct. 2004 : annonce du lancement de Google Print à la Foire de Francfort (Google), rebaptisé Google Book Search/ Google Recherche de livres en nov. 2005  Janv. 2005 : article de JN Jeanneney dans Le Monde lance l’idée d’une Bibliothèque numérique européenne (BnF, Commission européenne)  Oct. 2005 : création du consortium Open Content Alliance (Internet Archive, Yahoo!, MSN, Bibliothèques, archives anglophones etc.)  Nov. 2005 : partenariat Microsoft-Bristish Library pour numérisation de 25 millions de pages ($2,5 M) et annonce MSN Live Search  Nov. 2005 : lancement de la World Digital Library par James Billington (Library of Congress + UNESCO) avec l’aide de Google ($3 M)
  • 72. L’actualité en 2006-2007  Sept. 2006 : réalisation par la BnF d’une maquette (Europeana) préfigurant des accès et services pour une bibliothèque numérique européenne  Déc. 2006 : lancement de MSN Live Search  Mars 2007 : lancement par la BnF du prototype Europeana au Salon du livre (hors ligne depuis fin 2007)  Juillet 2007 : reprise du projet Europeana au niveau européen (géré par EDL Foundation)  Oct. 2007 : lancement de Gallica 2  Mars 2010 : 1 millions de documents accessibles dans Gallica
  • 73. Que sont devenus ces projets en 2013?  Google recherche de livres en 2012:     30 bibliothèques partenaires pour la numérisation de leurs collections 10 000 éditeurs et auteurs partenaires Interface dans 35 langues Pas de communication sur le nombre de documents (20 Millions évoqués)  Arrêt du programme de numérisation de livres de MSN en mai 2008  Open Content Alliance en novembre 2008 : Open Library  Bibliothèques américaines (Boston Library consortium), canadiennes, universités, Sociétés de l’Internet (une cinquantaine de partenaires)  19,401,009 titres de livres numérisés dont 340,083 en plein-texte  Documents également accessibles sur Internet Archive   http://www.hathitrust.org/ rassemble depuis 2008 les grandes bibliothèques américaines (NYPL, Yale, Cornell, Columbia…)  10,556,750 volumes 5,556,767 livres 274,642 périodiques 3,694,862,850 pages Dont 1 702 727 volumes dans le domaine public en 2010 et 1 437 886 en 2012
  • 79. Principales différences entre ces différents projets  Bibliothèque (Gallica, Europeana, WDL) versus Entrepôt (Google, OCA)  Gouvernance centralisée (Google) versus Consortium ou Partenariats (OCA, Europeana, WDL)  Financements majoritairement publics (Europeana, Gallica) versus financements privés (Google, OCA)  Architecture centralisée (Google, OCA) versus architecture répartie (Europeana)  L’utilisateur va vers la ressource (Gallica, Google, Europeana, WDL) versus la ressource va vers l’utilisateur (OCA)  Modèles organisationnels et économiques différents
  • 80. Les enjeux  Enjeux culturels    Enjeux technologiques     Le Web comme média principal pour la diffusion de l’information et de la connaissance, enjeu de démocratisation culturelle Nécessité de répondre aux attentes des utilisateurs, de s’adapter aux pratiques des internautes (recherche plein texte) Numérisation comme support de sauvegarde et de diffusion machines pour la numérisation de masse Mise en réseaux de ressources dispersées et nécessité d’interopérabilité (coopération) Enjeux économiques    Enjeu commercial : plus de contenu pour attirer plus d’internautes / Enjeu culturel : mission de diffusion et de valorisation des institutions Besoin de contenu/besoin de financement Partenariats public/privé
  • 82. Conclusion : que retenir de tout cela ?
  • 83. Règle n° 1 : « Numériser, ce n’est pas éditer »  Numériser ce n’est pas   commenter   interpréter améliorer Numériser c’est  reproduire  donner à consulter  aider à lire
  • 84. Règle n° 2 : « l’information n’est pas connaissance »  Une bibliothèque numérique ce n’est pas     Un entrepôt de données Un moteur de recherche Une librairie en ligne Une bibliothèque numérique c’est     Un ensemble organisé Des services Des informations structurées et contextualisées Un accès à toutes les informations contenues dans un document
  • 85. Règle n° 3 : « Numériser n’est pas seulement un acte technique »  Les choix techniques ne sont pas     Déterminés uniquement par les moyens financiers Déterminés par le prestataire qui numérise La première chose à décider Les choix techniques sont    Déterminants pour les conditions de consultation Déterminants pour l’interopérabilité Déterminants pour la conservation à long terme
  • 86. Sélection Collecte / production Préparation à la Gestion d’une collection Acquisition Description : Catalogage 00100000001000000010000000110001001100100011000000100000001 00000001000000010000000110101001110000010000000100000001101 01001000000010000000100000001100010011100100111000001100010 01011010011000000111001001011010011001100110000010101000011 00010011010000111010001100100011001000111010001100000011000 10010111000110110001100100011100101011010001000000010000000 10000000110011001110000011100100111000001011100011011100110 00000100000001000000010000000110010001100110011010100110010 00101110001101000011010100100000001000000010000000100000001 00000001011010011000100101110001101100011011000100000001000 00001000000010110100110111001011100110111001100100010000000 10000000101101001100010011100000101110001101100011000100100 00000100000001011010011100000110000001011000110000001100000 01000000010000000101101001110000011000000101110001100000011 00000010000000100000001000000011000100100000001000000011010 00011001100100000001000000010000000111001001000000010000000 10000000100000001110010011100000111001001011100011010000110 01000100000001000000010000000100000001000000011000100110110 00101110001100000011001000100000001000000010000000100000001 00000001101010011001100101110001110000011001100100000001000 00001000000010000000100000001101010011011000101110001101100 01100100010000000100000001000000010000000100000001000000011 01000010111000111000001100010010000000100000001000000010000 00011011100111001001100110010111000110101001110000010000000 10000000100000001000000010000000100000001100110010111000110 01100110100000010100010000000100000001000000011000100110010 00110000001000000010000000100000001000000011010100111000001 00000001000000011010100100000001000000010000000110001001110 01001110000011000100101101001100000011100100101101001100110 01100000101010000110001001101000011101000110010001100100011 10100011000000110101001011100011011100111000001110000101101 00010000000100000001000000011001100111000001110010011010000 10111000110110001101000010000000100000001000000011001000110 10100110100001101100010111000111000001110000010000000100000 00100000001000000010000001000000010110100111000001100000010 Sélection consultation : Équipement Description : Métadonnées / indexation Préparation à la consultation : Empaquetage Gestion Magasinage Conservation Communication Valorisation Consultation d’une collection Rangement et conserrvatopn d’une collection Constitution d’une collection Bibliothèque physique et bibliothèque numérique Préservation Accès Valorisation
  • 87. Le rôle du bibliothécaire numérique  Ce qui ne change pas :     Il travaille à la constitution des collections et à l’élaboration des instruments de référence qui permettent d’y accéder Il gère physiquement la collection, veille à son organisation, à son bon état de conservation Il sert d’interface (au sens propre) entre le public et les collections, fait fonctionner les services au public et la collection Ce qui change    Il acquiert des compétences techniques en informatique (architecture Web, capacité à rédiger à cahier des charges – même si ce n’est pas lui qui met en œuvre) Il comprend ce qu’est un document numérique, et la différence avec un document bibliographique et un document analogique, il connaît l’environnement juridique de la propriété intellectuelle Il est capable de traduire en termes ergonomiques ses compétences de service public pour s’adapter à un public distant
  • 88. Quelques sites  http://gallica.bnf.fr / http://gallica2.bnf.fr  http://www.europeana.eu  http://maquette.bnf.fr/labs/scenario/Europeana.demo.html  http://memory.loc.gov/ammem/index.html  http://www.gutenberg.org  http://cnum.cnam.fr/  www.bvh.univ-tours.fr  http://gdz.sub.uni-goettingen.de/de/index.html  http://www.persee.fr  http://elec.enc.sorbonne.fr/  http://books.google.fr/  http://www.openlibrary.org
  • 90. Quelques ressources  Sur le site Numérisation du patrimoine culturel du Ministère de la Culture :   La bibliographie : http://www.culture.gouv.fr/culture/mrt/numerisation/fr/f_06.htm, Les fiches techniques : http://www.culture.gouv.fr/culture/mrt/numerisation/fr/f_04.htm  Figoblog http://www.figoblog.org/  Affordance : http://affordance.typepad.com/mon_weblog/  Silex : http://scinfolex.wordpress.com/  Tour de toile du BBF (bibliothèques numériques et numérisation) http://blogbbf.enssib.fr/? Bib_num_numerisation  Bibliothèques sur le Web, BBF 2006 - Paris, t. 51, n° 3  Entretiens de la BnF, 7-8 décembre 2006 “Numérique et bibliothèques : le deuxième choc » http://www.bnf.fr/pages/infopro/journeespro/jp_entretiens06.htm  Dico illustré du Web 2.0 http://www.journaldunet.com/diaporama/0610-dicoweb2/index.shtml  http://www.bnf.fr/pages/zNavigat/frame/infopro.htm : rubrique en cours de mise à jour

Notes de l'éditeur

  1. http://print.google.com
  2. http://www.persee.fr
  3. Plusieurs niveaux d’accès => plusieurs niveaux de descriptions