Hubert Villard - La numérisation en bibliothèque1. La numérisation en
bibliothèques
Quelques éléments de la problématique
Lausanne – 3 avril 2009
©Hubert Villard - Belmont/Lausanne 3.4.2009/HV 2
2. Depuis quand numérise-t-on?
début des années 1980, généralisation de
l’information sous forme numérique,
d’abord "native" (digital-born documents),
puis projets de rétro-numérisation à partir
de documents imprimés
Bibliothèque Ste Geneviève (iconogr.)
Gallica (textes, sous forme image)
CEVIS Martigny (iconogr.)
StUB : collection Ryhiner (iconogr.), etc.
didacticiel de Cornell University
©Hubert Villard - Belmont/Lausanne 3.4.2009/HV 3
3. Que numérise-t-on?
documents iconographiques (ex. KORA,
les affiches suisses)
manuscrits (ex. E-codices)
livres précieux (ex. Digi-archives, BPU
Neuchâtel, KORA)
quotidiens (ex. La Liberté, le Journal de
Genève)
revues scientifiques (backfiles Jstor, etc.)
livres (ex. Gallica, Google)
©Hubert Villard - Belmont/Lausanne 3.4.2009/HV 4
5. R ˇ tr o -n u m ˇ r i sat io n D ocum e nt s na t i fs
num ér ique s
à pa r tir d e
mi c r of ilm s ( exe m p l e :
th ès e s U nil )
( ex: M e s s ager
bo it e u x)
à pa r tir d e
doc s im p r imé s
( ex: o u vrag e s
de l a R é se r ve ) 1 . s cann i ng
2. t r ai t em e nt OCR
3. ( r e )f o rm atag e
4 . m é tadonn ées
s it e s
St ockage mi ro ir S e r veur
pé r enne d'ac c ès
( fo rm a t ri che ) ( fo rm a t s
po rt ab l es )
( B i b li o t h è qu e n a ti ona le ( SER V A L, RER O
po u r l es th èse s ) DOC,
Goog l e Book s )
©Hubert Villard - Belmont/Lausanne 3.4.2009/HV 6
6. Sélection et manipulation des ouvrages:
droit d'auteur
R ˇ tr o -n u m ˇ r isat io n D ocum e nt s na tifs
num ér ique s
état physique des à pa r tir d e
mi c r of ilm s ( exe m p le :
th ès e s U nil )
(ex: M e ss ager
documents à pa r tir d e
doc s im p r imé s
bo it e u x)
(ex: o u vrag e s
de l a R é se r ve ) 1 . s cann ing
manipulation des 2. t rai tem e nt OCR
3. ( re )f o rm atag e
documents 4 . m é tadonn é e s
mesure de St ockage
pé r enne
(fo rm a t ri che )
sit e s
mi ro ir S e r veur
d'ac c ès
( fo rm a ts
po rt ab les )
préservation? ( B ib li o th è qu e n a ti ona le
po u r l es th èse s )
(SER V A L, RER O
DOC,
Goog le Book s )
©Hubert Villard - Belmont/Lausanne 3.4.2009/HV 7
7. Aspects techniques :
choix du format de numérisation
(densité en bpi) R ˇ tr o-n um ˇ risat io n D ocum ent s na tifs
num ér ique s
à pa rtir de
mi crof ilm s (exe m ple :
th ès es U nil )
choix du format à pa rtir de
doc s im primé s
(ex: M essager
bo it eux)
d'archivage (TIFF,
(ex: ou vrag es
de l a R é se rve ) 1. scann ing
2. t rai tem ent OCR
JPEG, etc.) 3. ( re)f orm atag e
4 . m étadonn ées
traitement OCR ou pas
sites
St ockage S erveur
(pour accès sur les mots
mi ro ir
pé renne d'ac cès
(fo rm at ri che ) (fo rm ats
po rt ab les )
(Bibliothè qu e nationa le (SER V AL, RER O
po ur l es th èse s) DOC,
du texte) Goog le Book s)
©Hubert Villard - Belmont/Lausanne 3.4.2009/HV 8
8. Métadonnées :
ensemble des informations
qui caractérisent l'objet R ˇ tr o -n u m ˇ r isat io n D ocum e nt s na tifs
num ér ique s
numérique à pa rtir d e
mi c rof ilm s
(ex: M e ss ager
bo it e u x)
(exe m p le :
th ès e s U nil )
à pa r tir d e
doc s im p rimé s
( ex: o u vrag e s
de l a R é se r ve ) 1 . scann ing
standards internationaux 2. t rai tem e nt OCR
3. ( re )f o rm atag e
(Dublin Core, METS) 4 . m é tadonn é e s
ontologies
sit e s
St ockage mi ro ir S e r veur
pé r enne d'ac c ès
( fo rm a t ri che ) (fo rm a ts
po rt ab les )
(B ib li o th è qu e n a ti ona le ( SER V A L, RER O
po u r l es th èse s ) DOC,
Goog le Book s )
©Hubert Villard - Belmont/Lausanne 3.4.2009/HV 9
9. Accès aux documents :
gratuit ou payant?
R ˇ tr o -n u m ˇ risat io n D ocum e nt s na tifs
num ér ique s
à pa rtir d e
(exe m p le :
restreint ou libre?
mi crof ilm s
th ès e s U nil )
(ex: M e ssager
bo it eu x)
à pa rtir d e
doc s im p rimé s
(ex: o u vrag e s
de l a R é se rve ) 1 . scann ing
unifié via des portails 2. t rai tem e nt OCR
3. ( re)f o rm atag e
thématiques? 4 . m é tadonn é es
sit es
St ockage mi ro ir S erveur
pé renne d'ac c ès
(fo rm at ri che ) (fo rm ats
po rt ab les )
(B ib li o th è qu e n a ti ona le (SER V A L, RER O
po u r l es th èse s ) DOC,
Goog le Book s)
©Hubert Villard - Belmont/Lausanne 3.4.2009/HV 10
10. Archivage pérenne :
avec accès aux documents
R ˇ tr o -n u m ˇ risat io n D ocum e nt s na tifs
garanti sur la durée num ér ique s
à pa rtir d e
mi crof ilm s (exe m p le :
th ès e s U nil )
(ex: M e ssager
bo it eu x)
à pa rtir d e
doc s im p rimé s
assure que les objets (ex: o u vrag e s
de l a R é se rve ) 1 . scann ing
numériques seront 2. t rai tem e nt OCR
3. ( re)f o rm atag e
toujours lisibles sur le
4 . m é tadonn é es
long terme
sit es
St ockage mi ro ir S erveur
pé renne d'ac c ès
(fo rm at ri che ) (fo rm ats
po rt ab les )
normes internationales (B ib li o th è qu e n a ti ona le
po u r l es th èse s )
(SER V A L, RER O
DOC,
Goog le Book s)
©Hubert Villard - Belmont/Lausanne 3.4.2009/HV 11
11. Mais aussi
financement des opérations?
sensibilisation des politiques?
statut des bibliothèques?
©Hubert Villard - Belmont/Lausanne 3.4.2009/HV 12