SlideShare une entreprise Scribd logo
1  sur  46
De online
erfgoedbibliotheek (2)


David Coppoolse
Stafmedewerker ontsluiting en digitalisering
Vlaamse Erfgoedbibliotheek

Vormingsreeks ‘Van heemkundige collectie tot
online erfgoedbibliotheek’
Heemkunde Vlaanderen | november 2011
Wat vooraf ging in presentatie 1


 Zelf digitaliseren
 De vzw Vlaamse Erfgoedbibliotheek
        Erfgoedbibliotheken
 Wat is digitalisering?
 Digitalisering van ‘ingangen’ op collecties
        Catalogi
              Netwerkcatalogi, Union Catalogs
        Bibliografieën
              Abraham, STCV
        Collectiebeschrijvingen
              Collectieregisters

2011-11-30                                       2
Digitalisering van publicaties
Papieren publicaties


 Boeken
        Manuscripten (‘handgeschreven boeken’)
        Handgedrukte boeken (‘oude drukken’)
              1455 – negentiende eeuw (1830)
        Machinaal gedrukte boeken
         (‘moderne drukken’)
              negentiende eeuw (1830) – nu




2011-11-30                                        4
Papieren publicaties


 Periodieken
        Kranten
              Vanaf ca. 1620 – Abraham Verhoeven, Antwerpen
        Tijdschriften
              Vanaf tweede helft
               achttiende eeuw




2011-11-30                                                     5
De krant, toen en nu…




2011-11-30              6
Elektronische publicaties


 e-Books
 Digitale periodieken
        Kranten
        Tijdschriften
      Websites
      Apps
      Games
      Databanken
      …

2011-11-30                  7
‘Born digital’


 = ‘Van oorsprong digitaal’
 Digitale publicaties die nooit in papieren vorm
  bestaan hebben
        Creatie, bewaring en raadpleging zijn volledig digitaal
        Vaak is er nog wel een papieren pendant
        Bewaring is speciale uitdaging!
 Eigenlijk ook: alle papieren publicaties anno 2011
        Op basis van computerbestanden
        Begonnen in de jaren 1970 met computergestuurd zetten
2011-11-30                                                         8
Waarom publicaties
digitaliseren?
Waarom digitaliseren?


 Reden 1: Conservering (behoud informatie)

                                    Veel          Weinig
                                geraadpleegd   geraadpleegd
               Kwetsbaar/
             In slechte staat      ++              +
             In goede staat         +              –
2011-11-30                                                    10
Groot probleem: Kranten




2011-11-30                11
Alternatief voor microfilm?


 Microfilm:
        Goede microfilm gaat meer
         dan 100 jaar mee
        Met een vergrootglas kom je een heel eind
 Digitaal bestand:
        Hoe lang gaat de drager, het bestand, de
         softwaretoepassing, het besturingssysteem, de
         hardware mee?
        Digitale duurzaamheid

2011-11-30                                               12
Waarom digitaliseren?


 Reden 2: Toegang
  erfgoedobjecten verbeteren
   Bibliotheekerfgoed relatief
     moeilijk toegankelijk
   Massaal bladeren door
     manuscripten,
     oude boeken, kranten etc.
     bedreigt voortbestaan
   Topstukken liggen
     normaliter in de kluis

2011-11-30                        13
Gedemonteerde Bijbel van Anjou




             © Bruno Vandermeulen



2011-11-30                          14
Gedigitaliseerde Bijbel van Anjou




2011-11-30                          15
Waarom digitaliseren?


 Reden 3: Informatietoegang verbeteren
        Toegang tot materiaal vereenvoudigen
              Van achter het bureau van de gebruiker
              ‘Overal ter wereld’
        Nieuwe antwoorden en vragen mogelijk maken
              Snel zoeken door grote corpora
              Taalkundige analyse van grote hoeveelheden teksten




2011-11-30                                                          16
Problemen digitale toegang


 Digitaal materiaal opgeslagen
        in heel veel afzonderlijke ‘silo’s’
        met zeer verschillende manieren van toegang
 Gedigitaliseerd op
        uiteenlopende kwaliteiten
        volgens diverse standaarden


                    Verbeterpunten voor de komende jaren!


2011-11-30                                                  17
Hoe publicaties
digitaliseren?
Conversie van publicaties


 Optie 1: Maken van digitale beelden van
  papieren pagina’s
        ‘Imaging’ met een scanner of een digitale fotocamera
        Voordeel:
          Ziet eruit zoals het origineel
          Direct leesbaar voor mensen (soms beter dan origineel)
          Is inhoudelijk foutloos
        Nadeel:
          Niet leesbaar voor computers
                 Bijv. zoeken, knippen+plakken niet mogelijk
              Véél grotere bestanden dan gewone tekst
2011-11-30                                                          19
Eén pagina als tekstbestand

MS Word 2003             Platte tekst




2011-11-30                              20
Eén pagina als beeldbestand

TIFF - kleur, 300 dpi, ongecomprimeerd   Alternatieven - kwaliteitsverlies
                                          TIFF Grijstinten
                                              8.513 kB (~8,3 MB)
                                          TIFF Zwart/Wit
                                              482 kB (~0,5 MB)
                                          JPEG Kleur 90%
                                              1.388 kB (~1,4 MB)




2011-11-30                                                                   21
Waarom toch grote bestanden?


 We willen:
        Een moederkopie die het origineel zo goed mogelijk
         benadert
        In een zo eenvoudig mogelijk, duurzaam bestandsformaat

 Dus:
        Kleur (of tenminste grijswaarden)
        Hoge resolutie
         (veel beeldpunten per cm2)
        Geen compressie met beeldverlies
2011-11-30                                                        22
Maken van beelden




2011-11-30          23
Niet voor bibliotheekerfgoed




2011-11-30                     24
Boekscanners


 Lees-
  zaal-
  model




2011-11-30     25
2011-11-30
                                                                         model
                                                                                         Boekscanners


                                                                        Professioneel




 26




Scanstudio Universiteit Gent | © Vlaamse Erfgoedbibliotheek – Foto: Stefan Tavernier
Boekscanners


 Volautomatisch
  model




2011-11-30         27
2011-11-30
                                                                                          Fotostudio




   Scanstudio Universiteit Gent | © Vlaamse Erfgoedbibliotheek – Foto: Stefan Tavernier
28
Wat staat hier?




2011-11-30        29
Wat staat hier?




2011-11-30        30
Conversie van publicaties


 Optie 2: Interpreteren van de lettertekens van
  digitale beelden
        ‘Optical Character Recognition’ (OCR)
        Computer herkent patronen van beeldpunten als
         lettertekens
 Voordeel: Zoeken, kopiëren en andere
  computerbewerkingen worden mogelijk
 Nadeel: Foutenmarge


2011-11-30                                               31
Stappen van OCR




Fysieke tekst   Opname   Verwerking   Computertekst

  2011-11-30                                     32
Optical Character Recognition

Wat werkt quasi feilloos?     Waarom?
 Alledaags                    Eenvoudige
  kantoordocument               tekststructuur
 Op laserprinter              Scherpe contrastrijke
  afgedrukt                     afdruk
 In een gangbaar              Gekende lettervormen,
  lettertype                    zonder ligaturen etc
 Met een lettergrootte van    Veel pixels per letter
  minimaal 10 pt
 In een moderne taal          Woordenlijsten
                                beschikbaar ter controle
2011-11-30                                                 33
Uitdagingen tekstherkenning


      Handgeschreven tekst
      Complexe of ongebruikelijke lettertypes
      Kleine lettertypes
      Slecht drukwerk
      Beschadigde materialen
      Gebonden materialen
      Oude en onregelmatige spelling
      Pagina’s in kolommen
2011-11-30                                       34
Handgeschreven tekst




2011-11-30             35
Lastige lettertypes




2011-11-30            36
Verschillende lettertypes




2011-11-30                  37
Lettervarianten




2011-11-30        38
Beschadigde materialen




2011-11-30               39
Gebonden materialen




2011-11-30            40
Tekst in kolommen




2011-11-30          41
Oplossingen OCR-problemen?


      Trainen, trainen, trainen van de software
      Herkenning van woordbeeld (i.p.v. losse letters)
      Woordenlijsten van specifieke periodes opstellen
      Taalkundige analyse verwerken in
       herkenningssoftware
        Grammaticaal correct? Inhoudelijk correct?
 100% foutloos wordt het waarschijnlijk nooit
 Voer voor onderzoekers: www.impact-project.eu

2011-11-30                                            42
Conversie van publicaties


 Optie 3: Transcriberen van papieren teksten
        Handmatige computerinvoer door menselijke lezers
 Nadeel: Arbeidsintensief
 Voordelen:
            Lage foutenmarge (indien zorgvuldig uitgevoerd)
            Tekststructuur kan mee worden getranscribeerd
            Noodzakelijk voor bep. wetenschappelijk onderzoek
            Sterke verbetering digitale ontsluitingsmogelijkheden


2011-11-30                                                       43
Codering van tekststructuur




                             ‘Platte tekst’
                             Eenvoudig, goedkoop
                             Informatieverlies
                              (opmaak, tekststructuur)


                                       ‘Tagged text’
                                       Specialistisch, duur
                                       Bevat ook info over
                                        opmaak of structuur
2011-11-30                                               44
Vervolg in presentatie 3


 Stappen in het digitaliseringsproces
       1.    Materiaalanalyse
       2.    Metadatering
                                                                         Optische
                                 Materiaalanalyse   Beeldbewerking
       3.    Rechten klaren                                          tekstherkenning


       4.    Preservering
       5.    Beeldbewerking       Metadatering         Scanning      Duurzame opslag


       6.    Scannen
       7.    OCR                 Rechten klaren
                                                    Preserverende
                                                                     Online publicatie
                                                     handelingen
       8.    Duurzame opslag
       9.    Online publicatie
 Digitaliseringsprojecten Vlaams bibliotheekerfgoed
2011-11-30                                                                               45
Contactgegevens




David Coppoolse
Stafmedewerker Ontsluiting en Digitalisering
david@vlaamse-erfgoedbibliotheek.be
http://www.vlaamse-erfgoedbibliotheek.be

Contenu connexe

Similaire à De online erfgoedbibliotheek (2/3)

E readers en tablet pc's
E readers en tablet pc'sE readers en tablet pc's
E readers en tablet pc'ssonar71
 
Digitalisering van erfgoedcollecties in bibliotheken, archieven en musea. Ove...
Digitalisering van erfgoedcollecties in bibliotheken, archieven en musea. Ove...Digitalisering van erfgoedcollecties in bibliotheken, archieven en musea. Ove...
Digitalisering van erfgoedcollecties in bibliotheken, archieven en musea. Ove...Zilvermuseum Sterckshof
 
Opleiding muziekafdeling in digitale tijden 20110214
Opleiding muziekafdeling in digitale tijden 20110214Opleiding muziekafdeling in digitale tijden 20110214
Opleiding muziekafdeling in digitale tijden 20110214Johan Mijs
 
Vep bibschool 20121114_deel1
Vep bibschool 20121114_deel1Vep bibschool 20121114_deel1
Vep bibschool 20121114_deel1Johan Delaure
 
E readers kb 23jun10
E readers kb 23jun10E readers kb 23jun10
E readers kb 23jun10Frits Hoff
 
Naar een Vlaams E-boek Platform
Naar een Vlaams E-boek PlatformNaar een Vlaams E-boek Platform
Naar een Vlaams E-boek PlatformBibnet vzw
 
E Readers In Het Onderwijs Ipon
E Readers In Het Onderwijs   IponE Readers In Het Onderwijs   Ipon
E Readers In Het Onderwijs IponWvanbruggen
 
Workshop Ereaders Tbv Bibliotheek
Workshop Ereaders Tbv BibliotheekWorkshop Ereaders Tbv Bibliotheek
Workshop Ereaders Tbv Bibliotheekguestb627672
 
Platform voor digitale publicaties NL
Platform voor digitale publicaties NLPlatform voor digitale publicaties NL
Platform voor digitale publicaties NLElco van Staveren
 
Aan de slag met elektronische boeken in het onderwijs
Aan de slag met elektronische boeken in het onderwijsAan de slag met elektronische boeken in het onderwijs
Aan de slag met elektronische boeken in het onderwijsJeroen van Beijnen
 
KNVI 2017: De collectie in een ander licht - Creatieve inzet van nieuwe techn...
KNVI 2017: De collectie in een ander licht - Creatieve inzet van nieuwe techn...KNVI 2017: De collectie in een ander licht - Creatieve inzet van nieuwe techn...
KNVI 2017: De collectie in een ander licht - Creatieve inzet van nieuwe techn...TimelessFuture
 
E book in nederland! Retro-lezing van 25-11- 2000
E book in nederland! Retro-lezing van 25-11- 2000E book in nederland! Retro-lezing van 25-11- 2000
E book in nederland! Retro-lezing van 25-11- 2000Jan de Waal
 
Presentatie Digi Atelier 28.09.11 Zeist en 29.09.11 Breukelen-F.Taffijn Micro...
Presentatie Digi Atelier 28.09.11 Zeist en 29.09.11 Breukelen-F.Taffijn Micro...Presentatie Digi Atelier 28.09.11 Zeist en 29.09.11 Breukelen-F.Taffijn Micro...
Presentatie Digi Atelier 28.09.11 Zeist en 29.09.11 Breukelen-F.Taffijn Micro...geocurtis
 

Similaire à De online erfgoedbibliotheek (2/3) (20)

E readers en tablet pc's
E readers en tablet pc'sE readers en tablet pc's
E readers en tablet pc's
 
Presentatie Ebook
Presentatie EbookPresentatie Ebook
Presentatie Ebook
 
De online erfgoedbibliotheek (1/3)
De online erfgoedbibliotheek (1/3)De online erfgoedbibliotheek (1/3)
De online erfgoedbibliotheek (1/3)
 
Digitalisering van erfgoedcollecties in bibliotheken, archieven en musea. Ove...
Digitalisering van erfgoedcollecties in bibliotheken, archieven en musea. Ove...Digitalisering van erfgoedcollecties in bibliotheken, archieven en musea. Ove...
Digitalisering van erfgoedcollecties in bibliotheken, archieven en musea. Ove...
 
Opleiding muziekafdeling in digitale tijden 20110214
Opleiding muziekafdeling in digitale tijden 20110214Opleiding muziekafdeling in digitale tijden 20110214
Opleiding muziekafdeling in digitale tijden 20110214
 
Vep bibschool 20121114_deel1
Vep bibschool 20121114_deel1Vep bibschool 20121114_deel1
Vep bibschool 20121114_deel1
 
E readers kb 23jun10
E readers kb 23jun10E readers kb 23jun10
E readers kb 23jun10
 
Geert Van Reyn, “Huis-, tuin- en keukentips bij kleinschalige digitaliserings...
Geert Van Reyn, “Huis-, tuin- en keukentips bij kleinschalige digitaliserings...Geert Van Reyn, “Huis-, tuin- en keukentips bij kleinschalige digitaliserings...
Geert Van Reyn, “Huis-, tuin- en keukentips bij kleinschalige digitaliserings...
 
Naar een Vlaams E-boek Platform
Naar een Vlaams E-boek PlatformNaar een Vlaams E-boek Platform
Naar een Vlaams E-boek Platform
 
20070914 Van Peteghem Sylvia
20070914 Van Peteghem Sylvia20070914 Van Peteghem Sylvia
20070914 Van Peteghem Sylvia
 
E Readers In Het Onderwijs Ipon
E Readers In Het Onderwijs   IponE Readers In Het Onderwijs   Ipon
E Readers In Het Onderwijs Ipon
 
Workshop Ereaders Tbv Bibliotheek
Workshop Ereaders Tbv BibliotheekWorkshop Ereaders Tbv Bibliotheek
Workshop Ereaders Tbv Bibliotheek
 
Flandrica.be: Naar een virtuele Vlaamse Erfgoedbibliotheek
Flandrica.be: Naar een virtuele Vlaamse ErfgoedbibliotheekFlandrica.be: Naar een virtuele Vlaamse Erfgoedbibliotheek
Flandrica.be: Naar een virtuele Vlaamse Erfgoedbibliotheek
 
Platform voor digitale publicaties NL
Platform voor digitale publicaties NLPlatform voor digitale publicaties NL
Platform voor digitale publicaties NL
 
Aan de slag met elektronische boeken in het onderwijs
Aan de slag met elektronische boeken in het onderwijsAan de slag met elektronische boeken in het onderwijs
Aan de slag met elektronische boeken in het onderwijs
 
KNVI 2017: De collectie in een ander licht - Creatieve inzet van nieuwe techn...
KNVI 2017: De collectie in een ander licht - Creatieve inzet van nieuwe techn...KNVI 2017: De collectie in een ander licht - Creatieve inzet van nieuwe techn...
KNVI 2017: De collectie in een ander licht - Creatieve inzet van nieuwe techn...
 
E book in nederland! Retro-lezing van 25-11- 2000
E book in nederland! Retro-lezing van 25-11- 2000E book in nederland! Retro-lezing van 25-11- 2000
E book in nederland! Retro-lezing van 25-11- 2000
 
Presentatie Digi Atelier 28.09.11 Zeist en 29.09.11 Breukelen-F.Taffijn Micro...
Presentatie Digi Atelier 28.09.11 Zeist en 29.09.11 Breukelen-F.Taffijn Micro...Presentatie Digi Atelier 28.09.11 Zeist en 29.09.11 Breukelen-F.Taffijn Micro...
Presentatie Digi Atelier 28.09.11 Zeist en 29.09.11 Breukelen-F.Taffijn Micro...
 
Anita Sempels
Anita SempelsAnita Sempels
Anita Sempels
 
Geert Van Reyn
Geert Van ReynGeert Van Reyn
Geert Van Reyn
 

Plus de Vlaamse Erfgoedbibliotheken

Overlegplatform 2023_20230915_2_Overlegplatform_JonasVanMulder_KADOC-.pdf
Overlegplatform 2023_20230915_2_Overlegplatform_JonasVanMulder_KADOC-.pdfOverlegplatform 2023_20230915_2_Overlegplatform_JonasVanMulder_KADOC-.pdf
Overlegplatform 2023_20230915_2_Overlegplatform_JonasVanMulder_KADOC-.pdfVlaamse Erfgoedbibliotheken
 
Overlegplatform 2023_20230915_1_Sarah Fierens_DBNL-klassiekers en kantlijnen....
Overlegplatform 2023_20230915_1_Sarah Fierens_DBNL-klassiekers en kantlijnen....Overlegplatform 2023_20230915_1_Sarah Fierens_DBNL-klassiekers en kantlijnen....
Overlegplatform 2023_20230915_1_Sarah Fierens_DBNL-klassiekers en kantlijnen....Vlaamse Erfgoedbibliotheken
 
Overlegplatform 2023_20230915_5_Diewer van der Meijden_KU_Leuven_Bibliotheken...
Overlegplatform 2023_20230915_5_Diewer van der Meijden_KU_Leuven_Bibliotheken...Overlegplatform 2023_20230915_5_Diewer van der Meijden_KU_Leuven_Bibliotheken...
Overlegplatform 2023_20230915_5_Diewer van der Meijden_KU_Leuven_Bibliotheken...Vlaamse Erfgoedbibliotheken
 
Overlegplatform 2023_20230915_3_Olga Van Oost_Diversiteitsplan.pptx
Overlegplatform 2023_20230915_3_Olga Van Oost_Diversiteitsplan.pptxOverlegplatform 2023_20230915_3_Olga Van Oost_Diversiteitsplan.pptx
Overlegplatform 2023_20230915_3_Olga Van Oost_Diversiteitsplan.pptxVlaamse Erfgoedbibliotheken
 
Overlegplatform 2023_20230915_0_Resultaten bevraging.pdf
Overlegplatform 2023_20230915_0_Resultaten bevraging.pdfOverlegplatform 2023_20230915_0_Resultaten bevraging.pdf
Overlegplatform 2023_20230915_0_Resultaten bevraging.pdfVlaamse Erfgoedbibliotheken
 
Overlegplatform 2023_20230915_4_Dries Blanchaert_Luisterpuntbibliotheek_DEF.pptx
Overlegplatform 2023_20230915_4_Dries Blanchaert_Luisterpuntbibliotheek_DEF.pptxOverlegplatform 2023_20230915_4_Dries Blanchaert_Luisterpuntbibliotheek_DEF.pptx
Overlegplatform 2023_20230915_4_Dries Blanchaert_Luisterpuntbibliotheek_DEF.pptxVlaamse Erfgoedbibliotheken
 
Overlegplatform_De win win van de beroepsinlevingsstage_Vlaamse erfgoedbiblio...
Overlegplatform_De win win van de beroepsinlevingsstage_Vlaamse erfgoedbiblio...Overlegplatform_De win win van de beroepsinlevingsstage_Vlaamse erfgoedbiblio...
Overlegplatform_De win win van de beroepsinlevingsstage_Vlaamse erfgoedbiblio...Vlaamse Erfgoedbibliotheken
 
Overlegplatform_Ervaring met werkervaring_Erfgoedbibliotheek Hendrik Conscien...
Overlegplatform_Ervaring met werkervaring_Erfgoedbibliotheek Hendrik Conscien...Overlegplatform_Ervaring met werkervaring_Erfgoedbibliotheek Hendrik Conscien...
Overlegplatform_Ervaring met werkervaring_Erfgoedbibliotheek Hendrik Conscien...Vlaamse Erfgoedbibliotheken
 
Overlegplatform_De bib bende en de boekenclub_Museum M_20211119
Overlegplatform_De bib bende en de boekenclub_Museum M_20211119Overlegplatform_De bib bende en de boekenclub_Museum M_20211119
Overlegplatform_De bib bende en de boekenclub_Museum M_20211119Vlaamse Erfgoedbibliotheken
 
Overlegplatform_Van korte of lange duur. Vrijwilligerswerking van KADOC_20211119
Overlegplatform_Van korte of lange duur. Vrijwilligerswerking van KADOC_20211119Overlegplatform_Van korte of lange duur. Vrijwilligerswerking van KADOC_20211119
Overlegplatform_Van korte of lange duur. Vrijwilligerswerking van KADOC_20211119Vlaamse Erfgoedbibliotheken
 
Overlegplatform_ Tot uw dienst _Vlaamse erfgoedbibliotheken_20211119
Overlegplatform_ Tot uw dienst _Vlaamse erfgoedbibliotheken_20211119Overlegplatform_ Tot uw dienst _Vlaamse erfgoedbibliotheken_20211119
Overlegplatform_ Tot uw dienst _Vlaamse erfgoedbibliotheken_20211119Vlaamse Erfgoedbibliotheken
 
Wijzer Waarderen - Overlegplatform voor erfgoedbibliotheken 2018
Wijzer Waarderen - Overlegplatform voor erfgoedbibliotheken 2018Wijzer Waarderen - Overlegplatform voor erfgoedbibliotheken 2018
Wijzer Waarderen - Overlegplatform voor erfgoedbibliotheken 2018Vlaamse Erfgoedbibliotheken
 
Waarderen van krantencollecties: een praktijkvoorbeeld - Overlegplatform voor...
Waarderen van krantencollecties: een praktijkvoorbeeld - Overlegplatform voor...Waarderen van krantencollecties: een praktijkvoorbeeld - Overlegplatform voor...
Waarderen van krantencollecties: een praktijkvoorbeeld - Overlegplatform voor...Vlaamse Erfgoedbibliotheken
 
Overleg Cultureel Erfgoed: belangenbehartiger van cultureel erfgoed - Overleg...
Overleg Cultureel Erfgoed: belangenbehartiger van cultureel erfgoed - Overleg...Overleg Cultureel Erfgoed: belangenbehartiger van cultureel erfgoed - Overleg...
Overleg Cultureel Erfgoed: belangenbehartiger van cultureel erfgoed - Overleg...Vlaamse Erfgoedbibliotheken
 
Beleid Vlaamse Erfgoedbibliotheek 2019-2023 / Vlaamse Erfgoedbibliotheek 2.0 ...
Beleid Vlaamse Erfgoedbibliotheek 2019-2023 / Vlaamse Erfgoedbibliotheek 2.0 ...Beleid Vlaamse Erfgoedbibliotheek 2019-2023 / Vlaamse Erfgoedbibliotheek 2.0 ...
Beleid Vlaamse Erfgoedbibliotheek 2019-2023 / Vlaamse Erfgoedbibliotheek 2.0 ...Vlaamse Erfgoedbibliotheken
 
Het kwaliteitslabel in de praktijk - Overlegplatform voor erfgoedbibliotheken...
Het kwaliteitslabel in de praktijk - Overlegplatform voor erfgoedbibliotheken...Het kwaliteitslabel in de praktijk - Overlegplatform voor erfgoedbibliotheken...
Het kwaliteitslabel in de praktijk - Overlegplatform voor erfgoedbibliotheken...Vlaamse Erfgoedbibliotheken
 

Plus de Vlaamse Erfgoedbibliotheken (20)

Overlegplatform_2023_Fotoreportage.pdf
Overlegplatform_2023_Fotoreportage.pdfOverlegplatform_2023_Fotoreportage.pdf
Overlegplatform_2023_Fotoreportage.pdf
 
Overlegplatform 2023_20230915_2_Overlegplatform_JonasVanMulder_KADOC-.pdf
Overlegplatform 2023_20230915_2_Overlegplatform_JonasVanMulder_KADOC-.pdfOverlegplatform 2023_20230915_2_Overlegplatform_JonasVanMulder_KADOC-.pdf
Overlegplatform 2023_20230915_2_Overlegplatform_JonasVanMulder_KADOC-.pdf
 
BROCHURE FARO-Meerstemmigheid
BROCHURE FARO-MeerstemmigheidBROCHURE FARO-Meerstemmigheid
BROCHURE FARO-Meerstemmigheid
 
Overlegplatform 2023_20230915_1_Sarah Fierens_DBNL-klassiekers en kantlijnen....
Overlegplatform 2023_20230915_1_Sarah Fierens_DBNL-klassiekers en kantlijnen....Overlegplatform 2023_20230915_1_Sarah Fierens_DBNL-klassiekers en kantlijnen....
Overlegplatform 2023_20230915_1_Sarah Fierens_DBNL-klassiekers en kantlijnen....
 
Overlegplatform 2023_20230915_5_Diewer van der Meijden_KU_Leuven_Bibliotheken...
Overlegplatform 2023_20230915_5_Diewer van der Meijden_KU_Leuven_Bibliotheken...Overlegplatform 2023_20230915_5_Diewer van der Meijden_KU_Leuven_Bibliotheken...
Overlegplatform 2023_20230915_5_Diewer van der Meijden_KU_Leuven_Bibliotheken...
 
Overlegplatform 2023_20230915_3_Olga Van Oost_Diversiteitsplan.pptx
Overlegplatform 2023_20230915_3_Olga Van Oost_Diversiteitsplan.pptxOverlegplatform 2023_20230915_3_Olga Van Oost_Diversiteitsplan.pptx
Overlegplatform 2023_20230915_3_Olga Van Oost_Diversiteitsplan.pptx
 
Overlegplatform 2023_20230915_0_Resultaten bevraging.pdf
Overlegplatform 2023_20230915_0_Resultaten bevraging.pdfOverlegplatform 2023_20230915_0_Resultaten bevraging.pdf
Overlegplatform 2023_20230915_0_Resultaten bevraging.pdf
 
Overlegplatform 2023_20230915_4_Dries Blanchaert_Luisterpuntbibliotheek_DEF.pptx
Overlegplatform 2023_20230915_4_Dries Blanchaert_Luisterpuntbibliotheek_DEF.pptxOverlegplatform 2023_20230915_4_Dries Blanchaert_Luisterpuntbibliotheek_DEF.pptx
Overlegplatform 2023_20230915_4_Dries Blanchaert_Luisterpuntbibliotheek_DEF.pptx
 
Workshop Transkribus
Workshop TranskribusWorkshop Transkribus
Workshop Transkribus
 
Overlegplatform_De win win van de beroepsinlevingsstage_Vlaamse erfgoedbiblio...
Overlegplatform_De win win van de beroepsinlevingsstage_Vlaamse erfgoedbiblio...Overlegplatform_De win win van de beroepsinlevingsstage_Vlaamse erfgoedbiblio...
Overlegplatform_De win win van de beroepsinlevingsstage_Vlaamse erfgoedbiblio...
 
Overlegplatform_Ervaring met werkervaring_Erfgoedbibliotheek Hendrik Conscien...
Overlegplatform_Ervaring met werkervaring_Erfgoedbibliotheek Hendrik Conscien...Overlegplatform_Ervaring met werkervaring_Erfgoedbibliotheek Hendrik Conscien...
Overlegplatform_Ervaring met werkervaring_Erfgoedbibliotheek Hendrik Conscien...
 
Overlegplatform_De bib bende en de boekenclub_Museum M_20211119
Overlegplatform_De bib bende en de boekenclub_Museum M_20211119Overlegplatform_De bib bende en de boekenclub_Museum M_20211119
Overlegplatform_De bib bende en de boekenclub_Museum M_20211119
 
Overlegplatform_Van korte of lange duur. Vrijwilligerswerking van KADOC_20211119
Overlegplatform_Van korte of lange duur. Vrijwilligerswerking van KADOC_20211119Overlegplatform_Van korte of lange duur. Vrijwilligerswerking van KADOC_20211119
Overlegplatform_Van korte of lange duur. Vrijwilligerswerking van KADOC_20211119
 
Overlegplatform_ Tot uw dienst _Vlaamse erfgoedbibliotheken_20211119
Overlegplatform_ Tot uw dienst _Vlaamse erfgoedbibliotheken_20211119Overlegplatform_ Tot uw dienst _Vlaamse erfgoedbibliotheken_20211119
Overlegplatform_ Tot uw dienst _Vlaamse erfgoedbibliotheken_20211119
 
Waarderingstraject wiskundige oude drukken
Waarderingstraject wiskundige oude drukkenWaarderingstraject wiskundige oude drukken
Waarderingstraject wiskundige oude drukken
 
Wijzer Waarderen - Overlegplatform voor erfgoedbibliotheken 2018
Wijzer Waarderen - Overlegplatform voor erfgoedbibliotheken 2018Wijzer Waarderen - Overlegplatform voor erfgoedbibliotheken 2018
Wijzer Waarderen - Overlegplatform voor erfgoedbibliotheken 2018
 
Waarderen van krantencollecties: een praktijkvoorbeeld - Overlegplatform voor...
Waarderen van krantencollecties: een praktijkvoorbeeld - Overlegplatform voor...Waarderen van krantencollecties: een praktijkvoorbeeld - Overlegplatform voor...
Waarderen van krantencollecties: een praktijkvoorbeeld - Overlegplatform voor...
 
Overleg Cultureel Erfgoed: belangenbehartiger van cultureel erfgoed - Overleg...
Overleg Cultureel Erfgoed: belangenbehartiger van cultureel erfgoed - Overleg...Overleg Cultureel Erfgoed: belangenbehartiger van cultureel erfgoed - Overleg...
Overleg Cultureel Erfgoed: belangenbehartiger van cultureel erfgoed - Overleg...
 
Beleid Vlaamse Erfgoedbibliotheek 2019-2023 / Vlaamse Erfgoedbibliotheek 2.0 ...
Beleid Vlaamse Erfgoedbibliotheek 2019-2023 / Vlaamse Erfgoedbibliotheek 2.0 ...Beleid Vlaamse Erfgoedbibliotheek 2019-2023 / Vlaamse Erfgoedbibliotheek 2.0 ...
Beleid Vlaamse Erfgoedbibliotheek 2019-2023 / Vlaamse Erfgoedbibliotheek 2.0 ...
 
Het kwaliteitslabel in de praktijk - Overlegplatform voor erfgoedbibliotheken...
Het kwaliteitslabel in de praktijk - Overlegplatform voor erfgoedbibliotheken...Het kwaliteitslabel in de praktijk - Overlegplatform voor erfgoedbibliotheken...
Het kwaliteitslabel in de praktijk - Overlegplatform voor erfgoedbibliotheken...
 

De online erfgoedbibliotheek (2/3)

  • 1. De online erfgoedbibliotheek (2) David Coppoolse Stafmedewerker ontsluiting en digitalisering Vlaamse Erfgoedbibliotheek Vormingsreeks ‘Van heemkundige collectie tot online erfgoedbibliotheek’ Heemkunde Vlaanderen | november 2011
  • 2. Wat vooraf ging in presentatie 1  Zelf digitaliseren  De vzw Vlaamse Erfgoedbibliotheek  Erfgoedbibliotheken  Wat is digitalisering?  Digitalisering van ‘ingangen’ op collecties  Catalogi  Netwerkcatalogi, Union Catalogs  Bibliografieën  Abraham, STCV  Collectiebeschrijvingen  Collectieregisters 2011-11-30 2
  • 4. Papieren publicaties  Boeken  Manuscripten (‘handgeschreven boeken’)  Handgedrukte boeken (‘oude drukken’)  1455 – negentiende eeuw (1830)  Machinaal gedrukte boeken (‘moderne drukken’)  negentiende eeuw (1830) – nu 2011-11-30 4
  • 5. Papieren publicaties  Periodieken  Kranten  Vanaf ca. 1620 – Abraham Verhoeven, Antwerpen  Tijdschriften  Vanaf tweede helft achttiende eeuw 2011-11-30 5
  • 6. De krant, toen en nu… 2011-11-30 6
  • 7. Elektronische publicaties  e-Books  Digitale periodieken  Kranten  Tijdschriften  Websites  Apps  Games  Databanken  … 2011-11-30 7
  • 8. ‘Born digital’  = ‘Van oorsprong digitaal’  Digitale publicaties die nooit in papieren vorm bestaan hebben  Creatie, bewaring en raadpleging zijn volledig digitaal  Vaak is er nog wel een papieren pendant  Bewaring is speciale uitdaging!  Eigenlijk ook: alle papieren publicaties anno 2011  Op basis van computerbestanden  Begonnen in de jaren 1970 met computergestuurd zetten 2011-11-30 8
  • 10. Waarom digitaliseren?  Reden 1: Conservering (behoud informatie) Veel Weinig geraadpleegd geraadpleegd Kwetsbaar/ In slechte staat ++ + In goede staat + – 2011-11-30 10
  • 12. Alternatief voor microfilm?  Microfilm:  Goede microfilm gaat meer dan 100 jaar mee  Met een vergrootglas kom je een heel eind  Digitaal bestand:  Hoe lang gaat de drager, het bestand, de softwaretoepassing, het besturingssysteem, de hardware mee?  Digitale duurzaamheid 2011-11-30 12
  • 13. Waarom digitaliseren?  Reden 2: Toegang erfgoedobjecten verbeteren  Bibliotheekerfgoed relatief moeilijk toegankelijk  Massaal bladeren door manuscripten, oude boeken, kranten etc. bedreigt voortbestaan  Topstukken liggen normaliter in de kluis 2011-11-30 13
  • 14. Gedemonteerde Bijbel van Anjou © Bruno Vandermeulen 2011-11-30 14
  • 15. Gedigitaliseerde Bijbel van Anjou 2011-11-30 15
  • 16. Waarom digitaliseren?  Reden 3: Informatietoegang verbeteren  Toegang tot materiaal vereenvoudigen  Van achter het bureau van de gebruiker  ‘Overal ter wereld’  Nieuwe antwoorden en vragen mogelijk maken  Snel zoeken door grote corpora  Taalkundige analyse van grote hoeveelheden teksten 2011-11-30 16
  • 17. Problemen digitale toegang  Digitaal materiaal opgeslagen  in heel veel afzonderlijke ‘silo’s’  met zeer verschillende manieren van toegang  Gedigitaliseerd op  uiteenlopende kwaliteiten  volgens diverse standaarden Verbeterpunten voor de komende jaren! 2011-11-30 17
  • 19. Conversie van publicaties  Optie 1: Maken van digitale beelden van papieren pagina’s  ‘Imaging’ met een scanner of een digitale fotocamera  Voordeel:  Ziet eruit zoals het origineel  Direct leesbaar voor mensen (soms beter dan origineel)  Is inhoudelijk foutloos  Nadeel:  Niet leesbaar voor computers  Bijv. zoeken, knippen+plakken niet mogelijk  Véél grotere bestanden dan gewone tekst 2011-11-30 19
  • 20. Eén pagina als tekstbestand MS Word 2003 Platte tekst 2011-11-30 20
  • 21. Eén pagina als beeldbestand TIFF - kleur, 300 dpi, ongecomprimeerd Alternatieven - kwaliteitsverlies  TIFF Grijstinten  8.513 kB (~8,3 MB)  TIFF Zwart/Wit  482 kB (~0,5 MB)  JPEG Kleur 90%  1.388 kB (~1,4 MB) 2011-11-30 21
  • 22. Waarom toch grote bestanden?  We willen:  Een moederkopie die het origineel zo goed mogelijk benadert  In een zo eenvoudig mogelijk, duurzaam bestandsformaat  Dus:  Kleur (of tenminste grijswaarden)  Hoge resolutie (veel beeldpunten per cm2)  Geen compressie met beeldverlies 2011-11-30 22
  • 25. Boekscanners  Lees- zaal- model 2011-11-30 25
  • 26. 2011-11-30 model Boekscanners  Professioneel 26 Scanstudio Universiteit Gent | © Vlaamse Erfgoedbibliotheek – Foto: Stefan Tavernier
  • 27. Boekscanners  Volautomatisch model 2011-11-30 27
  • 28. 2011-11-30 Fotostudio Scanstudio Universiteit Gent | © Vlaamse Erfgoedbibliotheek – Foto: Stefan Tavernier 28
  • 31. Conversie van publicaties  Optie 2: Interpreteren van de lettertekens van digitale beelden  ‘Optical Character Recognition’ (OCR)  Computer herkent patronen van beeldpunten als lettertekens  Voordeel: Zoeken, kopiëren en andere computerbewerkingen worden mogelijk  Nadeel: Foutenmarge 2011-11-30 31
  • 32. Stappen van OCR Fysieke tekst Opname Verwerking Computertekst 2011-11-30 32
  • 33. Optical Character Recognition Wat werkt quasi feilloos? Waarom?  Alledaags  Eenvoudige kantoordocument tekststructuur  Op laserprinter  Scherpe contrastrijke afgedrukt afdruk  In een gangbaar  Gekende lettervormen, lettertype zonder ligaturen etc  Met een lettergrootte van  Veel pixels per letter minimaal 10 pt  In een moderne taal  Woordenlijsten beschikbaar ter controle 2011-11-30 33
  • 34. Uitdagingen tekstherkenning  Handgeschreven tekst  Complexe of ongebruikelijke lettertypes  Kleine lettertypes  Slecht drukwerk  Beschadigde materialen  Gebonden materialen  Oude en onregelmatige spelling  Pagina’s in kolommen 2011-11-30 34
  • 42. Oplossingen OCR-problemen?  Trainen, trainen, trainen van de software  Herkenning van woordbeeld (i.p.v. losse letters)  Woordenlijsten van specifieke periodes opstellen  Taalkundige analyse verwerken in herkenningssoftware  Grammaticaal correct? Inhoudelijk correct?  100% foutloos wordt het waarschijnlijk nooit  Voer voor onderzoekers: www.impact-project.eu 2011-11-30 42
  • 43. Conversie van publicaties  Optie 3: Transcriberen van papieren teksten  Handmatige computerinvoer door menselijke lezers  Nadeel: Arbeidsintensief  Voordelen:  Lage foutenmarge (indien zorgvuldig uitgevoerd)  Tekststructuur kan mee worden getranscribeerd  Noodzakelijk voor bep. wetenschappelijk onderzoek  Sterke verbetering digitale ontsluitingsmogelijkheden 2011-11-30 43
  • 44. Codering van tekststructuur  ‘Platte tekst’  Eenvoudig, goedkoop  Informatieverlies (opmaak, tekststructuur)  ‘Tagged text’  Specialistisch, duur  Bevat ook info over opmaak of structuur 2011-11-30 44
  • 45. Vervolg in presentatie 3  Stappen in het digitaliseringsproces 1. Materiaalanalyse 2. Metadatering Optische Materiaalanalyse Beeldbewerking 3. Rechten klaren tekstherkenning 4. Preservering 5. Beeldbewerking Metadatering Scanning Duurzame opslag 6. Scannen 7. OCR Rechten klaren Preserverende Online publicatie handelingen 8. Duurzame opslag 9. Online publicatie  Digitaliseringsprojecten Vlaams bibliotheekerfgoed 2011-11-30 45
  • 46. Contactgegevens David Coppoolse Stafmedewerker Ontsluiting en Digitalisering david@vlaamse-erfgoedbibliotheek.be http://www.vlaamse-erfgoedbibliotheek.be