SlideShare une entreprise Scribd logo
1  sur  16
Télécharger pour lire hors ligne
Het Europeana Newspapers
Project
Historische kranten online
Den Haag, 22-11-2012
Lotte Wilms
@lottewilms @eurnews
Europeana Newspapers – waarom kranten?

Waarom kranten?
• Belangrijke bron voor onderzoek

• Relevant voor het algemeen publiek




     Bronnen:
     http://digi.kansalliskirjasto.fi/sanomalehti/secure/showPage.html?id=395644&conversationId=1&action=entryPage;
     http://kranten.kb.nl/view/paper/id/ddd%3A010212139%3Ampeg21%3Ap001%3Aa0001/backlink/home
     http://gallica.bnf.fr/ark:/12148/bpt6k265203z ;                                                                  2
Projectprofiel: Consortium & stakeholders
• 17 partners uit 12 landen:
    • Nationale bibliotheken

    • Universiteitsbibliotheken

    • Onderzoeksinstituten

    • Commerciële partij

• Framework:
    • Best Practice Network

    • ICT-PSP programma van de Europese Commissie

    • Projectduur: februari 2012 – januari 2015



                                                    3
Europeana Newspapers
Consortium
Europeana Newspapers: Doelen

 •   Aggregatie en verrijking van kranten voor Europeana
      •   Circa 18 miljoen krantenpagina’s naar Europeana

      •   Verrijken met OCR, layout herkenning (OLR) en named entity
          recognition



 •   Analyse bestaande krantencollecties
      •   Overzicht bestaande projecten

      •   Aanmoedigen om ook kranten bij te dragen




                                                                       5
Europeana Newspapers: Doelen

 •   Quality assurance en best practice aanbevelingen
     •   Voortbouwen op andere projecten (o.a. IMPACT en Europeana
         Libraries)

     •   Bijdragen aan geoptimaliseerde workflows

     •   Aanbevelingen voor digitalisering, verrijking, workflows, metadata, etc.



 •   Presentatie en full-text doorzoeken
     •   18 miljoen Europese krantenpagina’s

     •   Verbeteren van de toegang van kranten in Europeana
Aggregatie en verrijking van kranten voor Europeana

• Aggregatie in Europeana en The European
  Library
   • 18 miljoen gedigitaliseerde krantenpagina’s

       • 8 miljoen pagina’s zonder bewerkingen
                                                    www.europeana.eu/
            (content leveranciers)

       • 8 miljoen verrijkte pagina’s: OCR (UIBK,
            Oostenrijk)

       • 2 miljoen verrijkte pagina’s: OCR/OLR
            (artikelsegmentatie) (CCS, Duitsland)

                                                    www.theeuropeanlibrary.org/


                                                                             7
Verrijking – OCR en OLR

• 8 miljoen verrijkte pagina’s:
 OCR (UIBK, Oostenrijk)
   • OCR (ABBYY)

   • Output in ALTO formaat



   • Test met Document Understanding
     Platform (FEP)
      • Ontwikkeld binnen IMPACT

      • Profielen aangepast aan kranten

                                          UIBK: Herkenning van titels, voetnoten, etc.
                                                       Extractie van inhoudsopgave
Verrijking – OCR en OLR

• 2 miljoen verrijkte pagina’s:                 • Automatische layout herkenning
 OCR/OLR (artikelsegmentatie)                      • Kolommen
 (CCS, Duitsland)
                                                   • Zones
   • OCR (ABBYY)
                                                   • Pagina types



                                                • Automatische artikelsegmentatie



                                                • Aanvullende handmatige verificatie
                                                 en quality control
   CCS: Kolomherkenning en artikelsegmentatie
Verrijking - Named Entity Recognition
• Named entity herkenning (KB, Nederland)
   • Tot drie talen

      • Nederlands

      • Engels

      • Duits
Analyse bestaande krantencollecties
• Enquête over digitale krantencollecties
   • Zomer 2012
   • Circa 45 Europese bibliotheken


• De resultaten naar “Zeitschriftendatenbank” van de Staatsbibliotheek van
 Berlijn

• Potentiële nieuwe partners

• Informatie over de technische status van gedigitaliseerd materiaal
Quality assurance en best practice aanbevelingen

• Ontwikkeling van een             • Evaluatie van de
 metadataprofiel (METS)             digitaliseringsworkflow voor

  • Gebruik binnen het project      kranten, inclusief verrijking

  • Aanbeveling voor toekomstige      • M.b.v. een quality assessment

    digitaliseer- en                   framework

    verrijkingsprojecten              • Inclusief tools uit IMPACT



                                   • Aanbevelingen voor het digitaliseren
                                    en verrijken van kranten
Presentatie en full-text doorzoeken

• Content browser
  • Onderdeel van het TEL portal

  • Zoeken op full-text
     • Zoekterm

     • Named entities

     • Per collectie

     • Op datum

  • Krantenafbeeldingen

  • Link naar bibliotheek


                                      Nb. Mock-ups
Promotie
• Doelen:
   • Publiciteit van het project

   • Vergroten van gebruik Europeana

• Media
   • @eurnews

   • www.facebook.com/EuropeanaNewspapers

• Workshops en conferenties
   • Drie dissemination workshops

   • Nationale informatie dagen

   • Uitbreiding van het netwerk

                                            14
Voordeel voor de KB kranten en gebruikers

• Beschikbaar via Europeana

• 2 miljoen KB krantenpagina’s doorzoekbaar in combinatie met 16 miljoen
 andere Europese krantenpagina’s uit 12 landen
   • Duitse kranten
   • Franse kranten
   • Oostenrijkse kranten
   • Finse kranten
   • Poolse kranten
   • Etc.


• Verrijking met Named Entities
Bedankt! Vragen?
http://www.europeana-newspapers.eu/


Lotte Wilms
lotte.wilms@kb.nl
@lottewilms @eurnews

Contenu connexe

Tendances

Tendances (14)

Hoe ISNI en Linked Open Data cultureel erfgoed helpen beheren en ontsluiten
Hoe ISNI en Linked Open Data cultureel erfgoed helpen beheren en ontsluitenHoe ISNI en Linked Open Data cultureel erfgoed helpen beheren en ontsluiten
Hoe ISNI en Linked Open Data cultureel erfgoed helpen beheren en ontsluiten
 
Karin Van Honacker
Karin Van HonackerKarin Van Honacker
Karin Van Honacker
 
Kbr, een eeuwenoude bibliotheek in (r)evolutie
Kbr, een eeuwenoude bibliotheek in (r)evolutieKbr, een eeuwenoude bibliotheek in (r)evolutie
Kbr, een eeuwenoude bibliotheek in (r)evolutie
 
Digitale bibliotheken: flandrica.be + dbnl.org (Overlegplatform voor erfgoedb...
Digitale bibliotheken: flandrica.be + dbnl.org (Overlegplatform voor erfgoedb...Digitale bibliotheken: flandrica.be + dbnl.org (Overlegplatform voor erfgoedb...
Digitale bibliotheken: flandrica.be + dbnl.org (Overlegplatform voor erfgoedb...
 
Lemmens
LemmensLemmens
Lemmens
 
Johan Van der Eycken
Johan Van der EyckenJohan Van der Eycken
Johan Van der Eycken
 
Goetschalckx
GoetschalckxGoetschalckx
Goetschalckx
 
Corthouts
CorthoutsCorthouts
Corthouts
 
Mensen, manuscripten, manifesten MMMonk
Mensen, manuscripten, manifesten MMMonkMensen, manuscripten, manifesten MMMonk
Mensen, manuscripten, manifesten MMMonk
 
Sébastien Soyez
Sébastien Soyez Sébastien Soyez
Sébastien Soyez
 
Beleid Vlaamse Erfgoedbibliotheek 2019-2023 / Vlaamse Erfgoedbibliotheek 2.0 ...
Beleid Vlaamse Erfgoedbibliotheek 2019-2023 / Vlaamse Erfgoedbibliotheek 2.0 ...Beleid Vlaamse Erfgoedbibliotheek 2019-2023 / Vlaamse Erfgoedbibliotheek 2.0 ...
Beleid Vlaamse Erfgoedbibliotheek 2019-2023 / Vlaamse Erfgoedbibliotheek 2.0 ...
 
Overlegplatform_ Tot uw dienst _Vlaamse erfgoedbibliotheken_20211119
Overlegplatform_ Tot uw dienst _Vlaamse erfgoedbibliotheken_20211119Overlegplatform_ Tot uw dienst _Vlaamse erfgoedbibliotheken_20211119
Overlegplatform_ Tot uw dienst _Vlaamse erfgoedbibliotheken_20211119
 
Abraham 1800-2020: Nieuw leven voor oud nieuws - Overlegplatform voor erfgoed...
Abraham 1800-2020: Nieuw leven voor oud nieuws - Overlegplatform voor erfgoed...Abraham 1800-2020: Nieuw leven voor oud nieuws - Overlegplatform voor erfgoed...
Abraham 1800-2020: Nieuw leven voor oud nieuws - Overlegplatform voor erfgoed...
 
Wim Van Dongen
Wim Van DongenWim Van Dongen
Wim Van Dongen
 

En vedette

IMPACT Final Event 26-06-2012 - Use of IMPACT tools in the Europeana Newspap...
IMPACT Final Event 26-06-2012  - Use of IMPACT tools in the Europeana Newspap...IMPACT Final Event 26-06-2012  - Use of IMPACT tools in the Europeana Newspap...
IMPACT Final Event 26-06-2012 - Use of IMPACT tools in the Europeana Newspap...
IMPACT Centre of Competence
 
Europeana Newspapers (Project Details and Aggregation Workflow)
Europeana Newspapers (Project Details and Aggregation Workflow)Europeana Newspapers (Project Details and Aggregation Workflow)
Europeana Newspapers (Project Details and Aggregation Workflow)
The European Library
 
Alastair Dunning, Open data at The European library, TEL
Alastair Dunning, Open data at The European library, TELAlastair Dunning, Open data at The European library, TEL
Alastair Dunning, Open data at The European library, TEL
The European Library
 
Dunning welsh-newspapers-130314110640-phpapp01
Dunning welsh-newspapers-130314110640-phpapp01Dunning welsh-newspapers-130314110640-phpapp01
Dunning welsh-newspapers-130314110640-phpapp01
The European Library
 

En vedette (20)

ENP_Dutch_infoday_EVanEijck
ENP_Dutch_infoday_EVanEijckENP_Dutch_infoday_EVanEijck
ENP_Dutch_infoday_EVanEijck
 
Turkish Information Day for Europeana Newspapers Project
Turkish Information Day for Europeana Newspapers ProjectTurkish Information Day for Europeana Newspapers Project
Turkish Information Day for Europeana Newspapers Project
 
IMPACT Final Event 26-06-2012 - Use of IMPACT tools in the Europeana Newspap...
IMPACT Final Event 26-06-2012  - Use of IMPACT tools in the Europeana Newspap...IMPACT Final Event 26-06-2012  - Use of IMPACT tools in the Europeana Newspap...
IMPACT Final Event 26-06-2012 - Use of IMPACT tools in the Europeana Newspap...
 
ENP_Dutch_Infoday_SKruizinga
ENP_Dutch_Infoday_SKruizingaENP_Dutch_Infoday_SKruizinga
ENP_Dutch_Infoday_SKruizinga
 
Europeana Libraries: bringing content to the researcher
Europeana Libraries: bringing content to the researcherEuropeana Libraries: bringing content to the researcher
Europeana Libraries: bringing content to the researcher
 
ENP_Dutch_Infoday_MWillems
ENP_Dutch_Infoday_MWillemsENP_Dutch_Infoday_MWillems
ENP_Dutch_Infoday_MWillems
 
ENP_Dutch_Infoday_LWilms
ENP_Dutch_Infoday_LWilmsENP_Dutch_Infoday_LWilms
ENP_Dutch_Infoday_LWilms
 
Europeana Newspapers (Project Details and Aggregation Workflow)
Europeana Newspapers (Project Details and Aggregation Workflow)Europeana Newspapers (Project Details and Aggregation Workflow)
Europeana Newspapers (Project Details and Aggregation Workflow)
 
ENP_Dutch_Infoday_PHuijnen
ENP_Dutch_Infoday_PHuijnen ENP_Dutch_Infoday_PHuijnen
ENP_Dutch_Infoday_PHuijnen
 
Positioning libraries in the digital preservation landscape
Positioning libraries in the digital preservation landscapePositioning libraries in the digital preservation landscape
Positioning libraries in the digital preservation landscape
 
Europeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne KoutsEuropeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne Kouts
 
Alastair Dunning, Open data at The European library, TEL
Alastair Dunning, Open data at The European library, TELAlastair Dunning, Open data at The European library, TEL
Alastair Dunning, Open data at The European library, TEL
 
Europeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred PussEuropeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred Puss
 
Europeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista AruEuropeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista Aru
 
Europeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista KiisaEuropeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista Kiisa
 
Aubéry Escande - Europeana Newspapers - A new tool for researchers
Aubéry Escande - Europeana Newspapers - A new tool for researchersAubéry Escande - Europeana Newspapers - A new tool for researchers
Aubéry Escande - Europeana Newspapers - A new tool for researchers
 
Europeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel VeimannEuropeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel Veimann
 
Dunning welsh-newspapers-130314110640-phpapp01
Dunning welsh-newspapers-130314110640-phpapp01Dunning welsh-newspapers-130314110640-phpapp01
Dunning welsh-newspapers-130314110640-phpapp01
 
ENP_ONB_infday_GMuehlberger
ENP_ONB_infday_GMuehlbergerENP_ONB_infday_GMuehlberger
ENP_ONB_infday_GMuehlberger
 
ENP_ONB_infoday_Schaller
ENP_ONB_infoday_SchallerENP_ONB_infoday_Schaller
ENP_ONB_infoday_Schaller
 

Similaire à Het Europeana Newspapers Project

De webdossiers van Bibliotheek De Krook - een bibliotheek en collectie in bew...
De webdossiers van Bibliotheek De Krook - een bibliotheek en collectie in bew...De webdossiers van Bibliotheek De Krook - een bibliotheek en collectie in bew...
De webdossiers van Bibliotheek De Krook - een bibliotheek en collectie in bew...
Bibliotheek De Krook
 

Similaire à Het Europeana Newspapers Project (20)

Collegagroep digitale collectieregistratie
Collegagroep digitale collectieregistratieCollegagroep digitale collectieregistratie
Collegagroep digitale collectieregistratie
 
De webdossiers van bibliotheek De Krook: een bibliotheek en collectie in bewe...
De webdossiers van bibliotheek De Krook: een bibliotheek en collectie in bewe...De webdossiers van bibliotheek De Krook: een bibliotheek en collectie in bewe...
De webdossiers van bibliotheek De Krook: een bibliotheek en collectie in bewe...
 
De webdossiers van Bibliotheek De Krook - een bibliotheek en collectie in bew...
De webdossiers van Bibliotheek De Krook - een bibliotheek en collectie in bew...De webdossiers van Bibliotheek De Krook - een bibliotheek en collectie in bew...
De webdossiers van Bibliotheek De Krook - een bibliotheek en collectie in bew...
 
Elco van Staveren - KB
Elco van Staveren - KBElco van Staveren - KB
Elco van Staveren - KB
 
The Youtube of Dutch digital publications - one national platform for full-te...
The Youtube of Dutch digital publications - one national platform for full-te...The Youtube of Dutch digital publications - one national platform for full-te...
The Youtube of Dutch digital publications - one national platform for full-te...
 
Nieuwe bibliotheekwebsites voor bibs en publiek #3in1 #mobilefirst #stayconne...
Nieuwe bibliotheekwebsites voor bibs en publiek #3in1 #mobilefirst #stayconne...Nieuwe bibliotheekwebsites voor bibs en publiek #3in1 #mobilefirst #stayconne...
Nieuwe bibliotheekwebsites voor bibs en publiek #3in1 #mobilefirst #stayconne...
 
Naar een geïntegreerde ontsluiting van de KADOC erfgoedcollecties met Limo
Naar een geïntegreerde ontsluiting van de KADOC erfgoedcollecties met LimoNaar een geïntegreerde ontsluiting van de KADOC erfgoedcollecties met Limo
Naar een geïntegreerde ontsluiting van de KADOC erfgoedcollecties met Limo
 
My Discoveries evaluatie 2015
My Discoveries evaluatie 2015My Discoveries evaluatie 2015
My Discoveries evaluatie 2015
 
Presentatie InCTFormatie 25/04/2012
Presentatie InCTFormatie 25/04/2012Presentatie InCTFormatie 25/04/2012
Presentatie InCTFormatie 25/04/2012
 
TYPO3 Congres 2012 - Aan de slag met TYPO3 Extbase en Fluid
TYPO3 Congres 2012 - Aan de slag met TYPO3 Extbase en FluidTYPO3 Congres 2012 - Aan de slag met TYPO3 Extbase en Fluid
TYPO3 Congres 2012 - Aan de slag met TYPO3 Extbase en Fluid
 
De KADOC-lezer op zijn wenken bediend
De KADOC-lezer op zijn wenken bediendDe KADOC-lezer op zijn wenken bediend
De KADOC-lezer op zijn wenken bediend
 
Thema, een introductie
Thema, een introductieThema, een introductie
Thema, een introductie
 
11 wilms kb_lab
11 wilms kb_lab11 wilms kb_lab
11 wilms kb_lab
 
Ontwikkelingen in e-distributie Frankfurt 2014
Ontwikkelingen in e-distributie Frankfurt 2014Ontwikkelingen in e-distributie Frankfurt 2014
Ontwikkelingen in e-distributie Frankfurt 2014
 
Haalbaarheidsonderzoek eengemaakt bibliotheeksysteem
Haalbaarheidsonderzoek eengemaakt bibliotheeksysteemHaalbaarheidsonderzoek eengemaakt bibliotheeksysteem
Haalbaarheidsonderzoek eengemaakt bibliotheeksysteem
 
Wikipedia en Bibliotheken: een presentatie voor Mediacoaches
Wikipedia en Bibliotheken: een presentatie voor MediacoachesWikipedia en Bibliotheken: een presentatie voor Mediacoaches
Wikipedia en Bibliotheken: een presentatie voor Mediacoaches
 
Bewaren van erfgoed
Bewaren van erfgoedBewaren van erfgoed
Bewaren van erfgoed
 
Activiteitenverslag M4B 2014
Activiteitenverslag M4B 2014Activiteitenverslag M4B 2014
Activiteitenverslag M4B 2014
 
Progress report Wikipedian-in-Residence national library & archives Netherlan...
Progress report Wikipedian-in-Residence national library & archives Netherlan...Progress report Wikipedian-in-Residence national library & archives Netherlan...
Progress report Wikipedian-in-Residence national library & archives Netherlan...
 
CB bookshelf presentatie
CB bookshelf presentatie CB bookshelf presentatie
CB bookshelf presentatie
 

Plus de Europeana Newspapers

Présentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information DayPrésentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information Day
Europeana Newspapers
 

Plus de Europeana Newspapers (19)

Presentation of Philippe Mezzasalma at the BnF Information Day in Paris
Presentation of Philippe Mezzasalma at the BnF Information Day in ParisPresentation of Philippe Mezzasalma at the BnF Information Day in Paris
Presentation of Philippe Mezzasalma at the BnF Information Day in Paris
 
Presentation of Ioannis Anagnostopoulos at BnF Information Day
Presentation of Ioannis Anagnostopoulos at BnF Information DayPresentation of Ioannis Anagnostopoulos at BnF Information Day
Presentation of Ioannis Anagnostopoulos at BnF Information Day
 
Presentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information DayPresentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information Day
 
Presentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information DayPresentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information Day
 
Présentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information DayPrésentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information Day
 
Presentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information DayPresentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information Day
 
Presentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information DayPresentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information Day
 
IFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza AtanassovaIFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza Atanassova
 
Europeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday NeudeckerEuropeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday Neudecker
 
Europeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday ThompsonEuropeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday Thompson
 
Europeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday RossiEuropeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday Rossi
 
Enp lft infoday_neudecker
Enp lft infoday_neudeckerEnp lft infoday_neudecker
Enp lft infoday_neudecker
 
Europeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday MuehlbergerEuropeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday Muehlberger
 
Europeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday MessinaEuropeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday Messina
 
Europeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday MarchettiEuropeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday Marchetti
 
Europeana Newspapers LFT Infoday Kempf
Europeana Newspapers LFT Infoday KempfEuropeana Newspapers LFT Infoday Kempf
Europeana Newspapers LFT Infoday Kempf
 
Europeana Newspapers LFT Infoday Genereux
Europeana Newspapers LFT Infoday GenereuxEuropeana Newspapers LFT Infoday Genereux
Europeana Newspapers LFT Infoday Genereux
 
Europeana Newspapers LFT Infoday Bolioli
Europeana Newspapers LFT Infoday BolioliEuropeana Newspapers LFT Infoday Bolioli
Europeana Newspapers LFT Infoday Bolioli
 
ENP_Dutch_infoday_HCrijns
ENP_Dutch_infoday_HCrijnsENP_Dutch_infoday_HCrijns
ENP_Dutch_infoday_HCrijns
 

Het Europeana Newspapers Project

  • 1. Het Europeana Newspapers Project Historische kranten online Den Haag, 22-11-2012 Lotte Wilms @lottewilms @eurnews
  • 2. Europeana Newspapers – waarom kranten? Waarom kranten? • Belangrijke bron voor onderzoek • Relevant voor het algemeen publiek Bronnen: http://digi.kansalliskirjasto.fi/sanomalehti/secure/showPage.html?id=395644&conversationId=1&action=entryPage; http://kranten.kb.nl/view/paper/id/ddd%3A010212139%3Ampeg21%3Ap001%3Aa0001/backlink/home http://gallica.bnf.fr/ark:/12148/bpt6k265203z ; 2
  • 3. Projectprofiel: Consortium & stakeholders • 17 partners uit 12 landen: • Nationale bibliotheken • Universiteitsbibliotheken • Onderzoeksinstituten • Commerciële partij • Framework: • Best Practice Network • ICT-PSP programma van de Europese Commissie • Projectduur: februari 2012 – januari 2015 3
  • 5. Europeana Newspapers: Doelen • Aggregatie en verrijking van kranten voor Europeana • Circa 18 miljoen krantenpagina’s naar Europeana • Verrijken met OCR, layout herkenning (OLR) en named entity recognition • Analyse bestaande krantencollecties • Overzicht bestaande projecten • Aanmoedigen om ook kranten bij te dragen 5
  • 6. Europeana Newspapers: Doelen • Quality assurance en best practice aanbevelingen • Voortbouwen op andere projecten (o.a. IMPACT en Europeana Libraries) • Bijdragen aan geoptimaliseerde workflows • Aanbevelingen voor digitalisering, verrijking, workflows, metadata, etc. • Presentatie en full-text doorzoeken • 18 miljoen Europese krantenpagina’s • Verbeteren van de toegang van kranten in Europeana
  • 7. Aggregatie en verrijking van kranten voor Europeana • Aggregatie in Europeana en The European Library • 18 miljoen gedigitaliseerde krantenpagina’s • 8 miljoen pagina’s zonder bewerkingen www.europeana.eu/ (content leveranciers) • 8 miljoen verrijkte pagina’s: OCR (UIBK, Oostenrijk) • 2 miljoen verrijkte pagina’s: OCR/OLR (artikelsegmentatie) (CCS, Duitsland) www.theeuropeanlibrary.org/ 7
  • 8. Verrijking – OCR en OLR • 8 miljoen verrijkte pagina’s: OCR (UIBK, Oostenrijk) • OCR (ABBYY) • Output in ALTO formaat • Test met Document Understanding Platform (FEP) • Ontwikkeld binnen IMPACT • Profielen aangepast aan kranten UIBK: Herkenning van titels, voetnoten, etc. Extractie van inhoudsopgave
  • 9. Verrijking – OCR en OLR • 2 miljoen verrijkte pagina’s: • Automatische layout herkenning OCR/OLR (artikelsegmentatie) • Kolommen (CCS, Duitsland) • Zones • OCR (ABBYY) • Pagina types • Automatische artikelsegmentatie • Aanvullende handmatige verificatie en quality control CCS: Kolomherkenning en artikelsegmentatie
  • 10. Verrijking - Named Entity Recognition • Named entity herkenning (KB, Nederland) • Tot drie talen • Nederlands • Engels • Duits
  • 11. Analyse bestaande krantencollecties • Enquête over digitale krantencollecties • Zomer 2012 • Circa 45 Europese bibliotheken • De resultaten naar “Zeitschriftendatenbank” van de Staatsbibliotheek van Berlijn • Potentiële nieuwe partners • Informatie over de technische status van gedigitaliseerd materiaal
  • 12. Quality assurance en best practice aanbevelingen • Ontwikkeling van een • Evaluatie van de metadataprofiel (METS) digitaliseringsworkflow voor • Gebruik binnen het project kranten, inclusief verrijking • Aanbeveling voor toekomstige • M.b.v. een quality assessment digitaliseer- en framework verrijkingsprojecten • Inclusief tools uit IMPACT • Aanbevelingen voor het digitaliseren en verrijken van kranten
  • 13. Presentatie en full-text doorzoeken • Content browser • Onderdeel van het TEL portal • Zoeken op full-text • Zoekterm • Named entities • Per collectie • Op datum • Krantenafbeeldingen • Link naar bibliotheek Nb. Mock-ups
  • 14. Promotie • Doelen: • Publiciteit van het project • Vergroten van gebruik Europeana • Media • @eurnews • www.facebook.com/EuropeanaNewspapers • Workshops en conferenties • Drie dissemination workshops • Nationale informatie dagen • Uitbreiding van het netwerk 14
  • 15. Voordeel voor de KB kranten en gebruikers • Beschikbaar via Europeana • 2 miljoen KB krantenpagina’s doorzoekbaar in combinatie met 16 miljoen andere Europese krantenpagina’s uit 12 landen • Duitse kranten • Franse kranten • Oostenrijkse kranten • Finse kranten • Poolse kranten • Etc. • Verrijking met Named Entities