SlideShare une entreprise Scribd logo
1  sur  25
Télécharger pour lire hors ligne
Projekt Europeana Newspapers
online brána k evropským historickým novinám




Aleš Pekárek, Asociace evropských vědeckých
knihoven (LIBER)
Moravská zemská knihovna, Brno, 30.11.2012
Obsah

•   Cíle a záměry projektu
•   Partnerské instituce
•   Oblasti projektových aktivit
•   Komunikace a diseminace projektu
•   Přidružení partneři projektu




                                       2
Proč zrovna noviny?


 „Noviny jsou bazarem dějin“ (Die Zeitungen sind der Sekundenzeiger der
  Geschichte)

Arthur Schopenhauer

 „Noviny jsou jedním z nejpopulárnějších materiálů v naší knihovně, protože
 přímo přetékají informacemi a mají co říci širokému spektru našich
 návštěvníků. V rámci projektu dodáme do Europeany 2 milliony našich plně
 digitalizovaných stránek, čímž je zpřístupníme mnohem většímu okruhu
 uživatelů a v mnohem širším kontextu než doposud.“

Lily Knibbeler,
Ředitelka Marketingu a Služeb Královské (Národní) knihovny Nizozemí

                 V novinách si zkrátka každý něco najde!


                                                                              3
Cíle & Záměry

1) Výběr, Rafinace („refinement“) a Agregace obsahu
• Učinit z Europeany největšího poskytovatele pan-evropské digitální sbírky
    novin
• Dodání více než 18 million novinových stránek do Europeany, mnoho z
    nich společně s vyextrahovaným fulltextem (OCR, OLR, NER)
2) Analýza existujících digitálních novinových sbírek
• Celoevropský průzkum
3) Kvalita & Doporučení nejlepší praxe
• Vytvoření optimalizovaného workflow a infrastruktur pro agregaci dat
• Doporučení nejlepších praxí pro pročištění, workflow, metadata a evaluačních
    nástrojů v oblasti digitalizace novinových sbírek
4) Prezentace obsahu a fulltextové vyhledávání
• Vylepšený přístup k novinovým sbírkám v rámci Europeany (Content
    Browser)



                                                                                 4
Projektové konsorcium & Stakeholdeři

• 17 partnerů z 12 zemí
    • Národní knihovny – obsahoví a techničtí partneři
    • Univerzitní knihovny – převážně techničtí partneři
    • Malý a střední podnik (CCS – Content Conversion Specialists)

• Externí partneři a stakeholdeři:
    • Zapojení knihoven vně projektového konsorcia

• Celkový rámec:
    • Financováno jako Best Practice Network v programu ICT-PSP
      Evropské komise
    • Trvání projektu: Únor 2012 – Leden 2015

                                                                     5
Partneři projektu Europeana Newspapers


                                    NLE                        NLF
                   LIBER
       TEL
                              SUB HH
                                                         NLL
                                        CCS
USAL
                                                   NLP

       BL                         SBB
                      KB                  ONB

                                                                 NLT
                           UIBK
             BnF

                                              UB
                             LFT
Partneři projektu

1. Staatsbibliothek zu Berlin    9. University of Salford
(koordinátor projektu)           10. CCS Content Conversion
2. National Library of the       Specialists GmbH
Netherlands                      11. Stichting LIBER
3. National Library of Estonia   12. National Library of Latvia
4. Österreichische               13. National Library of Turkey
Nationalbibliothek               14. University Library of Belgrade
5. National Library of Finland   15. University of Innsbruck
6. Staats- und                   16. Landesbibliothek Dr.
Universitätsbibliothek Hamburg   Friedrich Tessmann
7. Bibliothèque nationale de     17. The British Library
France
8. National Library of Poland
Struktura projektových aktivit (+ koordinátoři)

• Work Package 1: Koordinace a řízení projektu
  • Berlin State Library (SBB)
• Work Package 2: Výběr a rafinace digitalizovaných novin
  • National Library of the Netherlands (KB)
• Work Package 3: Evaluace a hodnocení kvality výběru
  • University of Salford (USAL)
• Work Package 4: Agregace a příprava novin pro Europeanu
  • The European Library (TEL)
• Work Package 5: Doporučení „Best Practice“ v oblasti novinových
 metadat
  • University of Innsbruck (UIBK)
• Work Package 6: Diseminace a zužitkování projektu
  • Association of European Research Libraries (LIBER)
WP 1: Koordinace a řízení projektu

• Administrace projektu
  • Řízení všech finančních a organizačních záležitostí
• Finanční kontrola
• Projektová komunikace
  • Sharepoint
• Zajištění kvality projektu
  • monitoring, evaluace a reporting výsledků
• Risk managament
  • Předcházení konfliktů v rámci konsorcia 
WP 2: Rafinace digitalizovaných novin

• Analýza obsahu a výběr vhodných souborů z digitálních
 novinových sbírek k “zušlechtění” (rafinaci)

• Definice požadavků na minimální kvalitu digitalizovaných
 novin

• Koordinace zušlechťování vybraného novinového obsahu –
 novin poskytnutých partnerskými institucemi

• Doporučení nejlepších praxí v oblasti rafinace digitálních
 novinových sbírek
WP2: Rafinace – OCR and OLR

• 8 millionů stránek bude do Europeany
  naagregováno „tak jak jsou”
==================================
• 10 millionů zrafinovaných stránek:            CCS: Automatické rozpoznávání a
  OCR (UIBK, Rakousko)                          segmentace novinových
Z toho:                                         sloupků a článků
2 milliony:
  OCR/OLR (segmentace článků)
  (CCS, Německo)

 UIBK obohatí vyextrahovaný obsah
 strukturálními informacemi z její „Platformy
 porozumění dokumentům“,
 CCS pak informacemi o sloupcích, článcích;
 zoning; segmentace článků a jejich úrovní
 CCS zároveň poskytuje knihovnám
 technologii pro manuální korekci výsledných         UIBK: Detekce titulků a poznámek;
 strukturálních informací                            Automatické generování obsahu
WP 2: Rafinace – Rozpoznávání jmenných entit

• KB dodala systém rozpoznávání jmenných entit (NER) (pro holandštinu,
 angličtinu a němčinu)
WP 3: Evaluace a hodnocení kvality

• Vytvoření uživatelských scénářů se vzorovými profily, datovými
 sadami, „ground truth“ a nástroji hodnocení kvality výstupů

• Přehled faktorů využitelnosti, limitů a reálného potenciálu
 existujících vstupních materiálů

• Identifikace kritických míst procesu společně s návrhem řešení

• Evaluace jednotlivých aktivit procesu

• Doporučení nejlepších praxí pro podobné post-digitalizační
 pojekty
WP 4: Agregace a příprava pro Europeanu

• Identifikace a analýza veřejných i soukromých zdigitalizovaných
  novinových sbírek napříč Evropou
• Vytvoření reálného časového rámce agregace novinového obsahu
• Vytvoření celoevropského registru digitalizovaných novinových
  sbírek
• Doporučení, jak napasovat existující novinová metadata na EDM
  (standard Europeany)
• Agregace novinových metadat partnerů projektu
• Vytvoření fulltextového indexu novinového obsahu
• Vývoj a spuštění prohlížeče obsahu (full-text + metadata +
  originálni skeny či náhledy
WP 4: Agregace obsahu

• Agregace 18 millionů digitalizovaných
  novinových stránek do služby Europeana
  prostřednictvím Evropské knihovny
  (jednotný portál evropských národních
  knihoven)
                                              www.europeana.eu
• Transformace vstupních metadat na bázi
  EDM

• Distribuce dat do Europeany (po jejich
  finální transformaci v rámci TEL)

                                           www.theeuropeanlibrary.org


                                                                 16
WP 4: Prezentace & Přístup k plným textům

Funkce obsahového browseru:
• Fulltextové vyhledávání, např.
  •   podle klíčového slova,
  •   podle jmenných entit
  •   podle novinových sbírek
  •   podle data vydání novin...
• Prohlížení naskenovaných
  novinových stránek
• Propojení s příbuzným obsahem
  nenovinového typu (fotky, hudba,
  pohlednice...)
WP 5: Doporučení nejlepších praxí v oblasti metadat


• Analýza novinových metadatových formátů používaných
 v evropských zemích

• Propojení existujících metadatových modelů se
 standardem METS/ALTO a vydání doporučení
 nejlepších praxí

  • Použitelnost doporučení bude testováno v rámci
    specifického evaluačního cyklu
Standard METS


METS – Metadata Encoding and Transmission Standard

 vznikl v roce 2001
 otevřený na bázi XML
 Připraven pro Digital Library Federation (DLF)
   Jerome McDonoughem a týmem METS

 schéma hotováno LOC
 udržováno redakční radou METS
 Současná verze: 1.9
Funkce METS


 Popisuje zdigitalizovaný objekt
    Tištěná media (kniha, noviny, časopis)
    audio/video materiály

 Umožňuje včlenění jiných druhů metadat
    Popisná metadata (DC, MODS, MARC, Premis)
    Technická metadata (Mix, …)

 Možnost strukturálních informací
    Fyzická struktura
    Logická struktura

 Umí odkazovat na jakýkoliv jiný digitální objekt
      Obrázky
      Audio / video streamy
      Text
      Externí metadatové objekty
Standard ALTO



ALTO – Analyzed Layout and Text Object

 XML based open standard
 Schema is hosted at LOC (Library of Congress)
 Maintained by METS Editorial Board
 Current version: 2.0
WP 6: Komunikace a diseminace projektu

• Cíle
     • Vytvoření celoevropské publicity
     • Větší používanost Europeany
     • Zajištění informovanosti cílových skupin
•   Úkoly
     1. Komunikace v mediích
     2. Workshopy a účast na konferencích
         • Tři hlavní diseminační workshopy
           (rafinace, agregace, závěrečný)
         • Národní informační dny (minimálně 10)
         • Rozšíření sítě o další partnery
     3. Zužitkování výsledků projektu


                                                   22
Hlavní komunikační kanály projektu

WWW: http://www.europeana-newspapers.eu/
Twitter: @eurnews
Facebook: https://www.facebook.com/EuropeanaNewspapers
Newsletter: http://bit.ly/TsoMpY (najdete na webové stránce projektu)
Slideshare: http://www.slideshare.net/Europeana_Newspapers




                                                                        23
Přidružení partneři projektu

• Rozšíření sítě o tzv. Přidružené partnery projektu (nefinancované,
  nepřímé benefity z partnerství)
   • Možnost poskytnutí metadat digitálních novinových sbírek do Europeany v
     rámci procesů projektu  rapidní nárust návštěvníků
   • Využití a přístup k výsledkům projektu (doporučení, dokumentace, SW
     nástroje, metodika workflow)

   • Hlavně pro držitele obsahu

   • Většina identifikována v rámci průzkumu (40 vyplněných dotazníků, 35
     potenciálních přidružených partnerů – o metodě výběru se stále diskutuje)

   • Za ČR zájem projevila NK ČR a MZK (i ostatní instituce s digitálními
     novinovými sbírkami jsou vítány)


                                                                                 24
Děkuji za pozornost

  pekarek.ales@gmail.com
www.europeana-newspapers.eu
    www.libereurope.eu

Contenu connexe

En vedette

Europeana Newspapers German infoday - Verarbeitung Digitale Zeitungen
Europeana Newspapers German infoday - Verarbeitung Digitale ZeitungenEuropeana Newspapers German infoday - Verarbeitung Digitale Zeitungen
Europeana Newspapers German infoday - Verarbeitung Digitale ZeitungenEuropeana Newspapers
 
Historical newspapers in the context of Digital Library of Slovenia
Historical newspapers in the context of Digital Library of SloveniaHistorical newspapers in the context of Digital Library of Slovenia
Historical newspapers in the context of Digital Library of SloveniaEuropeana Newspapers
 
Presentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information DayPresentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information DayEuropeana Newspapers
 
Europeana Newspapers German infoday - Struturelle Metadata historische Zeitungen
Europeana Newspapers German infoday - Struturelle Metadata historische ZeitungenEuropeana Newspapers German infoday - Struturelle Metadata historische Zeitungen
Europeana Newspapers German infoday - Struturelle Metadata historische ZeitungenEuropeana Newspapers
 
Europeana Newspapers Polish Information Day
Europeana Newspapers Polish Information DayEuropeana Newspapers Polish Information Day
Europeana Newspapers Polish Information DayEuropeana Newspapers
 
Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja
Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja
Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja Europeana Newspapers
 
Challenges and solutions in creating a european historic newspapers browser
Challenges and solutions in creating a european historic newspapers browser Challenges and solutions in creating a european historic newspapers browser
Challenges and solutions in creating a european historic newspapers browser Europeana Newspapers
 
Europeana Newspapers Amsterdam workshop introduction
Europeana Newspapers Amsterdam workshop introductionEuropeana Newspapers Amsterdam workshop introduction
Europeana Newspapers Amsterdam workshop introductionEuropeana Newspapers
 
eluxemburgensia: the portal for Luxembourg's historic newspapers
eluxemburgensia: the portal for Luxembourg's historic newspaperseluxemburgensia: the portal for Luxembourg's historic newspapers
eluxemburgensia: the portal for Luxembourg's historic newspapersEuropeana Newspapers
 
Europeana Newspapers Project - German infoday
Europeana Newspapers Project - German infoday Europeana Newspapers Project - German infoday
Europeana Newspapers Project - German infoday Europeana Newspapers
 
The European(a) Newspapers Project
The European(a) Newspapers ProjectThe European(a) Newspapers Project
The European(a) Newspapers ProjectEuropeana Newspapers
 
ENP Belgrade WS refinement introduction
ENP Belgrade WS refinement introductionENP Belgrade WS refinement introduction
ENP Belgrade WS refinement introductionEuropeana Newspapers
 

En vedette (19)

ENP Belgrade WS Introduction
ENP Belgrade WS IntroductionENP Belgrade WS Introduction
ENP Belgrade WS Introduction
 
Europeana Newspapers German infoday - Verarbeitung Digitale Zeitungen
Europeana Newspapers German infoday - Verarbeitung Digitale ZeitungenEuropeana Newspapers German infoday - Verarbeitung Digitale Zeitungen
Europeana Newspapers German infoday - Verarbeitung Digitale Zeitungen
 
Historical newspapers in the context of Digital Library of Slovenia
Historical newspapers in the context of Digital Library of SloveniaHistorical newspapers in the context of Digital Library of Slovenia
Historical newspapers in the context of Digital Library of Slovenia
 
Presentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information DayPresentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information Day
 
ENP_SEEDI_2013_UB
ENP_SEEDI_2013_UBENP_SEEDI_2013_UB
ENP_SEEDI_2013_UB
 
Europeana Newspapers German infoday - Struturelle Metadata historische Zeitungen
Europeana Newspapers German infoday - Struturelle Metadata historische ZeitungenEuropeana Newspapers German infoday - Struturelle Metadata historische Zeitungen
Europeana Newspapers German infoday - Struturelle Metadata historische Zeitungen
 
Europeana Newspapers Polish Information Day
Europeana Newspapers Polish Information DayEuropeana Newspapers Polish Information Day
Europeana Newspapers Polish Information Day
 
Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja
Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja
Europeana Newspapers: novo mesto susreta korisnika digitalnih sadržaja
 
Challenges and solutions in creating a european historic newspapers browser
Challenges and solutions in creating a european historic newspapers browser Challenges and solutions in creating a european historic newspapers browser
Challenges and solutions in creating a european historic newspapers browser
 
Europeana Newspapers Amsterdam workshop introduction
Europeana Newspapers Amsterdam workshop introductionEuropeana Newspapers Amsterdam workshop introduction
Europeana Newspapers Amsterdam workshop introduction
 
eluxemburgensia: the portal for Luxembourg's historic newspapers
eluxemburgensia: the portal for Luxembourg's historic newspaperseluxemburgensia: the portal for Luxembourg's historic newspapers
eluxemburgensia: the portal for Luxembourg's historic newspapers
 
Europeana Newspapers Project - German infoday
Europeana Newspapers Project - German infoday Europeana Newspapers Project - German infoday
Europeana Newspapers Project - German infoday
 
On the two sides of the pond
On the two sides of the pondOn the two sides of the pond
On the two sides of the pond
 
The European(a) Newspapers Project
The European(a) Newspapers ProjectThe European(a) Newspapers Project
The European(a) Newspapers Project
 
Trtovac, dakic, september 2012
Trtovac, dakic, september 2012Trtovac, dakic, september 2012
Trtovac, dakic, september 2012
 
ENP Belgrade WS refinement introduction
ENP Belgrade WS refinement introductionENP Belgrade WS refinement introduction
ENP Belgrade WS refinement introduction
 
Metadata
MetadataMetadata
Metadata
 
What is a named entity
What is a named entityWhat is a named entity
What is a named entity
 
ENP Belgrade WS Metadata
ENP Belgrade WS MetadataENP Belgrade WS Metadata
ENP Belgrade WS Metadata
 

Similaire à Projekt Europeana Newspapers - online brána k evropským historickým novinám

Sharing Knowledge - Open Access Repositories in the V4 Countries
Sharing Knowledge - Open Access Repositories in the V4 CountriesSharing Knowledge - Open Access Repositories in the V4 Countries
Sharing Knowledge - Open Access Repositories in the V4 CountriesTereza Simandlová
 
Knihovny.cz - centrální portál českých knihoven
Knihovny.cz - centrální portál českých knihovenKnihovny.cz - centrální portál českých knihoven
Knihovny.cz - centrální portál českých knihovenKnihovny.cz
 
Portál Europeana, evropské projekty CARARE a LoCloud – inspirace pro informač...
Portál Europeana, evropské projekty CARARE a LoCloud – inspirace pro informač...Portál Europeana, evropské projekty CARARE a LoCloud – inspirace pro informač...
Portál Europeana, evropské projekty CARARE a LoCloud – inspirace pro informač...locloud
 
Ceska digitalni knihovna
Ceska digitalni knihovnaCeska digitalni knihovna
Ceska digitalni knihovnamartinlhotak
 
Knihovny.cz v Bloku expertů KISK 2017
Knihovny.cz v Bloku expertů KISK 2017 Knihovny.cz v Bloku expertů KISK 2017
Knihovny.cz v Bloku expertů KISK 2017 Knihovny.cz
 
Klára Rösslerová: Henrietta D. Avramová (1919-2006) a její přínos pro obor kn...
Klára Rösslerová: Henrietta D. Avramová (1919-2006) a její přínos pro obor kn...Klára Rösslerová: Henrietta D. Avramová (1919-2006) a její přínos pro obor kn...
Klára Rösslerová: Henrietta D. Avramová (1919-2006) a její přínos pro obor kn...ÚISK FF UK
 
Martin Lhoták - Projektový záměr ArcLib
Martin Lhoták - Projektový záměr ArcLibMartin Lhoták - Projektový záměr ArcLib
Martin Lhoták - Projektový záměr ArcLibLTP-portal-cz
 
Elektronické informační zdroje nejen pro filology - se zaměřením na zdroje pr...
Elektronické informační zdroje nejen pro filology - se zaměřením na zdroje pr...Elektronické informační zdroje nejen pro filology - se zaměřením na zdroje pr...
Elektronické informační zdroje nejen pro filology - se zaměřením na zdroje pr...Ústřední knihovna FF MU
 
5. 3. O Digitalizace A Vedecke Digitalni Knihovny Martin Lhotak
5. 3. O Digitalizace A  Vedecke  Digitalni Knihovny  Martin Lhotak5. 3. O Digitalizace A  Vedecke  Digitalni Knihovny  Martin Lhotak
5. 3. O Digitalizace A Vedecke Digitalni Knihovny Martin LhotakKISK FF MU
 
Vít Richter: Benchmarking knihoven
Vít Richter: Benchmarking knihovenVít Richter: Benchmarking knihoven
Vít Richter: Benchmarking knihovenÚISK FF UK
 
Jan Mach: Akademické výsledky na veřejnosti - hrozba či příležitost?
Jan Mach: Akademické výsledky na veřejnosti - hrozba či příležitost? Jan Mach: Akademické výsledky na veřejnosti - hrozba či příležitost?
Jan Mach: Akademické výsledky na veřejnosti - hrozba či příležitost? ÚISK FF UK
 
Clanky.knihovna.cz
Clanky.knihovna.czClanky.knihovna.cz
Clanky.knihovna.czKISK FF MU
 

Similaire à Projekt Europeana Newspapers - online brána k evropským historickým novinám (20)

Digitalni knihovna AV ČR
Digitalni knihovna AV ČRDigitalni knihovna AV ČR
Digitalni knihovna AV ČR
 
Sharing Knowledge - Open Access Repositories in the V4 Countries
Sharing Knowledge - Open Access Repositories in the V4 CountriesSharing Knowledge - Open Access Repositories in the V4 Countries
Sharing Knowledge - Open Access Repositories in the V4 Countries
 
Knihovny.cz - centrální portál českých knihoven
Knihovny.cz - centrální portál českých knihovenKnihovny.cz - centrální portál českých knihoven
Knihovny.cz - centrální portál českých knihoven
 
Portál Europeana, evropské projekty CARARE a LoCloud – inspirace pro informač...
Portál Europeana, evropské projekty CARARE a LoCloud – inspirace pro informač...Portál Europeana, evropské projekty CARARE a LoCloud – inspirace pro informač...
Portál Europeana, evropské projekty CARARE a LoCloud – inspirace pro informač...
 
Informační zdroje pro germanistiku
Informační zdroje pro germanistiku Informační zdroje pro germanistiku
Informační zdroje pro germanistiku
 
Ceska digitalni knihovna
Ceska digitalni knihovnaCeska digitalni knihovna
Ceska digitalni knihovna
 
Knihovny.cz v Bloku expertů KISK 2017
Knihovny.cz v Bloku expertů KISK 2017 Knihovny.cz v Bloku expertů KISK 2017
Knihovny.cz v Bloku expertů KISK 2017
 
Knihovny.cz v Bloku expertů 2017
Knihovny.cz v Bloku expertů 2017Knihovny.cz v Bloku expertů 2017
Knihovny.cz v Bloku expertů 2017
 
Klára Rösslerová: Henrietta D. Avramová (1919-2006) a její přínos pro obor kn...
Klára Rösslerová: Henrietta D. Avramová (1919-2006) a její přínos pro obor kn...Klára Rösslerová: Henrietta D. Avramová (1919-2006) a její přínos pro obor kn...
Klára Rösslerová: Henrietta D. Avramová (1919-2006) a její přínos pro obor kn...
 
Knihovny.cz
Knihovny.czKnihovny.cz
Knihovny.cz
 
Slezska digitalni knihovna
Slezska digitalni knihovnaSlezska digitalni knihovna
Slezska digitalni knihovna
 
Martin Lhoták - Projektový záměr ArcLib
Martin Lhoták - Projektový záměr ArcLibMartin Lhoták - Projektový záměr ArcLib
Martin Lhoták - Projektový záměr ArcLib
 
Elektronické informační zdroje nejen pro filology - se zaměřením na zdroje pr...
Elektronické informační zdroje nejen pro filology - se zaměřením na zdroje pr...Elektronické informační zdroje nejen pro filology - se zaměřením na zdroje pr...
Elektronické informační zdroje nejen pro filology - se zaměřením na zdroje pr...
 
5. 3. O Digitalizace A Vedecke Digitalni Knihovny Martin Lhotak
5. 3. O Digitalizace A  Vedecke  Digitalni Knihovny  Martin Lhotak5. 3. O Digitalizace A  Vedecke  Digitalni Knihovny  Martin Lhotak
5. 3. O Digitalizace A Vedecke Digitalni Knihovny Martin Lhotak
 
Webarchiv CZ
Webarchiv CZWebarchiv CZ
Webarchiv CZ
 
Informační zdroje pro anglistiku
Informační zdroje pro anglistikuInformační zdroje pro anglistiku
Informační zdroje pro anglistiku
 
Vít Richter: Benchmarking knihoven
Vít Richter: Benchmarking knihovenVít Richter: Benchmarking knihoven
Vít Richter: Benchmarking knihoven
 
Centrální portál knihoven
Centrální portál knihovenCentrální portál knihoven
Centrální portál knihoven
 
Jan Mach: Akademické výsledky na veřejnosti - hrozba či příležitost?
Jan Mach: Akademické výsledky na veřejnosti - hrozba či příležitost? Jan Mach: Akademické výsledky na veřejnosti - hrozba či příležitost?
Jan Mach: Akademické výsledky na veřejnosti - hrozba či příležitost?
 
Clanky.knihovna.cz
Clanky.knihovna.czClanky.knihovna.cz
Clanky.knihovna.cz
 

Plus de Europeana Newspapers

Presentation of Philippe Mezzasalma at the BnF Information Day in Paris
Presentation of Philippe Mezzasalma at the BnF Information Day in ParisPresentation of Philippe Mezzasalma at the BnF Information Day in Paris
Presentation of Philippe Mezzasalma at the BnF Information Day in ParisEuropeana Newspapers
 
Presentation of Ioannis Anagnostopoulos at BnF Information Day
Presentation of Ioannis Anagnostopoulos at BnF Information DayPresentation of Ioannis Anagnostopoulos at BnF Information Day
Presentation of Ioannis Anagnostopoulos at BnF Information DayEuropeana Newspapers
 
Presentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information DayPresentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information DayEuropeana Newspapers
 
Presentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information DayPresentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information DayEuropeana Newspapers
 
Présentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information DayPrésentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information DayEuropeana Newspapers
 
Presentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information DayPresentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information DayEuropeana Newspapers
 
IFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza AtanassovaIFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza AtanassovaEuropeana Newspapers
 
Europeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne KoutsEuropeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne KoutsEuropeana Newspapers
 
Europeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel VeimannEuropeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel VeimannEuropeana Newspapers
 
Europeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista KiisaEuropeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista KiisaEuropeana Newspapers
 
Europeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista AruEuropeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista AruEuropeana Newspapers
 
Europeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred PussEuropeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred PussEuropeana Newspapers
 
Europeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday NeudeckerEuropeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday NeudeckerEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday ThompsonEuropeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday ThompsonEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday RossiEuropeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday RossiEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday MuehlbergerEuropeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday MuehlbergerEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday MessinaEuropeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday MessinaEuropeana Newspapers
 
Europeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday MarchettiEuropeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday MarchettiEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Kempf
Europeana Newspapers LFT Infoday KempfEuropeana Newspapers LFT Infoday Kempf
Europeana Newspapers LFT Infoday KempfEuropeana Newspapers
 

Plus de Europeana Newspapers (20)

Presentation of Philippe Mezzasalma at the BnF Information Day in Paris
Presentation of Philippe Mezzasalma at the BnF Information Day in ParisPresentation of Philippe Mezzasalma at the BnF Information Day in Paris
Presentation of Philippe Mezzasalma at the BnF Information Day in Paris
 
Presentation of Ioannis Anagnostopoulos at BnF Information Day
Presentation of Ioannis Anagnostopoulos at BnF Information DayPresentation of Ioannis Anagnostopoulos at BnF Information Day
Presentation of Ioannis Anagnostopoulos at BnF Information Day
 
Presentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information DayPresentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information Day
 
Presentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information DayPresentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information Day
 
Présentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information DayPrésentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information Day
 
Presentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information DayPresentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information Day
 
IFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza AtanassovaIFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza Atanassova
 
Europeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne KoutsEuropeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne Kouts
 
Europeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel VeimannEuropeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel Veimann
 
Europeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista KiisaEuropeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista Kiisa
 
Europeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista AruEuropeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista Aru
 
Europeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred PussEuropeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred Puss
 
Europeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday NeudeckerEuropeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday Neudecker
 
Europeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday ThompsonEuropeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday Thompson
 
Europeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday RossiEuropeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday Rossi
 
Enp lft infoday_neudecker
Enp lft infoday_neudeckerEnp lft infoday_neudecker
Enp lft infoday_neudecker
 
Europeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday MuehlbergerEuropeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday Muehlberger
 
Europeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday MessinaEuropeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday Messina
 
Europeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday MarchettiEuropeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday Marchetti
 
Europeana Newspapers LFT Infoday Kempf
Europeana Newspapers LFT Infoday KempfEuropeana Newspapers LFT Infoday Kempf
Europeana Newspapers LFT Infoday Kempf
 

Projekt Europeana Newspapers - online brána k evropským historickým novinám

  • 1. Projekt Europeana Newspapers online brána k evropským historickým novinám Aleš Pekárek, Asociace evropských vědeckých knihoven (LIBER) Moravská zemská knihovna, Brno, 30.11.2012
  • 2. Obsah • Cíle a záměry projektu • Partnerské instituce • Oblasti projektových aktivit • Komunikace a diseminace projektu • Přidružení partneři projektu 2
  • 3. Proč zrovna noviny? „Noviny jsou bazarem dějin“ (Die Zeitungen sind der Sekundenzeiger der Geschichte) Arthur Schopenhauer „Noviny jsou jedním z nejpopulárnějších materiálů v naší knihovně, protože přímo přetékají informacemi a mají co říci širokému spektru našich návštěvníků. V rámci projektu dodáme do Europeany 2 milliony našich plně digitalizovaných stránek, čímž je zpřístupníme mnohem většímu okruhu uživatelů a v mnohem širším kontextu než doposud.“ Lily Knibbeler, Ředitelka Marketingu a Služeb Královské (Národní) knihovny Nizozemí V novinách si zkrátka každý něco najde! 3
  • 4. Cíle & Záměry 1) Výběr, Rafinace („refinement“) a Agregace obsahu • Učinit z Europeany největšího poskytovatele pan-evropské digitální sbírky novin • Dodání více než 18 million novinových stránek do Europeany, mnoho z nich společně s vyextrahovaným fulltextem (OCR, OLR, NER) 2) Analýza existujících digitálních novinových sbírek • Celoevropský průzkum 3) Kvalita & Doporučení nejlepší praxe • Vytvoření optimalizovaného workflow a infrastruktur pro agregaci dat • Doporučení nejlepších praxí pro pročištění, workflow, metadata a evaluačních nástrojů v oblasti digitalizace novinových sbírek 4) Prezentace obsahu a fulltextové vyhledávání • Vylepšený přístup k novinovým sbírkám v rámci Europeany (Content Browser) 4
  • 5. Projektové konsorcium & Stakeholdeři • 17 partnerů z 12 zemí • Národní knihovny – obsahoví a techničtí partneři • Univerzitní knihovny – převážně techničtí partneři • Malý a střední podnik (CCS – Content Conversion Specialists) • Externí partneři a stakeholdeři: • Zapojení knihoven vně projektového konsorcia • Celkový rámec: • Financováno jako Best Practice Network v programu ICT-PSP Evropské komise • Trvání projektu: Únor 2012 – Leden 2015 5
  • 6. Partneři projektu Europeana Newspapers NLE NLF LIBER TEL SUB HH NLL CCS USAL NLP BL SBB KB ONB NLT UIBK BnF UB LFT
  • 7. Partneři projektu 1. Staatsbibliothek zu Berlin 9. University of Salford (koordinátor projektu) 10. CCS Content Conversion 2. National Library of the Specialists GmbH Netherlands 11. Stichting LIBER 3. National Library of Estonia 12. National Library of Latvia 4. Österreichische 13. National Library of Turkey Nationalbibliothek 14. University Library of Belgrade 5. National Library of Finland 15. University of Innsbruck 6. Staats- und 16. Landesbibliothek Dr. Universitätsbibliothek Hamburg Friedrich Tessmann 7. Bibliothèque nationale de 17. The British Library France 8. National Library of Poland
  • 8. Struktura projektových aktivit (+ koordinátoři) • Work Package 1: Koordinace a řízení projektu • Berlin State Library (SBB) • Work Package 2: Výběr a rafinace digitalizovaných novin • National Library of the Netherlands (KB) • Work Package 3: Evaluace a hodnocení kvality výběru • University of Salford (USAL) • Work Package 4: Agregace a příprava novin pro Europeanu • The European Library (TEL) • Work Package 5: Doporučení „Best Practice“ v oblasti novinových metadat • University of Innsbruck (UIBK) • Work Package 6: Diseminace a zužitkování projektu • Association of European Research Libraries (LIBER)
  • 9. WP 1: Koordinace a řízení projektu • Administrace projektu • Řízení všech finančních a organizačních záležitostí • Finanční kontrola • Projektová komunikace • Sharepoint • Zajištění kvality projektu • monitoring, evaluace a reporting výsledků • Risk managament • Předcházení konfliktů v rámci konsorcia 
  • 10. WP 2: Rafinace digitalizovaných novin • Analýza obsahu a výběr vhodných souborů z digitálních novinových sbírek k “zušlechtění” (rafinaci) • Definice požadavků na minimální kvalitu digitalizovaných novin • Koordinace zušlechťování vybraného novinového obsahu – novin poskytnutých partnerskými institucemi • Doporučení nejlepších praxí v oblasti rafinace digitálních novinových sbírek
  • 11. WP2: Rafinace – OCR and OLR • 8 millionů stránek bude do Europeany naagregováno „tak jak jsou” ================================== • 10 millionů zrafinovaných stránek: CCS: Automatické rozpoznávání a OCR (UIBK, Rakousko) segmentace novinových Z toho: sloupků a článků 2 milliony: OCR/OLR (segmentace článků) (CCS, Německo) UIBK obohatí vyextrahovaný obsah strukturálními informacemi z její „Platformy porozumění dokumentům“, CCS pak informacemi o sloupcích, článcích; zoning; segmentace článků a jejich úrovní CCS zároveň poskytuje knihovnám technologii pro manuální korekci výsledných UIBK: Detekce titulků a poznámek; strukturálních informací Automatické generování obsahu
  • 12.
  • 13. WP 2: Rafinace – Rozpoznávání jmenných entit • KB dodala systém rozpoznávání jmenných entit (NER) (pro holandštinu, angličtinu a němčinu)
  • 14. WP 3: Evaluace a hodnocení kvality • Vytvoření uživatelských scénářů se vzorovými profily, datovými sadami, „ground truth“ a nástroji hodnocení kvality výstupů • Přehled faktorů využitelnosti, limitů a reálného potenciálu existujících vstupních materiálů • Identifikace kritických míst procesu společně s návrhem řešení • Evaluace jednotlivých aktivit procesu • Doporučení nejlepších praxí pro podobné post-digitalizační pojekty
  • 15. WP 4: Agregace a příprava pro Europeanu • Identifikace a analýza veřejných i soukromých zdigitalizovaných novinových sbírek napříč Evropou • Vytvoření reálného časového rámce agregace novinového obsahu • Vytvoření celoevropského registru digitalizovaných novinových sbírek • Doporučení, jak napasovat existující novinová metadata na EDM (standard Europeany) • Agregace novinových metadat partnerů projektu • Vytvoření fulltextového indexu novinového obsahu • Vývoj a spuštění prohlížeče obsahu (full-text + metadata + originálni skeny či náhledy
  • 16. WP 4: Agregace obsahu • Agregace 18 millionů digitalizovaných novinových stránek do služby Europeana prostřednictvím Evropské knihovny (jednotný portál evropských národních knihoven) www.europeana.eu • Transformace vstupních metadat na bázi EDM • Distribuce dat do Europeany (po jejich finální transformaci v rámci TEL) www.theeuropeanlibrary.org 16
  • 17. WP 4: Prezentace & Přístup k plným textům Funkce obsahového browseru: • Fulltextové vyhledávání, např. • podle klíčového slova, • podle jmenných entit • podle novinových sbírek • podle data vydání novin... • Prohlížení naskenovaných novinových stránek • Propojení s příbuzným obsahem nenovinového typu (fotky, hudba, pohlednice...)
  • 18. WP 5: Doporučení nejlepších praxí v oblasti metadat • Analýza novinových metadatových formátů používaných v evropských zemích • Propojení existujících metadatových modelů se standardem METS/ALTO a vydání doporučení nejlepších praxí • Použitelnost doporučení bude testováno v rámci specifického evaluačního cyklu
  • 19. Standard METS METS – Metadata Encoding and Transmission Standard  vznikl v roce 2001  otevřený na bázi XML  Připraven pro Digital Library Federation (DLF) Jerome McDonoughem a týmem METS  schéma hotováno LOC  udržováno redakční radou METS  Současná verze: 1.9
  • 20. Funkce METS  Popisuje zdigitalizovaný objekt  Tištěná media (kniha, noviny, časopis)  audio/video materiály  Umožňuje včlenění jiných druhů metadat  Popisná metadata (DC, MODS, MARC, Premis)  Technická metadata (Mix, …)  Možnost strukturálních informací  Fyzická struktura  Logická struktura  Umí odkazovat na jakýkoliv jiný digitální objekt  Obrázky  Audio / video streamy  Text  Externí metadatové objekty
  • 21. Standard ALTO ALTO – Analyzed Layout and Text Object  XML based open standard  Schema is hosted at LOC (Library of Congress)  Maintained by METS Editorial Board  Current version: 2.0
  • 22. WP 6: Komunikace a diseminace projektu • Cíle • Vytvoření celoevropské publicity • Větší používanost Europeany • Zajištění informovanosti cílových skupin • Úkoly 1. Komunikace v mediích 2. Workshopy a účast na konferencích • Tři hlavní diseminační workshopy (rafinace, agregace, závěrečný) • Národní informační dny (minimálně 10) • Rozšíření sítě o další partnery 3. Zužitkování výsledků projektu 22
  • 23. Hlavní komunikační kanály projektu WWW: http://www.europeana-newspapers.eu/ Twitter: @eurnews Facebook: https://www.facebook.com/EuropeanaNewspapers Newsletter: http://bit.ly/TsoMpY (najdete na webové stránce projektu) Slideshare: http://www.slideshare.net/Europeana_Newspapers 23
  • 24. Přidružení partneři projektu • Rozšíření sítě o tzv. Přidružené partnery projektu (nefinancované, nepřímé benefity z partnerství) • Možnost poskytnutí metadat digitálních novinových sbírek do Europeany v rámci procesů projektu  rapidní nárust návštěvníků • Využití a přístup k výsledkům projektu (doporučení, dokumentace, SW nástroje, metodika workflow) • Hlavně pro držitele obsahu • Většina identifikována v rámci průzkumu (40 vyplněných dotazníků, 35 potenciálních přidružených partnerů – o metodě výběru se stále diskutuje) • Za ČR zájem projevila NK ČR a MZK (i ostatní instituce s digitálními novinovými sbírkami jsou vítány) 24
  • 25. Děkuji za pozornost pekarek.ales@gmail.com www.europeana-newspapers.eu www.libereurope.eu