SlideShare une entreprise Scribd logo
1  sur  48
Télécharger pour lire hors ligne
Metadata a metadatové
standardy užívané v knihovnách
Pavla Švástová
Moravská zemská knihovna
28.3.2012 Univerzita Pardubice
Obsah
●Metadata a metadatová schémata
●Knihovnické metadatové standardy
●Výroba metadat v praxi – digitalizační
workflow
●Digitální knihovny
●Využití v praxi – zajímavé projekty
Moravská zemská knihovna
Metadata
data o datech ???
● tuto definici lze použít v případě, že chcete člověka ještě
více zmást :)
● vyjadřuje teoretickou podstatu, ALE:
● nepomůže pomoci pochopit, co to vlastně metadata jsou a
k čemu slouží
● jak se liší data a metadata?
Moravská zemská knihovna
Moravská zemská knihovna
Moravská zemská knihovna
Moravská zemská knihovna
Moravská zemská knihovna
Metadata
● „metadata is constructed, constructive and actionable“
(Understanding the Semantic Web: Bibliographic Data and Metadata,
Karen Coyle http://alatechsource.metapress.
com/content/p3022442071g7655)
● Constructed – metadata jsou uměle vytvořená, nenacházejí se v
přírodě, jsou nadstavbou nad něčím jiným, lidskou invencí
● Constructive – metadata jsou vytvářena cíleně, aby vyřešila nějaký
problém
● Actionable – cílem metadat je, aby byla smysluplně využita
Moravská zemská knihovna
Knihovní metadata
● knihovnictví je od počátků založeno na vytváření a využívání
metadat
● knihovní metadata řeší problém, jak se vyznat v rozsáhlejších
sbírkách dat
○ přírůstkové katalogy – seznam majetku knihovny
○ lískové katalogy (rozdělení dle autorů, názvů, témat, jazyků...)
● vznik schémat – jak popsat knihu? co zažívá knihovník při popisu
knížky?
● http://aleph.mzk.cz:80/F?
func=direct&doc_number=000059616&local_base=MZK01&format=
999
Moravská zemská knihovna
Knihovní metadata - vývoj
● původně vznikala fyzicky vyjádřená metadata o fyzických
dokumentech (kniha byla zkatalogizována a její metadata zapsána
na katalogizační lístek)
● nástup počítačového zápisu a zpracování fyzických knihovních
jednotek – MARC
● zdigitalizované dokumenty a born digital dokumenty – nové potřeby
možností popisu – DC, MODS, METS
Moravská zemská knihovna
Metadatové schéma
● soubor prvků určitého formátu, díky němuž lze metadata
zaznamenat a vytvořit jejich strukturu
● důležité je využívat mezinárodní standardy pro vyjádření a výměnu
a vytvořit metadatové schéma tak, aby bylo využitelné pokud
možno jednoznačně
● v syntaxi dnes jednoznačně vede XML
●specifikace formátu
●DTD
●jmenné tagy
Moravská zemská knihovna
Popisná metadata
● popisná = bibliografická = deskriptivní = ta klasická, co se využívají
odjakživa pro popis fyzických dokumentů uložených v knihovně
● popis dokumentů:
○ jmenný popis – autor, název, rok vydaní, nakladatel, ...
○ věcný popis – pokus o popis obsahu či tématu dokumentu –
určuje, kam je potom kniha v knihovně zařazena (předmětová
hesla, MDT, klíčová slova, atd.)
● rozdíly mezi popisem fyzických a digitálních dokumentů nejsou tak
dramatické
Moravská zemská knihovna
Popisná metadata
● MARC (Machine Readable Cataloguing – strojově čitelný – umožňuje
strojové zpracování a výměnu, MARC21, MARCXML)
● http://www.loc.gov/marc/
● příklad
● MODS (Metadata Object Description Schema)
● http://www.loc.gov/standards/mods/
● příklad
● DC (Dublin Core)
● http://dublincore.org/
● ESE – formát pro Europeanu
● TEI (Text Encoding Iniciative)
● http://www.tei-c.org/index.xml
● VRA CORE (Visual Record Association)
● http://www.loc.gov/standards/vracore/
Moravská zemská knihovna
MARC
● http://www.loc.gov/marc/
● Machine Readable Cataloguing – strojově čitelný – umožňuje strojové
zpracování a výměnu
● je vyvíjen jako standard pro výměnu katalogizačních záznamů od
poloviny 60.let Kongresovou knihovnou, další rozšíření nastalo v 70.
letech
● vzniklo mnoho tzv. národních formátů se základem MARC, později byl
vytvořen mezinárodní formát MARC 21 (v ČR přechod z UNIMARC v
roce 2004) (http://www.ikaros.cz/node/1761)
Moravská zemská knihovna
MARC 21 - struktura
● základem zápisu jsou tři prvky:
○ struktura záznamu
○ označení obsahu –
třímístné číselné kódy a
jejich podpole
○ obsah záznamu
(definován dalšími
standardy – ISBD, AACR2)
Moravská zemská knihovna
MARCXML
● MARC 21 ve formátu XML
● popisná metadata v digitálních knihovnách jsou
uchovávána ve formátu XML
● potřebný při konverzích mezi schématy
Moravská zemská knihovna
MARCXML
Moravská zemská knihovna
Dublin Core (DC)
● formát vznikl v roce 1995 z požadavků na minimální
univerzální popis dokumentu
● požadavky:
○ dostatečná jednoduchost
○ zároveň dostatečný rozsah, schopnost popsat zdroj detailně
○ možnost popisu prakticky jakéhokoliv zdroje
○ interoperabilita mezi dalšími formáty
● vznikl standard, který tvoří 15 základních metadat prvků
● rozšíření je možné na tzv. kvalifikovaný Dublin Core –
základem je DC, rozšíření záleží na tvůrci standardu
● http://dublincore.org/
● http://www.ics.muni.cz/dublin_core/
Moravská zemská knihovna
Dublin Core - prvky
Obsah:
● Název
● Předmět a klíčová
slova
● Popis
● Typ zdroje
● Zdroj
● Vztah
● Pokrytí
Intelektuální
vlastnictví:
● Tvůrce
● Vydavatel
● Přispěvatel
● Autorská práva
Zdroj:
● Datum
● Formát
● Identifikátor
● Jazyk
http://www.webarchiv.cz/generator/dc_generator.php
Moravská zemská knihovna
ESE
● Europeana Semantic Elements
● http://www.google.cz/url?
sa=t&source=web&cd=1&sqi=2&ved=0CBoQFjAA&url=http%3A%
2F%2Fwww.version1.europeana.eu%2Fc%2Fdocument_library%
2Fget_file%3Fuuid%3D104614b7-1ef3-4313-9578-
59da844e732f%26groupId%
3D10602&ei=XxT9TPvECYqhOpvT1NQK&usg=AFQjCNH7O6p69
YjatvJPytrjG-LUEmeaBQ
● metadatové schéma založené na Dublin Core pro publikování v
evropské digitální knihovně Europeana http://www.europeana.
eu/portal/
● standard obsahuje oproti DC několik prvků navíc (např. odkaz na
jeden nebo několik náhledů na digitalizovaný dokument)
Moravská zemská knihovna
Metadata Object Description Schema
(MODS)
● schéma bylo představeno v roce 2002 jako kompromis mezi
složitým popisem v MARC a nedostatečným popisem v DC
● důraz na popis digitálních zdrojů, ale lze jím popsat prakticky
jakýkoliv dokument
● XML – eXtensible Markup Language http://www.w3.org/XML/, http:
//www.w3schools.com/xml/default.asp
● interoperabilita s dalšími schématy
● využití v digitálních knihovnách
● http://www.loc.gov/standards/mods/
Moravská zemská knihovna
MODS - struktura
Moravská zemská knihovna
TEI – Text Encoding Iniciative
● TEI je konsorcium, které vyvíjí standardy pro reprezentaci textů v
digitální podobě
● http://www.tei-c.org/index.xml
● využívá se pro podrobný popis rukopisů, včetně přepisu plných
textů
● specifikace, která je využívána pro popis rukopisů nejen
bibliografický popis, obsahuje též popis struktury a počítá s
problematikou
● TEI P5, MASTER
● Manuscritorium - http://www.manuscriptorium.com/
Moravská zemská knihovna
VRA CORE
● http://www.loc.gov/standards/vracore/
● standard pro popis uměleckých předmětů, uměleckých objektů a
audiovizuálních dokumentů (včetně architektonických staveb, soch
a dalších 3D předmětů, obrazů, fotografií, filmů, atd.)
● http://www.archivision.com/outgoing/vracore4/examplesindex.html
Moravská zemská knihovna
Technická metadata
● týkají se spíše digitalizovaných / digitálních dokumentů
● obsahují informace např. o:
○ použitých softwarových nástrojích a jejich verzích (není .doc jako .
doc), hardwarových nástrojích (typ skeneru), obrazových souborech
(formát a jeho specifikace, rozlišení, velikost obrázku, barevnost...),
kódování, kompatibilitě...
● MIX (Metadata for Images in XML)
○ http://www.loc.gov/standards/mix/
○ příklad
● ALTO (Analyzed Layout and Text Object)
○ http://www.loc.gov/standards/alto/
○ příklad
Moravská zemská knihovna
MIX
●informace o obrazových souborech
Moravská zemská knihovna
ALTO
● http://www.loc.gov/standards/alto/
● standard pro ukládání informací o vzhledu a
obsahu digitalizovaného dokumentu ve formátu
XML
● „nadstavba“ nad OCR, které v tomto případě
není pouze .txt
● určuje pozici slov, řádků i odstavců na stránce s
přesností na desetinu milimetru
● zaznamenává typ a velikost písma
Moravská zemská knihovna
ALTO - příklad
Moravská zemská knihovna
ALTO - použití
● možnost vygenerování obrázku pouze z xml
souboru (záleží na kvalitě OCR, jak to bude
potom čitelné :)
● rozdělení na články
● odlišení obrázků, textu a bílého místa na
stránce
● opravy OCR - http://trove.nla.gov.
au/newspaper
● projekt Impact
● další?
Moravská zemská knihovna
Administrativní a autorsko-právní
metadata
● autorsko-právní otázky – kdo vlastní práva k
dokumentu, kdy bude volně přístupný, za jakých
podmínek apod.
● prezervační funkce – co se s dokumentem děje za
celou jeho kariéru od vzniku až po zpřístupnění –
konverze do nových verzí či jiných formátů
● PREMIS (The Preservation Metadata Implementation
Strategies)
○ http://www.loc.gov/standards/premis/
○ příklad
Moravská zemská knihovna
PREMIS – The Preservation Metadata
Implementation Strategies
● http://www.loc.gov/standards/premis/
● formát vznikl za účelem ochrany a
dlouhodobého uchování dokumentů
Moravská zemská knihovna
PREMIS - struktura
● http://www.rinascimento-digitale.it/eventi/premis/premis-
tutorial/Premis-pt1.pdf
● intelektuální entita (kniha, fotka, webová stránka, mapa, databáze...)
● objekt (kapitola knihy v pdf, fotka v tiff, html soubor...)
● událost (validace souboru, transformace, konverze, migrace...)
● agent (autor, instituce, program...)
● autorská práva (copyright, licence, další...)
Moravská zemská knihovna
PREMIS
Moravská zemská knihovna
Strukturální metadata
● digitální objekty tvoří souhrn dat a metadat, které je
potřeba logicky provázat
● př. naskenovanou a metadaty opatřenou knihu tvoří:
○ soubor obrázků v různé kvalitě a různých formátech
○ xml soubor bibliografických metadat ve formátu MODS
○ xml soubor technických metadat ve formátu MIX
○ xml soubor administrativních metadat ve formátu PREMIS
○ xml soubor OCR ve formátu ALTO
● METS (Metadata Encoding and Transmission Standard)
● http://www.loc.gov/standards/mets/
● příklad
Moravská zemská knihovna
METS – Metadata Encoding and
Transmission Standard
● http://www.loc.gov/standards/mets/
● kontejnerový formát pro uchování a výměnu
metadat v digitálních knihovnách založený na
XML
● určuje strukturu dokumentu
● provazuje všechny typy metadat v jeden
složený objekt
Moravská zemská knihovna
METS - struktura
● může obsahovat 5 sekcí:
○ metsHdr - hlavička
○ dmdSec - popisná metadata
○ admSec - administrativní metadata
○ fileSec – objekty, soubory
○ structMap – strukturální mapa
○ behaviourSec – chování dle obsahu
● nemusí být použity všechny sekce
● každá sekce může obsahovat další typy
metadat nebo na ně odkazovat
Moravská zemská knihovna
Konec teorie ☺
Teď k praxi…
Moravská zemská knihovna
Digitalizace – kdy která metadata
vznikají?
Digitalizační workflow
výběr a příprava dokumentu
skenování a úprava obrázků
metadatový popis a identifikátory
publikování v digitální knihovně
dlouhodobá archivace
Metadatový popis
popisná metadata
technická metadata
administrativní a autorsko-
právní metadata
strukturální metadata
●Ve které fázi digitalizace vznikají která
metadata?
Moravská zemská knihovna
Výroba metadat – metadatové editory
● většina metadat je generovaná automaticky –
software je vyrábí automaticky dle nastavení
v požadovaném formátu
● některá je třeba ručně dodělat – popřípadě
opravit špatně vygenerovaná, zkonvertovaná
apod.
● editor3.mzk.cz
Moravská zemská knihovna
Projekty
Moravská zemská knihovna
Kramerius 4
● digitální knihovna
● vývoj: NK, KNAV, MZK
● kramerius.mzk.cz
● novinky a plány:
○ virtuální sbírky a kolekce
○ uživatelské účty (možnost
tvořit si osobní kolekce)
○ vylepšení GUI
○ lepší statistiky pro
administrátory
● vývoj
● příklad
Moravská zemská knihovna
Registr digitalizace
● zabránění duplicit při
digitalizaci
● najdu zde centrálně to,
co je digitalizované
● workflow digitalizace
● www.registrdigitalizace.cz
● vývoj
Moravská zemská knihovna
Europeana
● cílem projektu je agregovat veškeré
zdigitalizované kulturní dědictví z celé Evropy
a jednotně zpřístupnit
● www.europeana.eu
Moravská zemská knihovna
Trove – Národní knihovna austrálie
● kolaborativní opravy OCR u
starých novin a časopisů
● zapojení široké veřejnosti do
činnosti knihovny
● trove.nla.au/newspaper
● www.nla.gov.au/ndp/
● info o projektu
Moravská zemská knihovna
Impact
●cílem projektu je zlepšit kvalitu OCR a tak
umožnit lepší vyhledávání v dokumentech
●http://www.impact-project.eu/home/
●video
Moravská zemská knihovna
What is on the menu?
● projekt NYPL
● knihovna zdigitalizovala na 12tis. obědových menu
● přepis jídelních lístků
● menus.nypl.or
Moravská zemská knihovna
Digitalkoot – Národní finská knihovna
● historická periodika
● hraním hry opravujeme
OCR
● přihlášení přes facebook
● www.digitalkoot.fi/en
● hra
Moravská zemská knihovna v Brně
www.mzk.cz
Děkuji za pozornost
Pavla Švástová
pavla.svastova@gmail.com

Contenu connexe

Similaire à Metadata a metadatové standardy užívané v knihovnách

5. 3. O Digitalizace A Vedecke Digitalni Knihovny Martin Lhotak
5. 3. O Digitalizace A  Vedecke  Digitalni Knihovny  Martin Lhotak5. 3. O Digitalizace A  Vedecke  Digitalni Knihovny  Martin Lhotak
5. 3. O Digitalizace A Vedecke Digitalni Knihovny Martin Lhotak
KISK FF MU
 
Ceska digitalni knihovna
Ceska digitalni knihovnaCeska digitalni knihovna
Ceska digitalni knihovna
martinlhotak
 
Ondra Kučera: Otevřený web a jeho současný stav
Ondra Kučera: Otevřený web a jeho současný stavOndra Kučera: Otevřený web a jeho současný stav
Ondra Kučera: Otevřený web a jeho současný stav
Tomáš Holas
 

Similaire à Metadata a metadatové standardy užívané v knihovnách (20)

5. 3. O Digitalizace A Vedecke Digitalni Knihovny Martin Lhotak
5. 3. O Digitalizace A  Vedecke  Digitalni Knihovny  Martin Lhotak5. 3. O Digitalizace A  Vedecke  Digitalni Knihovny  Martin Lhotak
5. 3. O Digitalizace A Vedecke Digitalni Knihovny Martin Lhotak
 
Linked data (nejen) v knihovnách
Linked data (nejen) v knihovnáchLinked data (nejen) v knihovnách
Linked data (nejen) v knihovnách
 
TNPW2-2013-10
TNPW2-2013-10TNPW2-2013-10
TNPW2-2013-10
 
TNPW2-2012-09
TNPW2-2012-09TNPW2-2012-09
TNPW2-2012-09
 
05 Standardy a nástroje.pptx
05 Standardy a nástroje.pptx05 Standardy a nástroje.pptx
05 Standardy a nástroje.pptx
 
Miroslav Bartošek: Česká digitální matematická knihovna (Nominované projekty ...
Miroslav Bartošek: Česká digitální matematická knihovna (Nominované projekty ...Miroslav Bartošek: Česká digitální matematická knihovna (Nominované projekty ...
Miroslav Bartošek: Česká digitální matematická knihovna (Nominované projekty ...
 
Šárka Hálečková a Tomáš Burda - Řešení pro dlouhodobou archivaci v Národní kn...
Šárka Hálečková a Tomáš Burda - Řešení pro dlouhodobou archivaci v Národní kn...Šárka Hálečková a Tomáš Burda - Řešení pro dlouhodobou archivaci v Národní kn...
Šárka Hálečková a Tomáš Burda - Řešení pro dlouhodobou archivaci v Národní kn...
 
Ceska digitalni knihovna
Ceska digitalni knihovnaCeska digitalni knihovna
Ceska digitalni knihovna
 
Změny v Národním stadnardu a jejich dopad na původce i dodavatele
Změny v Národním stadnardu a jejich dopad na původce i dodavateleZměny v Národním stadnardu a jejich dopad na původce i dodavatele
Změny v Národním stadnardu a jejich dopad na původce i dodavatele
 
Ondra Kučera: Otevřený web a jeho současný stav
Ondra Kučera: Otevřený web a jeho současný stavOndra Kučera: Otevřený web a jeho současný stav
Ondra Kučera: Otevřený web a jeho současný stav
 
Matedatový sklad
Matedatový skladMatedatový sklad
Matedatový sklad
 
NoSQL databáze, MongoDB
NoSQL databáze, MongoDBNoSQL databáze, MongoDB
NoSQL databáze, MongoDB
 
Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek
Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek
Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek
 
Martin Lhoták - Projektový záměr ArcLib
Martin Lhoták - Projektový záměr ArcLibMartin Lhoták - Projektový záměr ArcLib
Martin Lhoták - Projektový záměr ArcLib
 
Databáze v genetice, sekvenování nové generace, bioinformatika
Databáze v genetice, sekvenování nové generace, bioinformatikaDatabáze v genetice, sekvenování nové generace, bioinformatika
Databáze v genetice, sekvenování nové generace, bioinformatika
 
Zkušenosti se systémem Archivematica
Zkušenosti se systémem ArchivematicaZkušenosti se systémem Archivematica
Zkušenosti se systémem Archivematica
 
Marek Melichar - Zkušenosti se systémem Archivematica
Marek Melichar - Zkušenosti se systémem ArchivematicaMarek Melichar - Zkušenosti se systémem Archivematica
Marek Melichar - Zkušenosti se systémem Archivematica
 
Závěrečný úkol KPI
Závěrečný  úkol KPIZávěrečný  úkol KPI
Závěrečný úkol KPI
 
Webové technologie
Webové technologieWebové technologie
Webové technologie
 
TNPW2-2011-09
TNPW2-2011-09TNPW2-2011-09
TNPW2-2011-09
 

Plus de MoravskaZemskaKnihovna

Issues and Challenges of Audio Heritage Preservation in Czech Memory Institut...
Issues and Challenges of Audio Heritage Preservation in Czech Memory Institut...Issues and Challenges of Audio Heritage Preservation in Czech Memory Institut...
Issues and Challenges of Audio Heritage Preservation in Czech Memory Institut...
MoravskaZemskaKnihovna
 
Virtualní národní fonotéka - jeden portál, dvě země, společné řešení.
Virtualní národní fonotéka - jeden portál, dvě země, společné řešení.Virtualní národní fonotéka - jeden portál, dvě země, společné řešení.
Virtualní národní fonotéka - jeden portál, dvě země, společné řešení.
MoravskaZemskaKnihovna
 
Terénními projekty k portálu pro zvukové dokumenty. zn. Spěchá.
Terénními projekty k portálu pro zvukové dokumenty. zn. Spěchá.Terénními projekty k portálu pro zvukové dokumenty. zn. Spěchá.
Terénními projekty k portálu pro zvukové dokumenty. zn. Spěchá.
MoravskaZemskaKnihovna
 

Plus de MoravskaZemskaKnihovna (20)

Issues and Challenges of Audio Heritage Preservation in Czech Memory Institut...
Issues and Challenges of Audio Heritage Preservation in Czech Memory Institut...Issues and Challenges of Audio Heritage Preservation in Czech Memory Institut...
Issues and Challenges of Audio Heritage Preservation in Czech Memory Institut...
 
Virtuální národní fonotéka – Sektorový agregátor pro zvukové dokumenty ČR.
Virtuální národní fonotéka – Sektorový agregátor pro zvukové dokumenty ČR.Virtuální národní fonotéka – Sektorový agregátor pro zvukové dokumenty ČR.
Virtuální národní fonotéka – Sektorový agregátor pro zvukové dokumenty ČR.
 
Virtualní národní fonotéka - jeden portál, dvě země, společné řešení.
Virtualní národní fonotéka - jeden portál, dvě země, společné řešení.Virtualní národní fonotéka - jeden portál, dvě země, společné řešení.
Virtualní národní fonotéka - jeden portál, dvě země, společné řešení.
 
Kramerius do kapsy?
Kramerius do kapsy?Kramerius do kapsy?
Kramerius do kapsy?
 
Terénními projekty k portálu pro zvukové dokumenty. zn. Spěchá.
Terénními projekty k portálu pro zvukové dokumenty. zn. Spěchá.Terénními projekty k portálu pro zvukové dokumenty. zn. Spěchá.
Terénními projekty k portálu pro zvukové dokumenty. zn. Spěchá.
 
Digitální knihovna Kramerius a její mobilní aplikace
Digitální knihovna Kramerius a její mobilní aplikaceDigitální knihovna Kramerius a její mobilní aplikace
Digitální knihovna Kramerius a její mobilní aplikace
 
Digi 2015
Digi 2015Digi 2015
Digi 2015
 
LTP-workshop
LTP-workshopLTP-workshop
LTP-workshop
 
IASA 2015: Virtuální národní fonotéka
IASA 2015: Virtuální národní fonotékaIASA 2015: Virtuální národní fonotéka
IASA 2015: Virtuální národní fonotéka
 
Google aplikace ve službách knihovny
Google aplikace ve službách knihovnyGoogle aplikace ve službách knihovny
Google aplikace ve službách knihovny
 
Knihovny.cz
Knihovny.czKnihovny.cz
Knihovny.cz
 
Centrální portál knihoven
Centrální portál knihovenCentrální portál knihoven
Centrální portál knihoven
 
Old maps in Moravian Library
Old maps in Moravian LibraryOld maps in Moravian Library
Old maps in Moravian Library
 
Virtuální národní fonotéka – Sektorový agregátor pro zvukové dokumenty ČR
Virtuální národní fonotéka – Sektorový agregátor pro zvukové dokumenty ČRVirtuální národní fonotéka – Sektorový agregátor pro zvukové dokumenty ČR
Virtuální národní fonotéka – Sektorový agregátor pro zvukové dokumenty ČR
 
Staremapy.cz jako národní agregátor pro Oldmapsonline
Staremapy.cz jako národní agregátor pro OldmapsonlineStaremapy.cz jako národní agregátor pro Oldmapsonline
Staremapy.cz jako národní agregátor pro Oldmapsonline
 
StaréMapy.cz (TEMAP)
StaréMapy.cz (TEMAP)StaréMapy.cz (TEMAP)
StaréMapy.cz (TEMAP)
 
Rekvalifikační kurz MZK - sociální sítě
Rekvalifikační kurz MZK - sociální sítěRekvalifikační kurz MZK - sociální sítě
Rekvalifikační kurz MZK - sociální sítě
 
10 things about moravian library
10 things about moravian library 10 things about moravian library
10 things about moravian library
 
Historiographie bei den Benediktinern in Raigern – Unterschiede in der histor...
Historiographie bei den Benediktinern in Raigern – Unterschiede in der histor...Historiographie bei den Benediktinern in Raigern – Unterschiede in der histor...
Historiographie bei den Benediktinern in Raigern – Unterschiede in der histor...
 
Romana Macháčková - Rajhradský klášter jako kulturní instituce dnes
Romana Macháčková - Rajhradský klášter jako kulturní instituce dnesRomana Macháčková - Rajhradský klášter jako kulturní instituce dnes
Romana Macháčková - Rajhradský klášter jako kulturní instituce dnes
 

Metadata a metadatové standardy užívané v knihovnách

  • 1. Metadata a metadatové standardy užívané v knihovnách Pavla Švástová Moravská zemská knihovna 28.3.2012 Univerzita Pardubice
  • 2. Obsah ●Metadata a metadatová schémata ●Knihovnické metadatové standardy ●Výroba metadat v praxi – digitalizační workflow ●Digitální knihovny ●Využití v praxi – zajímavé projekty
  • 3. Moravská zemská knihovna Metadata data o datech ??? ● tuto definici lze použít v případě, že chcete člověka ještě více zmást :) ● vyjadřuje teoretickou podstatu, ALE: ● nepomůže pomoci pochopit, co to vlastně metadata jsou a k čemu slouží ● jak se liší data a metadata?
  • 8. Moravská zemská knihovna Metadata ● „metadata is constructed, constructive and actionable“ (Understanding the Semantic Web: Bibliographic Data and Metadata, Karen Coyle http://alatechsource.metapress. com/content/p3022442071g7655) ● Constructed – metadata jsou uměle vytvořená, nenacházejí se v přírodě, jsou nadstavbou nad něčím jiným, lidskou invencí ● Constructive – metadata jsou vytvářena cíleně, aby vyřešila nějaký problém ● Actionable – cílem metadat je, aby byla smysluplně využita
  • 9. Moravská zemská knihovna Knihovní metadata ● knihovnictví je od počátků založeno na vytváření a využívání metadat ● knihovní metadata řeší problém, jak se vyznat v rozsáhlejších sbírkách dat ○ přírůstkové katalogy – seznam majetku knihovny ○ lískové katalogy (rozdělení dle autorů, názvů, témat, jazyků...) ● vznik schémat – jak popsat knihu? co zažívá knihovník při popisu knížky? ● http://aleph.mzk.cz:80/F? func=direct&doc_number=000059616&local_base=MZK01&format= 999
  • 10. Moravská zemská knihovna Knihovní metadata - vývoj ● původně vznikala fyzicky vyjádřená metadata o fyzických dokumentech (kniha byla zkatalogizována a její metadata zapsána na katalogizační lístek) ● nástup počítačového zápisu a zpracování fyzických knihovních jednotek – MARC ● zdigitalizované dokumenty a born digital dokumenty – nové potřeby možností popisu – DC, MODS, METS
  • 11. Moravská zemská knihovna Metadatové schéma ● soubor prvků určitého formátu, díky němuž lze metadata zaznamenat a vytvořit jejich strukturu ● důležité je využívat mezinárodní standardy pro vyjádření a výměnu a vytvořit metadatové schéma tak, aby bylo využitelné pokud možno jednoznačně ● v syntaxi dnes jednoznačně vede XML ●specifikace formátu ●DTD ●jmenné tagy
  • 12. Moravská zemská knihovna Popisná metadata ● popisná = bibliografická = deskriptivní = ta klasická, co se využívají odjakživa pro popis fyzických dokumentů uložených v knihovně ● popis dokumentů: ○ jmenný popis – autor, název, rok vydaní, nakladatel, ... ○ věcný popis – pokus o popis obsahu či tématu dokumentu – určuje, kam je potom kniha v knihovně zařazena (předmětová hesla, MDT, klíčová slova, atd.) ● rozdíly mezi popisem fyzických a digitálních dokumentů nejsou tak dramatické
  • 13. Moravská zemská knihovna Popisná metadata ● MARC (Machine Readable Cataloguing – strojově čitelný – umožňuje strojové zpracování a výměnu, MARC21, MARCXML) ● http://www.loc.gov/marc/ ● příklad ● MODS (Metadata Object Description Schema) ● http://www.loc.gov/standards/mods/ ● příklad ● DC (Dublin Core) ● http://dublincore.org/ ● ESE – formát pro Europeanu ● TEI (Text Encoding Iniciative) ● http://www.tei-c.org/index.xml ● VRA CORE (Visual Record Association) ● http://www.loc.gov/standards/vracore/
  • 14. Moravská zemská knihovna MARC ● http://www.loc.gov/marc/ ● Machine Readable Cataloguing – strojově čitelný – umožňuje strojové zpracování a výměnu ● je vyvíjen jako standard pro výměnu katalogizačních záznamů od poloviny 60.let Kongresovou knihovnou, další rozšíření nastalo v 70. letech ● vzniklo mnoho tzv. národních formátů se základem MARC, později byl vytvořen mezinárodní formát MARC 21 (v ČR přechod z UNIMARC v roce 2004) (http://www.ikaros.cz/node/1761)
  • 15. Moravská zemská knihovna MARC 21 - struktura ● základem zápisu jsou tři prvky: ○ struktura záznamu ○ označení obsahu – třímístné číselné kódy a jejich podpole ○ obsah záznamu (definován dalšími standardy – ISBD, AACR2)
  • 16. Moravská zemská knihovna MARCXML ● MARC 21 ve formátu XML ● popisná metadata v digitálních knihovnách jsou uchovávána ve formátu XML ● potřebný při konverzích mezi schématy
  • 18. Moravská zemská knihovna Dublin Core (DC) ● formát vznikl v roce 1995 z požadavků na minimální univerzální popis dokumentu ● požadavky: ○ dostatečná jednoduchost ○ zároveň dostatečný rozsah, schopnost popsat zdroj detailně ○ možnost popisu prakticky jakéhokoliv zdroje ○ interoperabilita mezi dalšími formáty ● vznikl standard, který tvoří 15 základních metadat prvků ● rozšíření je možné na tzv. kvalifikovaný Dublin Core – základem je DC, rozšíření záleží na tvůrci standardu ● http://dublincore.org/ ● http://www.ics.muni.cz/dublin_core/
  • 19. Moravská zemská knihovna Dublin Core - prvky Obsah: ● Název ● Předmět a klíčová slova ● Popis ● Typ zdroje ● Zdroj ● Vztah ● Pokrytí Intelektuální vlastnictví: ● Tvůrce ● Vydavatel ● Přispěvatel ● Autorská práva Zdroj: ● Datum ● Formát ● Identifikátor ● Jazyk http://www.webarchiv.cz/generator/dc_generator.php
  • 20. Moravská zemská knihovna ESE ● Europeana Semantic Elements ● http://www.google.cz/url? sa=t&source=web&cd=1&sqi=2&ved=0CBoQFjAA&url=http%3A% 2F%2Fwww.version1.europeana.eu%2Fc%2Fdocument_library% 2Fget_file%3Fuuid%3D104614b7-1ef3-4313-9578- 59da844e732f%26groupId% 3D10602&ei=XxT9TPvECYqhOpvT1NQK&usg=AFQjCNH7O6p69 YjatvJPytrjG-LUEmeaBQ ● metadatové schéma založené na Dublin Core pro publikování v evropské digitální knihovně Europeana http://www.europeana. eu/portal/ ● standard obsahuje oproti DC několik prvků navíc (např. odkaz na jeden nebo několik náhledů na digitalizovaný dokument)
  • 21. Moravská zemská knihovna Metadata Object Description Schema (MODS) ● schéma bylo představeno v roce 2002 jako kompromis mezi složitým popisem v MARC a nedostatečným popisem v DC ● důraz na popis digitálních zdrojů, ale lze jím popsat prakticky jakýkoliv dokument ● XML – eXtensible Markup Language http://www.w3.org/XML/, http: //www.w3schools.com/xml/default.asp ● interoperabilita s dalšími schématy ● využití v digitálních knihovnách ● http://www.loc.gov/standards/mods/
  • 23. Moravská zemská knihovna TEI – Text Encoding Iniciative ● TEI je konsorcium, které vyvíjí standardy pro reprezentaci textů v digitální podobě ● http://www.tei-c.org/index.xml ● využívá se pro podrobný popis rukopisů, včetně přepisu plných textů ● specifikace, která je využívána pro popis rukopisů nejen bibliografický popis, obsahuje též popis struktury a počítá s problematikou ● TEI P5, MASTER ● Manuscritorium - http://www.manuscriptorium.com/
  • 24. Moravská zemská knihovna VRA CORE ● http://www.loc.gov/standards/vracore/ ● standard pro popis uměleckých předmětů, uměleckých objektů a audiovizuálních dokumentů (včetně architektonických staveb, soch a dalších 3D předmětů, obrazů, fotografií, filmů, atd.) ● http://www.archivision.com/outgoing/vracore4/examplesindex.html
  • 25. Moravská zemská knihovna Technická metadata ● týkají se spíše digitalizovaných / digitálních dokumentů ● obsahují informace např. o: ○ použitých softwarových nástrojích a jejich verzích (není .doc jako . doc), hardwarových nástrojích (typ skeneru), obrazových souborech (formát a jeho specifikace, rozlišení, velikost obrázku, barevnost...), kódování, kompatibilitě... ● MIX (Metadata for Images in XML) ○ http://www.loc.gov/standards/mix/ ○ příklad ● ALTO (Analyzed Layout and Text Object) ○ http://www.loc.gov/standards/alto/ ○ příklad
  • 27. Moravská zemská knihovna ALTO ● http://www.loc.gov/standards/alto/ ● standard pro ukládání informací o vzhledu a obsahu digitalizovaného dokumentu ve formátu XML ● „nadstavba“ nad OCR, které v tomto případě není pouze .txt ● určuje pozici slov, řádků i odstavců na stránce s přesností na desetinu milimetru ● zaznamenává typ a velikost písma
  • 29. Moravská zemská knihovna ALTO - použití ● možnost vygenerování obrázku pouze z xml souboru (záleží na kvalitě OCR, jak to bude potom čitelné :) ● rozdělení na články ● odlišení obrázků, textu a bílého místa na stránce ● opravy OCR - http://trove.nla.gov. au/newspaper ● projekt Impact ● další?
  • 30. Moravská zemská knihovna Administrativní a autorsko-právní metadata ● autorsko-právní otázky – kdo vlastní práva k dokumentu, kdy bude volně přístupný, za jakých podmínek apod. ● prezervační funkce – co se s dokumentem děje za celou jeho kariéru od vzniku až po zpřístupnění – konverze do nových verzí či jiných formátů ● PREMIS (The Preservation Metadata Implementation Strategies) ○ http://www.loc.gov/standards/premis/ ○ příklad
  • 31. Moravská zemská knihovna PREMIS – The Preservation Metadata Implementation Strategies ● http://www.loc.gov/standards/premis/ ● formát vznikl za účelem ochrany a dlouhodobého uchování dokumentů
  • 32. Moravská zemská knihovna PREMIS - struktura ● http://www.rinascimento-digitale.it/eventi/premis/premis- tutorial/Premis-pt1.pdf ● intelektuální entita (kniha, fotka, webová stránka, mapa, databáze...) ● objekt (kapitola knihy v pdf, fotka v tiff, html soubor...) ● událost (validace souboru, transformace, konverze, migrace...) ● agent (autor, instituce, program...) ● autorská práva (copyright, licence, další...)
  • 34. Moravská zemská knihovna Strukturální metadata ● digitální objekty tvoří souhrn dat a metadat, které je potřeba logicky provázat ● př. naskenovanou a metadaty opatřenou knihu tvoří: ○ soubor obrázků v různé kvalitě a různých formátech ○ xml soubor bibliografických metadat ve formátu MODS ○ xml soubor technických metadat ve formátu MIX ○ xml soubor administrativních metadat ve formátu PREMIS ○ xml soubor OCR ve formátu ALTO ● METS (Metadata Encoding and Transmission Standard) ● http://www.loc.gov/standards/mets/ ● příklad
  • 35. Moravská zemská knihovna METS – Metadata Encoding and Transmission Standard ● http://www.loc.gov/standards/mets/ ● kontejnerový formát pro uchování a výměnu metadat v digitálních knihovnách založený na XML ● určuje strukturu dokumentu ● provazuje všechny typy metadat v jeden složený objekt
  • 36. Moravská zemská knihovna METS - struktura ● může obsahovat 5 sekcí: ○ metsHdr - hlavička ○ dmdSec - popisná metadata ○ admSec - administrativní metadata ○ fileSec – objekty, soubory ○ structMap – strukturální mapa ○ behaviourSec – chování dle obsahu ● nemusí být použity všechny sekce ● každá sekce může obsahovat další typy metadat nebo na ně odkazovat
  • 37. Moravská zemská knihovna Konec teorie ☺ Teď k praxi…
  • 38. Moravská zemská knihovna Digitalizace – kdy která metadata vznikají? Digitalizační workflow výběr a příprava dokumentu skenování a úprava obrázků metadatový popis a identifikátory publikování v digitální knihovně dlouhodobá archivace Metadatový popis popisná metadata technická metadata administrativní a autorsko- právní metadata strukturální metadata ●Ve které fázi digitalizace vznikají která metadata?
  • 39. Moravská zemská knihovna Výroba metadat – metadatové editory ● většina metadat je generovaná automaticky – software je vyrábí automaticky dle nastavení v požadovaném formátu ● některá je třeba ručně dodělat – popřípadě opravit špatně vygenerovaná, zkonvertovaná apod. ● editor3.mzk.cz
  • 41. Moravská zemská knihovna Kramerius 4 ● digitální knihovna ● vývoj: NK, KNAV, MZK ● kramerius.mzk.cz ● novinky a plány: ○ virtuální sbírky a kolekce ○ uživatelské účty (možnost tvořit si osobní kolekce) ○ vylepšení GUI ○ lepší statistiky pro administrátory ● vývoj ● příklad
  • 42. Moravská zemská knihovna Registr digitalizace ● zabránění duplicit při digitalizaci ● najdu zde centrálně to, co je digitalizované ● workflow digitalizace ● www.registrdigitalizace.cz ● vývoj
  • 43. Moravská zemská knihovna Europeana ● cílem projektu je agregovat veškeré zdigitalizované kulturní dědictví z celé Evropy a jednotně zpřístupnit ● www.europeana.eu
  • 44. Moravská zemská knihovna Trove – Národní knihovna austrálie ● kolaborativní opravy OCR u starých novin a časopisů ● zapojení široké veřejnosti do činnosti knihovny ● trove.nla.au/newspaper ● www.nla.gov.au/ndp/ ● info o projektu
  • 45. Moravská zemská knihovna Impact ●cílem projektu je zlepšit kvalitu OCR a tak umožnit lepší vyhledávání v dokumentech ●http://www.impact-project.eu/home/ ●video
  • 46. Moravská zemská knihovna What is on the menu? ● projekt NYPL ● knihovna zdigitalizovala na 12tis. obědových menu ● přepis jídelních lístků ● menus.nypl.or
  • 47. Moravská zemská knihovna Digitalkoot – Národní finská knihovna ● historická periodika ● hraním hry opravujeme OCR ● přihlášení přes facebook ● www.digitalkoot.fi/en ● hra
  • 48. Moravská zemská knihovna v Brně www.mzk.cz Děkuji za pozornost Pavla Švástová pavla.svastova@gmail.com