Prezentace představuje základní standardy v oblasti LTP a certifikaci důvěryhodného digitálního úložiště a následně porovnává shodu systému Archivematicy s normou OAIS.
2. WG Standardy
OBSAH
1. Činnost WG Standardy
2. Výstupy pracovní skupiny
3. Standardy, audit a certifikace
4. Archivematica vs. OAIS
3. WG Standardy
Činnost WG Standardy
• spolupráce s jinými WG (WG Use Cases, WG kurátoři - praktické zkušenosti s
Archivematicou, WG Publicita – výstupy)
• zmapování standardů, které se přímo či nepřímo dotýkají úložišť
• podrobná analýza ČSN ISO 14721:2012 ve vztahu k deklarovaným a
testovaným funkcím systému Archivematica
• překlad Technology Watch Reports od B.Lavoie: „The Open Archival
Information System (OAIS) Reference Model: Introductory Guide“
4. WG Standardy
Výstupy pracovní skupiny
• Překlad studie B.Lavoie: „The Open Archival Information System (OAIS)
Reference Model: Introductory Guide“ Digital Preservation Coalition –
Technology Watch Reports
• publikování jako oficiální český překlad (2016)
• Seznam nejdůležitějších standardů, metodik a dokumentů pro LTP
• Seznam kritérií ČSN ISO16363, které je možné podchytit LTP systémem
• B4 Důvěryhodná dlouhodobá úložiště (časopis Knihovna – prosinec 2015)
• B7 Orientace v terénu LTP a přehled standardů
• C6 Archivematica z pohledy normy OAIS
5. 2.5 WG Standardy a normy
Standardy, audit a certifikace
• Evropský rámec pro audit a certifikaci repozitářů
• Základní certifikace: dána repozitářům, jež splní podmínky auditu Data
Seal of Approval (http://datasealofapproval.org/en/).
• Rozšířená certifikace: splněna na základě pečetě Data Seal of Approval a
interního „samo-auditu“ podle norem ISO 16363 nebo DIN 31644 (viz jejich
popis níže v textu), přičemž o výsledcích tohoto „samo-auditu“ musí
úložiště veřejně informovat.
• Formální certifikace: naplněna v případě, kdy kromě základní certifikace
získá úložiště i certifikaci na základě kompletního auditu (externími
auditory) podle normy ISO 16363 nebo rovnocenné německé normy DIN
31644.
6. 2.5 WG Standardy a normy
Standardy, audit a certifikace #2
• Data Seal of Approval
• dostupné i v českém překladu na stránkách Univerzity Karlovy v Praze –
http://dsa.cuni.cz
• startovní bod pro dlouhodobou ochranu digitálních dokumentů
• 16 kritérií; ve třech základních kategoriích - Producenti dat, Datový repozitář a
Příjemci dat
• Kategorie Producenti dat – odpovídá za kvalitu dat, kterou přímo ovlivňuje
samotná hodnota výstupů vědeckého a akademického výzkumu; dokumentace v
podobě metadat a dalších kontextuálních informací
• Kategorie Datový repozitář – odpovídá za řádné uchování a dostupnost těchto
dat v dlouhodobém měřítku (procesy a kvalita organizace; technická
infrastruktura)
• Kategorie Příjemci dat - řeší kvalitní využití dat cílovými skupinami v rámci
stanoveného národního legislativního rámce a politiky přístupů
7. 2.5 WG Standardy a normy
Standardy, audit a certifikace #3
• DIN 31644, nestor
• pochází z německy mluvícího prostředí; rozsahem a účelem je možné jí
zařadit na vyšší stupeň než DSA
• DIN 31644 Information und Dokumentation – Kriterien für
vertrauenswürdige digitale Langzeitarchive reprezentuje standardní rámec
umožňující vyhodnocování důvěryhodnosti digitálního úložiště, z
organizačního i technického hlediska
• Norma vychází z katalogu Nestor – Network of Expertise in Long-Term
Storage and Long-Term availability of Digital Resources in Germany
• Hodnocení repozitářů je možné rozdělit do tří hlavních okruhů:
• organizační rámec, správa objektů, infrastruktura a zabezpečení
8. 2.5 WG Standardy a normy
Standardy, audit a certifikace #4
• ČSN ISO 16363
• Standard ČSN ISO 16363 (319621) – Audit a certifikace důvěryhodných
digitálních úložišť - stanovuje doporučený postup pro posuzování
důvěryhodnosti digitálních úložišť
• Norma obsahuje celkem 108 kritérií (normativních metrik), rozdělených do
tří základních kategorií:
• A. organizační infrastruktura (Organizational Infrastructure)
• B. správa digitálních objektů (Digital Object Management)
• C. technologie, technická infrastruktura a bezpečnost (Technologies, Technical
Infrastructure, & Security)
• úložiště jako organizační celek se dotýká pracovníků na nejrůznějších úrovních
• vedení a nižší management - část A.; systémoví administrátoři, síťoví správci a další
techničtí pracovníci – část C; producenti a příjemci dat A a B.
9. 2.5 WG Standardy a normy
Standardy, audit a certifikace #5
• proč? jednoznačnější (jednotná) úroveň pro důvěryhodná úložiště:
• trvalá správa/ochrana digitálních objektů pro definovanou komunitu
• organizační způsobilost a fiskální zodpovědnost
• splnění smluvních a právních požadavků
• získávání a zpracování dle stanovených pravidel
• udržování dlouhodobé integrity, autenticity, použitelnosti objektů
• archivace všech potřebných metadat
• naplnit kritéria pro zpřístupňování
• strategický plán pro dlouhodobou ochranu a odpovídající technická
infrastruktura
10. 2.5 WG Standardy a normy
Archivematica vs. OAIS
• konformita se standardem publikována formou tabulkového přehledu
• praktické zkušenosti - deklarovaná shoda s ISO 14721 (na webových
stránkách projektu Archivematica) mnohdy neodpovídá realitě
• příklady: administrativní metadata v METS
• revize OAIS standardu (2017):
• http://www.dpconline.org/newsroom/latest-news/1565-dpc-invites-
members-to-review-oais
• http://wiki.dpconline.org/index.php?title=OAIS_Community
11. 2.5 WG Standardy a normy
Funkční entita Příjem
• funkční prvek příjem vstupních dat: AV nabízí dodání SIPu offline, nebo on-line
cestou; potvrzuje dodavateli převzetí/nepřevzetí balíčku (v GUI).
• funkční prvek kontrola kvality: provádí kontrolu integrity SIP, případně
generuje kontrolní součet, pokud není k SIP přiložen. Kontroluje na přítomnost
malwaru, zabezpečuje jeho odstranění a kontroluje případné další nedostatky.
• funkční prvek vytváření balíčku AIP: normalizuje/převádí formáty souborů při
zachování těch původních.
• funkční prvek vytváření popisných informací přidává informační obsah a PDI
do AIP, dává informaci o uchování PDI do AIP, generuje popisné informace.
• funkční prvek sladění aktualizací nese odpovědnost za přesun balíčků AIP do
Archivního uložení. V první fázi žádá o přidělení místa na úložišti, pokud je
požadavek schválený, přesune AIP do Archivního úložiště a úspěšné ne/přijetí i
ne/uložení AIP oznámí.
13. 2.5 WG Standardy a normy
Funkční entita Archivní uložení
• funkční prvek příjem dat
• funkční entita Archivní uložení zašle požadavek na uložení AIP, vybere se
vhodné zařízení či nosič a přesune AIP do Archival storage. Systém pošle
potvrzení o uložení, případně akci zamítne. Zkontroluje integritu AIP, přidá
informaci o umístění AIP na úložišti. Zkopíruje AIP na zálohovací média na
fyzicky odděleném místě od originálních AIP. Informaci je poté součástí
popisných informací, kdy prvek předá popisné informace do Data managementu
a z Data managementu se vygeneruje příslušné potvrzení.
• funkční prvek správy struktury úložiště – ano - připraví vhodný typ nebo
jednotku datového úložiště a po úspěšném dokončení přenosu (příjem dat),
zkontroluje integritu AIP. V případě poškození AIP, zasílá oznámení o této
skutečnosti a AIP zamítne. Pokud je AIP v pořádku, nakopíruje ji do příslušný
typ úložiště, opětovně zkontroluje integritu a odešle na zálohovací médium.
Poté odešle oznámení o úspěšném uložení.
14. 2.5 WG Standardy a normy
Funkční entita Archivní uložení #2
• funkční prvek nahrazení datových nosičů - tuto funkcionalitu AV nenabízí.
• funkční prvek kontrola chyb - tento funkční prvek požaduje, aby veškerý
HW a SW v archivu upozorňoval na případné chyby. AV má k dispozici
kontrolu chyb všech kopií, není ale jasné v jaké frekvenci
• funkční prvek poskytnutí dat - přijímá žádost o poskytnutí dat, zpracuje ji
a pošle AIP funkčnímu celku zpřístupnění.
• funkční prvek obnova po havárii - AV tento funkční prvek řeší tak, že
přijímá žádost o zpřístupnění AIP. Kontroluje jejich integritu a
použitelnost, vybírá nejvhodnější kopii, generuje AIP a přesouvá ji do
správy uložení.
15. 2.5 WG Standardy a normy
Funkční entita Správa dat
• funkční prvek správa databáze - AV přijímá popisné informace, updatuje DB a
potvrdí update a zálohuje příslušné updaty DB.
• funkční prvek provádění dotazů - přijímá dotazy (z interních prvků systému
nebo přímo od žadatele), zpracuje je a na výstupu nabízí výsledky dotazů nebo
reporty. Následně žádosti a výsledky operace zapisuje do příslušných logů.
• funkční prvek vytváření přehledů - tuto funkcionalitu AV nabízí (např. jako
přehledy v základním GUI).
• funkční prvek příjem aktualizací databáze - AV umožňuje aktualizace systému
a aktualizace dat vztahující se k novým balíčkům AIP.
16. 2.5 WG Standardy a normy
Funkční entita Správa
• funkční prvek vyjednávání dohody o dodávání dat - tento funkční prvek AV s
tvůrcem vyjednává dohodu o dodávání dat, včetně harmonogramu dodávání
těchto dat. Dále zasílá šablony balíčků SIP a všechny přizpůsobené šablony
balíčků AIP, aby mohly být následně využity funkčním celkem příjmu. Spravuje
též kalendář očekávaných spojení pro dodávání dat, zasílá oznámení
producentům.
• funkční prvek správa nastavení systému - tento prvek se týká organizačně-
systémového nastavení, nikoliv pouze AV jako systému.
• funkční prvek aktualizace archivovaných informací - AV přijímá požadavky na
změny a postupy a nástroje na provádění těchto změn. Provádí aktualizace, a
to tím, že zasílá požadavky na DIPy, aktualizuje obsah výsledných balíčků DIP a
opětovně je v podobě balíčků SIP dodává funkčnímu celku příjmu.
17. 2.5 WG Standardy a normy
Funkční entita Správa #2
• funkční prvek řízení fyzického přístupu - tento prvek se týká organizačního zabezpečení,
nikoliv AV jako systému.
• funkční prvek stanovování standardů a pravidel - tento prvek se týká organizačního
zabezpečení, nikoliv AV jako systému.
• funkční prvek kontrola vstupních dat - tento prvek se týká organizačně-personálního
zabezpečení, nikoliv AV jako systému. Srozumitelnost dat pro určenou komunitu provádí
zaměstnanci repozitáře/archivu, AV “pouze” zodpovídá za kontrolu kvality SIP balíčků.
• funkční prvek spouštění požadavků - udržuje záznamy o požadavcích založených na
událostech, vytváří požadavek na šíření a vytváří objednávky, které jsou zaslány
funkčnímu celku zpřístupnění.
• funkční prvek služba zákazníkům - vytváří, udržuje a maže účty koncových uživatelů.
Získávání fakturačních údajů, zasílání faktur a vybírání plateb není součástí AV.
18. 2.5 WG Standardy a normy
Funkční entita Plánování uchovávání
• funkční prvek sledování určené skupiny - tento prvek se týká organizačního zabezpečení
repozitáře/archivu, nikoliv AV jako systému.
• funkční prvek sledování technologií - AV pomocí mikroslužeb hlídá formáty, v ostatních
záležitostech se tento prvek týká organizačního-technického zabezpečení
repozitáře/archivu, nikoliv nutně AV jako systému.
• funkční prvek tvorba strategií a standardů pro uchovávání - nese odpovědnost za tvorbu
a doporučování strategií a standardů a za hodnocení rizik. V tomto kontextu AV podporuje
strategii normalizaci formátů. Migrace není podporována.
• funkční prvek tvorba šablon balíčků a plánů přesunů - AV neumí přesuny/převody AIP, i
když podle deklarovaných plánů by to mělo být v dalších verzích. AIP umí exportovat do
DIPu a ten pak přijmout jako SIP a tak provést potřebné změny. Kdy a co přesně se má
provést, určuje archiv.
19. 2.5 WG Standardy a normy
Funkční entita Zpřístupnění
• funkční prvek sladění činností pro zpřístupnění AV splňuje.
• funkční prvek vytváření balíčku DIP - AV tento funkční prvek v základu
splňuje, ale tím, že je DIP vytvořen ve stejné chvíli jako AIP, tak není
možné DIP upravit přidáním např. DRM, nebo odstraněním osobních údajů
pro anonymizaci dat (jak se uvádí v OAIS str. 48). Nesplňuje “pouze”
nepovinné části.
• AV nemá propracované rozhraní pro dodávání balíčků koncovým
uživatelům.