SlideShare une entreprise Scribd logo
1  sur  27
DIGITÁLNÍ SBÍRKY A JEJICH
DLOUHODOBÉ UCHOVÁVÁNÍ V NÁRODNÍ
KNIHOVNĚ AUSTRÁLIE
LIBOR COUFAL
Digitální uchovávání „vzhůru
nohama“
Průkopnická léta
• 80. léta – „elektronické“ materiály na PN
• 1994 – pozice pro „elektronické uchovávání“
• 1996 – Pandora
• 1997/98 – IT projekt „Digital Services“
– digitální úložiště (DOSS)
– DCM
Průkopnická léta
• 2006/7 – Australian Partnership for
Sustainable repositories
– Automated Obsolescence Notification System
(AONS)
• 2007/8 – interní projekty
– Mediapedia, Prometheus, Configulator
Průkopnická léta
• 2008 – interní hodnocení (DRAMBORA, TRAC)
• 2009 – profilace digitálních fondů
• 2010/11 – „preservation intents“
• 2012 – DLIR
• 2016 – Preservica v provozu
Strategický plán 2015 - 19
• Strategické cíle, priority a implementační rámec
• Typy digitálních materiálů:
– Původní digitální
• Publikovaný
• Nepublikovaný
– Digitalizovaný
• Interně
• Externě
– Původní digitální vytvořený
• Interně/na zakázku
– Sklizený webový materiál
Hodnocení rizik
• Faktory
– Jedinečnost
• Existuje ve fyzické podobě?
– Charakteristiky
• Jak/kým vytvořen?
• Standardy, kontrola kvality?
• Uniformita
TYPE
CHARACTERISTICS
Input – source item Output – digital item Preservation risk
Born-digital –
Internally-created or
commissioned
 No physical equivalent  Created to a defined standard
 Agreed preservation format
 Uniform format(s)
 Quality assurance/control in place
 Low – based on homogeneity and
control over creation
Born-digital – Published  No physical equivalent (often)  Creation outside NLA control
 Various file formats (not necessarily
‘well-formed’)
 Some container formats
 Possibly complex objects
 Quality assurance/control uncertain
 Content may exist in multiple
operating system versions
 Prone to Technological Protection
Measures (TPMs) such as encryption
or password protection to inhibit
access and copying
 Preservation may be mandated by
legislation (e.g. legal deposit) or
there may be a reputational risk if
we do not fulfil our preservation
commitment
 Possibly high - based on
heterogeneity and lack of control
over creation
 Expected or known issues with
specific file formats (e.g.
RealMedia)
 Preservation action likely to be
required sooner in the lifecycle.
No business decision has been
taken on ‘normalising’ formats on
ingest (i.e. ‘format shift’).
Hodnocení rizik
Riziko pro digitální uchování Typ materiálu
Vysoké Původní digitální – publikovaný
Původní digitální – nepublikovaný
Původní digitální – webový materiál
Nízké Původní digitální – vytvořený interně/na zakázku
Digitalizovaný – interně
Digitalizovaný - externě
Strategický cíl 1
• Uložit na řízeném úložišti a zajistit uchování na
úrovni bitů
– Všechny digitální objekty uloženy na úložišti
– Mnohonásobné kopie
– Řízení úložiště pro případ havárie
– Pravidelná migrace úložných médií
– Zabezpečení úložiště
– Procesy pro pravidelnou verifikaci kontrolních součtů
Strategický cíl 2
• Správa digitálních objektů v LTP systému
– „Ingest“ do produkční verze LTP
– Pravidelná analýza a vykazování složení a stavu
digitálních sbírek
– Monitorování rizik pro dlouhodobé uchovávání
– Logická ochrana sbírek (např. formátová migrace)
podle potřeby
Strategický cíl 3
• Digitální uchovávání je robustní, spolehlivé a
škálovatelné
– Integrace LTP s ostatními knihovními systémy
– Digitální uchovávání jako součást běžných business
procesů, po boku ostatních funkcí pro správu
fondů
Strategická priorita 1
• Původní digitální materiál
– Publikovaný
– Nepublikovaný
– Pandora
• Plně implementovat strategické cíle 1 (bitová
ochrana) + 2 (logická ochrana)
Strategická priorita 2
• Zvukový materiál
– Digitalizovaný (interně + externě)
– Původní digitální
• Plná implementace strategického cíle 1 (bitová
ochrana)
• Ingest do LTP, zbytek logické ochrany po roce
2019
Strategická priorita 3
• Digitalizovaný materiál, původní digitální
vytvořený interně, webový materiál (mimo
Pandory)
• Plná bitová ochrana (Priorita 1)
• Správa v DCM
• Logická ochrana mimo LTP (pokud potřeba)
– Přehodnocení po 2019
Q3 Q4 Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4 Q1 Q2
Ebooks and E-serials
Music Scores
Maps
Physical Carriers
PANDORA
Simple Unpublished
Complex Unpublished
Monthly Activity Reports
Annual QA Audit
Annual Report
Monitor Level of Support
Monitor Preservation Risks
Format Obsolescence Watch
Collection Health Reports
Preservation Treatments
Not Started In Progress Delayed BAU
Bit-level Preservation
Maintain Long-term Usability
Digital Preservation Road Map 2016 - 2019
2016/17 2017/18 2018/19
Ingest into Preservica
Bitová ochrana
Policy on bit-level preservation of digital
collection material
• Redundance a diverzifikace
– Nejméně 3 kopie
– Nejméně 2 typy úložných médií
– Nejméně jedna kopie v jiné lokalitě
Bitová ochrana
• Kontrola integrity
– Všechny soubory musí mít
• Kontrolní součet
• Časové razítko vytvoření součtu
– Kontrolní součty musí být chráněny proti
• Ztrátě
• Poškození
• Úmyslné změně
– Integrita všech souborů musí být pravidelně
kontrolována
Bitová ochrana
• Audit
– Měsíční výkazy o aktivitě (IT, kontola DiP)
• Počet nových souborů a kontrolních součtů
• Počet zkontrolovaných souborů a výsledky
• Podniklé kroky v případě nesrovnalostí
– Roční audit na reprezentativním vzorku (DiP za
asistence IT)
– Roční zpráva (DiP, pro CSG)
• Souhrn aktivit v průběhu roku
• Výsledky ročního audit
Preservica
• Integrace se systémem eDeposit
• Ingest plně automatizován
– Extrakce metadat a souborů přes API
– Vytvoření SIP
• Hierarchie
• Mapování metadat do XIP + DC
• Použití původního kontrolního součtu
– Vyexportování SIP na síťový disk monitorovaný Preservicou
• 1x týdně, zpoždění 3 měsíce
• Flexibilní, konfigurovatelný rámec
Preservica
• Funkční
– e-knihy, e-seriály, e-hudebniny
• Připravuje se
– Synchronizace po ingestu (duben/květen 2017)
– e-mapy (květen/červen 2017)
– Digitální archivy (květen/červen 2017)
• Integrace s ArchivesSpace
– Publikace na pevných nosičích (červenec 2017)
– Pandora (červen 2018)
• Integrace s Pandas
Logická ochrana
• Neidentifikované formáty
– Vysoké riziko  akce
• Nejednoznačně/nesprávně identifikované
formáty
– Potenciálně vysoké riziko  akce
• (Interní) podpora pro souborové formáty
– Schopnost „zobrazit“ soubory v daném formátu
Podpora souborových formátů
• Světově unikátní empirický výzkum
– Mapování podpory formátů v SW aplikacích
– Empirické testování kvality
• Hlavní součást znalostní báze NLA
• Od 2012/13, 1 pracovník (60 – 70 % úvazku)
• > 12 tis. Záznamů
• Implementace
– Pracovní verze Excel
– Import dat do graph DB
Podpora souborových formátů
• Proces
– Prioritizace formátů podle typu
• (Pravděpodobnost) zastoupení ve fondu
– Výzkum a dokumentace formátu
– Výběr a dokumentace aplikací
– Mapování podpory formátů v dané aplikaci
– Testování kvality podpory
Podpora souborových formátů
• Využití
– Obsolescence Watch
– Collection Health Report
– Indikace migračních možností
• Data budou zveřejněna
Certifikace
# Rok Proces
1 2018/19 Samo-hodnocení podle Data Seal of Approval
2 2018/19 Získání Data Seal of Approval
3 2022/23 Samo-hodnocení podle ISO 16363
4 2023/24 Úpravy na základě samo-hodnocení
5 2025/26 Akreditace

Contenu connexe

Tendances

Tendances (7)

Michal Konečný - Systém Archivematica z pohledu uživatele
Michal Konečný - Systém Archivematica z pohledu uživateleMichal Konečný - Systém Archivematica z pohledu uživatele
Michal Konečný - Systém Archivematica z pohledu uživatele
 
Zkušenosti se systémem Archivematica
Zkušenosti se systémem ArchivematicaZkušenosti se systémem Archivematica
Zkušenosti se systémem Archivematica
 
LTP Pilot - Archivematica Projekt v CR
LTP Pilot - Archivematica Projekt v CRLTP Pilot - Archivematica Projekt v CR
LTP Pilot - Archivematica Projekt v CR
 
Vlastimil Krejčíř - Systémový pohled na software Archivematica
Vlastimil Krejčíř - Systémový pohled na software ArchivematicaVlastimil Krejčíř - Systémový pohled na software Archivematica
Vlastimil Krejčíř - Systémový pohled na software Archivematica
 
Blok expertů KISK: Ditigalizace, Metadata, Pojekty
Blok expertů KISK: Ditigalizace, Metadata, PojektyBlok expertů KISK: Ditigalizace, Metadata, Pojekty
Blok expertů KISK: Ditigalizace, Metadata, Pojekty
 
Michal Růžička - Napojení systému Archivematica na úložiště CESNET
Michal Růžička - Napojení systému Archivematica na úložiště CESNETMichal Růžička - Napojení systému Archivematica na úložiště CESNET
Michal Růžička - Napojení systému Archivematica na úložiště CESNET
 
Šárka Hálečková a Tomáš Burda - Řešení pro dlouhodobou archivaci v Národní kn...
Šárka Hálečková a Tomáš Burda - Řešení pro dlouhodobou archivaci v Národní kn...Šárka Hálečková a Tomáš Burda - Řešení pro dlouhodobou archivaci v Národní kn...
Šárka Hálečková a Tomáš Burda - Řešení pro dlouhodobou archivaci v Národní kn...
 

En vedette (7)

Libor Coufal - Australská národní knihovna - přednáška Praha 22.3.2017
Libor Coufal - Australská národní knihovna - přednáška Praha 22.3.2017Libor Coufal - Australská národní knihovna - přednáška Praha 22.3.2017
Libor Coufal - Australská národní knihovna - přednáška Praha 22.3.2017
 
Digital preservation: an introduction
Digital preservation: an introductionDigital preservation: an introduction
Digital preservation: an introduction
 
Prometheus
PrometheusPrometheus
Prometheus
 
Food ver1
Food ver1Food ver1
Food ver1
 
Dlouhodobá ochrana digitálních informací na Novém Zélandu
Dlouhodobá ochrana digitálních informací na Novém ZélanduDlouhodobá ochrana digitálních informací na Novém Zélandu
Dlouhodobá ochrana digitálních informací na Novém Zélandu
 
Prometheus
PrometheusPrometheus
Prometheus
 
Alojz Androvič - Centrálny dátový archív v roku 1
Alojz Androvič - Centrálny dátový archív v roku 1Alojz Androvič - Centrálny dátový archív v roku 1
Alojz Androvič - Centrálny dátový archív v roku 1
 

Similaire à Libor Coufal - Australská národní knihovna 2 - přednáška Praha 22.3.2017

SmartCard Forum 2010 - Multiaplikační čipové karty - zvažování nástrah a přínosů
SmartCard Forum 2010 - Multiaplikační čipové karty - zvažování nástrah a přínosůSmartCard Forum 2010 - Multiaplikační čipové karty - zvažování nástrah a přínosů
SmartCard Forum 2010 - Multiaplikační čipové karty - zvažování nástrah a přínosů
OKsystem
 
Odpoledne se Seznamem II - Provozní bezpečnost
Odpoledne se Seznamem II - Provozní bezpečnostOdpoledne se Seznamem II - Provozní bezpečnost
Odpoledne se Seznamem II - Provozní bezpečnost
chaplin06
 

Similaire à Libor Coufal - Australská národní knihovna 2 - přednáška Praha 22.3.2017 (20)

05 Standardy a nástroje.pptx
05 Standardy a nástroje.pptx05 Standardy a nástroje.pptx
05 Standardy a nástroje.pptx
 
Digitalizace a dlouhodobá ochrana digitálních dokumentů
Digitalizace a dlouhodobá ochrana digitálních dokumentůDigitalizace a dlouhodobá ochrana digitálních dokumentů
Digitalizace a dlouhodobá ochrana digitálních dokumentů
 
06 Cvičení.pptx
06 Cvičení.pptx06 Cvičení.pptx
06 Cvičení.pptx
 
04 Strategie dlouhodobé ochrany.pptx
04 Strategie dlouhodobé ochrany.pptx04 Strategie dlouhodobé ochrany.pptx
04 Strategie dlouhodobé ochrany.pptx
 
PSUG 2 - 2024-04-15: Proactive IT Monitoring & Dynamic Asset Management (Czech)
PSUG 2 - 2024-04-15: Proactive IT Monitoring & Dynamic Asset Management (Czech)PSUG 2 - 2024-04-15: Proactive IT Monitoring & Dynamic Asset Management (Czech)
PSUG 2 - 2024-04-15: Proactive IT Monitoring & Dynamic Asset Management (Czech)
 
LTP-workshop
LTP-workshopLTP-workshop
LTP-workshop
 
Ndk mu
Ndk muNdk mu
Ndk mu
 
02 OAIS.pptx
02 OAIS.pptx02 OAIS.pptx
02 OAIS.pptx
 
Ndk
NdkNdk
Ndk
 
SmartCard Forum 2010 - Multiaplikační čipové karty - zvažování nástrah a přínosů
SmartCard Forum 2010 - Multiaplikační čipové karty - zvažování nástrah a přínosůSmartCard Forum 2010 - Multiaplikační čipové karty - zvažování nástrah a přínosů
SmartCard Forum 2010 - Multiaplikační čipové karty - zvažování nástrah a přínosů
 
Data management a jak psát data management plan
Data management a jak psát data management planData management a jak psát data management plan
Data management a jak psát data management plan
 
Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek
Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek
Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek
 
Co přináší Oracle Database 12c Release 2
Co přináší Oracle Database 12c Release 2Co přináší Oracle Database 12c Release 2
Co přináší Oracle Database 12c Release 2
 
Projekt Bitcoinová burza Coinmate
Projekt Bitcoinová burza CoinmateProjekt Bitcoinová burza Coinmate
Projekt Bitcoinová burza Coinmate
 
02 Funkční model OAIS.pptx
02 Funkční model OAIS.pptx02 Funkční model OAIS.pptx
02 Funkční model OAIS.pptx
 
Odpoledne se Seznamem II - Provozní bezpečnost
Odpoledne se Seznamem II - Provozní bezpečnostOdpoledne se Seznamem II - Provozní bezpečnost
Odpoledne se Seznamem II - Provozní bezpečnost
 
Data management a jak psát data management plan
Data management a jak psát data management planData management a jak psát data management plan
Data management a jak psát data management plan
 
Mentat a Warden: Sběr a zpracování dat z bezpečnostních nástrojů
Mentat a Warden: Sběr a zpracování dat z bezpečnostních nástrojůMentat a Warden: Sběr a zpracování dat z bezpečnostních nástrojů
Mentat a Warden: Sběr a zpracování dat z bezpečnostních nástrojů
 
Kurátorský životní cyklus DCC.pptx
Kurátorský životní cyklus DCC.pptxKurátorský životní cyklus DCC.pptx
Kurátorský životní cyklus DCC.pptx
 
McAfee - ochrana dat, DLP, šifrování, database security
McAfee - ochrana dat, DLP, šifrování, database securityMcAfee - ochrana dat, DLP, šifrování, database security
McAfee - ochrana dat, DLP, šifrování, database security
 

Libor Coufal - Australská národní knihovna 2 - přednáška Praha 22.3.2017

  • 1. DIGITÁLNÍ SBÍRKY A JEJICH DLOUHODOBÉ UCHOVÁVÁNÍ V NÁRODNÍ KNIHOVNĚ AUSTRÁLIE LIBOR COUFAL
  • 3. Průkopnická léta • 80. léta – „elektronické“ materiály na PN • 1994 – pozice pro „elektronické uchovávání“ • 1996 – Pandora • 1997/98 – IT projekt „Digital Services“ – digitální úložiště (DOSS) – DCM
  • 4. Průkopnická léta • 2006/7 – Australian Partnership for Sustainable repositories – Automated Obsolescence Notification System (AONS) • 2007/8 – interní projekty – Mediapedia, Prometheus, Configulator
  • 5. Průkopnická léta • 2008 – interní hodnocení (DRAMBORA, TRAC) • 2009 – profilace digitálních fondů • 2010/11 – „preservation intents“ • 2012 – DLIR • 2016 – Preservica v provozu
  • 6. Strategický plán 2015 - 19 • Strategické cíle, priority a implementační rámec • Typy digitálních materiálů: – Původní digitální • Publikovaný • Nepublikovaný – Digitalizovaný • Interně • Externě – Původní digitální vytvořený • Interně/na zakázku – Sklizený webový materiál
  • 7. Hodnocení rizik • Faktory – Jedinečnost • Existuje ve fyzické podobě? – Charakteristiky • Jak/kým vytvořen? • Standardy, kontrola kvality? • Uniformita
  • 8. TYPE CHARACTERISTICS Input – source item Output – digital item Preservation risk Born-digital – Internally-created or commissioned  No physical equivalent  Created to a defined standard  Agreed preservation format  Uniform format(s)  Quality assurance/control in place  Low – based on homogeneity and control over creation Born-digital – Published  No physical equivalent (often)  Creation outside NLA control  Various file formats (not necessarily ‘well-formed’)  Some container formats  Possibly complex objects  Quality assurance/control uncertain  Content may exist in multiple operating system versions  Prone to Technological Protection Measures (TPMs) such as encryption or password protection to inhibit access and copying  Preservation may be mandated by legislation (e.g. legal deposit) or there may be a reputational risk if we do not fulfil our preservation commitment  Possibly high - based on heterogeneity and lack of control over creation  Expected or known issues with specific file formats (e.g. RealMedia)  Preservation action likely to be required sooner in the lifecycle. No business decision has been taken on ‘normalising’ formats on ingest (i.e. ‘format shift’).
  • 9. Hodnocení rizik Riziko pro digitální uchování Typ materiálu Vysoké Původní digitální – publikovaný Původní digitální – nepublikovaný Původní digitální – webový materiál Nízké Původní digitální – vytvořený interně/na zakázku Digitalizovaný – interně Digitalizovaný - externě
  • 10. Strategický cíl 1 • Uložit na řízeném úložišti a zajistit uchování na úrovni bitů – Všechny digitální objekty uloženy na úložišti – Mnohonásobné kopie – Řízení úložiště pro případ havárie – Pravidelná migrace úložných médií – Zabezpečení úložiště – Procesy pro pravidelnou verifikaci kontrolních součtů
  • 11. Strategický cíl 2 • Správa digitálních objektů v LTP systému – „Ingest“ do produkční verze LTP – Pravidelná analýza a vykazování složení a stavu digitálních sbírek – Monitorování rizik pro dlouhodobé uchovávání – Logická ochrana sbírek (např. formátová migrace) podle potřeby
  • 12. Strategický cíl 3 • Digitální uchovávání je robustní, spolehlivé a škálovatelné – Integrace LTP s ostatními knihovními systémy – Digitální uchovávání jako součást běžných business procesů, po boku ostatních funkcí pro správu fondů
  • 13. Strategická priorita 1 • Původní digitální materiál – Publikovaný – Nepublikovaný – Pandora • Plně implementovat strategické cíle 1 (bitová ochrana) + 2 (logická ochrana)
  • 14. Strategická priorita 2 • Zvukový materiál – Digitalizovaný (interně + externě) – Původní digitální • Plná implementace strategického cíle 1 (bitová ochrana) • Ingest do LTP, zbytek logické ochrany po roce 2019
  • 15. Strategická priorita 3 • Digitalizovaný materiál, původní digitální vytvořený interně, webový materiál (mimo Pandory) • Plná bitová ochrana (Priorita 1) • Správa v DCM • Logická ochrana mimo LTP (pokud potřeba) – Přehodnocení po 2019
  • 16. Q3 Q4 Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4 Q1 Q2 Ebooks and E-serials Music Scores Maps Physical Carriers PANDORA Simple Unpublished Complex Unpublished Monthly Activity Reports Annual QA Audit Annual Report Monitor Level of Support Monitor Preservation Risks Format Obsolescence Watch Collection Health Reports Preservation Treatments Not Started In Progress Delayed BAU Bit-level Preservation Maintain Long-term Usability Digital Preservation Road Map 2016 - 2019 2016/17 2017/18 2018/19 Ingest into Preservica
  • 17. Bitová ochrana Policy on bit-level preservation of digital collection material • Redundance a diverzifikace – Nejméně 3 kopie – Nejméně 2 typy úložných médií – Nejméně jedna kopie v jiné lokalitě
  • 18. Bitová ochrana • Kontrola integrity – Všechny soubory musí mít • Kontrolní součet • Časové razítko vytvoření součtu – Kontrolní součty musí být chráněny proti • Ztrátě • Poškození • Úmyslné změně – Integrita všech souborů musí být pravidelně kontrolována
  • 19. Bitová ochrana • Audit – Měsíční výkazy o aktivitě (IT, kontola DiP) • Počet nových souborů a kontrolních součtů • Počet zkontrolovaných souborů a výsledky • Podniklé kroky v případě nesrovnalostí – Roční audit na reprezentativním vzorku (DiP za asistence IT) – Roční zpráva (DiP, pro CSG) • Souhrn aktivit v průběhu roku • Výsledky ročního audit
  • 20. Preservica • Integrace se systémem eDeposit • Ingest plně automatizován – Extrakce metadat a souborů přes API – Vytvoření SIP • Hierarchie • Mapování metadat do XIP + DC • Použití původního kontrolního součtu – Vyexportování SIP na síťový disk monitorovaný Preservicou • 1x týdně, zpoždění 3 měsíce • Flexibilní, konfigurovatelný rámec
  • 21. Preservica • Funkční – e-knihy, e-seriály, e-hudebniny • Připravuje se – Synchronizace po ingestu (duben/květen 2017) – e-mapy (květen/červen 2017) – Digitální archivy (květen/červen 2017) • Integrace s ArchivesSpace – Publikace na pevných nosičích (červenec 2017) – Pandora (červen 2018) • Integrace s Pandas
  • 22.
  • 23. Logická ochrana • Neidentifikované formáty – Vysoké riziko  akce • Nejednoznačně/nesprávně identifikované formáty – Potenciálně vysoké riziko  akce • (Interní) podpora pro souborové formáty – Schopnost „zobrazit“ soubory v daném formátu
  • 24. Podpora souborových formátů • Světově unikátní empirický výzkum – Mapování podpory formátů v SW aplikacích – Empirické testování kvality • Hlavní součást znalostní báze NLA • Od 2012/13, 1 pracovník (60 – 70 % úvazku) • > 12 tis. Záznamů • Implementace – Pracovní verze Excel – Import dat do graph DB
  • 25. Podpora souborových formátů • Proces – Prioritizace formátů podle typu • (Pravděpodobnost) zastoupení ve fondu – Výzkum a dokumentace formátu – Výběr a dokumentace aplikací – Mapování podpory formátů v dané aplikaci – Testování kvality podpory
  • 26. Podpora souborových formátů • Využití – Obsolescence Watch – Collection Health Report – Indikace migračních možností • Data budou zveřejněna
  • 27. Certifikace # Rok Proces 1 2018/19 Samo-hodnocení podle Data Seal of Approval 2 2018/19 Získání Data Seal of Approval 3 2022/23 Samo-hodnocení podle ISO 16363 4 2023/24 Úpravy na základě samo-hodnocení 5 2025/26 Akreditace