4. [ Digitaal Depot
belangrijke principes ]
Archiveren van authentieke en integere documenten vs.
snelle technologische ontwikkeling en veroudering van
formaten, dragers, leestechnologie en -apparatuur vereist:
● risicospreiding
● risicopreventie
● risicoherstel
→ actief preserveringsbeleid
Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009
5. [ 10 stappen
overzicht ]
hard- en software
architectuur
functionaliteiten
digitaal archief
documenteren
digitaal archief
Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009
6. [ 10 stappen
overzicht ]
hard- en software
architectuur
functionaliteiten
digitaal archief
documenteren
digitaal archief
Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009
7. [ hard- en softwarearchitectuur
opslagsysteem 1]
● bestaan duurzame gegevensdragers in de digitale wereld?
● nog een probleem: afhankelijkheid van leestechnologie
George W. Hart, disk combobulation
Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009
8. [ hard- en softwarearchitectuur
opslagsysteem 1]
WAT DOEN?
● opslagsysteem
● uitbreidbaar
● gescheiden van de beheersapplicatie
● ondersteunt meerdere interfaces
● genormeerde gegevensdragers
● genormeerde bestandssystemen
● digitale objecten naar een nieuw opslagsysteem overplaatsen
WANNEER:
● de vereiste leestechnologie raakt in onbruik/ wordt niet langer ondersteund (fysieke
dragers, bestandssysteem, aansluitingen, …)
● het aantal fouten op een drager stijgt opvallend
● de drager degradeert
Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009
9. [ hard- en softwarearchitectuur
opslagsysteem 1]
WAT DOEN?
● kwaliteitscontroles
● alle digitale objecten aanwezig?
● bitintegriteit OK?
● kwaliteit en performantie opslagsysteem en/of opslagmedia OK?
● digitale objecten virusvrij?
● permanent en systematisch
● volledig geautomatiseerd (bv. NAS/SAN systemen)
● of bij eenvoudigere systemen: steekproefgewijs op een representatief staal
● checksums/ CRC's voor controle bitintegriteit
● toegangscontrole
Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009
10. [ hard- en softwarearchitectuur
opslagsysteem 1]
WAT DOEN?
● back-ups en veiligheidskopieën
● meerdere kopieën van één digitaal object
● verschillende opslagsystemen of -media voor moeder- en veiligheidskopie
● verschillende bestandssystemen voor moeder- en veiligheidskopie
● opslagmedia van verschillende producenten
● verschillende locaties voor moeder- en veiligheidskopieën
● bij opslag op harde schijven:
● RAID-configuratie (min. niveau 5 of 5+)
● mirroring van digitale objecten in twee of drie systemen
● monitoring performantie van harde schijven
Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009
11. [ hard- en softwarearchitectuur
metadata duurzaam bewaren 2]
Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009
12. [ hard- en softwarearchitectuur
metadata duurzaam bewaren 2]
● digitale duurzaamheid van documenten heeft alleen nut als de
metadata over de documenten digitaal duurzaam worden
bewaard
● meeste archiveringssystemen slaan metadata in eigen
formaat en/of database op
● afhankelijkheid
● metadata moeten bij elke versie upgrade worden gemanipuleerd
WAT DOEN?
● systeemonafhankelijke opslag (geen vendor lock-in)
● metadata niet enkel in applicatieafhankelijke formaten en/of
database bewaren
● bv. in XML-formaat in het digitale archiveringssysteem bewaren
● archiveringsstrategie voor metadata
● documentatie over datamodel van database archiveren
Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009
13. [ hard- en softwarearchitectuur
band document – metadata 3]
● contextinformatie is essentieel voor het begrijpen en
gebruiken van archiefdocumenten
● veel archiveringssystemen slaan metadata gescheiden van
documenten op
METADATA
archiveringssysteem
Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009
14. [ hard- en softwarearchitectuur
band document – metadata 3]
WAT DOEN?
● duurzame/ reconstrueerbare link document-metadata
● metadata inbedden in header van bestanden (bv. bij TIFF)
● inkapseling van document en metadata in containerformaat
(bv. XML)
● opslag metadata bij digitale objecten in het opslagsysteem
(bv. als XML)
METADATA
archiveringssysteem
Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009
15. [ functionaliteiten digitaal archief
voor elk digitaal object metadata registreren 4]
● elk object moet identificeerbaar zijn
● elk object moet lokaliseerbaar zijn
● elk object moet controleerbaar zijn op fouten
● relatie document – representaties – digitale objecten moet
duidelijk zijn
Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009
16. [ functionaliteiten digitaal archief
voor elk digitaal object metadata registreren 4]
WAT DOEN?
Expliciet registeren van (in datatabel, XML-bestand, ...):
● unieke identificatiekenmerken ID
● reference information: locatie binnen het opslagsysteem
● fixity information: CRC/checksum
● tools: MD5summer, md5, MD5/SHA hash tool, Advanced Checksum Verifier, ...
● representation information: bestandsformaat en toegepast
profiel
● tools voor extractie van formaatinformatie: JHOVE, DROID, FITS, National Library
of New Zealand Metadata Extractor, Apache Tika, MediaInfo
● naar file format registries verwijzen: UDFR (Pronom+GlobalDigitalFormatsRegistry)
● relatie met de representatie en het digitale document
Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009
17. [ functionaliteiten digitaal archief
essentiële eigenschappen definieren en documenteren 5]
● essentiële eigenschappen van documenten moeten worden
bewaard
● welke dit zijn hangt af van de ontstaanscontext en
archiefwaarde
WAT DOEN:
● documenteren welke elementen van een digitaal document
essentieel zijn voor het behoud van authenticiteit en integriteit
● Binnen welke context is het document ontstaan (tentoonstelling, werkproces,
evenement, …)?
● keuzes van archiveringsformaten, omzettings- en
emulatietools baseren op het behoud van de essentiële
eigenschappen van het document
Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009
18. [ functionaliteiten digitaal archief
essentiële eigenschappen definieren en documenteren 5]
Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009
19. [ functionaliteiten digitaal archief
leesbaarheid van documenten bewaren 6]
● leesbaarheid van digitale objecten hangt af van software
WAT DOEN?
● afhankelijkheden van softwarepakket, -versie of -leverancier
vermijden door formaten en codecs die:
● genormeerd en open gedocumenteerd zijn
● voldoende gedocumeeteerd zijn
● essentiële eigenschappen van het authentieke document bewaren
● geen significant informatieverlies met zich meebrengen
● voldoen aan de behoeften van de gebruikersgroep(en)
Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009
20. [ functionaliteiten digitaal archief
leesbaarheid van documenten bewaren 6]
WAT DOEN?
● migratie en/of emulatie
● opties open houden door oorspronkelijk en duurzaam archiveringsformaat te
bewaren
Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009
21. [ functionaliteiten digitaal archief
leesbaarheid van documenten bewaren 6]
WAT DOEN?
● zijn documenten vrij van wachtwoorden/encrypties?
● welke representaties van documenten zijn aanwezig?
● bij opname in het digitale archief controleren:
● zijn vereiste representaties aanwezig?
● voldoen representaties aan voorgeschreven formaatprofiel?
● tools: JHOVE en/of DROID
● zijn de documenten niet corrupt of beschadigd?
● kunnen documenten geopend worden?
● zijn technische metadata aanwezig?
● is software-ondersteuning voor het leesbaar maken van documenten aanwezig?
● technologische evolutie opvolgen
● PLATO-tool
bewaarstrategie en tools kiezen, preserveringsacties plannen en
voorbereiden, preserveringsacties documenteren
Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009
22. [ functionaliteiten digitaal archief
componenten voor getrouwe reconstructie archiveren 7]
In de digitale wereld is het niet altijd voldoende om een
digitaal document te archiveren. Voor de getrouwe
reconstructie is meestal bepaalde software vereist
WAT DOEN?
● alle componenten voor de getrouwe reconstructie
identificeren
● documenten openen op computer met minimale hard- en softwareconfiguratie,
zonder netwerkverbinding
● vereiste componenten opnemen in digitaal archief
● geen afhankelijkheden van externe bronnen
● bij archivering in documentvorm: templates, formulieren, stylesheets
● bij archivering los van documentvorm: brongegevens en logica
● bij emulatie: ghosts of images van de applicatiesoftware archiveren
● componenten en hun afhankelijkheden en onderlinge
relaties documenteren
Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009
23. [ functionaliteiten digitaal archief
beheer van documenten documenteren 8]
Hoe kunnen we de authenticiteit van documenten
onderbouwen?
WAT DOEN?
documenteer de evolutie van een document vanaf
creatie/opname in het digitale archief
● beheersmetadata
● bepalen voor welke beheersacties welke metadata uitgevoerd worden
● metadata voor het uitvoeren van preserveringsacties
● WELKE ACTIE werd WANNEER uitgevoerd?
● WELKE TOOLS werden gebruikt?
● WIE voerde de actie uit?
Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009
24. [ functionaliteiten digitaal archief
documenten beschrijven 9]
Beschrijvende metadata zijn nodig om documenten terug te
vinden en te begrijpen
● WAT DOEN?
● documenten identificeren
● ISAD(G), ISAAR, ISDF, ISBD, MARC21, CDWA, …
● trefwoorden, tagging, taxonomie
● documenten contextualiseren
● WIE is de archiefvormer?
● binnen WELK WERKPROCES had het document een rol?
● WELKE RELATIE heeft het document met andere documenten?
● koppeling voorzien
● dossierlijsten
● retrieval mogelijk maken
● gearchiveerde documenten indexeren
Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009
25. [ documentatie digitaal archief
digitaal archief documenteren 10]
● reconstructie van de levenscyclus van archiefdocumenten
moet mogelijk zijn zonder te hoge redundantie
● “gemakkelijk” versiebeheer en probleemopvolging
● bescherming tegen vendor lock-in
● het digitale archief is geen black box voor archiefbeheerders
● verantwoording afleggen over werking en beheer
?
??
Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009
26. [ documentatie digitaal archief
digitaal archief documenteren 10]
WAT DOEN?
● archiveren van documentatie van:
● digitaal archiveringsbeleid, bewaarstrategie, toegepaste
normen en standaarden
● databasemodellen, broncode
● procedures, workflows
● UML-diagrammen, use cases, schema's informatie- en systeemarchitectuur
● handleidingen, richtlijnen, checklists archiveren
●opslagsysteem, logica
● documentatie niet exclusief in het eigen archief bewaren
● escrowregeling, notaris, archiefbeheerende instelling
Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009
27. [ meer informatie
]
● F. Boudrez, Een digitaal archief in 10 stappen
● F. Boudrez, Basisprocessen voor een digitaal archiefdepot
● S. Schaule, Organisatorische aspecten bij het bouwen en het
beheren van een digitaal depot
● DAVID-handboek. Digitaal archiveren in de praktijk
● XML-schema's e-mail, database, calendar, …
Deze en verdere publicaties zijn beschikbaar op
www.edavid.be
Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009
28. Vragen? Suggesties?
sonja.schaule@edavid.be
www.edavid.be
Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009