3. 3
UNESCO
Octombrie 2003 este adoptată Carta prezervării Patromoniului
Cultural Digital
resursele informaționale și expresiile creative sunt din ce în ce
mai mult produse, distribuite, accesate și întreținute în formă
digitală, creându-se o nouă moștenire – patrimoniul digital
Scopul prezervării patrimoniului digital este garantarea că
acesta rămâne accesibil publicului.
Prezervarea pe term lung a patrimoniului digital începe cu
proiectarea de sisteme fiabile și de proceduri care vor produce
obiecte digitale stabile și autentice.
5. 5
Recommendation concerning the preservation of, and access to,
documentary heritage including in digital form (UNESCO)
Noiembrie 2015
Documentul este obiectul care are conținut informațional analog sau digital și un
suport pe care este fixat. Acesta poate fi prezervat și se poate muta. Conținutul
poate fi compus din codurile caracterelor (text), imagini (statice sau în mișcare)
și sunete, aceste putând fi copiate sau migrate. Suportul poate avea calități de
natură estetică, culturală sau tehnică. Relația dintre conținut și suport poate
varia de la incidentală la integrală. De exemplu, într-un manuscris medieval sau
anumite discuri analoge pentru înregistrări fonografice există o conexiune
intrinsecă dintre conținut și suport; pentru o bandă video sau un fișier digital
conexiune poate fi mai mult incidentală.
Instituție de memorie este un termen colectiv care include, dar nu se limitează
doar la arhive, biblioteci, muzee și alte instituții de educație culturale și de
cercetare.
6. 6
Recommendation concerning the preservation of, and access to,
documentary heritage including in digital form (UNESCO)
Prezervarea poate fi considerată a fi suma lucrurilor necesare pentru a asigura accesibilitatea
perenă - pentru totdeauna - în maximă integritate a patrimoniului documentar. Prezervarea
documentelor este întotdeauna un proces în continuă desfășurare. Pe măsură ce colecțiile cresc,
acesta devine un proces cumulativ. Prevenția este preferabilă tratamentului, dar acolo unde este
necesar, trebuie să fie făcuți pași pentru remediere.
În domeniul analog, prezervarea poate include un număr de pași așa cum ar fi conservarea și
restaurare suportului, copierea sau migrarea conținutului, păstrarea documentului într-un mediu
de depozitare corespunzător, precum și cercetarea și colectarea de informații care să sprijine
aceste activități. Atunci când migrarea devine esențială, suporturile analogice trebuie păstrate în
cazurile în care au o valoare perenă ca originale autentice, artefacte sau obiecte care poartă
informație.
În domeniul digital, prezervarea se constituie dintr-o combinație de politici, strategii și acțiuni
pentru a garanta accesul la conținutul convertit și la cel nativ digital indiferent de problemele
legate de defectele suportului sau cele de natură tehnologică. Scopul prezervării digitale este
afișarea cu acuratețe a conținutului autentic de-a lungul timpului.
8. 8
Depozit digital sau bibliotecă digitală
Digital repository – depozit digital: serviciile cele mai apropiate
de obiectele digitale. Sunt nivelul de infrastructură prin care
stochezi, gestionezi, reutilizezi și îngrijești materiale digitale
(https://www.dcc.ac.uk/guidance/briefing-papers/introduction-curation/digital-repositories).
- institutional repositories
- digital archives
Digital library – bibliotecă digitală: incorporează serviciile unui
depozit digital peste care sunt așezate modelele de practică și
interacțiune specifice bibliotecilor, oferind acces la resurse
electronice (colecții electronice)
9. 9
Simon Hodson (CODATA)
Depozitele digitale, chiar și cele care își au originile în
universități și sunt supranumite „depozite instituționale”, nu
mai sunt folosite doar pentru a gestiona pre-printurile PDF. Rolul
depozitului se schimbă precum și conținuturile sale. Depozitele
sunt din ce în ce mai mult componente cheie în infrastructurile
de informare care ajută universitățile, organismele de finanțare
și managerii să-și afișeze rezultatele.
https://www.sciencedirect.com/book/9781843347439/new-content-in-digital-
repositories
10. 10
DELOS
Bibliotecile digitale reprezintă punctul de întâlnire al mai
multor discipline, incluzând managementul datelor,
regăsirea informațiilor, bibliologie, managementul
documentelor, sisteme de informare, Web-ul, procesarea
de imagine, inteligență artificială, interacțiune om-
computer și administrare digitală.
The DELOS Digital Library Reference Model
Foundations for Digital Libraries
Version 0.98
December 2007
11. 11
Theory and Practice
90 – etapa formativă
2000 – digitizare de masă
Biblioteci digitale de mari dimensiuni așa cum
este Digital Public Library of America, Europeana
sau HathiTrust, agregă conținut de la bibliotecile
digitale individuale de mai mici dimensiuni și
oferă portaluri pentru căutare și regăsire la nivel
global.
12. 12
ArXiv - cea mai veche aplicație pentru preprint-uri
O arhitectură
care a evoluat în
timp. Acest lucru
este vizibil
pentru că
arhitectura sa
reflectă însăși
evoluția World
Wide Web și a
standardelor
folosite în
comunicarea
științifică. Este
tributară unei
stive mari de
tehnologii.
23. 23
Archivematica și AtoM (Access to Memory)
Archivematica este un sistem de prezervare digitală cu sursă
deschisă conceput pentru accesul de lungă durată bazat pe
standarde la materiale digitale. Este un kit de instrumente proiectat
pentru implementarea strategiilor care tratează obsolescența
tehnologică și incompatibilitățile pentru a asigura că obiectele
digitale rămân securizate, accesibile și utilizabile și în viitor.
AtoM este un software pentru descrieri arhivistice multilingve bazat
integral pe tehnologii web, care a fost comandat de International
Council on Archives cu scopul de a facilita instituțiilor de arhivă din
întreaga lume să-și pună fondurile online folosind standardele de
descriere ale ICA.
30. 30
Noile generații de depozite digitale / instituționale
În documentul declarativ pentru o nouă
generație de depozite digitale, care oferă
infrastructura de comunicare științifică
actuală, există o secțiune care definiște un
„comportament” (behaviour) legat de
prezervarea digitală a rezultatelor de
cercetare. Cel de-al 11-lea și ultimul este
dedicat prezervării resurselor.
Preocuparea este legată doar de capacitatea
depozitelor digitale de a transfera
conținuturile text în platformele de
prezervare digitală.
https://ngr.coar-repositories.org/behaviour/preserving-resources/
Nu sunt menționate
tehnologiile în relație
cu acest
comportament, dar la
cel legat de
transferul resurselor
sunt trecute
ResourceSync, SWORD
și surprinzător, IPFS
33. 33
Parte a unui sistem la nivel națioal – rcaap.pt
http://opensciencefair.eu/images/workshops/OSFair2019_55-
DSpace_7_OpenAIRE_Guidelines_CRIS_and_ORCID.pdf
37. 37
Information and documentation — Records management — Part 1:
Concepts and principles
RECORD
,,information created, received, and maintained as evidence and
information by an organization or person, in pursuance of legal
obligations or în the transaction of business”
ISO 16363:2012
40. 40
DATELE INFORMAȚIILOR (Concepte generale de lucru
OAIS - I)
La bază totul poate fi privit prin prisma datelor, informațiilor și metadatelor.
Date: O reprezentare reinterpretabilă a informației într-o modalitate formalizată pretabilă
pentru comunicare, interpretare sau procesare.
Obiect de date (data object): Un obiect fizic sau un obiect digital.
Obiect digital (digital object): Un obiect compus dintr-un set de secvențe de biți.
Informație: orice tip de cunoaștere care poate fi tranzacționată. Într-o tranzacție este
reprezentată prin date.
Informație de reprezentare (representation information): Informația care marchează un Obiect
de Date prin concepte cu înțelesuri mai evidente pentru ca Obiectul de Date să fie înțeles în
modurile pe care le exemplifică Obiectivele de Prezervare.
Obiect informațional (Information Object): Este un Obiect de Date împreună cu Informația de
reprezentare.
Metadate: Date despre alte date.
(Reference Model for an Open Archival System – OAIS, CCSDS 650.0-P-3)
41. 41
Un sistem de management
al documentelor
Un sistem de management
al actelor…
…permite documentelor să fie modificate …protejează actele de modificări
…permite documentelor să existe în câteva
versiuni
…permite existența unei singure versiuni finale
a actului
…poate permite ca responsabilii să își
șteargă documentele
…protejează actele împotriva ștergerii, cu
excepția unor situații strict controlate
…poate include o evidență de păstrare …trebuie să includă o evidență riguroasă
de păstrare
…poate include o structură de stocare a
documentelor, care poate fi sub controlul
utilizatorilor
…trebuie să includă o structură riguroasă
de ordonare a actelor (schema de
clasificare), care este întreținută de rolul
de administrator
…este destinat în primul rând să sprijine
folosirea zilnică a documentelor pentru
activități în desfășurare
…poate sprijini activitatea zilnică, dar este
gândit în primul rând să furnizeze un
depozit sigur pentru actele rezultate din
activitate.
Repere funcționale generale ale unui depozit digital
S-au urmărit definițiile în strânsă
legătură cu rolul și funcționalitatea pe
care o joacă „documentele” în
sistemele de gestiune informatice.
Concepte centrale:
- digital record (document digital)
- records management (administrarea
documentelor [documente|acte])
ISO 15489-1:2016
42. Gestionarea „record of science”
[...]înregistrare a ceea ce este
cunoscut și împărtășit de
investigatorii trecutului
MEMORIE
record/înregistrare tipărită
Cunoașterea care a fost acumulată încă din
primele zile ale practicii științifice este
împrospătată continuu, reînnoită și
reevaluată prin noi experimente, noi
observații și noi perspective teoretice și este
comunicată public prin documente
științifice publicate.
43. 43
De ce prezervare digitală
Motivul este legat de fragilitatea în timp a resurselor digitale,
fie că vorbim despre deteriorarea la nivel de bit, fie că pur și
simplu acestea dispar din Internet odată cu instituții,
departamente, etc.
44. 44
Modele consorțiale de prezervare digitală a
documentelor de cercetare
În acest moment, pentru a face față exigențelor privind
păstrarea documentelor în format electronic, există modele
consorțiale cum ar fi Big Academic Alliance (btaa.org), National
Digital Stewardship Alliance sau CLOCKSS (Controlled Lots of
Copies Keep Stuff Safe – https://clockss.org)
45. 45
LOCKSS – Lots of Copies Keeps Stuff Safe
Este unul dintre cele mai longevive programe dedicate prezervării
digitale inițiat de Bibliotecile Stanford în 1999.
LOCKSS este un pachet software cu ajutorul căruia se pot realiza
noduri independente care sunt gata să primească date. Împreună
aceste noduri se pot coordona pentru a verifica în continuu datele
replicate, pentru a le audita și dacă este necesar pentru a le expune
sau doar pentru a păstra (dark archive) . Conținutul poate fi
divers: articole științifice, pagini web, etc.
Global LOCKSS Network
47. 47
CLOCKSS - Controlled LOCKSS
CLOCKSS este o organizație non-profit dezvoltată și guvernată de bibliotecari și
edituri. CLOCKSS folosește soluția cu sursă deschisă oferită de LOCKSS și au o
relație contractuală cu Stanford Libraries pentru rezolvarea problemelor de
natură tehnică.
CLOCKSS beneficiază de 12 noduri găzduite de instituții academice de prestigiu.
Serviciul asigură prezervarea digitală a peste 43 de milioane de articole de
revistă, peste 25 de mii de seriale și peste 240.000 de cărți.
Instituțiile participante în CLOCKSS includ 300 de biblioteci și 400 de edituri.
Principalul serviciu constă într-o arhivă întunecată (dark archive) care deține
conținuturile clienților (biblioteci sau edituri).
48. 48
Detalii CLOCKSS
CLOKSS este considerat a fi un depozit digital de încredere.
Datele sunt recoltate direct din site-urile furnizorilor sau prin transfer de
fișiere folosind FTP sau rsync. Datele sunt replicate în 12 noduri care se
auditează reciproc continuu.
Cele 12 noduri sunt distribuite pe tot globul pământesc: 5 S.U.A., 1 Canada, 1
Marea Britanie, 1 Germania, 1 Italia, 1 Japonia, 1 Hong Kong, 1 Australia.
În cazul în care accesul direct la conținutul unei edituri este întrerupt, CLOCKSS
este autorizat prin contract să transfere conținutul în cauză unor terți
autorizați. În cazul în care CLOKSS eșuează, organizațiile găzduitoare trebuie
să pună conținutul la dispoziția publicului sub o licență Creative Commons sau
echivalentă. Universitățile Edinburg, Stanford, Humboldt și Alberta sunt cele
care joacă rol de host-uri în cazurile speciale (re-publish trigger).
Editurile plătesc texele aferente, oferă conținutul și metadatele aferente.
49. 49
ISSN - Internațional Standard Serial Number
Portalul ISSN este un punct de intrare pentru căutarea
resurselor identificate folosind ISSN. Registrul Keepers este un
portal de interogare a tuturor „agențiilor de arhivare”, care au
drept scop păstrarea de lungă durată a publicațiilor electronice.
Toate agențiile menționate de https://keepers.issn.org/keepers
alimentează portalul cu metadatele entităților pe care le
gestionează.
50. 50
Definiția prezervării digitale
Definiția scurtă: prezervarea digitală combină politicile,
strategiile și acțiunile care asigură accesul la conținutul digital
de-a lungul timpului.
Association for Library Collections & Technical Services, o divizie a American Library Association.
http://www.ala.org/alcts/resources/preserv/defdigpres0408
51. 51
OAIS – un model central
Comitetul Consultativ pentru Sisteme pentru Date Spațiale -
Consultative Committee for Space Data Systems (CCSDS) a
dezvoltat un model de referință necesar stocării pe termen lung
a datelor digitale generate de misiunile spațiale. Acest model
poartă numele de Open Archival Information System, dar numele
după care este cunoscut este acronimul său: OAIS.
Modelul OAIS a fost aprobat în 2002 și a devenit standardul ISO
14721. O versiune revizuită a fost publicată în 2012: ISO
Standard 14721:2012.
Nu implică vreo obligație de conformitate. Este un model aplicat
în funcție de necesitățile unui implementator.
53. 53
Standarde privind arhitecturile și cerințele pentru
prezervare digitală și pentru certificare acestora
ISO 14721:2012 cunoscut și sub numele de CCSDS 650.0-M-2 (OAIS – un model de
referință pentru ceea ce se cere de la o arhivă pentru ca aceasta să ofere
prezervare de lungă durată a informației digitale)
ISO 16363:2013 cunoscut și sub numele de CCSDS 652.0-M-1 (Audit and
certification of trustworthy digital repositories – oferă metricile pentru ceea ce se
așteaptă de la o arhivă care resepectă modelul OAIS).Scopul standardului este de
a evalua dacă un depozit este capabil să prezerve obiectele digitale urmând
conceptele OAIS.
ISO 16919:2014 cunoscut și sub numele de CCSDS 652.1-M-2 (Requirements for
bodies providing audit and certification of candidate trustworthy digital
repositories – specifică competențele și cerințele pentru instituțiile care fac
auditarea)
ISO/IEC 17021-1:2015 Conformity assessment — Requirements for bodies
providing audit and certification of management systems — Part 1: Requirements
55. 55
Concepte generale de lucru pentru OAIS - II
Bază de cunoaștere (Knowledge Base): Este un set de informații
incorporate de o persoană sau de sistemul său apropiat care permite
ca persoana sau sistemul apropiat să înțeleagă informația primită.
Comunitatea desemnată (Designated Community): Este un grup
identificat ca posibili Consumatori care ar trebui să fie capabili de a
înțelege un anumit set de informații în moduri exemplificate de
Obiectivele de Prezervare.
Termen lung (Long Term): Este o periodă de timp îndeajuns de lungă
cât să ridice îngrijorări privind impactul tehnologiilor care se
schimbă, fiind inclus suportul pentru noile forme de media și formate
de date, precum și modificarea Comunității desemnate sau
modificatea Bazei de cunoaștere a Comunității desemnate.
56. 56
Concepte generale de lucru pentru OAIS - III
Independent Inteligibil (Independently Understandable): o
caracteristică a informației care este suficientă din punct de
vedere al competitudinii cât să-i permită să fie înțeleasă de
Comunitatea desemnată așa cum este exemplificat de Obiectivele
de prezervare asociate, fără a face apel la resurse speciale care nu
sunt larg disponibile, incluzând anumite persoane.
Prezervare pe Termen Lung (Long Term Preservation): Actul de a
menține informația Independent Inteligibilă de o Comunitate
desemnată, oferind dovezi că Autenticitatea este menținută pe
Termen lung.
57. 57
CE ESTE OAIS – Open Archival Information System
Un OAIS este o Arhivă ce constă dintr-o organizație, care poate
face parte dintr-o altă organizație mai mare, constituită din
persoane și sisteme care și-au asumat responsabilitatea de a
prezerva informația și de a o pune la dispoziția Comunității
desemnate.
Arhivă: O organizație care intenționează să conserve informație
pentru accesul și utilizarea de către o Comunitate desemnată.
58. 58
Modelul OAIS – vedere de ansamblu
Entitățile
funcționale ale
OAIS
59. 59
Definirea informației conform OAIS (CCSDS 650.0-M-2)
Information is defined as any type of knowledge that can be exchanged, and this information is always expressed
(i.e., represented) by some type of data in an exchange.
Informația este definită ca orice tip de cunoaștere care poate fi
tranzacționată, fiind întotdeauna exprimată (i.e., reprezentată)
de un anumit tip de date dintr-o tranzacție.
data object
obiect de date
Reprezentation information
informație privind
reprezentarea
information object
obiect informație
este
interpretată
folosind produce
Obținerea informațiilor din date
60. 60
Poate fi considerat un concept în adâncime
Dacă ne raportăm la terminologia adoptată la depozitele digitale
din sfera comunicării științifice, termenul „de la suprafață” este
cel de RESURSĂ.
Resursa este entitatea tranzacționată în rețea folosind
tehnologiile web și API-urile.
61. 61
Nivelul de management
Este sursa primară de finanțare a unui OAIS și poate oferi ghiduri
privind utilizarea resurselor (personal, echipament, spații)
Întreprinde evaluări la diferite intervale de timp pentru a analiza
progresul și performanțele în atingerea scopurilor pe Termen lung.
Evaluează riscurile la care sunt supuse obiectele digitale și stabilește
proceduri de utilizare.
Stabilește politici de preț pentru serviciile unei Arhive OAIS și se implică
în arbitrajul Producătorilor, Consumatorilor și administratorii interni.
62. 62
Acorduri și controlul asupra Conținutului
Informațional
Interacțiunile cu Producătorii au la bază modele de date menționate în
Acordul de preluare.
Pentru a atinge țintele unei prezervări de lungă durată este nevoie ca Arhiva
să dețină controlul asupra Conținutului Informațional. Implicații:
- drepturi de autor și alte aspecte privind proprietatea intelectuală;
- autoritatea de a modifica Conținutul Informațional;
- gestionarea acordurilor cu terți.
Arhiva trebuie să obțină drepturile de autor înainte de faza acceptării
materialelor pentru care există restricții. Arhiva trebuie să-i fie permisă
migrarea Obiectelor de Date a Conținutului.
66. 66
ISO/IEC 17021-1:2015 Conformity assessment — Requirements for
bodies providing audit and certification of management systems
Scopul principal al certificării este să ofere încredere tuturor
celor implicați în faptul că un sistem de management
îndeplinește cerințele specificate. Valoarea certificării este
gradul de încredere public stabilit printr-o evaluare competentă
și imparțială făcută de un terț.
68. 68
Web APIs
HTML5
Taxonomy & Status (October 2014)
Recommendation/Proposed
Candidate Recommendation
Last Call
Working Draft
Non-W3C Specifications
Deprecated or inactive
HTML5 & related technologies
W
3C HTML5 specification
I
n
i
t
i
a
l
W
HATWG HTML5 speci
f
i
c
a
t
i
o
n
HTML5
Markup
Web
Messaging
Web
Sockets
Web
Workers
Micro
Data
Drag
and
Drop
Audio
Video
Canvas
2D
HTML 5.1
WebSQL
Web
Storage
HTML +
RDFa
MathML
3.0
SVG Selectors
L1
Navigation
Timing
User
Timing
RDFa
Geo
Location
WAI-ARIA
Touch
Events
Animation
Timing
WOFF
1.0
Media
Capture
Indexed
Database
File API
Battery
Status
XMLHttp
Request
Device
Orientation
JavaScript
WebGL
CSS3
70. 70
Total cost of ownership
https://www.oclc.org/
research/publications/
2021/oclcresearch-total-
cost-of-stewardship.html
71. 71
Resurse de explorat
Can We Do More? An Examination of Potential Roles, Contributors,
Incentives, and Frameworks to Sustain Large-Scale Digital
Preservation https://www.clir.org/can-we-do-more/
Postdoctoral Fellowships in Data Curation for the Sciences and Social
Sciences: Early Experiences and Contexts
https://www.clir.org/postdoctoral-fellowships-dcsss-early-experiences-
and-contexts/
7 things you should know about Institutional Repositories, CRIS
Systems, and their Interoperability
https://www.coar-repositories.org/news-updates/7-things-you-should-k
now-aboutirs/