1. First Studies on Self-Preserving
Digital Objects
Josep Lluis DE LA ROSA and José Antonio OLVERA
2. Estructura
• Introducció
• Estat de l’art
• Model de comportament dels SPDO
• Experimentació
• Conclusions
2
CCIA 2012
3. Estructura
• Introducció
• Estat de l’art
• Model de comportament dels SPDO
• Experimentació
• Conclusions
3
CCIA 2012
4. Introducció
• La Preservació Digital (PD) és la gestió activa dels
continguts digitals al llarg del temps per garantir
l’accés permanent
• És cada vegada més important per a les empreses,
els organismes del sector públic, científics i
ciutadans
• La informació digital generada en totes les àrees
de la nostra societat creix a un ritme exponencial:
▫ En 2011 s’han superat els 1,8 zettabytes
(1,8 billons de gygabytes) [1]
▫ Creix per 9 cada 5 anys
4
[1] Gantz, J. and Reisel, D. (2011). Extracting Value from Chaos. Available at http://idcdocserv.com/1142
5. Introducció
• Fins avui només les institucions públiques afronten
aquest problema, a través dels arxius nacional o les
biblioteques
• Aquests requereixen un canvi dels sistemes digitals
d'arxiu a gran escala cap als objectes intel·ligents en
entorns amb capacitat d'aprenentatge
5
CCIA 2012
6. Introducció
• La missió d’aquesta Recerca és:
▫ Distribuir els esforços de Preservació Digital
▫ Fer la Preservació Digital prou fàcil per les persones,
companyies i institucions en general
▫ Ajudar a reduir el cost i incrementar la capacitat de les
institucions per preservar la informació digital a llarg
termini
6
CCIA 2012
7. Introducció
• Aquest estudi és un primer intent d'establir les bases
d'un nou paradigma en PD centrat en l’objecte
▫ Es caracteritzen per tenir “pressupost digital” crèdit per desplaçar-se,
fer còpies i que es podrà recarregar
▫ Els OD competiran entre ells per preservar-se
▫ Com més interès en un OD, més pressupost rebrà i més probabilitat de ser
preservat
7
CCIA 2012
8. Estructura
• Introducció
• Estat de l’art
• Model de comportament dels SPDO
• Experimentació
• Conclusions
8
CCIA 2012
9. Estructura
• Introducció
• Estat de l’art
• Model de comportament dels SPDO
• Experimentació
• Conclusions
9
CCIA 2012
10. Estat de l’art
• Buckets: Van ser dissenyats per dotar als objectes
amb certes responsabilitats com:
▫ La visualització
▫ Disseminació
▫ Protecció
▫ Manteniment
• Com faran els SPDO
10
CCIA 2012
[8] Nelson M. 2001, Buckets: Smart Objects for Digital Libraries, PhD thesis, Old Dominion Univ.
11. Estat de l’art
• Abans del 2000, va haver una sèrie de projectes
similars als SPDO i als buckets, com:
▫ Els contenidors Warwick Framework
▫ Flexible and Extensible Digital Object Repository
Architecture (FEDORA)
11
CCIA 2012
12. Estat de l’art
• El paradigma SPDO es únic degut a que l’objecte és
intel·ligent, proporcionant intel·ligència de màquina
a màquina (o intel·ligència de SPDO a SPDO i de
SPDO a Serveis Web)
12
CCIA 2012
13. Estructura
• Introducció
• Estat de l’art
• Model de comportament dels SPDO
• Experimentació
• Conclusions
13
CCIA 2012
14. Estructura
• Introducció
• Estat de l’art
• Model de comportament dels SPDO
• Experimentació
• Conclusions
14
CCIA 2012
15. Model de comportament dels SPDO
• Les solucions de PD es classifiquen en dos estratègies
principals:
▫ La preservació de l’entorn tecnològic (emulació)
▫ I superar la obsolescència dels formats dels fitxers
(migració)
• Nosaltres ens centrem en el segon enfocament per
superar les migracions de formats mitjançant la
tècnica d'Intel·ligència d’Eixam
15
CCIA 2012
16. Model de comportament dels SPDO
• L’analogia emprada és la següent:
▫ Objectes digitals (vídeo o imatge) ≡ formigues
▫ Usuaris xarxa (servei de preservació)≡ aliment
▫ Ordinadors xarxa ≡ hàbitats
16
CCIA 2012
17. Model de comportament dels SPDO
17
CATÀSTROFE
format={ }
Format ivmídaetog:e: 13 24
1 2 3 4 5
1
2
3
4
5
Agents usuari
Objectes
Digitals
i els seus
possibles
formats
Usuaris afectats
per catàstrofe
CCIA 2012
18. Model de comportament dels SPDO
• Catàstrofes: consisteixen en un canvi sobtat de ¼,
1/3 o ½ dels usuaris de la xarxa, degut a una
actualització del seu programari
• Mesura de la “resiliència”:
▫ Entropia de Shannon: per saber quan hi ha prou diversitat de formats que
proporcionen la suficient resiliència per recuperar de nou l’estat anterior
després de cada catàstrofe.
18
CCIA 2012
n
H ( x ) p
log
p
i 2 i
i
1
, 2 , ( ) log
H x p
p
i j i j
n
i 1
j
5
1
5
1
,
i ,
j
,
k
i k
i j
f
f
p
Adaptat als
models simulats
On:
• n és el total d'objectes digitals originals
• j són els diferents formats que hi ha, que
són 5
• pi,j és el percentatge que suposen les
còpies de format j respecte el total de
còpies que té un objecte digital original i
• k són els diferents formats que hi ha
19. Model de comportament dels SPDO
• Paràmetres emprats en la simulació:
19
CCIA 2012
Small world Mesh
20. Estructura
• Introducció
• Estat de l’art
• Model de comportament dels SPDO
• Experimentació
• Conclusions
20
CCIA 2012
21. Estructura
• Introducció
• Estat de l’art
• Model de comportament dels SPDO
• Experimentació
• Conclusions
21
CCIA 2012
22. Experimentació
• Emulacions de durada de 20 anys cada 5 anys catàstrofe
• Topologia de xarxa 1: small world
22
• Després de la primera
catàstrofe el sistema mostra el
major percentatge de
recuperació d’entropia
• En el 10% d’adopció es
recupera totalment; al 33% i 50%
va disminuint després de cada
catàstrofe
CCIA 2012
23. Experimentació
• Topologia de xarxa 1: mesh
23
• La recuperació en cada onada
és menor que la topologia
anterior
• També s’observen menors
percentatges de recuperació si
comparem l’entropia al final de la
simulació respecte el primer pic,
abans de la primera catàstrofe
CCIA 2012
24. Estructura
• Introducció
• Estat de l’art
• Model de comportament dels SPDO
• Experimentació
• Conclusions
24
CCIA 2012
25. Estructura
• Introducció
• Estat de l’art
• Model de comportament dels SPDO
• Experimentació
• Conclusions
25
CCIA 2012
26. Conclusions
• Hem proposat un nou mètode de PD emprant objectes digitals
auto-preservables, creant objectes dissenyats per lluitar per la seva
pròpia preservació
• Hem demostrat l’efectivitat d’aquesta estratègia a través de
l’experimentació amb un prototipus d’obsolescència digital
resultant de diverses (3) onades d’adopció de software.
• Coma a treball futur, els resultats experimentals seran comparats
amb aproximacions similars com les presentades per Cartledge i
Nelson [18, 19, 20]
• Aquest estudi és el primer treball experimental en aquest camp que
il·lustra com els objectes digitals auto-preservables amb
comportaments simples poden proporcionar la capacitat de
conservar la seva informació digital
26
CCIA 2012
27. Conclusions
• Diverses preguntes queden pendents:
▫ De quina altra manera s’hauria d’assignar i recarregar
el pressupost digital?
▫ Com es podria dissenyar la topologia de la xarxa social
(d’usuaris) per ajudar a preservar el contingut digital?
▫ Com podríem promoure aquestes topologies?
▫ Quins altres comportaments dels SPDO incrementarien
la resiliència?
▫ Hi ha altres maneres rellevants per mesurar la
resiliència?
27
CCIA 2012
28. First Studies on Self-Preserving
Digital Objects
Josep Lluis DE LA ROSA and José Antonio OLVERA