1. @MappaProject: un approccio computazionale
innovativo per l’archeologia italiana #opendata
#matematica
Gabriele Gattiglia
Seminario di Cultura Digitale, Pisa 6 novembre 2013
2. Carta Predittiva del Potenziale
Archeologico
Carta Archeologica
Carta geomorfologica
Modello matematico Open digital archaeological archive
Open Data
Collaborazione
Trasparenza
Geologi
Archeologi
Matematici
Pisa, Italy
2 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
3. 3 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
Perché essere Open?
4. i beni culturali sono pubblici
4 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
5. E deve conoscere i risultati
la collettività paga
5 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
6. i dati invecchiano
6 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
7. Nell’ultimo decennio sono stati prodotti una grande mole di
dati archeologici, spesso in formato digitale, che sono andati
ad aggiungersi alle sterminate documentazioni analogiche di
scavo prodotte negli ultimi 40 anni, spesso al solo scopo di
giacere inutilizzati negli archivi. Assistiamo al paradosso di
possedere potenti strumenti di calcolo informatico, ma pochi
dati da processare, di produrre con costi molto elevati nuovi
dati, per farne un uso limitato nel migliore dei casi a pochi o
pochissimi riutilizzi.
Ricicliamoli!
7 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
8. Come essere Open?
8 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
9. 9 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
10. Viene utilizzato principalmente per indicare l'accesso libero e
senza restrizione degli articoli pubblicati in riviste accademiche;
inoltre, l'open access copre non soltanto articoli di riviste, ma
anche capitoli di libri e monografie, ed in generale ogni prodotto
della ricerca.
Esistono due strategie principali per garantire pubblicazioni ad
accesso aperto, con numerose sfumature:
• Viene definita «via verde» ("green road") la pratica dell'auto-
archiviazione ("self-archiving"), da parte degli autori, di copie
dei loro articoli in archivi istituzionali o disciplinari, o ancora nei
loro siti personali.
• Viene definita «via d'oro» ("gold road") la pubblicazione di
riviste in cui gli articoli sono direttamente ed immediatamente
accessibili ad accesso aperto.
Fonte: http://it.wikipedia.org/wiki/Open_access
10 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
13. motore webGIS
database server
scripting
web server
Open….source
Fonte: Noti V.: Il webGIS del progetto MAPPA: architettura del sistema e sviluppi futuri
13 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
15. More info
Anichini F., Gattiglia G.: A qualcuno piace
‘webGIS’: indicazioni pratiche per un utilizzo
archeologico consapevole
Kansa E.: Open access in archaeology
Noti V.: Il webGIS del progetto MAPPA:
architettura del sistema e sviluppi futuri
ll webGIS del progetto MAPPA
Video
15 di 59
16. Secondo la Open Knowledge Foundation (http://it.okfn.org/) «un
contenuto o un dato si definisce aperto se chiunque è in grado di
utilizzarlo, ri-utilizzarlo e ridistribuirlo, soggetto, al massimo, alla
richiesta di attribuzione e condivisione allo stesso modo»
…e in archeologia?
16 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
17. Qualche dato
Per capirci meglio
17 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
18. Ricercatori 83%
Professionisti 78%
Addetti alla tutela 74%
di chi lavora in archeologia è d’accordo
sulla creazione di un archivio Open Data
archeologico
di chi lavora in archeologia pensa che
siano uno strumento di pianificazione e
tutela per il MiBAC
di chi lavora in archeologia pensa che
siano uno stimolo per migliorare la qualità
dei dati prodotti
Fonte: Sondaggio Mappa http://mappaproject.arch.unipi.it/wp-content/uploads/2011/08/2013_05_31_csv.csv
90%
93%
64%
61%
di chi lavora in archeologia
pensa che gli Open Data
rappresentino il futuro della
ricerca archeologica
18 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
19. Accessibili, Tempestivi, Riutilizzabili
Tutelandone la «Paternità intellettuale»
L’archeologia è sempre e comunque un’attività di
ricerca (dal momento che produce dati unici e
irripetibili) e non vi è ricerca finché non vi è
pubblicazione del dato
I Dati sono considerati una pubblicazione scientifica
Tramite
• Attribuzione codice DOI (Digital Object Identifier), un
«ISBN» digitale
• Licenza CC BY / CC BY SA
OPEN
Quindi?
19 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
20. Doc. grafica
Doc. fotografica
Doc. compilativa
Relazioni
Apparato
archeografico
(dataset)
Letteratura grigia
DATA
20 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
21. Aspetti legali
21 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
22. Legge 633/1941
Protezione del diritto d'autore e di altri diritti
connessi al suo esercizio
• Diritto d'autore
• Diritto su banche di dati (art. 102-bis e seg)
• Diritto su semplici fotografie (artt- 87-92)
Quali diritti?
Fonte: Anichini F., Ciurcina M. Noti V.: MOD (Mappa Archaeological Open Data Archive): new ideas for new minds
22 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
23. • Quando l'opera è creativa?
• Chi è l'autore?
• Chi è titolare dei diritti?
Problemi
Soluzioni
Liberatoria
D. Lgs. 42/2004 Codice dei
beni culturali e del paesaggio
• Diritto di riproduzione (artt.
106 e seg.)
Autorizzazione
dall'ente preposto
D. Lgs. 196/2003 Codice in
materia di
protezione dei dati personali
• Dati relativi a persone fisiche
identificate o identificabili
(nomi e cognomi di persone fisiche,
fotografie e documentazione grafica, di
immobili di persone fisiche)
Richiesta di diffusione
dei dati
(o anonimizzazione)
Fonte: Anichini F., Ciurcina M. Noti V.: MOD (Mappa Archaeological Open Data Archive): new ideas for new minds
23 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
24. Fonte: Anichini F., Ciurcina M. Noti V.: MOD (Mappa Archaeological Open Data Archive): new ideas for new minds
Attribuzione
Attribuzione Condividi allo stesso modo
compatibili con diritto di riproduzione art. 106 e
seg. D. Lgs. 42/2004
Licenze
24 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
25. Nella lista dei repositories consigliati dal Journal of Open
Archaeological Data http://openarchaeologydata.metajnl.com/
MOD
25 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
26. More info
Anichini F., L’analisi dei dati: un’archeologia
senza aggettivi
Anichini F., MAPPA survey. Gli Open Data
nell’archeologia italiana
Anichini F., Ciurcina M., Noti V, Il MOD: l’archivio
Open Data dell’archeologia italiana
Ciurcina M., Parere legale sul portale Mappa
Open Data
MAPPAproject, L’Open Data e l’archeologia
italiana. Risultati del sondaggio on-line 2013
Video
26 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
27. Modelli predittivi
A cosa servono?
• Pianificazione
• Tutele
• Ricerca
Cosa sono?
Servono a stimare la
presenza/consistenza dei
depositi archeologici
27 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
28. Alla pianificazione
28 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
29. Alla tutela
29 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
30. Map Algebra
Cost Surface Analysis
Alla ricerca
Land use evaluation
30 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
31. •Dati urbani
•Cartografia storica
•Dati geografici/
geomorfologici
•Dati archeologici
PRIMARY DATA
•Dati derivati
SECONDARY DATA
Data model
31 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
33. • Tipologia insediativa
• Densità insediativa
• Pluristratificazione dei depositi
• Rimovibilità non rimovibilità del
deposito
• Grado di conservazione del
deposito
Potenziale archeologico
Parametri
• Il potenziale archeologico di un’area rappresenta la probabilità, più o
meno alta, che vi sia conservata una stratificazione archeologica di
minore o maggiore rilevanza.
• Si calcola attraverso l’analisi e lo studio di una serie di dati storico-
archeologici e paleoambientali ricavati da fonti diverse, con un grado di
approssimazione che varia a seconda della quantità e della qualità dei
dati a disposizione e delle loro relazioni spaziali e contestuali.
• Il potenziale archeologico di un’area è di per sé un fattore indipendente da
qualsiasi tipo di successivo intervento si vada a realizzare, che deve
essere inteso come fattore di rischio contingente.
• La cartografia di potenziale archeologico è un modello predittivo e come
tale è consapevolmente creata come strumento decisionale.
33 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
34. Con un modello matematico
Come?
Perché?
I modelli matematici possono essere applicati ad altri centri urbani
generalità
• I modelli matematici sono utili nelle predizioni
• La matematica può avere un impatto sulla pratica archeologica
e sulla pianificazione territoriale
34 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
35. 7. Report,
explain,
predict
1. Real-world
problem
3. Formulate
the abstract
problem
4. Solve the
abstract problem
5. Interpret
the
solution
6. Verify
the model
TESTING
2. Make assumptions
BASIC RULES governing the system
PROBABILITY DISTRIBUTIONS
MATHEMATICAL
MODELS
STATISTICAL
MODELS
35 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
36. • Ipotesi: se si avesse una conoscenza perfetta del
sottosuolo, allora l’archeologo dovrebbe essere in
grado di assegnare il potenziale in ogni punto
• Un modello matematico è dunque un modo per
stimare il potenziale ogni qualvolta i dati non sono
noti (sempre)
Formalizzazione
36 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
37. Da un punto di vista astratto
• Un punto chiave è l’identificazione delle
relazioni tra ritrovamenti
• Tali relazioni possono essere spaziali o
funzionali
• Queste relazioni possono rafforzare o indebolire
la probabilità della presenza di una struttura più
complessa rafforzano o indeboliscono il
potenziale archeologico di un’area
Principi
37 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
38. • Analogia tra i criteri per attribuire il potenziale
archeologico e quelli per assegnare l’importanza
delle pagine web nei motori di ricerca
• Negli algoritmi page rank le pagine web
- attribuiscono importanza alle pagine web a cui
puntano (mediante un link)
- ricevono importanza dalle pagine web dalle
quali ricevono link
Page Rank
=
+=
=
13
312
21
2/1
2/1
ww
www
ww
38 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
39. Come funzione intuitivamente?
39 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
40. …e in archeologia?
40 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
41. WORKFLOW
Categorizzazione dei
ritrovamenti archeologici
Dare forma ai ritrovamenti
Entrambi influiscono sulla diffusione del potenziale
Creazione aree funzionali:
• urbana
• suburbana
• agricola
Relazioni tra i ritrovamenti
archeologici all’interno dello
stesso periodo
Creazione delle carte
paleogeografiche
Assegnazione del valore del
potenziale informativo
Relazioni tra i ritrovamenti
archeologici di differenti
periodi
Livello sincronico
Livello diacronico
[*]
[**]
[***]
[****]
41 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
42. • Organizazione del territorio
• Attività e tecniche produttive
• Tecniche costruttive
• Strategie e tecniche militari
• Igienico-sanitario
• Sistemi idrici
• Viabilità/trasporti
• Commerci
• Coltivazione/allevamento
• Alimentazione
• Gestione rifiuti
• Antropologia
• Culto/pratiche funerarie
• Aspetti politico-istituzionali
• Indicatori sociali e di genere
• Tempo libero
• Costume
• Fauna/flora
• Ambiente (geomorologia)
Ogni categoria di ritrovamento
archeologico può dare
informazioni su:
A ciascuno è stato
assegnato un valore
binario.
La somma dei valori dà il
potenziale archeologico di
ogni categoria.
[*] Assegnazione del valore del potenziale informativo
42 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
43. Casa-torre
bottega
vicolo
strada
corte
Relazioni tra i ritrovamenti archeologici all’interno dello stesso periodo
[**]
43 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
44. [***] Creazione delle aree funzionali
Ritrovamenti
archeologici
Aree funzionali
Partendo dal presupposto che ogni centro urbano,
in ogni periodo, risulti circondato da una zona di
suburbana e, più esternamente, da una zona
agricola, l'algoritmo utilizza le aree funzionali, vale
a dire i suddetti livelli di organizzazione spaziale, e i
loro valori di potenziale assoluto, per diffondere il
potenziale.
L'individuazione delle aree funzionali avviene
sulla base di numerosi elementi, in quanto dipende
dalle tipologie di ritrovamento, dalle relazioni tra
esse e dal contesto ambientale.
Per limitare la soggettività, nel definire le aree funzionali è
stata utilizzata una procedura automatica.
44 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
45. I dati geomorfologici, stratigrafici e archeologici sono stati
processati attraverso analisi geostatistiche per ottenere i DEM
storici e per realizzare la mappe paleogeografiche dei 7 periodi
analizzati.
Creazione delle carte paleogeografiche[***]
45 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
46. L’algoritmo MAPPA
Per il funziamento dell’algoritmo ogni DEM di periodo (ca 26 km2) è
stato diviso in un griglia di celle di 10 x 10 m per un totale di
1.850.000 celle complessive
46 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
47. Il valore dei links è ottenuto
pesando il valore dell’area funzionale
con il dato paleogeografico
L’ area di influenza è
proporzionale al valore
dell’area funzionale a cui
appartiene una cella
Il “peso” totale dei links distribuiti da ogni cella
contenente ritrovamenti archeologici varia sulla base
della probabilità stimata della presenza di un
determinato ritrovamento vicino ad un’altro
47 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
48. Età contemporanea
Età moderna
Basso medioevo
Alto medioevo
Periodo romano
Periodo etrusco
Protostoria
Il risultato finale
è stata la
creazione di 7
carte di
potenziale
archeologico:
una per ogni
periodo preso
in
considerazione.
48 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
49. Periodo romano
Basso medioevo
49 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
50. Il risultato ottenuto è stato verificato con una
campagna di 14 carotaggi.
Sono stati confrontati il potenziale assoluto dei
carotaggi con il potenziale stimato nella cella.
Il potenziale stimato è risultato:
• corretto in 9 casi su 13 pari al 69,2%;
• l’errore medio - in uno scala di potenziale
compresa tra 1 e 5 - è stato pari a 0.3077
(6,15 %).
Validazione
50 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
51. La carta del potenziale archeologico totale è data
dalla somma pesata delle singole carta di
potenziale di periodo, nella quale i periodi con
minori informazioni acquisiscono maggiore
importanza.
La carta di Potenziale
51 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
52. More info
Anichini F., Dubbini N., Fabiani F., Gattiglia G.,
Gualandi M.L.: MAPPA. Metodologie Applicate
alla Predittività del Potenziale Archeologico
vol.2
Gattiglia G.: MAPPA. Pisa medievale:
archeologia, analisi spaziali e modelli predittivi
Kamermans H. : Predictive Modeling: a view
from the Ivory tower
Video
52 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
54. 54 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
55. …..e il futuro?
55 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
56. 1. Il modello sembra lavorare meglio con quei dati che si
concentrano in un’area piuttosto che con dati di tipo
“policentrico”. Questo è dovuto principalmente al modo in
cui vengono definite le aree funzionali. Prevediamo di
implementare l’algoitmo con modelli differenti in modo da
poterlo utilizzare su scala territoriale;
2. È necessario valutare la bontà della stima fornita dal nostro
modello, attraverso un metodo generale che identifichi un
valore minimo per la quantità dei dati e/o di relazioni che
siano rappresentativi e che permetta di decidere quando
l’applicazione del modello sia appropriata;
3. Abbiamo lavorato solo sui dati “positivi”. Per i futuri sviluppi
sarebbe importante avere anche i dati “negativi”, in modo
che partecipino alla stima del potenziale.
Algoritmo MAPPA
56 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
57. Linked Open Data
Big Data
57 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica
58. Tendenze nel data storage
- digitalization processamento dati attraverso i computer
- usability disponibilità di dati in luoghi diversi e su
dispositivi diversi
Benché il processo sia più evidente in altri campi, anche in
archeologia queste tendenze incoraggiano la produzione di grandi
quantità di dati e lo sviluppo di archivi open data
Il solo metodo per analizzare grandi quantità di dati digitali (ed
eterogenei) è utilizzare metodi automatici
Qui entra in gioco la matematica: il modo per migliorare le
analisi è passare da avere i dati migliori ad avere il miglior modo
di analizzare I dati.
58 / 59@MappaProject: un approccio computazionale innovativo per l’archeologia italiana #opendata #matematica