SlideShare a Scribd company logo
1 of 18
Download to read offline
Management of cultural heritage
using Big Data
Palermo Rome and Venice a comparative study

Focus on Matera 2019
10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
Topics
Introduction
Framework
Corpus and Methods
Main results
Further analysis
11 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
Places and Persons
10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
Stars vs Texts
Bellissimo maestoso stupendo simbolo di Roma.
Consiglio di prenotare on line e di andare al mattino
presto massimo per le 09:30, perché poi arrivano
gruppi e la massa di turisti e si creano code fuori e ai
metal detector.
Rate me, please…
10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
If I read every review, I know more
Text Mining
10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
TM process and IT tools
10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
Interpretation - Evaluation
Text Mining - Pattern Discovery
Glossary
• Corpus is created by the
researcher (eg. a set of reviews).

• Texts are units defined by the
researcher (eg. each review is
a text).

• Text segments are the words
contexts, the corpus division
in TS is automatically done.
Corpus
a group of text
Text
a group of text segments
Text Segments
10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
Framework
Reinert Method
Preconditions:
Coherent textual data
Text large enough (minimum 10000 words)
10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
Alceste (Analyse Lexicale par Contexte d’un Ensemble de Segments de TExte)
Cooccurrence analysis
Full words (adverbs, adjectives, nouns, verbs )
Lexical worlds as “mental rooms”
Lexical content of each cluster
Framework
Reinert Method
10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
Cluster Analysis
• DHC Descending Hierarchical Classification
• Each cluster represents a recurring topic within the text
• Maximizing similarity between statements in the same
class
10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
Identify topics
class 2 (16.6%) class 3 (25.1%) class 1 (27.1%) class 4 (31.3%)
roma
mondo
vedere
storia
bellezza
città
visitare
monumento
bello
rimanere
notte
sera
volta
sempre
parola
biglietto
fila
coda
palatino
prenotare
saltare
guida
euro
ingresso
online
foro
acquistare
biglietteria
pagare
evitare
6416 segments classified on 7125 (90.05%)
2006/64161739/64161609/64161062/6416
10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
Identify topics
class 2 (16.6%) class 3 (25.1%) class 1 (27.1%) class 4 (31.3%)
roma
mondo
vedere
storia
bellezza
città
visitare
monumento
bello
rimanere
notte
sera
volta
sempre
parola
6416 segments classified on 7125 (90.05%)
2006/64161739/64161609/6416
10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
fila/coda
saltare/evitare
prenotare
biglietto
zaino/borsa
online
acquistare
ingresso
lungo
chilometrico
deposito
organizzazione
consiglio
basilica
san_marco
venezia
piazza
pala
oro
cavallo
museo
interno
pagamento
loggia
terrazza
chiesa
roma
colosseo
romano
monumento
mondo
storia
simbolo
eterno
anfiteatro
gladiatore
maestoso
sera
impero
cappella
palatino
palazzo
palermo
normanno
reale
arabo
sicilia
mostra
sede
gioiello
mosaico
siciliano
Planning the visit
Observe and Report
1062 segments classified on 6416 (16.6%)
• fila/coda/attesa
• saltare/evitare
• consiglio
• prenotare/acquistare
• entrare
• biglietto
• online/internet
• deposito
• zaino/borsa
• informazione
• gestire
• organizzazione
• orario/minuti
• apertura
• chiusura
10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
Most representative UCE
prima domenica del mese ingresso gratis la biglietteria apre alle 8 30 ma già 
alle 8 c’è fila. Tutt’intorno è pieno di venditori più o meno abusivi di visite
guidate con opportunità  di saltare la fila quella all’ ingresso non quella alla
biglietteria
10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
colosseo fantastico da rivedere l’organizzazione monumento di bellezza più unica
che rara merita assolutamente la visita, difetta di organizzazione nella vendita dei
biglietti visto che polizia municipale ed un addetto mi hanno fare la fila al
botteghino salvo poi scoprire che il biglietto si comprava direttamente all ingresso
caotico per accedere a questa basilica è obbligatorio fare code chilometriche e
bisogna informarsi molto bene degli orari, noi l’abbiamo fatta per poi scoprire
che era chiusa, inoltre occhio a non avere zaini o borse grandi altrimenti
verrete respinti sinceramente mi aspettavo migliore organizzazione
Most representative UCE
la basilica merita sicuramente qualche minuto di coda ed è gratis non ci si
può accedere con gli zaini ma viene offerto un deposito gratuito presso il
quale ti danno un pass che dura un ora e che ti permette anche di saltare la
fila
10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
Belle le stanze e davvero da non perdere la cappella palatina. Accessibile anche
a chi ha difficoltà motorie, é davvero un monumento da vedere.
nonostante gli sforzi per permettere l'accesso ai diversamente abili motori,
resta molto da fare. La “pala" è visibile solo con accompagnatori così come il
'tesoro'
Matera 2019
class 3 (25.7%) class 1 (35.1%) class 2 (39.2%)
guida
guidare
visita
consiglio
tour
giro
fare
capire
vivamente
turistico
accompagnare
euro
scarpa
giorno
sera
notte
presepe
panorama
belvedere
godere
vicolo
atmosfera
stradino
scorcio
bellissimo
giornata
cultura
capitale
patrimonio
europeo
unesco
italia
vergogna
passato
umanità
tradizione
anno
natura
uomo
1898 segments classified on 2442 (77.72%)
10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
Further developments
● Reporting
● Recommender System
● Tailored Tour
● ……………………………………..
● ……………………………………..
10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
Question Time
Sandro Stancampiano
Istat
Technologist
www.statsapp.it
sandro@statsapp.it
10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano

More Related Content

Similar to Gestire i beni culturali con i big data (Sandro Stancampiano, Istat)

Premio pa sostenibile_2019_passpartour
Premio pa sostenibile_2019_passpartourPremio pa sostenibile_2019_passpartour
Premio pa sostenibile_2019_passpartourGiulio Poggiaroni
 
#TDLAB Piano strategico per la Digitalizzazione del Turismo Italiano
#TDLAB Piano strategico per la Digitalizzazione del Turismo Italiano#TDLAB Piano strategico per la Digitalizzazione del Turismo Italiano
#TDLAB Piano strategico per la Digitalizzazione del Turismo ItalianoSergio Cagol
 
La Comunicazione Digitale per i Musei (Chiara Natali)
La Comunicazione Digitale per i Musei (Chiara Natali)La Comunicazione Digitale per i Musei (Chiara Natali)
La Comunicazione Digitale per i Musei (Chiara Natali)Chiara Natali
 
Piemonte Visual Storython - il percorso
Piemonte Visual Storython - il percorsoPiemonte Visual Storython - il percorso
Piemonte Visual Storython - il percorsoGiuliana Bonello
 
MakerInFF - Opendata nella pa: moda, adempimenti o reale opportunita' per un ...
MakerInFF - Opendata nella pa: moda, adempimenti o reale opportunita' per un ...MakerInFF - Opendata nella pa: moda, adempimenti o reale opportunita' per un ...
MakerInFF - Opendata nella pa: moda, adempimenti o reale opportunita' per un ...Francesco Piero Paolicelli
 
Premio pa sostenibile_2019_passpartour
Premio pa sostenibile_2019_passpartourPremio pa sostenibile_2019_passpartour
Premio pa sostenibile_2019_passpartourGiulio Poggiaroni
 
Produzione e valorizzazione del patrimonio culturale: modelli gestionali e in...
Produzione e valorizzazione del patrimonio culturale: modelli gestionali e in...Produzione e valorizzazione del patrimonio culturale: modelli gestionali e in...
Produzione e valorizzazione del patrimonio culturale: modelli gestionali e in...Iris Network
 
Premi e menzioni del CSI Piemonte ai lavori del Piemonte Visual Contest
Premi e menzioni del CSI Piemonte ai lavori del Piemonte Visual ContestPremi e menzioni del CSI Piemonte ai lavori del Piemonte Visual Contest
Premi e menzioni del CSI Piemonte ai lavori del Piemonte Visual ContestGiuliana Bonello
 
Ro Technology Smart City Exhibition
Ro Technology Smart City ExhibitionRo Technology Smart City Exhibition
Ro Technology Smart City Exhibitionlorenzo impronta
 

Similar to Gestire i beni culturali con i big data (Sandro Stancampiano, Istat) (12)

Arte responsiva?
Arte responsiva?Arte responsiva?
Arte responsiva?
 
Newsletter 14
Newsletter 14Newsletter 14
Newsletter 14
 
Premio pa sostenibile_2019_passpartour
Premio pa sostenibile_2019_passpartourPremio pa sostenibile_2019_passpartour
Premio pa sostenibile_2019_passpartour
 
#TDLAB Piano strategico per la Digitalizzazione del Turismo Italiano
#TDLAB Piano strategico per la Digitalizzazione del Turismo Italiano#TDLAB Piano strategico per la Digitalizzazione del Turismo Italiano
#TDLAB Piano strategico per la Digitalizzazione del Turismo Italiano
 
La Comunicazione Digitale per i Musei (Chiara Natali)
La Comunicazione Digitale per i Musei (Chiara Natali)La Comunicazione Digitale per i Musei (Chiara Natali)
La Comunicazione Digitale per i Musei (Chiara Natali)
 
Piemonte Visual Storython - il percorso
Piemonte Visual Storython - il percorsoPiemonte Visual Storython - il percorso
Piemonte Visual Storython - il percorso
 
MakerInFF - Opendata nella pa: moda, adempimenti o reale opportunita' per un ...
MakerInFF - Opendata nella pa: moda, adempimenti o reale opportunita' per un ...MakerInFF - Opendata nella pa: moda, adempimenti o reale opportunita' per un ...
MakerInFF - Opendata nella pa: moda, adempimenti o reale opportunita' per un ...
 
Premio pa sostenibile_2019_passpartour
Premio pa sostenibile_2019_passpartourPremio pa sostenibile_2019_passpartour
Premio pa sostenibile_2019_passpartour
 
Presentazione finale #TDLAB
Presentazione finale #TDLABPresentazione finale #TDLAB
Presentazione finale #TDLAB
 
Produzione e valorizzazione del patrimonio culturale: modelli gestionali e in...
Produzione e valorizzazione del patrimonio culturale: modelli gestionali e in...Produzione e valorizzazione del patrimonio culturale: modelli gestionali e in...
Produzione e valorizzazione del patrimonio culturale: modelli gestionali e in...
 
Premi e menzioni del CSI Piemonte ai lavori del Piemonte Visual Contest
Premi e menzioni del CSI Piemonte ai lavori del Piemonte Visual ContestPremi e menzioni del CSI Piemonte ai lavori del Piemonte Visual Contest
Premi e menzioni del CSI Piemonte ai lavori del Piemonte Visual Contest
 
Ro Technology Smart City Exhibition
Ro Technology Smart City ExhibitionRo Technology Smart City Exhibition
Ro Technology Smart City Exhibition
 

More from Data Driven Innovation

Integrazione della mobilità elettrica nei sistemi urbani (Stefano Carrese, Un...
Integrazione della mobilità elettrica nei sistemi urbani (Stefano Carrese, Un...Integrazione della mobilità elettrica nei sistemi urbani (Stefano Carrese, Un...
Integrazione della mobilità elettrica nei sistemi urbani (Stefano Carrese, Un...Data Driven Innovation
 
La statistica ufficiale e i trasporti marittimi nell'era dei big data (Vincen...
La statistica ufficiale e i trasporti marittimi nell'era dei big data (Vincen...La statistica ufficiale e i trasporti marittimi nell'era dei big data (Vincen...
La statistica ufficiale e i trasporti marittimi nell'era dei big data (Vincen...Data Driven Innovation
 
How can we realize the Mobility as a Service (Maas) (Andrea Paletti, London S...
How can we realize the Mobility as a Service (Maas) (Andrea Paletti, London S...How can we realize the Mobility as a Service (Maas) (Andrea Paletti, London S...
How can we realize the Mobility as a Service (Maas) (Andrea Paletti, London S...Data Driven Innovation
 
Il DTC-Lazio e i dati del patrimonio culturale (Maria Prezioso, Università To...
Il DTC-Lazio e i dati del patrimonio culturale (Maria Prezioso, Università To...Il DTC-Lazio e i dati del patrimonio culturale (Maria Prezioso, Università To...
Il DTC-Lazio e i dati del patrimonio culturale (Maria Prezioso, Università To...Data Driven Innovation
 
CHNet-DHLab: Servizi Cloud a supporto dei beni culturali (Fabio Proietti, INF...
CHNet-DHLab: Servizi Cloud a supporto dei beni culturali (Fabio Proietti, INF...CHNet-DHLab: Servizi Cloud a supporto dei beni culturali (Fabio Proietti, INF...
CHNet-DHLab: Servizi Cloud a supporto dei beni culturali (Fabio Proietti, INF...Data Driven Innovation
 
Progetto EOSC-Pillar (Fulvio Galeazzi, GARR)
Progetto EOSC-Pillar (Fulvio Galeazzi, GARR)Progetto EOSC-Pillar (Fulvio Galeazzi, GARR)
Progetto EOSC-Pillar (Fulvio Galeazzi, GARR)Data Driven Innovation
 
Una infrastruttura per l’accesso al patrimonio culturale: il Progetto del Por...
Una infrastruttura per l’accesso al patrimonio culturale: il Progetto del Por...Una infrastruttura per l’accesso al patrimonio culturale: il Progetto del Por...
Una infrastruttura per l’accesso al patrimonio culturale: il Progetto del Por...Data Driven Innovation
 
Utilizzo dei Big data per l’analisi dei flussi veicolari e della mobilità (Ma...
Utilizzo dei Big data per l’analisi dei flussi veicolari e della mobilità (Ma...Utilizzo dei Big data per l’analisi dei flussi veicolari e della mobilità (Ma...
Utilizzo dei Big data per l’analisi dei flussi veicolari e della mobilità (Ma...Data Driven Innovation
 
I dati personali nell'analisi comportamentale della mobilità di dipendenti e ...
I dati personali nell'analisi comportamentale della mobilità di dipendenti e ...I dati personali nell'analisi comportamentale della mobilità di dipendenti e ...
I dati personali nell'analisi comportamentale della mobilità di dipendenti e ...Data Driven Innovation
 
Estrarre valore dai dati: tecnologie per ottimizzare la mobilità del futuro (...
Estrarre valore dai dati: tecnologie per ottimizzare la mobilità del futuro (...Estrarre valore dai dati: tecnologie per ottimizzare la mobilità del futuro (...
Estrarre valore dai dati: tecnologie per ottimizzare la mobilità del futuro (...Data Driven Innovation
 
Le piattaforme dati per la mobilità nelle città italiane (Marco Mena, EY)
Le piattaforme dati per la mobilità nelle città italiane (Marco Mena, EY)Le piattaforme dati per la mobilità nelle città italiane (Marco Mena, EY)
Le piattaforme dati per la mobilità nelle città italiane (Marco Mena, EY)Data Driven Innovation
 
WiseTown, un ecosistema di applicazioni e strumenti per migliorare la qualità...
WiseTown, un ecosistema di applicazioni e strumenti per migliorare la qualità...WiseTown, un ecosistema di applicazioni e strumenti per migliorare la qualità...
WiseTown, un ecosistema di applicazioni e strumenti per migliorare la qualità...Data Driven Innovation
 
CityOpenSource as a civic tech tool (Ilaria Vitellio, CityOpenSource)
CityOpenSource as a civic tech tool (Ilaria Vitellio, CityOpenSource)CityOpenSource as a civic tech tool (Ilaria Vitellio, CityOpenSource)
CityOpenSource as a civic tech tool (Ilaria Vitellio, CityOpenSource)Data Driven Innovation
 
Big Data Confederation: toward the local urban data market place (Renzo Taffa...
Big Data Confederation: toward the local urban data market place (Renzo Taffa...Big Data Confederation: toward the local urban data market place (Renzo Taffa...
Big Data Confederation: toward the local urban data market place (Renzo Taffa...Data Driven Innovation
 
Making citizens the eyes of policy makers: a sweet spot for hybrid AI? (Danie...
Making citizens the eyes of policy makers: a sweet spot for hybrid AI? (Danie...Making citizens the eyes of policy makers: a sweet spot for hybrid AI? (Danie...
Making citizens the eyes of policy makers: a sweet spot for hybrid AI? (Danie...Data Driven Innovation
 
Dall'Agenda Digitale alla Smart City: il percorso di Roma Capitale verso il D...
Dall'Agenda Digitale alla Smart City: il percorso di Roma Capitale verso il D...Dall'Agenda Digitale alla Smart City: il percorso di Roma Capitale verso il D...
Dall'Agenda Digitale alla Smart City: il percorso di Roma Capitale verso il D...Data Driven Innovation
 
Reusing open data: how to make a difference (Vittorio Scarano, Università di ...
Reusing open data: how to make a difference (Vittorio Scarano, Università di ...Reusing open data: how to make a difference (Vittorio Scarano, Università di ...
Reusing open data: how to make a difference (Vittorio Scarano, Università di ...Data Driven Innovation
 
Data Governance: cos’è e perché è importante? (Elena Arista, Erwin)
Data Governance: cos’è e perché è importante? (Elena Arista, Erwin)Data Governance: cos’è e perché è importante? (Elena Arista, Erwin)
Data Governance: cos’è e perché è importante? (Elena Arista, Erwin)Data Driven Innovation
 
Data driven economy: bastano i dati per avviare una start up? (Gabriele Anton...
Data driven economy: bastano i dati per avviare una start up? (Gabriele Anton...Data driven economy: bastano i dati per avviare una start up? (Gabriele Anton...
Data driven economy: bastano i dati per avviare una start up? (Gabriele Anton...Data Driven Innovation
 
Developing Game-Changing Embedded Intelligence (Francesca Perino, MathWorks)
Developing Game-Changing Embedded Intelligence (Francesca Perino, MathWorks)Developing Game-Changing Embedded Intelligence (Francesca Perino, MathWorks)
Developing Game-Changing Embedded Intelligence (Francesca Perino, MathWorks)Data Driven Innovation
 

More from Data Driven Innovation (20)

Integrazione della mobilità elettrica nei sistemi urbani (Stefano Carrese, Un...
Integrazione della mobilità elettrica nei sistemi urbani (Stefano Carrese, Un...Integrazione della mobilità elettrica nei sistemi urbani (Stefano Carrese, Un...
Integrazione della mobilità elettrica nei sistemi urbani (Stefano Carrese, Un...
 
La statistica ufficiale e i trasporti marittimi nell'era dei big data (Vincen...
La statistica ufficiale e i trasporti marittimi nell'era dei big data (Vincen...La statistica ufficiale e i trasporti marittimi nell'era dei big data (Vincen...
La statistica ufficiale e i trasporti marittimi nell'era dei big data (Vincen...
 
How can we realize the Mobility as a Service (Maas) (Andrea Paletti, London S...
How can we realize the Mobility as a Service (Maas) (Andrea Paletti, London S...How can we realize the Mobility as a Service (Maas) (Andrea Paletti, London S...
How can we realize the Mobility as a Service (Maas) (Andrea Paletti, London S...
 
Il DTC-Lazio e i dati del patrimonio culturale (Maria Prezioso, Università To...
Il DTC-Lazio e i dati del patrimonio culturale (Maria Prezioso, Università To...Il DTC-Lazio e i dati del patrimonio culturale (Maria Prezioso, Università To...
Il DTC-Lazio e i dati del patrimonio culturale (Maria Prezioso, Università To...
 
CHNet-DHLab: Servizi Cloud a supporto dei beni culturali (Fabio Proietti, INF...
CHNet-DHLab: Servizi Cloud a supporto dei beni culturali (Fabio Proietti, INF...CHNet-DHLab: Servizi Cloud a supporto dei beni culturali (Fabio Proietti, INF...
CHNet-DHLab: Servizi Cloud a supporto dei beni culturali (Fabio Proietti, INF...
 
Progetto EOSC-Pillar (Fulvio Galeazzi, GARR)
Progetto EOSC-Pillar (Fulvio Galeazzi, GARR)Progetto EOSC-Pillar (Fulvio Galeazzi, GARR)
Progetto EOSC-Pillar (Fulvio Galeazzi, GARR)
 
Una infrastruttura per l’accesso al patrimonio culturale: il Progetto del Por...
Una infrastruttura per l’accesso al patrimonio culturale: il Progetto del Por...Una infrastruttura per l’accesso al patrimonio culturale: il Progetto del Por...
Una infrastruttura per l’accesso al patrimonio culturale: il Progetto del Por...
 
Utilizzo dei Big data per l’analisi dei flussi veicolari e della mobilità (Ma...
Utilizzo dei Big data per l’analisi dei flussi veicolari e della mobilità (Ma...Utilizzo dei Big data per l’analisi dei flussi veicolari e della mobilità (Ma...
Utilizzo dei Big data per l’analisi dei flussi veicolari e della mobilità (Ma...
 
I dati personali nell'analisi comportamentale della mobilità di dipendenti e ...
I dati personali nell'analisi comportamentale della mobilità di dipendenti e ...I dati personali nell'analisi comportamentale della mobilità di dipendenti e ...
I dati personali nell'analisi comportamentale della mobilità di dipendenti e ...
 
Estrarre valore dai dati: tecnologie per ottimizzare la mobilità del futuro (...
Estrarre valore dai dati: tecnologie per ottimizzare la mobilità del futuro (...Estrarre valore dai dati: tecnologie per ottimizzare la mobilità del futuro (...
Estrarre valore dai dati: tecnologie per ottimizzare la mobilità del futuro (...
 
Le piattaforme dati per la mobilità nelle città italiane (Marco Mena, EY)
Le piattaforme dati per la mobilità nelle città italiane (Marco Mena, EY)Le piattaforme dati per la mobilità nelle città italiane (Marco Mena, EY)
Le piattaforme dati per la mobilità nelle città italiane (Marco Mena, EY)
 
WiseTown, un ecosistema di applicazioni e strumenti per migliorare la qualità...
WiseTown, un ecosistema di applicazioni e strumenti per migliorare la qualità...WiseTown, un ecosistema di applicazioni e strumenti per migliorare la qualità...
WiseTown, un ecosistema di applicazioni e strumenti per migliorare la qualità...
 
CityOpenSource as a civic tech tool (Ilaria Vitellio, CityOpenSource)
CityOpenSource as a civic tech tool (Ilaria Vitellio, CityOpenSource)CityOpenSource as a civic tech tool (Ilaria Vitellio, CityOpenSource)
CityOpenSource as a civic tech tool (Ilaria Vitellio, CityOpenSource)
 
Big Data Confederation: toward the local urban data market place (Renzo Taffa...
Big Data Confederation: toward the local urban data market place (Renzo Taffa...Big Data Confederation: toward the local urban data market place (Renzo Taffa...
Big Data Confederation: toward the local urban data market place (Renzo Taffa...
 
Making citizens the eyes of policy makers: a sweet spot for hybrid AI? (Danie...
Making citizens the eyes of policy makers: a sweet spot for hybrid AI? (Danie...Making citizens the eyes of policy makers: a sweet spot for hybrid AI? (Danie...
Making citizens the eyes of policy makers: a sweet spot for hybrid AI? (Danie...
 
Dall'Agenda Digitale alla Smart City: il percorso di Roma Capitale verso il D...
Dall'Agenda Digitale alla Smart City: il percorso di Roma Capitale verso il D...Dall'Agenda Digitale alla Smart City: il percorso di Roma Capitale verso il D...
Dall'Agenda Digitale alla Smart City: il percorso di Roma Capitale verso il D...
 
Reusing open data: how to make a difference (Vittorio Scarano, Università di ...
Reusing open data: how to make a difference (Vittorio Scarano, Università di ...Reusing open data: how to make a difference (Vittorio Scarano, Università di ...
Reusing open data: how to make a difference (Vittorio Scarano, Università di ...
 
Data Governance: cos’è e perché è importante? (Elena Arista, Erwin)
Data Governance: cos’è e perché è importante? (Elena Arista, Erwin)Data Governance: cos’è e perché è importante? (Elena Arista, Erwin)
Data Governance: cos’è e perché è importante? (Elena Arista, Erwin)
 
Data driven economy: bastano i dati per avviare una start up? (Gabriele Anton...
Data driven economy: bastano i dati per avviare una start up? (Gabriele Anton...Data driven economy: bastano i dati per avviare una start up? (Gabriele Anton...
Data driven economy: bastano i dati per avviare una start up? (Gabriele Anton...
 
Developing Game-Changing Embedded Intelligence (Francesca Perino, MathWorks)
Developing Game-Changing Embedded Intelligence (Francesca Perino, MathWorks)Developing Game-Changing Embedded Intelligence (Francesca Perino, MathWorks)
Developing Game-Changing Embedded Intelligence (Francesca Perino, MathWorks)
 

Gestire i beni culturali con i big data (Sandro Stancampiano, Istat)

  • 1. Management of cultural heritage using Big Data Palermo Rome and Venice a comparative study Focus on Matera 2019 10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
  • 2. Topics Introduction Framework Corpus and Methods Main results Further analysis 11 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
  • 3. Places and Persons 10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
  • 4. Stars vs Texts Bellissimo maestoso stupendo simbolo di Roma. Consiglio di prenotare on line e di andare al mattino presto massimo per le 09:30, perché poi arrivano gruppi e la massa di turisti e si creano code fuori e ai metal detector. Rate me, please… 10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
  • 5. If I read every review, I know more Text Mining 10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
  • 6. TM process and IT tools 10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano Interpretation - Evaluation Text Mining - Pattern Discovery
  • 7. Glossary • Corpus is created by the researcher (eg. a set of reviews). • Texts are units defined by the researcher (eg. each review is a text). • Text segments are the words contexts, the corpus division in TS is automatically done. Corpus a group of text Text a group of text segments Text Segments 10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
  • 8. Framework Reinert Method Preconditions: Coherent textual data Text large enough (minimum 10000 words) 10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
  • 9. Alceste (Analyse Lexicale par Contexte d’un Ensemble de Segments de TExte) Cooccurrence analysis Full words (adverbs, adjectives, nouns, verbs ) Lexical worlds as “mental rooms” Lexical content of each cluster Framework Reinert Method 10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
  • 10. Cluster Analysis • DHC Descending Hierarchical Classification • Each cluster represents a recurring topic within the text • Maximizing similarity between statements in the same class 10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
  • 11. Identify topics class 2 (16.6%) class 3 (25.1%) class 1 (27.1%) class 4 (31.3%) roma mondo vedere storia bellezza città visitare monumento bello rimanere notte sera volta sempre parola biglietto fila coda palatino prenotare saltare guida euro ingresso online foro acquistare biglietteria pagare evitare 6416 segments classified on 7125 (90.05%) 2006/64161739/64161609/64161062/6416 10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
  • 12. Identify topics class 2 (16.6%) class 3 (25.1%) class 1 (27.1%) class 4 (31.3%) roma mondo vedere storia bellezza città visitare monumento bello rimanere notte sera volta sempre parola 6416 segments classified on 7125 (90.05%) 2006/64161739/64161609/6416 10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano fila/coda saltare/evitare prenotare biglietto zaino/borsa online acquistare ingresso lungo chilometrico deposito organizzazione consiglio basilica san_marco venezia piazza pala oro cavallo museo interno pagamento loggia terrazza chiesa roma colosseo romano monumento mondo storia simbolo eterno anfiteatro gladiatore maestoso sera impero cappella palatino palazzo palermo normanno reale arabo sicilia mostra sede gioiello mosaico siciliano
  • 13. Planning the visit Observe and Report 1062 segments classified on 6416 (16.6%) • fila/coda/attesa • saltare/evitare • consiglio • prenotare/acquistare • entrare • biglietto • online/internet • deposito • zaino/borsa • informazione • gestire • organizzazione • orario/minuti • apertura • chiusura 10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
  • 14. Most representative UCE prima domenica del mese ingresso gratis la biglietteria apre alle 8 30 ma già  alle 8 c’è fila. Tutt’intorno è pieno di venditori più o meno abusivi di visite guidate con opportunità  di saltare la fila quella all’ ingresso non quella alla biglietteria 10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano colosseo fantastico da rivedere l’organizzazione monumento di bellezza più unica che rara merita assolutamente la visita, difetta di organizzazione nella vendita dei biglietti visto che polizia municipale ed un addetto mi hanno fare la fila al botteghino salvo poi scoprire che il biglietto si comprava direttamente all ingresso caotico per accedere a questa basilica è obbligatorio fare code chilometriche e bisogna informarsi molto bene degli orari, noi l’abbiamo fatta per poi scoprire che era chiusa, inoltre occhio a non avere zaini o borse grandi altrimenti verrete respinti sinceramente mi aspettavo migliore organizzazione
  • 15. Most representative UCE la basilica merita sicuramente qualche minuto di coda ed è gratis non ci si può accedere con gli zaini ma viene offerto un deposito gratuito presso il quale ti danno un pass che dura un ora e che ti permette anche di saltare la fila 10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano Belle le stanze e davvero da non perdere la cappella palatina. Accessibile anche a chi ha difficoltà motorie, é davvero un monumento da vedere. nonostante gli sforzi per permettere l'accesso ai diversamente abili motori, resta molto da fare. La “pala" è visibile solo con accompagnatori così come il 'tesoro'
  • 16. Matera 2019 class 3 (25.7%) class 1 (35.1%) class 2 (39.2%) guida guidare visita consiglio tour giro fare capire vivamente turistico accompagnare euro scarpa giorno sera notte presepe panorama belvedere godere vicolo atmosfera stradino scorcio bellissimo giornata cultura capitale patrimonio europeo unesco italia vergogna passato umanità tradizione anno natura uomo 1898 segments classified on 2442 (77.72%) 10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
  • 17. Further developments ● Reporting ● Recommender System ● Tailored Tour ● …………………………………….. ● …………………………………….. 10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano
  • 18. Question Time Sandro Stancampiano Istat Technologist www.statsapp.it sandro@statsapp.it 10 may 2019 - Data Driven Innovation Summit - Sandro Stancampiano