Conferenza "Esperienze di creatività e democrazia digitale” organizzata dall'Associazione Luoghi di Relazione in collaborazione con IED all'interno del Digital Experience Festival - 26 maggio 2012 - Intervento di Giuliana Bonello (Practice manager Business Intelligence & Data Quality CSI Piemonte)
11. Velocità
Tipo dati vs velocità di aggiornamento
Biblioteca Digitale (Immagini, ecc.)
Leggi e atti amministrativi
Dati dai social network
Streaming sedute consiglio
Sensori
Dati geografici vettoriali
Dati geografici raster (da satellite,
radar, ecc.)
Telecamere strade
Basi dati alfanumeriche della PA
12. Storage complessivo in CSI
850 Tb
Nuovi segmenti
Dati tradizionali
Di dati
Dati Dati
Metadati e Dati GIS Dati GIS
Transazionali e infrastrutturali
Dati decisionali vettoriali raster
testuali (log, mail,..)
Storage attuale 100Tb Storage attuale 50Tb Storage attuale 0,1Tb Storage attuale 4-5Tb Storage attuale 300Tb
Velocità medio-bassa Velocità media Velocità bassa Velocità medio alta Velocità alta
Data Storage di informazioni “tradizionali”
13. Alcuni esempi di
Nuovi segmenti
Di dati
BDP: Biblioteca
IMR: Piattaforma
Digitale Reti di sensori
Immagini in rete di streaming
Piemontese
Storage attuale 100Tb Storage attuale 20Tb Storage attuale 1Tb Storage attuale 0,3Tb
Crescita annuale 25Tb Crescita annuale 20Tb Crescita annuale 0,2Tb Crescita annuale0,2Tb
Velocità: bassa Velocità: media Velocità: media Velocità: alta
Data Storage di nuovi segmenti di informazioni
15. Contributo di ogni Punto di Pubblicazione per anno
250,00
200,00
streamto2006
streamresidenzereali
150,00
streamregpie
streamprovto
G
b
e
y
t
streamgiuntareg
100,00
streameventi
streamcsi
streamconsreg
50,00 streamcomuneto
0,00
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
Anno
Un esempio: piattaforma di streaming
16. Ma crescono di più i dati della capacità
di usarli in modo intelligente…..
21. Livello interno alla PA
Portale di Valorizzazione e (sezione PA)
Accesso ai Dati Pubblici
Livello esterno
Livello interno
alla PA
alla Regione
(sezione pubblica)
(sezione Regione)
GOVERNO CONTENUTI DIGITALI
Basi Dati Condivisione Dati PA
Decisionali Interscambio Riuso Dati Pubblici
Regole di estrazione, Governo dati per la Gestione delle licenze d’uso
integrazione e validazione dei SOA Servizi di abbonamento a dati
dati
Regole
condivise di
trattamento dati
Basi Dati Operazionali
Gestione anagrafiche di riferimento (Master Data Management)
Qualità dei dati (massiva e on-line)
Gestione della sicurezza e normative sui dati
Gestione del ciclo di vita delle informazioni
Gestione dati storici
Metadati
Repository, Semantica e ontologie
Certificazione qualità dei dati
Regole di fornitura e fruizione dei dati
Regole di accesso ai dati
La Data Governance per la PA
22. Possibilità di usare in
modo “intelligente” il
GOVERNO CONTENUTI bacino informativo
DIGITALI Incrocio di Condivisione delle
informazioni informazioni tra le
Basi Dati Condivisione Dati PA
primarie per ottenere pubbliche
Decisionali
Interscambio Riuso Dati informazioni a valore amministrazioni e
Pubblici aggiunto verso i privati
Basi Dati Operazionali Informazioni primarie
(numeri, testi, immagini, video, carte geografiche,…)
Metadati Semantica di descrizione delle informazioni
Social Linked Open IoT
Data Data Data
Oltre la tradizionale Data Governance
23. Il messaggio ai CIO è che l’IT deve rendere
l’informazione più consumabile dal business e i
dati vanno ormai estratti in rete oltre che dall’IT
aziendale, per ottenerne informazione o
intelligence
Ricerca Gartner “The 2012 Gartner CEO and senior business executive survey”
24. Big
data
More
data
Open Linked
data Shared data data
More More stakeholders More
sources Context
Social
data
More
relationshiips
La sfida più generale è la consumabilità di dati condivisi (shared data), articolata su 4 dimensioni:
Più dati: in quantità elevatissime
Più fonti: crescente varietà di fonti che richiede trasparenza
Più contesto: in relazione al quale solo i dati non strutturati sono interpretabili
Più relazioni: ad esempio le affinità colte attraverso i social data
Le 4 dimensioni dei dati condivisi
(Gartner – EIM nel 21° secolo)
31. Cosa è un metadato?
“Il metadato è una informazione che descrive il dato”
Autore: Leonardo da Vinci
Data: 1503-1514 circa
Tecnica: Olio su tavola
Dimensioni: 77x53 cm
Ubicazione: Musée du Louvre, Paris
Metadati Ontologia Web semantico
32. Numerosi sono i progetti piemontesi che hanno promosso
la digitalizzazione delle risorse culturali:
dal 1985: SBN – Servizio Bibliotecario Nazionale
dal 1992: Guarini
dal 2004: BDP – Biblioteca Digitale Piemontese
dal 2010: Archivio Storico La Stampa
Digitalizzazione Patrimonio Culturale
Un altro aspetto fondamentale su Internet sono i contenuti e le PA hanno un patrimonio informativo notevole, pagato dai cittadini, ma nascosto nei forzieri pubblici