6. Big Data
n. Computing data of a very large size, typically to the extent that its manipulation and
management present significant logistical challenges; (also) the branch of computing
involving such data.
Oxford English Dictionary, 2013
7. L’ORIGINE DEL TERMINE
Usato per la prima volta nel 2008 nel
Computing Community Consortium. Italia
Stati Uniti
9. VOLUME
Volume
Velocità
Varietà
Informazione prodotta in un giorno
2.5 milioni di TB
(il 20% di tutta la conoscenza umana
nel 1999!)
532.000.000 DVD
Se impilati, 640 km!
In un anno, raggiungerebbero il 60%
della distanza Terra - Luna
Fonte: Harvard Business Review,“Big Data: the management revolution”, ottobre 2012.
17. Migliore informazione
Nuove analisi dati
Informazioni real-time
Influsso sui dati dalle nuove tecnologie
Forme non tradizionali di media
Grandi quantità di dati
L’ultima moda
Social media
0% 5% 9% 14% 18%
7%
8%
10%
13%
13%
15%
16%
18%
IN COSA CONSISTONO?
SECONDO GLI EXECUTIVE INTERVISTATI DA IBM
Fonte: IBM,“Analytics:The real-world use of big data”, 2012.
18. LE FONTI
SECONDO GLI EXECUTIVE INTERVISTATI DA IBM
Transazioni
Log
Eventi
E-mail
Social network
Sensori
RFID e POS
Testo libero
Geografici
Audio
Fotografie / video
0% 23% 45% 68% 90%
24%
38%
40%
41%
41%
42%
43%
57%
59%
73%
88%
Fonte: IBM,“Analytics:The real-world use of big data”, 2012.
26. LE OPPORTUNITÀ
1.I big data applicati alla sanità
possono far risparmiare agli Stati
Uniti 300 B$ in efficienza.
2.L’Europa può risparmiare 149 B$
in costi di amministrazione e
governo.
3.Solo negli Stati Uniti serviranno
nel breve periodo 1.5+ M di data
scientist e data manager.
28. I “DATA PRODUCT”
Cose che si conoscono
Cose che non si conoscono
Domande che ci si
fanno
Domande che non ci
si fanno
Business
intelligence
Data
Discovery
Analista dati
Data Scientist
38. […] Renzi ha spiegato di non avere in programma un aumento del prelievo fiscale e di
volere anzi combattere l’evasione “anche attraverso innovazione digitale e incrocio
dei dati”
Il Corriere della Sera Online, 21 marzo 2014
46. MANUFACTURING:TENARIS
FASE 2: USO DEL DATO
Aumento improvviso e non
giustificato di un parametro
di qualità del prodotto
Il processo è andato
fuori controllo
… e con il parametro di
qualità ritorno in controllo.
Viene fatto un intervento e il
processo ritorna in controllo…
54. IL ROI DEI BIG DATA
0.00 €
1.00 €
2.00 €
3.00 €
4.00 €
Ritorno per 1 € investito Ritorno atteso in 3-5 anni
3.50 €
0.55 €
Fonte:Wikibon,“Enterprise struggling to derive maximum value form Big Data”, 2013.
57. I CASI DI INSUCCESSO
1.Assenza di figure con la professionalità necessaria
2.Uso di tecnologie grezze e immature.
3.Mancanza di un business case specifico!
58. I CASI DI SUCCESSO
1.Progetti non sponsorizzati da IT, ma da dipartimenti di line-
of-business come marketing o logistica.
2.Focus su un caso d’uso piccolo, ma strategico.
3.Iterare e crescere sulla base dei risultati precedenti.
59. L’ALGORITMO PER IL SUCCESSO
Contesto di business ben definito
Giuste domande
Risposte
Sorgenti dati di valore
63. INTRODUZIONE AI BIG DATA
E ALLA SCIENZA DEI DATI
Ordine degli Ingegneri di Como, 30 gennaio 2016
Ing.Vincenzo Manzoni, PhD
me@vincenzomanzoni.com
Slide disponibili qui: http://www.vincenzomanzoni.com/corsi/