2. Cosa significa Big Data?
Big data è il termine per descrivere una raccolta di dataset
così grande e complessa da richiedere strumenti differenti
da quelli tradizionali, in tutte le fasi del processo:
dall'acquisizione, alla curation, passando per condivisione,
analisi e visualizzazione.
(Wikipedia)
3. ...e Data Mining?
Il data mining è l'insieme di tecniche e metodologie che
hanno per oggetto l'estrazione di un sapere o di una
conoscenza a partire da grandi quantità di dati e l'utilizzo
scientifico, industriale o operativo di questo sapere.
(Wikipedia)
5. Da dove arrivano tutti questi dati?
Basta pensare che ogni 60
secondi su facebook vengono
generati 350GB di dati, tra
post, mi piace, foto e video, o
che in tutto il mondo si
caricano circa 72 ore di video
su YouTube ogni minuto che
passa.
7. Non solo Social
➔ Archivi di documenti scannerizzati
➔ Documenti elettronici
➔ Media (immagini, video, audio, flash, live
stream, ecc…)
➔ Web (dati governativi, meteo, censuari,
wikipedia, ecc…)
➔ Applicazioni di business (CRM, ERP, portali
intranet, ecc…)
➔ Data Storage (SQL, Hadoop, file systems,
ecc…)
➔ Log di sistema (da server, dispositivi mobili,
ecc…)
➔ Data da Sensori (pubblici e privati)
10. Dati o informazioni?
Il dato è un elemento conosciuto, un’informazione grezza o
elementare ed è solitamente costituito da simboli che
devono essere elaborati.
L’informazione è il risultato derivante dall’interpretazione
di un insieme di dati, che è finalizzata all’apportare un
incremento delle conoscenze di un soggetto.
11. ..e se i Data sono Big?
Non basta più la ricerca e l’analisi statistica classica ma
necessitiamo del data mining.
Che cosa "non è" data mining?
● Cercare un numero di telefono nell'elenco;
● Fare una ricerca in Internet su "vacanze a Chioggia".
Che cosa "è" data mining?
● Scoprire che alcuni cognomi sono molto comuni in certe aree
dell'Italia;
● Fare una ricerca nel web su una parola chiave e classificare i
documenti trovati secondo un criterio semantico;
● Scoprire le relazioni tra tipi di clienti e certi prodotti o campagne
pubblicitarie.
12. Chi trova un (Big) Data...
I Big Data sono fondamentale per la creazione di nuovo
business, contribuiscono a migliorare efficienza, qualità,
prodotti e servizi personalizzati, producendo livelli più
elevati di soddisfazione ed esperienza del cliente.
13. ..trova un tesoro!
Le aziende, ma non solo, devono
imparare ad utilizzare pienamente le
loro risorse di dati.
L’aumento del volume, velocità e
varietà dei dati spesso supera le
capacità delle aziende di gestirli ed
elaborarli con efficacia nei tempi
utili. Una complessità che rende difficile far fronte alle
sempre più urgenti e crescenti esigenze del business.
14. 3V + 1
Volume, Velocità e Varietà sono le proprietà dei Big Data.
Alcune organizzazioni utilizzano una quarta V per indicare
la Veridicità dei dati, ossia la qualità dei dati intesa come il
valore informativo che si riesce ad estrarre.
15. È utile avere molti dati?
1872 - Il cavallo di Eadweard Muybridge
16. Petabyte Age
Giugno 2008 - Wired proclama la morte del
metodo scientifico.
● L’ingente quantità di dati prodotta induce ad analizzarli
matematicamente prima di contestualizzarli.
● Da ricerca delle cause a ricerca delle connessioni.
● “What can science learn from Google?”
18. NoSQL e Hadoop
Hadoop è usato anche da: AOL, Ebay, Facebook, IBM,
ImageShack, Joost, Linkedin, Spotify, The New York Times e
Twitter.
Yahoo! è il più grande contributore a questo progetto, e ne fa
fortemente uso.
19. Chi è interessato dai Big Data?
● AZIENDE
Devono estrarre informazioni utili da enormi quantità di dati
non strutturati, eterogenei, dinamici (Big Data).
● PRIVATO
A noi rimane il dilemma di come bilanciare l’accesso ai
servizi con la cessione di informazioni personali.
● PUBBLICO
Come collettività dovremmo iniziare a interrogarci su come
evitare un uso improprio e discriminatorio delle informazioni
che ci riguardano.
20. Big Data e Imprese
Dei più importanti responsabili marketing del mondo,
80%
Non valuta i feedback provenienti dai social media.
63%
Non utilizza analisi di marketing per prendere decisioni.
http://goo.gl/JiYBKO
21. Tweet sulle patatine in California?
Walmart ne rifornisce i supermercati
Big Data e Imprese
22. La Swedish Tax Agency, grazie
all’incrocio delle informazioni sui
contribuenti, riesce a inviare ai
cittadini un modulo delle
imposte già compilato. Ai
contribuenti spetta così il solo
onere di confermare o modificare
le informazioni via web o SMS.
Big Data e Pubblico
23. L’agenzia per il lavoro tedesca, analizzando i dati storici
sull’impiego e sugli investimenti effettuati, è riuscita a
segmentare la popolazione dei disoccupati per offrire
interventi mirati ed efficienti. Questa azione si è tradotta in
un risparmio di 10 miliardi di euro all’anno per il pubblico e
nella riduzione del tempo impiegato dal cittadino per
ottenere un lavoro.
Big Data e Pubblico
24. Big Data e Pubblico
Il dipartimento di polizia di Los Angeles sta utilizzando
PredPol, un sistema che sulla base delle serie storiche dei
reati, divide le aree da pattugliare in zone, calcola la
distribuzione e la frequenza dei reati, e poi indica quelle da
sorvegliare. L’applicazione del modello matematico ha
portato a un calo dei reati del 13%.
A Santa Cruz lo stesso metodo ha ridotto i furti del 27%.
25. Big Data e Persone
Se invece fosti interessati a migliorare la vostra forma
fisica, Nike+, dal 2006, propone una serie di device,
orologi e bracciali intelligenti, per registrare i chilometri
percorsi, i battiti cardiaci e le calorie consumate, ed
analizzare i dati raccolti sul sito web o sullo smartphone.
Tecnologie fino a qualche anno fa a disposizione dei soli
atleti professionisti, rappresentano i primi esempi di
wearable computing.
26. Rischi
Il dato personale è una moneta di scambio che necessita
di un controllo vigile, per evitare che aziende senza grossi
scrupoli lo utilizzino per inferenze predittive di tipo
prettamente commerciale o generalmente poco nobili.
29. Rischi
Il vero problema, quindi, è:
● definire limiti che assicurino il corretto uso delle
informazioni
● permettere all’utente di conoscere in base a quali
analisi vengano negati dei servizi
● fare trasparenza su quali informazioni siano in mano a
ciascuna azienda
30. Conclusioni
● Il fenomeno dei Big Data, pur rimanendo una novità per
molti, presenta potenziali utilizzi in ogni campo;
● La tecnologia si sta evolvendo apposta per facilitare l’
analisi e la ricerca sui grandi dati;
● Il cittadino deve valutare i servizi a cui può avere
accesso sacrificando parte della privacy;
● Lo stato deve vigilare sugli abusi a cui può condurre la
divulgazione di informazioni personali;
● Chi sfrutta i Big Data, ne trae profitto, a tutti i livelli.