SlideShare une entreprise Scribd logo
1  sur  23
Télécharger pour lire hors ligne
L’impatto di un’architettura Big Data
nell’IT Transformation di Octo Telematics
Silvia Marrone
Pisa, 28 gennaio 2016
Chi è Octo Telematics
• Pioniera e innovatrice
di soluzioni telematiche
• Modello all’avanguardia per ricerca,
sviluppo e gestione di applicazioni
per le assicurazioni auto
Chi è Octo Telematics
• Abitudini e comportamenti degli automobilisti
• Servizi di sicurezza e assistenza per il veicolo e la persona
• Analisi e ricostruzione della dinamica e cinematica
dei sinistri stradali
• Prodotti assicurativi personalizzati:
"pay per use" e "pay per risk"
• Telediagnostica
• Traffico in tempo reale
• Strade a pedaggio (“road charging”)
• Gestione delle flotte
• Monitoraggio dell'impatto ambientale dei veicoli in movimento
Che servizi offre
La trasformazione
Obiettivo del tirocinio
Nell’ambito del progetto di IT Transformation parteciperà al disegno
della soluzione Big Data acquisendo competenze in merito alla
trasformazione da un’architettura tradizionale basata su RDBMS (Oracle)
ad un modello NoSQL basato su Framework Hadoop (Cloudera). La
risorsa sarà inserita in un team di progetto che comprende Software
Vendor e System Integrator internazionali, con i quali potrà interagire e
collaborare per acquisire le competenze necessarie alla realizzazione di
un progetto pilota per la realizzazione di una soluzione NoSQL che
consenta di raccogliere in tempo reale dati telematici non strutturati,
necessari ad individuare i comportamenti dei guidatori.
Vantaggi di Hadoop
Architettura e flusso dati
Device Independent ProcessingDevice dependent Processing
Protocol
Decoding
Event
inference &
filtering
Data
acquisition
Data Lake
Telematics Data Storage
(TDS)
RADIUS
authentication
Event Enrichment
Realtime Analysis
Administration
Device
Management
Service
Inventory
TDM Admin
Service Data availability
TDS Query
Services
Event
Dispatching
GGSNGGSN
GGSN
OBU
OBU
OBD
External
Sources
External
Sources
External
Sources
1
2
4
3
3
5
6
8
7
9 10 13
Enrichment
Services
11 12
ELT
Service and Process Infrastructure
Data Transfer
Data Flow
Producer
MFT
Il Telematics Data Storage
Telematics Data Storage
(TDS)
Attività svolta
• Comprensione dati e architettura esistente
• Studio e definizione delle strutture dati distribuite
• Implementazione dei processi di trasferimento
• Data Analysis, un caso di studio
Comprensione dati e architettura esistente
Tabella dei Viaggi
INSURANCE_MESSAGE
latitude latitudine di ogni posizione
longitude longitudine di ogni posizione
timestamp data di rilevamento della posizione
speed velocità del veicolo
heading direzione di marcia del veicolo
quality misura della qualità dei dati gps
deltapos
differenza in metri rispetto alla posizione
precedente
deltatime
delta temporale rispetto alla rilevazione
precedente
id_panelsession
stato del quadro (quadro acceso, in moto,
quadro off)
speed_limit limite di velocità della strada percorsa
country_code identificativo del paese
zip_code codice di avviamento postale
id_locationtype
tipologia di strada (urbana, extraurbana,
autostrada, ecc.)
Tabella delle Posizioni
INSURANCE_PATH
id_terminal identificativo univoco di ogni dispositivo
start_date data di inizio viaggio
end_date data di fine viaggio
meters metri percorsi nell’intero viaggio
max_speed velocità massima misurata durante l’intero viaggio
tz_offset fuso orario
id_path numero identificativo univoco di ciascun viaggio
Studio e definizione delle strutture dati distribuite
Telematics Data Storage
(TDS)
Implementazione dei processi di trasferimento
Apache HBase
create 'path_pos_json_name', 'data', 'positions'
create 'path_pos_json', 'd', 'p'
Nomi
colonne
Spazio occupato
(Mb)
Estesi 89,0
Abbreviati 65,4
create 'path_pos_json', 'd','p'
create 'path_pos_json_gz, 'd',
{NAME => 'p',COMPRESSION => GZ}
create 'path_pos_json_snappy', 'd',
{NAME => 'p',COMPRESSION => 'SNAPPY'}
create 'path_pos_json_LZ4, 'd',
{NAME => 'p',COMPRESSION => 'LZ4'}
Algoritmo di
compressione
Spazio occupato
(Mb)
Nessuno 65,4
GZ 27,2
Snappy 35,0
LZ4 35,6
Apache HBase
create 'path_pos_json', 'd','p' create 'path_pos_json_snappy', 'd',
{NAME => 'p',COMPRESSION => 'SNAPPY'}
Device Giorni Righe path_pos_json path_pos_json_snappy
100 7 2370 5 Mb 2 Mb
7500000 365 19 Tb 8 Tb
Device Giorni Righe path_table
100 7 2370 600 Kb
7500000 365 2 Tb
Device Giorni Righe pos_table pos_table_snappy
100 7 56383 34 Gb 7 Gb
7500000 365 124 Tb 26 Tb
create 'path_table', 'd' create 'pos_table', 'p'
create 'pos_table_snappy',
{NAME => 'p',COMPRESSION => 'SNAPPY'}
Impala con file Parquet
Tabelle Esterna
positions_parquet
path_parquet
Create table as select
Impala con file Parquet
Device Giorni Righe Spazio occupato
100 7 2370 73 Kb
7500000 365 250 Gb
Device Giorni Righe Spazio occupato
100 7 56383 575 Kb
7500000 365 2 Tb
positions_parquetpath_parquet
Data Analysis, un caso di studio
Vehicle ID: 2760091
From: 2015-11-05 00:00:01
To: 2015-11-12 23:59:59
Differance: Days: 7 | Hours: 23.0 | Minutes: 59.0 | Seconds: 58.0
Overall time running (sec) 10144
Overall time running (min): 169.07
Overall time running (%): 1.47
Overall time parked (sec): 681054.0
Overall time parked (min): 11350.90
Overall time parked (%): 98.53
Vehicle ID: 2760091
From: 2015-11-05 00:00:01
To: 2015-11-12 23:59:59
Differance: Days: 7 | Hours: 23.0 | Minutes: 59.0 | Seconds: 58.0
Road Type: 0
Percentage Km: 48.36 %
Average Speed: 24.4893617021
Road Type: 1
Percentage Km: 1.43 %
Average Speed: 18.3684210526
Road Type: 2
Percentage Km: 50.22 %
Average Speed: 37.6857142857
DayTime: 100.00 %
Night : 0.00 %
Statistiche temporali
Statistiche chilometriche
Data Analysis, un caso di studio
5 Nov 2015 Seconds Running: 0
Percentage Running: 0.00 %
Seconds Parked: 86400
Percentage Parking: 34.69 %
Meters Runned: 0
Percentage Meters: 0.00 %
6 Nov 2015 Seconds Running: 1733
Percentage Running: 17.08 %
Seconds Parked: 84667
Percentage Parking: 34.00 %
Meters Runned: 14303
Percentage Meters: 10.82 %
7 Nov 2015 Seconds Running: 0
Percentage Running: 0.00 %
Seconds Parked: 86400
Percentage Parking: 34.69 %
Meters Runned: 0
Percentage Meters: 0.00 %
8 Nov 2015 Seconds Running: 0
Percentage Running: 0.00 %
Seconds Parked: 86400
Percentage Parking: 34.69 %
Meters Runned: 0
Percentage Meters: 0.00 %
9 Nov 2015 Seconds Running: 0
Percentage Running: 0.00 %
Seconds Parked: 86400
Percentage Parking: 34.69 %
Meters Runned: 0
Percentage Meters: 0.00 %
10 Nov 2015 Seconds Running: 0
Percentage Running: 0.00 %
Seconds Parked: 86400
Percentage Parking: 34.69 %
Meters Runned: 0
Percentage Meters: 0.00 %
11 Nov 2015 Seconds Running: 6806
Percentage Running: 67.09 %
Seconds Parked: 79594
Percentage Parking: 31.96 %
Meters Runned: 101787
Percentage Meters: 77.02 %
12 Nov 2015 Seconds Running: 1605
Percentage Running: 15.82 %
Seconds Parked: 84795
Percentage Parking: 34.05 %
Meters Runned: 16061
Percentage Meters: 12.15 %
Vehicle ID: 2760091
From: 2015-11-05 00:00:00
To: 2015-11-12 23:59:59
Total: 7 Days: 23.0 Hours, 59.0 Minutes, 59.0 Seconds
Total Seconds: 691199.0
Total Seconds Running: 10144
Total Meters: 132151
Total Seconds Parked: 249056
Conclusioni
Fattibilità
• Una tabella per viaggi e posizioni
• Posizioni JSON (lista di liste)
• Compressione Snappy
• Due tabelle
• Occupazione di spazio in linea con le aspettative
Sviluppi futuri
• grado di pericolosità delle strade
• probabilità di incidenti al variare delle condizioni
atmosferiche
• traffico predittivo
• integrazione dati del trasporto pubblico:
miglioramento dei tempi di percorrenza, più clienti
• riduzione dei costi di manutenzione stradale con
analisi dei volume di traffico.
Ringraziamenti
Roberto Trasarti Edoardo Resseguier
Domande?

Contenu connexe

Similaire à PresentazioneTesiSilviaMarrone1

QMap: Map Evolution in Big Data & Real Time concepts. Alessandra Parroni, QMAP
QMap: Map Evolution in Big Data & Real Time concepts. Alessandra Parroni, QMAPQMap: Map Evolution in Big Data & Real Time concepts. Alessandra Parroni, QMAP
QMap: Map Evolution in Big Data & Real Time concepts. Alessandra Parroni, QMAPData Driven Innovation
 
TomWare- TrackPro #sce2014 1
TomWare- TrackPro #sce2014 1TomWare- TrackPro #sce2014 1
TomWare- TrackPro #sce2014 1MelissaLama
 
OpenGeoData Italia 2014 - Emanuele Geri "Secondo modulo del corso: esperienza...
OpenGeoData Italia 2014 - Emanuele Geri "Secondo modulo del corso: esperienza...OpenGeoData Italia 2014 - Emanuele Geri "Secondo modulo del corso: esperienza...
OpenGeoData Italia 2014 - Emanuele Geri "Secondo modulo del corso: esperienza...giovannibiallo
 
Servizi a Rete TOUR 2023 - 27 settembre | VALLE UMBRA SERVIZI+EBWORLD
Servizi a Rete TOUR 2023 - 27 settembre | VALLE UMBRA SERVIZI+EBWORLDServizi a Rete TOUR 2023 - 27 settembre | VALLE UMBRA SERVIZI+EBWORLD
Servizi a Rete TOUR 2023 - 27 settembre | VALLE UMBRA SERVIZI+EBWORLDServizi a rete
 
casi studio di Brambilla e Meduri (gruppoF)
casi studio di Brambilla e Meduri (gruppoF)casi studio di Brambilla e Meduri (gruppoF)
casi studio di Brambilla e Meduri (gruppoF)servizicollaborativi
 
Final presentation of Project Management course (Gestione Progetti Software) ...
Final presentation of Project Management course (Gestione Progetti Software) ...Final presentation of Project Management course (Gestione Progetti Software) ...
Final presentation of Project Management course (Gestione Progetti Software) ...Alexander Minichino
 
Estrarre valore dai dati: tecnologie per ottimizzare la mobilità del futuro (...
Estrarre valore dai dati: tecnologie per ottimizzare la mobilità del futuro (...Estrarre valore dai dati: tecnologie per ottimizzare la mobilità del futuro (...
Estrarre valore dai dati: tecnologie per ottimizzare la mobilità del futuro (...Data Driven Innovation
 
Design Dell'Interazione - Tom Tom GO LIVE 1000 + Augmented Reality Navigatio...
Design Dell'Interazione - Tom Tom GO LIVE 1000  + Augmented Reality Navigatio...Design Dell'Interazione - Tom Tom GO LIVE 1000  + Augmented Reality Navigatio...
Design Dell'Interazione - Tom Tom GO LIVE 1000 + Augmented Reality Navigatio...Diego Rovelli
 
Gestione ed ottimizzazione del ciclo idrico integrato | OLIVA Pietro
 Gestione ed ottimizzazione del ciclo idrico integrato | OLIVA Pietro Gestione ed ottimizzazione del ciclo idrico integrato | OLIVA Pietro
Gestione ed ottimizzazione del ciclo idrico integrato | OLIVA PietroServizi a rete
 
Kiunsys - profilo, offerta, casi [it]
Kiunsys - profilo, offerta, casi [it]Kiunsys - profilo, offerta, casi [it]
Kiunsys - profilo, offerta, casi [it]Kiunsys
 
Webinar "L'approccio olistico per gestire le reti"
Webinar "L'approccio olistico per gestire le reti"Webinar "L'approccio olistico per gestire le reti"
Webinar "L'approccio olistico per gestire le reti"Servizi a rete
 
Ldb 25 strumenti gis e webgis_2014-06-06 lascialfari - networkanalyst
Ldb 25 strumenti gis e webgis_2014-06-06 lascialfari - networkanalystLdb 25 strumenti gis e webgis_2014-06-06 lascialfari - networkanalyst
Ldb 25 strumenti gis e webgis_2014-06-06 lascialfari - networkanalystlaboratoridalbasso
 
Opendata dinamici per i servizi di infomobilità della smartcity a Bari - Fran...
Opendata dinamici per i servizi di infomobilità della smartcity a Bari - Fran...Opendata dinamici per i servizi di infomobilità della smartcity a Bari - Fran...
Opendata dinamici per i servizi di infomobilità della smartcity a Bari - Fran...giovannibiallo
 
LandCity Revolution 2016 - Smart-Specialization nelle Reti Idriche - Marco In...
LandCity Revolution 2016 - Smart-Specialization nelle Reti Idriche - Marco In...LandCity Revolution 2016 - Smart-Specialization nelle Reti Idriche - Marco In...
LandCity Revolution 2016 - Smart-Specialization nelle Reti Idriche - Marco In...giovanni biallo
 
Monitorare una flotta di autobus: architettura di un progetto di acquisizione...
Monitorare una flotta di autobus: architettura di un progetto di acquisizione...Monitorare una flotta di autobus: architettura di un progetto di acquisizione...
Monitorare una flotta di autobus: architettura di un progetto di acquisizione...Speck&Tech
 
Best practice, Claudio Umana - Fracarro Radioindustrie Spa, Cloud Computing, ...
Best practice, Claudio Umana - Fracarro Radioindustrie Spa, Cloud Computing, ...Best practice, Claudio Umana - Fracarro Radioindustrie Spa, Cloud Computing, ...
Best practice, Claudio Umana - Fracarro Radioindustrie Spa, Cloud Computing, ...Manuela Moroncini
 
Il progetto Cluster AI-TEXTILES - Stato d’avanzamento IV semestre
Il progetto Cluster AI-TEXTILES - Stato d’avanzamento IV semestreIl progetto Cluster AI-TEXTILES - Stato d’avanzamento IV semestre
Il progetto Cluster AI-TEXTILES - Stato d’avanzamento IV semestreSardegna Ricerche
 

Similaire à PresentazioneTesiSilviaMarrone1 (20)

QMap: Map Evolution in Big Data & Real Time concepts. Alessandra Parroni, QMAP
QMap: Map Evolution in Big Data & Real Time concepts. Alessandra Parroni, QMAPQMap: Map Evolution in Big Data & Real Time concepts. Alessandra Parroni, QMAP
QMap: Map Evolution in Big Data & Real Time concepts. Alessandra Parroni, QMAP
 
TomWare- TrackPro #sce2014 1
TomWare- TrackPro #sce2014 1TomWare- TrackPro #sce2014 1
TomWare- TrackPro #sce2014 1
 
OpenGeoData Italia 2014 - Emanuele Geri "Secondo modulo del corso: esperienza...
OpenGeoData Italia 2014 - Emanuele Geri "Secondo modulo del corso: esperienza...OpenGeoData Italia 2014 - Emanuele Geri "Secondo modulo del corso: esperienza...
OpenGeoData Italia 2014 - Emanuele Geri "Secondo modulo del corso: esperienza...
 
Servizi a Rete TOUR 2023 - 27 settembre | VALLE UMBRA SERVIZI+EBWORLD
Servizi a Rete TOUR 2023 - 27 settembre | VALLE UMBRA SERVIZI+EBWORLDServizi a Rete TOUR 2023 - 27 settembre | VALLE UMBRA SERVIZI+EBWORLD
Servizi a Rete TOUR 2023 - 27 settembre | VALLE UMBRA SERVIZI+EBWORLD
 
casi studio di Brambilla e Meduri (gruppoF)
casi studio di Brambilla e Meduri (gruppoF)casi studio di Brambilla e Meduri (gruppoF)
casi studio di Brambilla e Meduri (gruppoF)
 
Final presentation of Project Management course (Gestione Progetti Software) ...
Final presentation of Project Management course (Gestione Progetti Software) ...Final presentation of Project Management course (Gestione Progetti Software) ...
Final presentation of Project Management course (Gestione Progetti Software) ...
 
Estrarre valore dai dati: tecnologie per ottimizzare la mobilità del futuro (...
Estrarre valore dai dati: tecnologie per ottimizzare la mobilità del futuro (...Estrarre valore dai dati: tecnologie per ottimizzare la mobilità del futuro (...
Estrarre valore dai dati: tecnologie per ottimizzare la mobilità del futuro (...
 
Design Dell'Interazione - Tom Tom GO LIVE 1000 + Augmented Reality Navigatio...
Design Dell'Interazione - Tom Tom GO LIVE 1000  + Augmented Reality Navigatio...Design Dell'Interazione - Tom Tom GO LIVE 1000  + Augmented Reality Navigatio...
Design Dell'Interazione - Tom Tom GO LIVE 1000 + Augmented Reality Navigatio...
 
Gestione ed ottimizzazione del ciclo idrico integrato | OLIVA Pietro
 Gestione ed ottimizzazione del ciclo idrico integrato | OLIVA Pietro Gestione ed ottimizzazione del ciclo idrico integrato | OLIVA Pietro
Gestione ed ottimizzazione del ciclo idrico integrato | OLIVA Pietro
 
Applicazioni di Advanced Analytics
Applicazioni di Advanced AnalyticsApplicazioni di Advanced Analytics
Applicazioni di Advanced Analytics
 
Auto a guida autonoma
Auto a guida autonomaAuto a guida autonoma
Auto a guida autonoma
 
Kiunsys - profilo, offerta, casi [it]
Kiunsys - profilo, offerta, casi [it]Kiunsys - profilo, offerta, casi [it]
Kiunsys - profilo, offerta, casi [it]
 
Webinar "L'approccio olistico per gestire le reti"
Webinar "L'approccio olistico per gestire le reti"Webinar "L'approccio olistico per gestire le reti"
Webinar "L'approccio olistico per gestire le reti"
 
Ldb 25 strumenti gis e webgis_2014-06-06 lascialfari - networkanalyst
Ldb 25 strumenti gis e webgis_2014-06-06 lascialfari - networkanalystLdb 25 strumenti gis e webgis_2014-06-06 lascialfari - networkanalyst
Ldb 25 strumenti gis e webgis_2014-06-06 lascialfari - networkanalyst
 
Opendata dinamici per i servizi di infomobilità della smartcity a Bari - Fran...
Opendata dinamici per i servizi di infomobilità della smartcity a Bari - Fran...Opendata dinamici per i servizi di infomobilità della smartcity a Bari - Fran...
Opendata dinamici per i servizi di infomobilità della smartcity a Bari - Fran...
 
Mobile senza frontiere
Mobile senza frontiereMobile senza frontiere
Mobile senza frontiere
 
LandCity Revolution 2016 - Smart-Specialization nelle Reti Idriche - Marco In...
LandCity Revolution 2016 - Smart-Specialization nelle Reti Idriche - Marco In...LandCity Revolution 2016 - Smart-Specialization nelle Reti Idriche - Marco In...
LandCity Revolution 2016 - Smart-Specialization nelle Reti Idriche - Marco In...
 
Monitorare una flotta di autobus: architettura di un progetto di acquisizione...
Monitorare una flotta di autobus: architettura di un progetto di acquisizione...Monitorare una flotta di autobus: architettura di un progetto di acquisizione...
Monitorare una flotta di autobus: architettura di un progetto di acquisizione...
 
Best practice, Claudio Umana - Fracarro Radioindustrie Spa, Cloud Computing, ...
Best practice, Claudio Umana - Fracarro Radioindustrie Spa, Cloud Computing, ...Best practice, Claudio Umana - Fracarro Radioindustrie Spa, Cloud Computing, ...
Best practice, Claudio Umana - Fracarro Radioindustrie Spa, Cloud Computing, ...
 
Il progetto Cluster AI-TEXTILES - Stato d’avanzamento IV semestre
Il progetto Cluster AI-TEXTILES - Stato d’avanzamento IV semestreIl progetto Cluster AI-TEXTILES - Stato d’avanzamento IV semestre
Il progetto Cluster AI-TEXTILES - Stato d’avanzamento IV semestre
 

PresentazioneTesiSilviaMarrone1

  • 1. L’impatto di un’architettura Big Data nell’IT Transformation di Octo Telematics Silvia Marrone Pisa, 28 gennaio 2016
  • 2. Chi è Octo Telematics • Pioniera e innovatrice di soluzioni telematiche • Modello all’avanguardia per ricerca, sviluppo e gestione di applicazioni per le assicurazioni auto
  • 3. Chi è Octo Telematics
  • 4. • Abitudini e comportamenti degli automobilisti • Servizi di sicurezza e assistenza per il veicolo e la persona • Analisi e ricostruzione della dinamica e cinematica dei sinistri stradali • Prodotti assicurativi personalizzati: "pay per use" e "pay per risk" • Telediagnostica • Traffico in tempo reale • Strade a pedaggio (“road charging”) • Gestione delle flotte • Monitoraggio dell'impatto ambientale dei veicoli in movimento Che servizi offre
  • 6. Obiettivo del tirocinio Nell’ambito del progetto di IT Transformation parteciperà al disegno della soluzione Big Data acquisendo competenze in merito alla trasformazione da un’architettura tradizionale basata su RDBMS (Oracle) ad un modello NoSQL basato su Framework Hadoop (Cloudera). La risorsa sarà inserita in un team di progetto che comprende Software Vendor e System Integrator internazionali, con i quali potrà interagire e collaborare per acquisire le competenze necessarie alla realizzazione di un progetto pilota per la realizzazione di una soluzione NoSQL che consenta di raccogliere in tempo reale dati telematici non strutturati, necessari ad individuare i comportamenti dei guidatori.
  • 8. Architettura e flusso dati Device Independent ProcessingDevice dependent Processing Protocol Decoding Event inference & filtering Data acquisition Data Lake Telematics Data Storage (TDS) RADIUS authentication Event Enrichment Realtime Analysis Administration Device Management Service Inventory TDM Admin Service Data availability TDS Query Services Event Dispatching GGSNGGSN GGSN OBU OBU OBD External Sources External Sources External Sources 1 2 4 3 3 5 6 8 7 9 10 13 Enrichment Services 11 12 ELT Service and Process Infrastructure Data Transfer Data Flow Producer MFT
  • 9. Il Telematics Data Storage Telematics Data Storage (TDS)
  • 10. Attività svolta • Comprensione dati e architettura esistente • Studio e definizione delle strutture dati distribuite • Implementazione dei processi di trasferimento • Data Analysis, un caso di studio
  • 11. Comprensione dati e architettura esistente Tabella dei Viaggi INSURANCE_MESSAGE latitude latitudine di ogni posizione longitude longitudine di ogni posizione timestamp data di rilevamento della posizione speed velocità del veicolo heading direzione di marcia del veicolo quality misura della qualità dei dati gps deltapos differenza in metri rispetto alla posizione precedente deltatime delta temporale rispetto alla rilevazione precedente id_panelsession stato del quadro (quadro acceso, in moto, quadro off) speed_limit limite di velocità della strada percorsa country_code identificativo del paese zip_code codice di avviamento postale id_locationtype tipologia di strada (urbana, extraurbana, autostrada, ecc.) Tabella delle Posizioni INSURANCE_PATH id_terminal identificativo univoco di ogni dispositivo start_date data di inizio viaggio end_date data di fine viaggio meters metri percorsi nell’intero viaggio max_speed velocità massima misurata durante l’intero viaggio tz_offset fuso orario id_path numero identificativo univoco di ciascun viaggio
  • 12. Studio e definizione delle strutture dati distribuite Telematics Data Storage (TDS)
  • 13. Implementazione dei processi di trasferimento
  • 14. Apache HBase create 'path_pos_json_name', 'data', 'positions' create 'path_pos_json', 'd', 'p' Nomi colonne Spazio occupato (Mb) Estesi 89,0 Abbreviati 65,4 create 'path_pos_json', 'd','p' create 'path_pos_json_gz, 'd', {NAME => 'p',COMPRESSION => GZ} create 'path_pos_json_snappy', 'd', {NAME => 'p',COMPRESSION => 'SNAPPY'} create 'path_pos_json_LZ4, 'd', {NAME => 'p',COMPRESSION => 'LZ4'} Algoritmo di compressione Spazio occupato (Mb) Nessuno 65,4 GZ 27,2 Snappy 35,0 LZ4 35,6
  • 15. Apache HBase create 'path_pos_json', 'd','p' create 'path_pos_json_snappy', 'd', {NAME => 'p',COMPRESSION => 'SNAPPY'} Device Giorni Righe path_pos_json path_pos_json_snappy 100 7 2370 5 Mb 2 Mb 7500000 365 19 Tb 8 Tb Device Giorni Righe path_table 100 7 2370 600 Kb 7500000 365 2 Tb Device Giorni Righe pos_table pos_table_snappy 100 7 56383 34 Gb 7 Gb 7500000 365 124 Tb 26 Tb create 'path_table', 'd' create 'pos_table', 'p' create 'pos_table_snappy', {NAME => 'p',COMPRESSION => 'SNAPPY'}
  • 16. Impala con file Parquet Tabelle Esterna positions_parquet path_parquet Create table as select
  • 17. Impala con file Parquet Device Giorni Righe Spazio occupato 100 7 2370 73 Kb 7500000 365 250 Gb Device Giorni Righe Spazio occupato 100 7 56383 575 Kb 7500000 365 2 Tb positions_parquetpath_parquet
  • 18. Data Analysis, un caso di studio Vehicle ID: 2760091 From: 2015-11-05 00:00:01 To: 2015-11-12 23:59:59 Differance: Days: 7 | Hours: 23.0 | Minutes: 59.0 | Seconds: 58.0 Overall time running (sec) 10144 Overall time running (min): 169.07 Overall time running (%): 1.47 Overall time parked (sec): 681054.0 Overall time parked (min): 11350.90 Overall time parked (%): 98.53 Vehicle ID: 2760091 From: 2015-11-05 00:00:01 To: 2015-11-12 23:59:59 Differance: Days: 7 | Hours: 23.0 | Minutes: 59.0 | Seconds: 58.0 Road Type: 0 Percentage Km: 48.36 % Average Speed: 24.4893617021 Road Type: 1 Percentage Km: 1.43 % Average Speed: 18.3684210526 Road Type: 2 Percentage Km: 50.22 % Average Speed: 37.6857142857 DayTime: 100.00 % Night : 0.00 % Statistiche temporali Statistiche chilometriche
  • 19. Data Analysis, un caso di studio 5 Nov 2015 Seconds Running: 0 Percentage Running: 0.00 % Seconds Parked: 86400 Percentage Parking: 34.69 % Meters Runned: 0 Percentage Meters: 0.00 % 6 Nov 2015 Seconds Running: 1733 Percentage Running: 17.08 % Seconds Parked: 84667 Percentage Parking: 34.00 % Meters Runned: 14303 Percentage Meters: 10.82 % 7 Nov 2015 Seconds Running: 0 Percentage Running: 0.00 % Seconds Parked: 86400 Percentage Parking: 34.69 % Meters Runned: 0 Percentage Meters: 0.00 % 8 Nov 2015 Seconds Running: 0 Percentage Running: 0.00 % Seconds Parked: 86400 Percentage Parking: 34.69 % Meters Runned: 0 Percentage Meters: 0.00 % 9 Nov 2015 Seconds Running: 0 Percentage Running: 0.00 % Seconds Parked: 86400 Percentage Parking: 34.69 % Meters Runned: 0 Percentage Meters: 0.00 % 10 Nov 2015 Seconds Running: 0 Percentage Running: 0.00 % Seconds Parked: 86400 Percentage Parking: 34.69 % Meters Runned: 0 Percentage Meters: 0.00 % 11 Nov 2015 Seconds Running: 6806 Percentage Running: 67.09 % Seconds Parked: 79594 Percentage Parking: 31.96 % Meters Runned: 101787 Percentage Meters: 77.02 % 12 Nov 2015 Seconds Running: 1605 Percentage Running: 15.82 % Seconds Parked: 84795 Percentage Parking: 34.05 % Meters Runned: 16061 Percentage Meters: 12.15 % Vehicle ID: 2760091 From: 2015-11-05 00:00:00 To: 2015-11-12 23:59:59 Total: 7 Days: 23.0 Hours, 59.0 Minutes, 59.0 Seconds Total Seconds: 691199.0 Total Seconds Running: 10144 Total Meters: 132151 Total Seconds Parked: 249056
  • 20. Conclusioni Fattibilità • Una tabella per viaggi e posizioni • Posizioni JSON (lista di liste) • Compressione Snappy • Due tabelle • Occupazione di spazio in linea con le aspettative
  • 21. Sviluppi futuri • grado di pericolosità delle strade • probabilità di incidenti al variare delle condizioni atmosferiche • traffico predittivo • integrazione dati del trasporto pubblico: miglioramento dei tempi di percorrenza, più clienti • riduzione dei costi di manutenzione stradale con analisi dei volume di traffico.