SlideShare une entreprise Scribd logo
1  sur  44
Fast Data Platforms
@HUG_Italy Meetup (17/4/2015)
@andrea_gioia
Un po’ di storia
VoltDB e i Fast Data
Utilizzo di VoltDB in una Enterprise
Data Platform
Un po’ di storia
VoltDB e i Fast Data
Utilizzo di VoltDB in una Enterprise
Data Platform
FASE 1: ONE SIZE FIT ALL
FASE 2: OLAP vs OLTP
FASE 2: ARCHITETTURA DATI
…MA I VOLUMI CRESCONO VELOCEMENTE
PROBLEMA: SCALABILITA’ SOLO VERTICALE
SOLUZIONE: CODE + SHARDING
SOLUZIONE: CODE + SHARDING
Partition-1 Partition-2 Partition-3 Partition-4 Partition-5 Partition-6
…MA I VOLUMI CRESCONO VELOCEMENTE
Problemi
PROBLEMI
1. Gestione dei
fault
2. Gestione
applicativa
del cluster
3. Ricalcolo
massivo
FASE 3: HADOOP 1.0
Componenti
1. Dati distribuiti (HDFS)
2. Computazione distribuita (Map-Reduce)
Vantaggi
1. Maschera la complessità della gestione
del cluster
2. Minimizza gli spostamenti dei dati
3. Scala orizzontalmente su commodity
hardware
FASE 3: ARCHITETTURA
FASE 3: DATA LAKE
Caratteristiche
1. Tutti i dati al massimo livello di
dettaglio (Volume)
2. Dati strutturati e non (Varietà)
3. Dati aggiunti appena disponibili
(Velocità)
4. Dati processabili in modalità
distribuita (Valore)
DATA LAKE != DWH
PROBLEMA: BIG MA NON FAST
COLLECT EXPLORE
ANALYZEACT
RISULTATI
1. Scoperta
2. Interrogazione
3. Ottimizzazione
FASE 4: SQL on HADOOP
FASE 4: ARCHITETTURA
PROBLEMA: VELOCE MA NON ABBASTANZA
…PERCHE’ I DATI CRESCONO IN VOLUME E IN VELOCITA’
FASE 5: SPECIALIZZAZIONE
FASE 5: LAMBDA ARCHITECTURE
Marged View
(QUERY)
LAMBDA ARCHITECTURE: PAIN POINTS
Problematiche
1. Duplicazione della logica di calcolo
2. Integrazione viste effettuata a livello
applicativo
3. Molte componenti software da
gestire
4. Molte componenti hardware
esposte a possibili fault
5. Velocità del fast layer limitata dal
sistema di storage dello stato
utilizzato
FAST LAYER SEMPLIFICATO
Un po’ di storia
VoltDB e i Fast Data
Utilizzo di VoltDB in una Enterprise
Data Platform
VoltDB è un database…
1. In memory
2. Partitioned
3. Single-threaded
4. Distributed
5. ACID compliant
COS’E’?
A tutte quelle applicazioni che
hanno bisogno di processare
grosse quantità di dati in
modo affidabile e veloce (fast
data)
Requisiti chiave per queste
applicazioni sono…
1. Altissimo throughput
2. Scalabilità
3. Affidabilità
4. High Availability
A CHI SERVE
A CHI NON SERVE
A tutte quelle applicazioni che
hanno bisogno di immagazzinare e
confrontare grosse quantità di dati
storici suddivisi su più tabelle (dwh
e bi)
DATA PARTITIONING
DATA REPLICATION
DISTRIBUTED PROCESSING
Garantita per mezzo di …
1. Replica delle partizioni
(K-SAFETY)
HIGH AVAILABILITY
DURABILITY
Garantita per mezzo di …
1. Snapshots periodici
2. Command logging (sincrono o
asincrono)
3. Replication (business continuity)
Un po’ di storia
VoltDB e i Fast Data
Utilizzo di VoltDB in una Enterprise
Data Platform
DATA PLATFORM 1
DATA PLATFORM 2
DATA PLATFORM 2
DATA PLATFORM 2
DATA PLATFORM 2
APP APP
GRAZIE!
DOMANDE?
BIBLIOGRAFIA
1. How to beat the CAP (Nathan Marz)
2. Questioning the Lambda Architecture (Jay Kreps)
3. The Log: What every software engineer should know about real-
time data's unifying abstraction (Jay Kreps)
4. Polyglot Persistence (Martin Fowler)
5. Fast Data and the New Enterprise Data Architecture (Scott Jarr)
6. Simplifying the (complex) Lambda architecture (John Piekos)
@andrea_gioia
andrea.gioia@quantyca.it
@quantycabi
www.quantyca.it

Contenu connexe

En vedette (7)

Big data ppt
Big data pptBig data ppt
Big data ppt
 
Big data ppt
Big data pptBig data ppt
Big data ppt
 
Big Data
Big DataBig Data
Big Data
 
Big data ppt
Big  data pptBig  data ppt
Big data ppt
 
What is big data?
What is big data?What is big data?
What is big data?
 
What is Big Data?
What is Big Data?What is Big Data?
What is Big Data?
 
Big Data Analytics with Hadoop
Big Data Analytics with HadoopBig Data Analytics with Hadoop
Big Data Analytics with Hadoop
 

Similaire à Fast data platforms - Hadoop User Group (Italy)

Partner Day Milano - dicembre 2015 - Software Difined Storage. Disaster recov...
Partner Day Milano - dicembre 2015 - Software Difined Storage. Disaster recov...Partner Day Milano - dicembre 2015 - Software Difined Storage. Disaster recov...
Partner Day Milano - dicembre 2015 - Software Difined Storage. Disaster recov...Clouditalia Telecomunicazioni
 
MySQL Tech Tour 2015 - Soluzioni di alta disponibilità con MySQL
MySQL Tech Tour 2015 - Soluzioni di alta disponibilità con MySQLMySQL Tech Tour 2015 - Soluzioni di alta disponibilità con MySQL
MySQL Tech Tour 2015 - Soluzioni di alta disponibilità con MySQLPar-Tec S.p.A.
 
SDS,la pietra d’angolo dell SDDC
SDS,la pietra d’angolo dell SDDC SDS,la pietra d’angolo dell SDDC
SDS,la pietra d’angolo dell SDDC VMUG IT
 
Big data stack tecnologico
Big data stack tecnologicoBig data stack tecnologico
Big data stack tecnologicoMassimo Romano
 
Virtualizzare Nanosoft
Virtualizzare   NanosoftVirtualizzare   Nanosoft
Virtualizzare NanosoftDario Vemagi
 
20160402_mlraviol_mariadb_TorinoWordCamp
20160402_mlraviol_mariadb_TorinoWordCamp20160402_mlraviol_mariadb_TorinoWordCamp
20160402_mlraviol_mariadb_TorinoWordCampmlraviol
 
Consolidamento e virtualizzazione
Consolidamento e virtualizzazione Consolidamento e virtualizzazione
Consolidamento e virtualizzazione S.info Srl
 
Db2 11.1: l'evoluzione del Database secondo IBM
Db2 11.1: l'evoluzione del Database secondo IBMDb2 11.1: l'evoluzione del Database secondo IBM
Db2 11.1: l'evoluzione del Database secondo IBMJürgen Ambrosi
 
Ottimizzazione della gestione dei dati sul cloud
Ottimizzazione della gestione dei dati sul cloudOttimizzazione della gestione dei dati sul cloud
Ottimizzazione della gestione dei dati sul cloudNicolò Carandini
 
Modernize Legacy Systems with Kubernetes
Modernize Legacy Systems with KubernetesModernize Legacy Systems with Kubernetes
Modernize Legacy Systems with KubernetesGiulio Roggero
 
MySQL Tech Tour 2016 - Database-as-a-Service con MySQL e Oracle Openstack
MySQL Tech Tour 2016 - Database-as-a-Service con MySQL e Oracle OpenstackMySQL Tech Tour 2016 - Database-as-a-Service con MySQL e Oracle Openstack
MySQL Tech Tour 2016 - Database-as-a-Service con MySQL e Oracle OpenstackPar-Tec S.p.A.
 
Oracle Application Server 10g
Oracle Application Server 10gOracle Application Server 10g
Oracle Application Server 10gPaolo Campegiani
 
Multitenancy con SQL Server e Azure SQL Database
Multitenancy con SQL Server e Azure SQL DatabaseMultitenancy con SQL Server e Azure SQL Database
Multitenancy con SQL Server e Azure SQL DatabaseGianluca Hotz
 
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDB
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDBPolyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDB
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDBSteve Maraspin
 
Nagios in alta affidabilità con strumenti open source
Nagios in alta affidabilità con strumenti open sourceNagios in alta affidabilità con strumenti open source
Nagios in alta affidabilità con strumenti open sourceBabel
 
Evento 18 giugno - ibm sicurezza - parte b - soluzioni
Evento 18 giugno - ibm sicurezza - parte b - soluzioni Evento 18 giugno - ibm sicurezza - parte b - soluzioni
Evento 18 giugno - ibm sicurezza - parte b - soluzioni PRAGMA PROGETTI
 

Similaire à Fast data platforms - Hadoop User Group (Italy) (20)

Partner Day Milano - dicembre 2015 - Software Difined Storage. Disaster recov...
Partner Day Milano - dicembre 2015 - Software Difined Storage. Disaster recov...Partner Day Milano - dicembre 2015 - Software Difined Storage. Disaster recov...
Partner Day Milano - dicembre 2015 - Software Difined Storage. Disaster recov...
 
MySQL Tech Tour 2015 - Soluzioni di alta disponibilità con MySQL
MySQL Tech Tour 2015 - Soluzioni di alta disponibilità con MySQLMySQL Tech Tour 2015 - Soluzioni di alta disponibilità con MySQL
MySQL Tech Tour 2015 - Soluzioni di alta disponibilità con MySQL
 
SDS,la pietra d’angolo dell SDDC
SDS,la pietra d’angolo dell SDDC SDS,la pietra d’angolo dell SDDC
SDS,la pietra d’angolo dell SDDC
 
Big data stack tecnologico
Big data stack tecnologicoBig data stack tecnologico
Big data stack tecnologico
 
Virtualizzare Nanosoft
Virtualizzare   NanosoftVirtualizzare   Nanosoft
Virtualizzare Nanosoft
 
Database Data Aggregator
Database Data AggregatorDatabase Data Aggregator
Database Data Aggregator
 
Cesvip 20110127
Cesvip 20110127Cesvip 20110127
Cesvip 20110127
 
20160402_mlraviol_mariadb_TorinoWordCamp
20160402_mlraviol_mariadb_TorinoWordCamp20160402_mlraviol_mariadb_TorinoWordCamp
20160402_mlraviol_mariadb_TorinoWordCamp
 
Ha solutions su power i
Ha solutions su power iHa solutions su power i
Ha solutions su power i
 
Consolidamento e virtualizzazione
Consolidamento e virtualizzazione Consolidamento e virtualizzazione
Consolidamento e virtualizzazione
 
Db2 11.1: l'evoluzione del Database secondo IBM
Db2 11.1: l'evoluzione del Database secondo IBMDb2 11.1: l'evoluzione del Database secondo IBM
Db2 11.1: l'evoluzione del Database secondo IBM
 
Ottimizzazione della gestione dei dati sul cloud
Ottimizzazione della gestione dei dati sul cloudOttimizzazione della gestione dei dati sul cloud
Ottimizzazione della gestione dei dati sul cloud
 
Modernize Legacy Systems with Kubernetes
Modernize Legacy Systems with KubernetesModernize Legacy Systems with Kubernetes
Modernize Legacy Systems with Kubernetes
 
MySQL Tech Tour 2016 - Database-as-a-Service con MySQL e Oracle Openstack
MySQL Tech Tour 2016 - Database-as-a-Service con MySQL e Oracle OpenstackMySQL Tech Tour 2016 - Database-as-a-Service con MySQL e Oracle Openstack
MySQL Tech Tour 2016 - Database-as-a-Service con MySQL e Oracle Openstack
 
Presentazione bd2
Presentazione bd2Presentazione bd2
Presentazione bd2
 
Oracle Application Server 10g
Oracle Application Server 10gOracle Application Server 10g
Oracle Application Server 10g
 
Multitenancy con SQL Server e Azure SQL Database
Multitenancy con SQL Server e Azure SQL DatabaseMultitenancy con SQL Server e Azure SQL Database
Multitenancy con SQL Server e Azure SQL Database
 
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDB
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDBPolyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDB
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDB
 
Nagios in alta affidabilità con strumenti open source
Nagios in alta affidabilità con strumenti open sourceNagios in alta affidabilità con strumenti open source
Nagios in alta affidabilità con strumenti open source
 
Evento 18 giugno - ibm sicurezza - parte b - soluzioni
Evento 18 giugno - ibm sicurezza - parte b - soluzioni Evento 18 giugno - ibm sicurezza - parte b - soluzioni
Evento 18 giugno - ibm sicurezza - parte b - soluzioni
 

Fast data platforms - Hadoop User Group (Italy)