SlideShare une entreprise Scribd logo
1  sur  34
Télécharger pour lire hors ligne
Architetture scalabili per la
memorizzazione, analisi, condivisione e
       pubblicazione dei dati

      Roma, 13 giugno 2012 - ArcheoFOSS 2012

           Rodolfo Boraso , Diego Guenzi
CSP s.c.a r.l.

Organismo di ricerca, ex Centro di Supercalcolo del Piemonte
   –   Senza scopo di lucro
   –   Utili reinvestiti in ricerca
   –   Sviluppo sperimentale e ricerca industriale in ICT
   –   Progetti europei, nazionali e regionali
   –   Laboratorio di ricerca iscritto all' “Albo dei laboratori MIUR”
   –   Nessun accesso preferenziale ai soci




                                                                         2
Topic




 MEMORIZZAZIONE




                  3
Ampia scelta di database

                                                                      Relational
 Non-relational              Analytic     Brisk Dryad        Infobright Netezza ParAccel SAP Sybase IQ Teradata EMC
                                                      Hadapt CalPont Infosphere AsterData Greeplum VectorWise Vertica
                              Piccolo Mapr Hadoop
       Operational                                           Oracle     IBM DB2     SQLServer    JustOne
   InterSystems
   Progress Versant
   Objectivity
                       Document             MarkLogic          Mysql        Ingres       PostgreSQL
                                            McObject                      SAP Sybase ASE            EnterpriseDB
                           Lotus Notes

        NOSQL
                    CouchDB                                       NewSQL                         HandlerSocket
      Key                 MongoDB

      Value
                    RavenDB                 'as-a-Service'     Amazon RDS
                                                                                                 Akiban
                                                                                                 MySQL Cluster
                               Cloudant                                       SQL Azure
     Riak     CouchBase              App Engine                                                          Clustrix
                                                               Database.com
        Redis                            Datastore                                               Drizzle
                                                               Xeround            FathomDB
                                      SimpleDB                                                           GenieDB
       Membrain                                                                                  ScalArc
                       Big Tables           Graph                 Schooner MySQL CodeFutures
              Cassandra                   InfiniteGraph              Tokutek    ScaleBase     NimbusDB
       Voldemort      Hypertable          Neo4J                   Continuent           VoltDB
     BerkeleyDB              HBase        GraphDB                        Translattice


                            Data                                                       Cloud
                            Cache                                                      Enable-
                                                                                       ment
Data Grid/Cache
Terracotta                   GigaSpaces           Oracle Coherence          memcached
       IBM eXtreme Scale                   GridGain          Vmware GemFire    InfiniSpan         CloudTran


                                                                                                                        4
NOSQL

Movimento che promuove una classe non ben definita di
strumenti di archiviazione di dati

“For some problems, other storage solutions are better suited”

Not Only SQL
   • Non è un movimento contro l’SQL
   • Esistono delle alternative ai RDBMS tradizionali
   • Un nuovo modo di vedere la persistenza
   • Strumenti nati per lavorare in ambienti distribuiti, adatti al
   cloud computing




                                                                      5
NOSQL


Si differenziano dai RDBMS
   • Non utilizzano il tradizionale SQL
   • Non adottano schemi tabellari fissi (dati semi-strutturati)
   • Evitano join
   • Scalano facilmente su commodity hardware

Uso complementare ai RDBMS
   • The right tool for the job
   • Coprono aree dove i RDBMS sono “deboli”
   • Hanno come target settori specifici




                                                                   6
Scalabilità


              Verticale
                 • Potenziamento dell'hardware

              Orizzontale
                 • Numero di macchine




                                                 7
Costo della scalabilità


            Verticale
               • Esponenziale

            Orizzontale
               • Lineare




                                8
Scalabilità RDBMS tradizionali


           Verticale
              • In genere non ci sono grosse difficoltà

           Orizzontale
              • Problematica: necessità di tecniche
              complesse con un forte degrado delle
              prestazioni offerte




                                                      9
Scalabilità DB NOSQL


           Verticale
              • In genere non ci sono grosse difficoltà

           Orizzontale
              • Nascono per essere inseriti in
              ambienti distribuiti: l'eccezione è il
              server stand-alone




                                                       10
Solo scalabilità?

Scalare orizzontalmente => avere più macchine

   • Fault tolerance
   • Load balancing
   • High availability

Avere più macchine => poter distribuire e replicare i dati su più nodi

   • Uso ideale in ambienti distribuiti
   • Affidabilità
   • Elevate prestazioni


Tutto in bundle, senza bisogno di software aggiuntivi


                                                                     11
NewSQL


●
    Una via di mezzo fra il mondo NOSQL e quello relazionale
      ●
        Uso di tabelle relazionali e di SQL
      ●
        Stessa scalabilità dei DBMS NOSQL
      ●
        Molti prodotti stanno nascendo: VoltDB, MySQL Cluster (NDB),
        ScaleDB, Xeround…
      ●
        Molti storage engine per MySQL




                                                                   12
HBase


●
  Architettura orientata alle colonne / ibrida basata su HDFS
●
  Si ispira a BigTable di Google
●
  Software open source con licenza Apache
●
  Utilizzato in produzione da molti enti fra i quali spicca Facebook
●
  Salvataggio dati in RAM (con flush su disco)
●
  Replica dei dati e sharding ottenuti grazie all’HDFS
●
  Aggiunta di nodi a caldo
●
  Self-healing




                                                                       13
HDFS


●
  Filesystem distribuito, altamente
scalabile
●
  Basato sul framework Hadoop
●
  Cluster di nodi formano uno
storage HDFS
●
  Fault-tolerant
●
  Lavora su commodity hardware
(low-cost)




                                      14
Hadoop

●
  Framework che supporta applicazioni distribuite con elevato
accesso ai dati
●
  Scritto interamente in Java
●
  Permette alle applicazioni di lavorare con migliaia di nodi e
petabyte di dati
●
  Si ispira alla tecnologia Map/Reduce di Google e al Google
File System
●
  Progetto top-level di Apache Foundation
●
  Usato da alcuni grossi player come AOL, eBay, Facebook,
IBM, Imageshack, Joost, Linkedin, The New York Times,
Twitter e Yahoo




                                                                  15
Topic




        ANALISI




                  16
R – Statistical computing

●
  Ambiente per l'analisi statistica con licenza GPL
●
  Predisposto per l'interconnessione a diversi database e a
sistemi GIS come GRASS (geostatistica)
●
  Ampia disponibilità di moduli per la connessione ad altre
applicazioni con driver specifici o tramite connessioni ODBC
●
  Disponibile per moltissime piattaforme




                                                               17
R + Hadoop

●
  Connubio “best-of-breed” open source per l'analisi
●
  Permette di analizzare grossi insiemi di dati distribuiti su
HDFS / HBase anziché su storage e database locali
●
  Utilizza script in linguaggio R e sfrutta le potenzialità della
metodologia di calcolo distribuito di Map / Reduce




                                                                    18
Big Data Analytics

●
  Big Data = informazioni in enormi quantità, delle più svariate tipologie e
formati e in costante crescita, che causano complessità nella gestione con
strumenti tradizionali

●
  Complessità sì nella memorizzazione (i RDBMS tradizionali sono
insufficienti) ma, specialmente, nell'analisi (tecniche di warehousing o di
business intelligence risultano inadatte)

●
    Big Data Analytics = utilizzo di “nuovi” strumenti distribuiti per l'analisi

●
 HDFS + NOSQL + Map / Reduce + R = una possibile soluzione open source
per la Big Data Analytics



                                                                                   19
Esempio: Oracle Big Data Appliance



           ●
            Un'appliance Oracle per l'analisi dei
           Big Data
               ●
                 Oracle Enterprise Linux 5.6
               ●
                 CDH - Cloudera's Distribution
                 including Hadoop (Hadoop
                 pacchettizzato da Cloudera)
               ●
                 Oracle NOSQL Database
                 (BerkleyDB)
               ●
                 Open source R




                                                    20
Topic




CONDIVISIONE e PUBBLICAZIONE




                           21
Apache web server e WebDAV



●
  Progetto della Apache Foundation
●
  Server web multipiattaforma open source attivo dal 1995
●
  Architettura modulare
●
  Grazie a mod_dav e dav_fs permette l'accesso tramite protocollo
WebDAV alle risorse presenti sul file system
●
  Web-based Distributed Authoring and Versioning (WebDAV)
   ●
     Protocollo basato su HTTP
   ●
     Permette all'utente di gestire in modo collaborativo i file in un
     server remoto
   ●
     Scopo: rendere il web un mezzo di lettura e scrittura
   ●
     Supportato da una miriade di dispositivi, dai computer agli
     smartphone


                                                                         22
Data feed via mobile
                                                           Cloud Computing




                                                                                            Cloud C
                                    Internet                             Cloud A

          Network Operators


                                                                                     Cloud B

Mobile Users                  Internet Service Providers



                                                                    Application Service Providers


      ●
        Esempio: crowdsourcing
      ●
        ...ma non solo: oltre al feed, anche la fruizione dei contenuti può
      avvenire tramite device mobili

                                                                                                      23
Topic




   ARCHITETTURA




                  24
Load balancing

●
 Metodologia per la distribuzione del carico su più
macchine all'interno di un cluster

●
 Moltissime soluzioni open source, ad esempio
HAProxy+Keepalived, ma anche Nginx + Keepalived




                                                      25
Schema architetturale


          Internet

                     HTTP/WebDAV
                                    Keepalived
     HAProxy   HAProxy   …...
                         HTTP/WebDAV

                                   Cluster Web                                Piattaforme
Apache    Apache     Apache
                                                      Apache                   di analisi
  +         +          +          …....           R
                                                       Solr
                                                             Pentaho   Hive   …....
 Fuse      Fuse       Fuse




                         Hadoop                          HBase

                      Nodo       Nodo     Nodo                HDFS
                     Hadoop     Hadoop   Hadoop       …....

                                                                                       26
Topic




  CONTESTI D'USO




                   27
Pubblica amministrazione
●
  Le PA possono disporre di grosse moli di dati di interesse per i cittadini,
tra i quali si identificano spesso gli open data
●
  Quale modo migliore per utilizzarli se non dal proprio smartphone?
●
  Come evidenziato su dati.gov.it esistono app per:
   ●
      amministrazioni centrali (trovare e lasciare opinioni sugli uffici
      pubblici, gestione INPS e INAIL, motorizzazione civile...)
   ●
      regioni (informazioni turistiche e culturali, analisi statistiche...)
   ●
      province (infomobilità, gastronomie tipiche...)
   ●
      comuni (mezzi pubblici, news...)




                                                                                28
Mobile data analytics
●
  Connubio fra data analytics e ambienti di nuova generazione
●
  Se si parla di Big Data è necessario elaborare i dati per renderli
anonimi e aggregarli, in modo che il cittadino li riceva in forma
semplificata
●
  Serve potenza di calcolo nell'infrastruttura di back-end: i dispositivi
mobili fungono solo da thin client
●
  Necessità di ambienti scalabili (cloud)


                                          12

                                          10

                                           8
                                                                             Colonna 1
                                           6                                 Colonna 2
                                           4                                 Colonna 3

                                           2

                                           0
                                               Riga 1 Riga 2 Riga 3 Riga 4




                                                                                         29
Cloud storage e personal cloud
●
  Necessità di avere un contesto comune fra più dispositivi, al fine di
condividere i dati fra i propri device
      ●
        PC
      ●
        Notebook
      ●
        Tablet
      ●
        Smartphone
●
  Necessità di condividere i propri dati con altri
●
  Necessità di capacità di storage addizionale




                                                                          30
Hadoop nell'archeologia
●
  Uso di LIDAR per la rilevazione della mappatura di siti relativi alle
civiltà pre-colombiane in America centrale (mole enorme di
campionamenti)
●
  Elaborazione dei dati grazie a Map / Reduce e Hadoop con
performance migliori rispetto ad architetture HPC, ben più costose
(San Diego Supercomputing Centre)
●
    http://silvertonconsulting.com/blog/2012/03/14/archeology-meets-big-data/




                                                                                31
R nell'archeologia
●
    Numerosi esempi di utilizzo:
      ●
        analisi di statistica circolare per lo studio dell'esposizione
        solare
      ●
        analisi dell'assetto spaziale di un deposito archeologico
        (Fabric Analysis)
      ●
        analisi di comparazione di reperti utilizzando indici di
        somiglianza tra oggetti o siti
                ●
                    “Un'anfora frammentaria della laguna di Venezia” di I. Modrzewska,
                    G. Taroni, F. Pianetti, 2010
                ●
                    “Correspondence analysis in R for archaeologists: an educational
                    account” di M.J. Baxter, H.E.M. Cool, 2010
      ●
          ...




                                                                                         32
Conclusioni

●
  La soluzione stato dell'arte è la soluzione FOSS (e.g. Oracle Big Data
Appliance adotta prevalentemente software open source)
●
  Architettura fortemente scalabile
●
  Modello “modulare” con componenti intercambiabili e interoperabili
●
  Infrastruttura general purpose, adatta alla memorizzazione e
all'analisi di diverse tipologie di dati (strutturati o meno)
●
  Componenti dell'architettura ampiamente adottate e fortemente
supportate dalla community
●
  Capacità di esecuzione su commodity hardware anziché su soluzioni
specifiche offerte da vari vendor (rischio di vendor lock-in)




                                                                      33
Direzione Progettazione e Gestione Risorse

       rodolfo.boraso@csp.it
       diego.guenzi@csp.it

CSP innovazione nelle ICT s.c. a r.l.

Via Nizza n. 150 – 10126 Torino – Italy
(ingresso da via Alassio, 11/c)

Tel: +39 011 4815111
Fax: +39 011 4815001
E-mail: innovazione@csp.it

www.csp.it

                                             34

Contenu connexe

En vedette

Museo Torino - un esempio reale d'uso di NOSQL-GraphDB, Linked Data e Web Sem...
Museo Torino - un esempio reale d'uso di NOSQL-GraphDB, Linked Data e Web Sem...Museo Torino - un esempio reale d'uso di NOSQL-GraphDB, Linked Data e Web Sem...
Museo Torino - un esempio reale d'uso di NOSQL-GraphDB, Linked Data e Web Sem...Codemotion
 
Neo4j the Anti Crime Database
Neo4j the Anti Crime DatabaseNeo4j the Anti Crime Database
Neo4j the Anti Crime DatabaseNeo4j
 
GraphTalks Rome - Introducing Neo4j
GraphTalks Rome - Introducing Neo4jGraphTalks Rome - Introducing Neo4j
GraphTalks Rome - Introducing Neo4jNeo4j
 
Introduction to Graph Databases
Introduction to Graph DatabasesIntroduction to Graph Databases
Introduction to Graph DatabasesMax De Marzi
 
MLA Style Guide
MLA Style GuideMLA Style Guide
MLA Style Guideclover66
 
Gücün merkezindeki 20 kadin
Gücün merkezindeki 20 kadinGücün merkezindeki 20 kadin
Gücün merkezindeki 20 kadinosman
 
Il catalogo 2010 Asset CSP
Il catalogo 2010 Asset CSP Il catalogo 2010 Asset CSP
Il catalogo 2010 Asset CSP CSP Scarl
 
I4 school qrpark_promoey_piazza
I4 school qrpark_promoey_piazzaI4 school qrpark_promoey_piazza
I4 school qrpark_promoey_piazzaCSP Scarl
 
19 Luglio 2013 - Il Futuro della TV - Sergio Duretti - CSP
19 Luglio 2013 - Il Futuro della TV - Sergio Duretti - CSP19 Luglio 2013 - Il Futuro della TV - Sergio Duretti - CSP
19 Luglio 2013 - Il Futuro della TV - Sergio Duretti - CSPCSP Scarl
 
Productivity Enhancement Tools in the Cloud
Productivity Enhancement Tools in the CloudProductivity Enhancement Tools in the Cloud
Productivity Enhancement Tools in the CloudDatto
 
Vượt lên nỗi đau
Vượt lên nỗi đauVượt lên nỗi đau
Vượt lên nỗi đaubita89
 
JACOB ZUMA - FINANCES • Hidden Empires | Investigating Money In Politics • Ta...
JACOB ZUMA - FINANCES • Hidden Empires | Investigating Money In Politics • Ta...JACOB ZUMA - FINANCES • Hidden Empires | Investigating Money In Politics • Ta...
JACOB ZUMA - FINANCES • Hidden Empires | Investigating Money In Politics • Ta...Tawanda Kanhema
 
Tiomf về sức mạnh vô biên
Tiomf về sức mạnh vô biênTiomf về sức mạnh vô biên
Tiomf về sức mạnh vô biênbita89
 

En vedette (20)

Museo Torino - un esempio reale d'uso di NOSQL-GraphDB, Linked Data e Web Sem...
Museo Torino - un esempio reale d'uso di NOSQL-GraphDB, Linked Data e Web Sem...Museo Torino - un esempio reale d'uso di NOSQL-GraphDB, Linked Data e Web Sem...
Museo Torino - un esempio reale d'uso di NOSQL-GraphDB, Linked Data e Web Sem...
 
Graph db
Graph dbGraph db
Graph db
 
Neo4j the Anti Crime Database
Neo4j the Anti Crime DatabaseNeo4j the Anti Crime Database
Neo4j the Anti Crime Database
 
GraphTalks Rome - Introducing Neo4j
GraphTalks Rome - Introducing Neo4jGraphTalks Rome - Introducing Neo4j
GraphTalks Rome - Introducing Neo4j
 
Introduction to Graph Databases
Introduction to Graph DatabasesIntroduction to Graph Databases
Introduction to Graph Databases
 
MLA Style Guide
MLA Style GuideMLA Style Guide
MLA Style Guide
 
Gücün merkezindeki 20 kadin
Gücün merkezindeki 20 kadinGücün merkezindeki 20 kadin
Gücün merkezindeki 20 kadin
 
Il catalogo 2010 Asset CSP
Il catalogo 2010 Asset CSP Il catalogo 2010 Asset CSP
Il catalogo 2010 Asset CSP
 
I4 school qrpark_promoey_piazza
I4 school qrpark_promoey_piazzaI4 school qrpark_promoey_piazza
I4 school qrpark_promoey_piazza
 
19 Luglio 2013 - Il Futuro della TV - Sergio Duretti - CSP
19 Luglio 2013 - Il Futuro della TV - Sergio Duretti - CSP19 Luglio 2013 - Il Futuro della TV - Sergio Duretti - CSP
19 Luglio 2013 - Il Futuro della TV - Sergio Duretti - CSP
 
3 5massvacation
3 5massvacation3 5massvacation
3 5massvacation
 
Kelsey
Kelsey Kelsey
Kelsey
 
Productivity Enhancement Tools in the Cloud
Productivity Enhancement Tools in the CloudProductivity Enhancement Tools in the Cloud
Productivity Enhancement Tools in the Cloud
 
Calendario
CalendarioCalendario
Calendario
 
Vượt lên nỗi đau
Vượt lên nỗi đauVượt lên nỗi đau
Vượt lên nỗi đau
 
amenorrhea
amenorrheaamenorrhea
amenorrhea
 
JACOB ZUMA - FINANCES • Hidden Empires | Investigating Money In Politics • Ta...
JACOB ZUMA - FINANCES • Hidden Empires | Investigating Money In Politics • Ta...JACOB ZUMA - FINANCES • Hidden Empires | Investigating Money In Politics • Ta...
JACOB ZUMA - FINANCES • Hidden Empires | Investigating Money In Politics • Ta...
 
Tiomf về sức mạnh vô biên
Tiomf về sức mạnh vô biênTiomf về sức mạnh vô biên
Tiomf về sức mạnh vô biên
 
Vowels 1
Vowels 1Vowels 1
Vowels 1
 
Marketing On The Internet
Marketing On The InternetMarketing On The Internet
Marketing On The Internet
 

Similaire à Archeo foss 2012 slides 1

Workshop paas - ECDay 23 Maggio 2012
Workshop paas - ECDay 23 Maggio 2012Workshop paas - ECDay 23 Maggio 2012
Workshop paas - ECDay 23 Maggio 2012VMEngine
 
Fabio Cecaro - WorkShop PaaS – Platform as a Services
Fabio Cecaro - WorkShop PaaS – Platform as a ServicesFabio Cecaro - WorkShop PaaS – Platform as a Services
Fabio Cecaro - WorkShop PaaS – Platform as a ServicesFondazione CUOA
 
Cloud – l’ecosistema platform
Cloud – l’ecosistema platformCloud – l’ecosistema platform
Cloud – l’ecosistema platformVMEngine
 
JBoss Data Grid Tech Lab
JBoss Data Grid Tech LabJBoss Data Grid Tech Lab
JBoss Data Grid Tech LabUgo Landini
 
Infinispan codemotion - Codemotion Rome 2015
Infinispan codemotion - Codemotion Rome 2015Infinispan codemotion - Codemotion Rome 2015
Infinispan codemotion - Codemotion Rome 2015Codemotion
 
Evoluzioni architetturali a partire da Hadoop
Evoluzioni architetturali a partire da HadoopEvoluzioni architetturali a partire da Hadoop
Evoluzioni architetturali a partire da HadoopData Driven Innovation
 
MongoDB SpringFramework Meeting september 2009
MongoDB SpringFramework Meeting september 2009MongoDB SpringFramework Meeting september 2009
MongoDB SpringFramework Meeting september 2009Massimiliano Dessì
 
20160402_mlraviol_mariadb_TorinoWordCamp
20160402_mlraviol_mariadb_TorinoWordCamp20160402_mlraviol_mariadb_TorinoWordCamp
20160402_mlraviol_mariadb_TorinoWordCampmlraviol
 
Azure PaaS databases
Azure PaaS databasesAzure PaaS databases
Azure PaaS databasesGianluca Hotz
 
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDB
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDBPolyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDB
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDBSteve Maraspin
 
Iaa s con openstack per l'analisi di bigdata
Iaa s con openstack per l'analisi di bigdataIaa s con openstack per l'analisi di bigdata
Iaa s con openstack per l'analisi di bigdataVincenzo Fogliaro
 
Cassandra DB - Linux Day 2019 - Catania - Italy
Cassandra DB - Linux Day 2019 - Catania - ItalyCassandra DB - Linux Day 2019 - Catania - Italy
Cassandra DB - Linux Day 2019 - Catania - ItalyFabrizio Spataro
 
Azure for Game Developers
Azure for Game DevelopersAzure for Game Developers
Azure for Game DevelopersMarco Parenzan
 
MySQL 5
MySQL 5MySQL 5
MySQL 5jekil
 
Multitenancy con SQL Server e Azure SQL Database
Multitenancy con SQL Server e Azure SQL DatabaseMultitenancy con SQL Server e Azure SQL Database
Multitenancy con SQL Server e Azure SQL DatabaseGianluca Hotz
 
Db2 11.1: l'evoluzione del Database secondo IBM
Db2 11.1: l'evoluzione del Database secondo IBMDb2 11.1: l'evoluzione del Database secondo IBM
Db2 11.1: l'evoluzione del Database secondo IBMJürgen Ambrosi
 
October 2009 - JBoss Cloud
October 2009 - JBoss CloudOctober 2009 - JBoss Cloud
October 2009 - JBoss CloudJBug Italy
 

Similaire à Archeo foss 2012 slides 1 (20)

Workshop paas - ECDay 23 Maggio 2012
Workshop paas - ECDay 23 Maggio 2012Workshop paas - ECDay 23 Maggio 2012
Workshop paas - ECDay 23 Maggio 2012
 
NOSQL
NOSQLNOSQL
NOSQL
 
Fabio Cecaro - WorkShop PaaS – Platform as a Services
Fabio Cecaro - WorkShop PaaS – Platform as a ServicesFabio Cecaro - WorkShop PaaS – Platform as a Services
Fabio Cecaro - WorkShop PaaS – Platform as a Services
 
Cloud – l’ecosistema platform
Cloud – l’ecosistema platformCloud – l’ecosistema platform
Cloud – l’ecosistema platform
 
JBoss Data Grid Tech Lab
JBoss Data Grid Tech LabJBoss Data Grid Tech Lab
JBoss Data Grid Tech Lab
 
Infinispan codemotion - Codemotion Rome 2015
Infinispan codemotion - Codemotion Rome 2015Infinispan codemotion - Codemotion Rome 2015
Infinispan codemotion - Codemotion Rome 2015
 
Evoluzioni architetturali a partire da Hadoop
Evoluzioni architetturali a partire da HadoopEvoluzioni architetturali a partire da Hadoop
Evoluzioni architetturali a partire da Hadoop
 
MongoDB SpringFramework Meeting september 2009
MongoDB SpringFramework Meeting september 2009MongoDB SpringFramework Meeting september 2009
MongoDB SpringFramework Meeting september 2009
 
Data grid
Data gridData grid
Data grid
 
20160402_mlraviol_mariadb_TorinoWordCamp
20160402_mlraviol_mariadb_TorinoWordCamp20160402_mlraviol_mariadb_TorinoWordCamp
20160402_mlraviol_mariadb_TorinoWordCamp
 
Azure PaaS databases
Azure PaaS databasesAzure PaaS databases
Azure PaaS databases
 
No Sql Intro
No Sql IntroNo Sql Intro
No Sql Intro
 
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDB
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDBPolyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDB
Polyglot Persistance con PostgreSQL, CouchDB, MongoDB, Redis e OrientDB
 
Iaa s con openstack per l'analisi di bigdata
Iaa s con openstack per l'analisi di bigdataIaa s con openstack per l'analisi di bigdata
Iaa s con openstack per l'analisi di bigdata
 
Cassandra DB - Linux Day 2019 - Catania - Italy
Cassandra DB - Linux Day 2019 - Catania - ItalyCassandra DB - Linux Day 2019 - Catania - Italy
Cassandra DB - Linux Day 2019 - Catania - Italy
 
Azure for Game Developers
Azure for Game DevelopersAzure for Game Developers
Azure for Game Developers
 
MySQL 5
MySQL 5MySQL 5
MySQL 5
 
Multitenancy con SQL Server e Azure SQL Database
Multitenancy con SQL Server e Azure SQL DatabaseMultitenancy con SQL Server e Azure SQL Database
Multitenancy con SQL Server e Azure SQL Database
 
Db2 11.1: l'evoluzione del Database secondo IBM
Db2 11.1: l'evoluzione del Database secondo IBMDb2 11.1: l'evoluzione del Database secondo IBM
Db2 11.1: l'evoluzione del Database secondo IBM
 
October 2009 - JBoss Cloud
October 2009 - JBoss CloudOctober 2009 - JBoss Cloud
October 2009 - JBoss Cloud
 

Plus de CSP Scarl

Reti Banda Ultra Larga e Internet delle cose
Reti Banda Ultra Larga e Internet delle cose Reti Banda Ultra Larga e Internet delle cose
Reti Banda Ultra Larga e Internet delle cose CSP Scarl
 
Internet delle cose e remote sensing per agricoltura di precisione Innovazion...
Internet delle cose e remote sensing per agricoltura di precisione Innovazion...Internet delle cose e remote sensing per agricoltura di precisione Innovazion...
Internet delle cose e remote sensing per agricoltura di precisione Innovazion...CSP Scarl
 
"Iot on the field: making smart environments in everyday experience"
"Iot on the field: making smart environments in everyday experience""Iot on the field: making smart environments in everyday experience"
"Iot on the field: making smart environments in everyday experience"CSP Scarl
 
Sigevi - Tecnologie ICT applicate in agricoltura
Sigevi - Tecnologie ICT applicate in agricolturaSigevi - Tecnologie ICT applicate in agricoltura
Sigevi - Tecnologie ICT applicate in agricolturaCSP Scarl
 
Living Labs ovvero il possibile contributo delle ICT ai Presidi Territoriali ...
Living Labs ovvero il possibile contributo delle ICT ai Presidi Territoriali ...Living Labs ovvero il possibile contributo delle ICT ai Presidi Territoriali ...
Living Labs ovvero il possibile contributo delle ICT ai Presidi Territoriali ...CSP Scarl
 
Forum PA challenge: HALADIN's
Forum PA challenge: HALADIN'sForum PA challenge: HALADIN's
Forum PA challenge: HALADIN'sCSP Scarl
 
Livinglabs per nexa_duretti
Livinglabs per nexa_durettiLivinglabs per nexa_duretti
Livinglabs per nexa_durettiCSP Scarl
 
Scuola futuro prossimo
Scuola futuro prossimoScuola futuro prossimo
Scuola futuro prossimoCSP Scarl
 
Storie dal futuro: persone e cose sempre connesse - per genitori
Storie dal futuro: persone e cose sempre connesse - per genitoriStorie dal futuro: persone e cose sempre connesse - per genitori
Storie dal futuro: persone e cose sempre connesse - per genitoriCSP Scarl
 
Storie dal futuro: persone e cose sempre connesse
Storie dal futuro: persone e cose sempre connesseStorie dal futuro: persone e cose sempre connesse
Storie dal futuro: persone e cose sempre connesseCSP Scarl
 
OBSERVO - Piattaforma Open Source per la videosorveglianza territoriale
OBSERVO - Piattaforma Open Source per la videosorveglianza territorialeOBSERVO - Piattaforma Open Source per la videosorveglianza territoriale
OBSERVO - Piattaforma Open Source per la videosorveglianza territorialeCSP Scarl
 
19 Luglio 2013 - Il futuro della TV - Marco Bussone - UNCEM
19 Luglio 2013 - Il futuro della TV - Marco Bussone - UNCEM19 Luglio 2013 - Il futuro della TV - Marco Bussone - UNCEM
19 Luglio 2013 - Il futuro della TV - Marco Bussone - UNCEMCSP Scarl
 
19 Luglio 2013 - Il futuro della TV - Marco Cantamessa - I3P
19 Luglio 2013 - Il futuro della TV - Marco Cantamessa - I3P19 Luglio 2013 - Il futuro della TV - Marco Cantamessa - I3P
19 Luglio 2013 - Il futuro della TV - Marco Cantamessa - I3PCSP Scarl
 
19 Luglio 2013 - Il futuro della TV - Andrea Piersanti, Virtual & Reality Mul...
19 Luglio 2013 - Il futuro della TV - Andrea Piersanti, Virtual & Reality Mul...19 Luglio 2013 - Il futuro della TV - Andrea Piersanti, Virtual & Reality Mul...
19 Luglio 2013 - Il futuro della TV - Andrea Piersanti, Virtual & Reality Mul...CSP Scarl
 
19 Luglio 2013 - Il Futuro della Televisione -
19 Luglio 2013 - Il Futuro della Televisione - 19 Luglio 2013 - Il Futuro della Televisione -
19 Luglio 2013 - Il Futuro della Televisione - CSP Scarl
 
19 Luglio 2013 - Il Futuro della Televisione - Andrea Casalegno - Top-IX
19 Luglio 2013 - Il Futuro della Televisione - Andrea Casalegno - Top-IX19 Luglio 2013 - Il Futuro della Televisione - Andrea Casalegno - Top-IX
19 Luglio 2013 - Il Futuro della Televisione - Andrea Casalegno - Top-IXCSP Scarl
 
19 Luglio 2013 - Il Futuro della Televisione - Chiara Gallino - CSP
19 Luglio 2013 - Il Futuro della Televisione - Chiara Gallino - CSP19 Luglio 2013 - Il Futuro della Televisione - Chiara Gallino - CSP
19 Luglio 2013 - Il Futuro della Televisione - Chiara Gallino - CSPCSP Scarl
 
19 Luglio 2013 - Il Futuro della Televisione - Fabrizio Gramaglia, Finpiemonte
19 Luglio 2013 - Il Futuro della Televisione - Fabrizio Gramaglia, Finpiemonte19 Luglio 2013 - Il Futuro della Televisione - Fabrizio Gramaglia, Finpiemonte
19 Luglio 2013 - Il Futuro della Televisione - Fabrizio Gramaglia, FinpiemonteCSP Scarl
 
Seminario ict agricoltura
Seminario ict agricolturaSeminario ict agricoltura
Seminario ict agricolturaCSP Scarl
 
Datidalle cose digitalfestival2013
Datidalle cose digitalfestival2013Datidalle cose digitalfestival2013
Datidalle cose digitalfestival2013CSP Scarl
 

Plus de CSP Scarl (20)

Reti Banda Ultra Larga e Internet delle cose
Reti Banda Ultra Larga e Internet delle cose Reti Banda Ultra Larga e Internet delle cose
Reti Banda Ultra Larga e Internet delle cose
 
Internet delle cose e remote sensing per agricoltura di precisione Innovazion...
Internet delle cose e remote sensing per agricoltura di precisione Innovazion...Internet delle cose e remote sensing per agricoltura di precisione Innovazion...
Internet delle cose e remote sensing per agricoltura di precisione Innovazion...
 
"Iot on the field: making smart environments in everyday experience"
"Iot on the field: making smart environments in everyday experience""Iot on the field: making smart environments in everyday experience"
"Iot on the field: making smart environments in everyday experience"
 
Sigevi - Tecnologie ICT applicate in agricoltura
Sigevi - Tecnologie ICT applicate in agricolturaSigevi - Tecnologie ICT applicate in agricoltura
Sigevi - Tecnologie ICT applicate in agricoltura
 
Living Labs ovvero il possibile contributo delle ICT ai Presidi Territoriali ...
Living Labs ovvero il possibile contributo delle ICT ai Presidi Territoriali ...Living Labs ovvero il possibile contributo delle ICT ai Presidi Territoriali ...
Living Labs ovvero il possibile contributo delle ICT ai Presidi Territoriali ...
 
Forum PA challenge: HALADIN's
Forum PA challenge: HALADIN'sForum PA challenge: HALADIN's
Forum PA challenge: HALADIN's
 
Livinglabs per nexa_duretti
Livinglabs per nexa_durettiLivinglabs per nexa_duretti
Livinglabs per nexa_duretti
 
Scuola futuro prossimo
Scuola futuro prossimoScuola futuro prossimo
Scuola futuro prossimo
 
Storie dal futuro: persone e cose sempre connesse - per genitori
Storie dal futuro: persone e cose sempre connesse - per genitoriStorie dal futuro: persone e cose sempre connesse - per genitori
Storie dal futuro: persone e cose sempre connesse - per genitori
 
Storie dal futuro: persone e cose sempre connesse
Storie dal futuro: persone e cose sempre connesseStorie dal futuro: persone e cose sempre connesse
Storie dal futuro: persone e cose sempre connesse
 
OBSERVO - Piattaforma Open Source per la videosorveglianza territoriale
OBSERVO - Piattaforma Open Source per la videosorveglianza territorialeOBSERVO - Piattaforma Open Source per la videosorveglianza territoriale
OBSERVO - Piattaforma Open Source per la videosorveglianza territoriale
 
19 Luglio 2013 - Il futuro della TV - Marco Bussone - UNCEM
19 Luglio 2013 - Il futuro della TV - Marco Bussone - UNCEM19 Luglio 2013 - Il futuro della TV - Marco Bussone - UNCEM
19 Luglio 2013 - Il futuro della TV - Marco Bussone - UNCEM
 
19 Luglio 2013 - Il futuro della TV - Marco Cantamessa - I3P
19 Luglio 2013 - Il futuro della TV - Marco Cantamessa - I3P19 Luglio 2013 - Il futuro della TV - Marco Cantamessa - I3P
19 Luglio 2013 - Il futuro della TV - Marco Cantamessa - I3P
 
19 Luglio 2013 - Il futuro della TV - Andrea Piersanti, Virtual & Reality Mul...
19 Luglio 2013 - Il futuro della TV - Andrea Piersanti, Virtual & Reality Mul...19 Luglio 2013 - Il futuro della TV - Andrea Piersanti, Virtual & Reality Mul...
19 Luglio 2013 - Il futuro della TV - Andrea Piersanti, Virtual & Reality Mul...
 
19 Luglio 2013 - Il Futuro della Televisione -
19 Luglio 2013 - Il Futuro della Televisione - 19 Luglio 2013 - Il Futuro della Televisione -
19 Luglio 2013 - Il Futuro della Televisione -
 
19 Luglio 2013 - Il Futuro della Televisione - Andrea Casalegno - Top-IX
19 Luglio 2013 - Il Futuro della Televisione - Andrea Casalegno - Top-IX19 Luglio 2013 - Il Futuro della Televisione - Andrea Casalegno - Top-IX
19 Luglio 2013 - Il Futuro della Televisione - Andrea Casalegno - Top-IX
 
19 Luglio 2013 - Il Futuro della Televisione - Chiara Gallino - CSP
19 Luglio 2013 - Il Futuro della Televisione - Chiara Gallino - CSP19 Luglio 2013 - Il Futuro della Televisione - Chiara Gallino - CSP
19 Luglio 2013 - Il Futuro della Televisione - Chiara Gallino - CSP
 
19 Luglio 2013 - Il Futuro della Televisione - Fabrizio Gramaglia, Finpiemonte
19 Luglio 2013 - Il Futuro della Televisione - Fabrizio Gramaglia, Finpiemonte19 Luglio 2013 - Il Futuro della Televisione - Fabrizio Gramaglia, Finpiemonte
19 Luglio 2013 - Il Futuro della Televisione - Fabrizio Gramaglia, Finpiemonte
 
Seminario ict agricoltura
Seminario ict agricolturaSeminario ict agricoltura
Seminario ict agricoltura
 
Datidalle cose digitalfestival2013
Datidalle cose digitalfestival2013Datidalle cose digitalfestival2013
Datidalle cose digitalfestival2013
 

Dernier

Descrizione Piccolo teorema di Talete.pptx
Descrizione Piccolo teorema di Talete.pptxDescrizione Piccolo teorema di Talete.pptx
Descrizione Piccolo teorema di Talete.pptxtecongo2007
 
LE ALGHE.pptx ..........................
LE ALGHE.pptx ..........................LE ALGHE.pptx ..........................
LE ALGHE.pptx ..........................giorgiadeascaniis59
 
descrizioni della antica civiltà dei sumeri.pptx
descrizioni della antica civiltà dei sumeri.pptxdescrizioni della antica civiltà dei sumeri.pptx
descrizioni della antica civiltà dei sumeri.pptxtecongo2007
 
Quadrilateri e isometrie studente di liceo
Quadrilateri e isometrie studente di liceoQuadrilateri e isometrie studente di liceo
Quadrilateri e isometrie studente di liceoyanmeng831
 
Oppressi_oppressori.pptx................
Oppressi_oppressori.pptx................Oppressi_oppressori.pptx................
Oppressi_oppressori.pptx................giorgiadeascaniis59
 
case passive_GiorgiaDeAscaniis.pptx.....
case passive_GiorgiaDeAscaniis.pptx.....case passive_GiorgiaDeAscaniis.pptx.....
case passive_GiorgiaDeAscaniis.pptx.....giorgiadeascaniis59
 
Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptx
Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptxLorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptx
Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptxlorenzodemidio01
 
Tosone Christian_Steve Jobsaaaaaaaa.pptx
Tosone Christian_Steve Jobsaaaaaaaa.pptxTosone Christian_Steve Jobsaaaaaaaa.pptx
Tosone Christian_Steve Jobsaaaaaaaa.pptxlorenzodemidio01
 
Presentazioni Efficaci e lezioni di Educazione Civica
Presentazioni Efficaci e lezioni di Educazione CivicaPresentazioni Efficaci e lezioni di Educazione Civica
Presentazioni Efficaci e lezioni di Educazione CivicaSalvatore Cianciabella
 
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptx
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptxScienza Potere Puntoaaaaaaaaaaaaaaa.pptx
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptxlorenzodemidio01
 
Vuoi girare il mondo? educazione civica.
Vuoi girare il mondo? educazione civica.Vuoi girare il mondo? educazione civica.
Vuoi girare il mondo? educazione civica.camillaorlando17
 
Aristotele, vita e opere e fisica...pptx
Aristotele, vita e opere e fisica...pptxAristotele, vita e opere e fisica...pptx
Aristotele, vita e opere e fisica...pptxtecongo2007
 
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptxNicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptxlorenzodemidio01
 
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptx
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptxLorenzo D'Emidio_Vita di Cristoforo Colombo.pptx
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptxlorenzodemidio01
 
Scrittura seo e scrittura accessibile
Scrittura seo e scrittura accessibileScrittura seo e scrittura accessibile
Scrittura seo e scrittura accessibileNicola Rabbi
 
discorso generale sulla fisica e le discipline.pptx
discorso generale sulla fisica e le discipline.pptxdiscorso generale sulla fisica e le discipline.pptx
discorso generale sulla fisica e le discipline.pptxtecongo2007
 
Lorenzo D'Emidio_Vita e opere di Aristotele.pptx
Lorenzo D'Emidio_Vita e opere di Aristotele.pptxLorenzo D'Emidio_Vita e opere di Aristotele.pptx
Lorenzo D'Emidio_Vita e opere di Aristotele.pptxlorenzodemidio01
 
Lorenzo D'Emidio_Francesco Petrarca.pptx
Lorenzo D'Emidio_Francesco Petrarca.pptxLorenzo D'Emidio_Francesco Petrarca.pptx
Lorenzo D'Emidio_Francesco Petrarca.pptxlorenzodemidio01
 
ProgettoDiEducazioneCivicaDefinitivo_Christian Tosone.pptx
ProgettoDiEducazioneCivicaDefinitivo_Christian Tosone.pptxProgettoDiEducazioneCivicaDefinitivo_Christian Tosone.pptx
ProgettoDiEducazioneCivicaDefinitivo_Christian Tosone.pptxlorenzodemidio01
 

Dernier (19)

Descrizione Piccolo teorema di Talete.pptx
Descrizione Piccolo teorema di Talete.pptxDescrizione Piccolo teorema di Talete.pptx
Descrizione Piccolo teorema di Talete.pptx
 
LE ALGHE.pptx ..........................
LE ALGHE.pptx ..........................LE ALGHE.pptx ..........................
LE ALGHE.pptx ..........................
 
descrizioni della antica civiltà dei sumeri.pptx
descrizioni della antica civiltà dei sumeri.pptxdescrizioni della antica civiltà dei sumeri.pptx
descrizioni della antica civiltà dei sumeri.pptx
 
Quadrilateri e isometrie studente di liceo
Quadrilateri e isometrie studente di liceoQuadrilateri e isometrie studente di liceo
Quadrilateri e isometrie studente di liceo
 
Oppressi_oppressori.pptx................
Oppressi_oppressori.pptx................Oppressi_oppressori.pptx................
Oppressi_oppressori.pptx................
 
case passive_GiorgiaDeAscaniis.pptx.....
case passive_GiorgiaDeAscaniis.pptx.....case passive_GiorgiaDeAscaniis.pptx.....
case passive_GiorgiaDeAscaniis.pptx.....
 
Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptx
Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptxLorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptx
Lorenzo D'Emidio- Lavoro sulla Bioarchittetura.pptx
 
Tosone Christian_Steve Jobsaaaaaaaa.pptx
Tosone Christian_Steve Jobsaaaaaaaa.pptxTosone Christian_Steve Jobsaaaaaaaa.pptx
Tosone Christian_Steve Jobsaaaaaaaa.pptx
 
Presentazioni Efficaci e lezioni di Educazione Civica
Presentazioni Efficaci e lezioni di Educazione CivicaPresentazioni Efficaci e lezioni di Educazione Civica
Presentazioni Efficaci e lezioni di Educazione Civica
 
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptx
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptxScienza Potere Puntoaaaaaaaaaaaaaaa.pptx
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptx
 
Vuoi girare il mondo? educazione civica.
Vuoi girare il mondo? educazione civica.Vuoi girare il mondo? educazione civica.
Vuoi girare il mondo? educazione civica.
 
Aristotele, vita e opere e fisica...pptx
Aristotele, vita e opere e fisica...pptxAristotele, vita e opere e fisica...pptx
Aristotele, vita e opere e fisica...pptx
 
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptxNicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
 
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptx
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptxLorenzo D'Emidio_Vita di Cristoforo Colombo.pptx
Lorenzo D'Emidio_Vita di Cristoforo Colombo.pptx
 
Scrittura seo e scrittura accessibile
Scrittura seo e scrittura accessibileScrittura seo e scrittura accessibile
Scrittura seo e scrittura accessibile
 
discorso generale sulla fisica e le discipline.pptx
discorso generale sulla fisica e le discipline.pptxdiscorso generale sulla fisica e le discipline.pptx
discorso generale sulla fisica e le discipline.pptx
 
Lorenzo D'Emidio_Vita e opere di Aristotele.pptx
Lorenzo D'Emidio_Vita e opere di Aristotele.pptxLorenzo D'Emidio_Vita e opere di Aristotele.pptx
Lorenzo D'Emidio_Vita e opere di Aristotele.pptx
 
Lorenzo D'Emidio_Francesco Petrarca.pptx
Lorenzo D'Emidio_Francesco Petrarca.pptxLorenzo D'Emidio_Francesco Petrarca.pptx
Lorenzo D'Emidio_Francesco Petrarca.pptx
 
ProgettoDiEducazioneCivicaDefinitivo_Christian Tosone.pptx
ProgettoDiEducazioneCivicaDefinitivo_Christian Tosone.pptxProgettoDiEducazioneCivicaDefinitivo_Christian Tosone.pptx
ProgettoDiEducazioneCivicaDefinitivo_Christian Tosone.pptx
 

Archeo foss 2012 slides 1

  • 1. Architetture scalabili per la memorizzazione, analisi, condivisione e pubblicazione dei dati Roma, 13 giugno 2012 - ArcheoFOSS 2012 Rodolfo Boraso , Diego Guenzi
  • 2. CSP s.c.a r.l. Organismo di ricerca, ex Centro di Supercalcolo del Piemonte – Senza scopo di lucro – Utili reinvestiti in ricerca – Sviluppo sperimentale e ricerca industriale in ICT – Progetti europei, nazionali e regionali – Laboratorio di ricerca iscritto all' “Albo dei laboratori MIUR” – Nessun accesso preferenziale ai soci 2
  • 4. Ampia scelta di database Relational Non-relational Analytic Brisk Dryad Infobright Netezza ParAccel SAP Sybase IQ Teradata EMC Hadapt CalPont Infosphere AsterData Greeplum VectorWise Vertica Piccolo Mapr Hadoop Operational Oracle IBM DB2 SQLServer JustOne InterSystems Progress Versant Objectivity Document MarkLogic Mysql Ingres PostgreSQL McObject SAP Sybase ASE EnterpriseDB Lotus Notes NOSQL CouchDB NewSQL HandlerSocket Key MongoDB Value RavenDB 'as-a-Service' Amazon RDS Akiban MySQL Cluster Cloudant SQL Azure Riak CouchBase App Engine Clustrix Database.com Redis Datastore Drizzle Xeround FathomDB SimpleDB GenieDB Membrain ScalArc Big Tables Graph Schooner MySQL CodeFutures Cassandra InfiniteGraph Tokutek ScaleBase NimbusDB Voldemort Hypertable Neo4J Continuent VoltDB BerkeleyDB HBase GraphDB Translattice Data Cloud Cache Enable- ment Data Grid/Cache Terracotta GigaSpaces Oracle Coherence memcached IBM eXtreme Scale GridGain Vmware GemFire InfiniSpan CloudTran 4
  • 5. NOSQL Movimento che promuove una classe non ben definita di strumenti di archiviazione di dati “For some problems, other storage solutions are better suited” Not Only SQL • Non è un movimento contro l’SQL • Esistono delle alternative ai RDBMS tradizionali • Un nuovo modo di vedere la persistenza • Strumenti nati per lavorare in ambienti distribuiti, adatti al cloud computing 5
  • 6. NOSQL Si differenziano dai RDBMS • Non utilizzano il tradizionale SQL • Non adottano schemi tabellari fissi (dati semi-strutturati) • Evitano join • Scalano facilmente su commodity hardware Uso complementare ai RDBMS • The right tool for the job • Coprono aree dove i RDBMS sono “deboli” • Hanno come target settori specifici 6
  • 7. Scalabilità Verticale • Potenziamento dell'hardware Orizzontale • Numero di macchine 7
  • 8. Costo della scalabilità Verticale • Esponenziale Orizzontale • Lineare 8
  • 9. Scalabilità RDBMS tradizionali Verticale • In genere non ci sono grosse difficoltà Orizzontale • Problematica: necessità di tecniche complesse con un forte degrado delle prestazioni offerte 9
  • 10. Scalabilità DB NOSQL Verticale • In genere non ci sono grosse difficoltà Orizzontale • Nascono per essere inseriti in ambienti distribuiti: l'eccezione è il server stand-alone 10
  • 11. Solo scalabilità? Scalare orizzontalmente => avere più macchine • Fault tolerance • Load balancing • High availability Avere più macchine => poter distribuire e replicare i dati su più nodi • Uso ideale in ambienti distribuiti • Affidabilità • Elevate prestazioni Tutto in bundle, senza bisogno di software aggiuntivi 11
  • 12. NewSQL ● Una via di mezzo fra il mondo NOSQL e quello relazionale ● Uso di tabelle relazionali e di SQL ● Stessa scalabilità dei DBMS NOSQL ● Molti prodotti stanno nascendo: VoltDB, MySQL Cluster (NDB), ScaleDB, Xeround… ● Molti storage engine per MySQL 12
  • 13. HBase ● Architettura orientata alle colonne / ibrida basata su HDFS ● Si ispira a BigTable di Google ● Software open source con licenza Apache ● Utilizzato in produzione da molti enti fra i quali spicca Facebook ● Salvataggio dati in RAM (con flush su disco) ● Replica dei dati e sharding ottenuti grazie all’HDFS ● Aggiunta di nodi a caldo ● Self-healing 13
  • 14. HDFS ● Filesystem distribuito, altamente scalabile ● Basato sul framework Hadoop ● Cluster di nodi formano uno storage HDFS ● Fault-tolerant ● Lavora su commodity hardware (low-cost) 14
  • 15. Hadoop ● Framework che supporta applicazioni distribuite con elevato accesso ai dati ● Scritto interamente in Java ● Permette alle applicazioni di lavorare con migliaia di nodi e petabyte di dati ● Si ispira alla tecnologia Map/Reduce di Google e al Google File System ● Progetto top-level di Apache Foundation ● Usato da alcuni grossi player come AOL, eBay, Facebook, IBM, Imageshack, Joost, Linkedin, The New York Times, Twitter e Yahoo 15
  • 16. Topic ANALISI 16
  • 17. R – Statistical computing ● Ambiente per l'analisi statistica con licenza GPL ● Predisposto per l'interconnessione a diversi database e a sistemi GIS come GRASS (geostatistica) ● Ampia disponibilità di moduli per la connessione ad altre applicazioni con driver specifici o tramite connessioni ODBC ● Disponibile per moltissime piattaforme 17
  • 18. R + Hadoop ● Connubio “best-of-breed” open source per l'analisi ● Permette di analizzare grossi insiemi di dati distribuiti su HDFS / HBase anziché su storage e database locali ● Utilizza script in linguaggio R e sfrutta le potenzialità della metodologia di calcolo distribuito di Map / Reduce 18
  • 19. Big Data Analytics ● Big Data = informazioni in enormi quantità, delle più svariate tipologie e formati e in costante crescita, che causano complessità nella gestione con strumenti tradizionali ● Complessità sì nella memorizzazione (i RDBMS tradizionali sono insufficienti) ma, specialmente, nell'analisi (tecniche di warehousing o di business intelligence risultano inadatte) ● Big Data Analytics = utilizzo di “nuovi” strumenti distribuiti per l'analisi ● HDFS + NOSQL + Map / Reduce + R = una possibile soluzione open source per la Big Data Analytics 19
  • 20. Esempio: Oracle Big Data Appliance ● Un'appliance Oracle per l'analisi dei Big Data ● Oracle Enterprise Linux 5.6 ● CDH - Cloudera's Distribution including Hadoop (Hadoop pacchettizzato da Cloudera) ● Oracle NOSQL Database (BerkleyDB) ● Open source R 20
  • 22. Apache web server e WebDAV ● Progetto della Apache Foundation ● Server web multipiattaforma open source attivo dal 1995 ● Architettura modulare ● Grazie a mod_dav e dav_fs permette l'accesso tramite protocollo WebDAV alle risorse presenti sul file system ● Web-based Distributed Authoring and Versioning (WebDAV) ● Protocollo basato su HTTP ● Permette all'utente di gestire in modo collaborativo i file in un server remoto ● Scopo: rendere il web un mezzo di lettura e scrittura ● Supportato da una miriade di dispositivi, dai computer agli smartphone 22
  • 23. Data feed via mobile Cloud Computing Cloud C Internet Cloud A Network Operators Cloud B Mobile Users Internet Service Providers Application Service Providers ● Esempio: crowdsourcing ● ...ma non solo: oltre al feed, anche la fruizione dei contenuti può avvenire tramite device mobili 23
  • 24. Topic ARCHITETTURA 24
  • 25. Load balancing ● Metodologia per la distribuzione del carico su più macchine all'interno di un cluster ● Moltissime soluzioni open source, ad esempio HAProxy+Keepalived, ma anche Nginx + Keepalived 25
  • 26. Schema architetturale Internet HTTP/WebDAV Keepalived HAProxy HAProxy …... HTTP/WebDAV Cluster Web Piattaforme Apache Apache Apache Apache di analisi + + + ….... R Solr Pentaho Hive ….... Fuse Fuse Fuse Hadoop HBase Nodo Nodo Nodo HDFS Hadoop Hadoop Hadoop ….... 26
  • 27. Topic CONTESTI D'USO 27
  • 28. Pubblica amministrazione ● Le PA possono disporre di grosse moli di dati di interesse per i cittadini, tra i quali si identificano spesso gli open data ● Quale modo migliore per utilizzarli se non dal proprio smartphone? ● Come evidenziato su dati.gov.it esistono app per: ● amministrazioni centrali (trovare e lasciare opinioni sugli uffici pubblici, gestione INPS e INAIL, motorizzazione civile...) ● regioni (informazioni turistiche e culturali, analisi statistiche...) ● province (infomobilità, gastronomie tipiche...) ● comuni (mezzi pubblici, news...) 28
  • 29. Mobile data analytics ● Connubio fra data analytics e ambienti di nuova generazione ● Se si parla di Big Data è necessario elaborare i dati per renderli anonimi e aggregarli, in modo che il cittadino li riceva in forma semplificata ● Serve potenza di calcolo nell'infrastruttura di back-end: i dispositivi mobili fungono solo da thin client ● Necessità di ambienti scalabili (cloud) 12 10 8 Colonna 1 6 Colonna 2 4 Colonna 3 2 0 Riga 1 Riga 2 Riga 3 Riga 4 29
  • 30. Cloud storage e personal cloud ● Necessità di avere un contesto comune fra più dispositivi, al fine di condividere i dati fra i propri device ● PC ● Notebook ● Tablet ● Smartphone ● Necessità di condividere i propri dati con altri ● Necessità di capacità di storage addizionale 30
  • 31. Hadoop nell'archeologia ● Uso di LIDAR per la rilevazione della mappatura di siti relativi alle civiltà pre-colombiane in America centrale (mole enorme di campionamenti) ● Elaborazione dei dati grazie a Map / Reduce e Hadoop con performance migliori rispetto ad architetture HPC, ben più costose (San Diego Supercomputing Centre) ● http://silvertonconsulting.com/blog/2012/03/14/archeology-meets-big-data/ 31
  • 32. R nell'archeologia ● Numerosi esempi di utilizzo: ● analisi di statistica circolare per lo studio dell'esposizione solare ● analisi dell'assetto spaziale di un deposito archeologico (Fabric Analysis) ● analisi di comparazione di reperti utilizzando indici di somiglianza tra oggetti o siti ● “Un'anfora frammentaria della laguna di Venezia” di I. Modrzewska, G. Taroni, F. Pianetti, 2010 ● “Correspondence analysis in R for archaeologists: an educational account” di M.J. Baxter, H.E.M. Cool, 2010 ● ... 32
  • 33. Conclusioni ● La soluzione stato dell'arte è la soluzione FOSS (e.g. Oracle Big Data Appliance adotta prevalentemente software open source) ● Architettura fortemente scalabile ● Modello “modulare” con componenti intercambiabili e interoperabili ● Infrastruttura general purpose, adatta alla memorizzazione e all'analisi di diverse tipologie di dati (strutturati o meno) ● Componenti dell'architettura ampiamente adottate e fortemente supportate dalla community ● Capacità di esecuzione su commodity hardware anziché su soluzioni specifiche offerte da vari vendor (rischio di vendor lock-in) 33
  • 34. Direzione Progettazione e Gestione Risorse rodolfo.boraso@csp.it diego.guenzi@csp.it CSP innovazione nelle ICT s.c. a r.l. Via Nizza n. 150 – 10126 Torino – Italy (ingresso da via Alassio, 11/c) Tel: +39 011 4815111 Fax: +39 011 4815001 E-mail: innovazione@csp.it www.csp.it 34