Introduction à Cassandra

•

1 j'aime•622 vues

Gérald Quintana

Intr

Technologie

1. Big Data
2. NoSQL
3. Architecture de Cassandra
4. Développer avec CQL
Objectifs
2 / 35

Big Data
Big data is highvolume, highvelocity and highvariety information
assets that demand costeffective, innovative forms of information
processing for enhanced insight and decision making.
Gartner
3 / 35

Big Data
Traitements en Batch ou Flux
Forts volumes
Performances
Hautedisponibilité
4 / 35

SQL or NoSQL?
Not using the relational model (nor the SQL language).
Open source.
Designed to run on large clusters
Based on the needs of 21st century web properties
No schema, allowing fields to be added to any record without controls
http://martinfowler.com/bliki/NosqlDefinition.html
5 / 35

Relationnel
CléValeur
Document
Colonnes Cassandra
Graphe
Mixte
Modèles de données
6 / 35

ACID
Atomicity
Cohérence
Isolation
Durability
BASE
Basically Available
Soft state
Eventual consistency
ACID ou BASE?
7 / 35

Consistency
Availability
Partition tolerance
CAP
8 / 35

Cassandra en résumé
Distribuée
Masterless: pas de SPOF
Scalabilité linéaire
Tolérance aux pannes: 100% uptime
Performances
Consistance réglable
Multidatacenter
Simplicité opérationnelle
10 / 35

Scalabilité linéaire
http://techblog.netflix.com/2011/11/benchmarkingcassandrascalabilityon.html
16 / 35

Node∈Rack∈Datacenter
Decoupage
Géographique
Logique
Cloud
Multi-datacenter
18 / 35

Timestamp par cellule
Consistance ALL: Ecriture
20 / 35

Tolérance aux pannes
Hinted Handoff
Consistance ONE: Ecriture
21 / 35

Last write wins
Read repair
Consistance ALL: Lecture
22 / 35

Eventual consistency
Consistance ONE: Lecture
23 / 35

Consistance réglable
Niveau de consistance par requête
24 / 35

Consistance immédiate
R + W > RF
Consistance au final
R + W ≤ RF
Consistance: le bilan
25 / 35

Pour l'écriture
Append only + compaction
Pas de disk seek
Pour la lecture
Réplication & Load balancing
Modélisation adaptée → Accès
direct
Caches par table
Performances
26 / 35

Simplicité opérationnelle
Installation
Linux, Java, Python, NTP
Packaging: .tar, .rpm, .deb, .exe
23 fichiers de configuration
1 seul processus
1 seul type de noeud
Monitoring
nodetool, JMX, OpsCenter
27 / 35

Simplicité pour le développement
CQL = SQL simplifié
cqlsh
DevCenter
CCM, un cluster en local
28 / 35

$CQL CREATETABLEutilisateur( id_utilisateurUUID, loginVARCHAR, date_naissanceTIMESTAMP, rolesSET<VARCHAR>, PRIMARYKEY(id_utilisateur) ); INSERTINTOutilisateur(id_utilisateur,login, date_naissance,roles) VALUES('abc123...','jdoe', '1978-04-06',{'blogger','journaliste'}); SELECT*FROMutilisateur WHEREid_utilisateur='abc123...'; 29 / 35$

Modèle orienté colonne
Table utilisateur
30 / 35

CQL Grandes lignes
CREATETABLEmessage(
id_utilisateurUUID,
id_messageTIMEUUID,
messageVARCHAR,
PRIMARYKEY(id_utilisateur,id_message)
);
INSERTINTOmessage(id_utilisateur,id_message)
VALUES('abc123...',now(),'ViveCassandra');
SELECT*FROMutilisateur
WHEREid_utilisateur='abc123...';
SELECTmessageFROMutilisateur
WHEREid_utilisateur='abc123...'ANDid_message='cde456...';
31 / 35

Modèle orienté colonne
Table utilisateur
Table message
Map<RowKey, SortedMap<ColumnKey, ColumnValue>>
32 / 35

Modélisation
Dénormaliser!
Besoin → Requête → Table
Adapter les données aux requêtes (pas l'inverse)
33 / 35

Driver
Load balancing, tolérance aux pannes, découverte
Synchrone ou asynchrone (réactive programming)
Librairies Java:
ObjectMapper, Achilles, Spring Data Cassandra...
Cassandra Unit, Stubbed Cassandra
34 / 35

Contenu connexe

Tendances

Apache Cassandra - Concepts et fonctionnalitésRomain Hardouin

Panorama des offres NoSQL disponibles dans AzureMicrosoft Décideurs IT

Administration et supervision depuis le Cloud avec Azure Logs AnalyticsMicrosoft

Azure Service Fabric pour les développeursMicrosoft

Modélisation, déploiement et gestion des infrastructures Cloud : outils et bo...Microsoft

Les nouveautés SQL Server 2016Microsoft

DataStax Enterprise BBLVictor Coustenoble

Webinar - Enterprise Cloud DatabasesOVHcloud

Apache Kafka, Un système distribué de messagerie hautement performantALTIC Altic

NoSql : conception des schémas, requêtage, et optimisationMicrosoft Technet France

NoSQL et Big Dataacogoluegnes

Bases de données NoSQLSamy Dindane

DataStax Enterprise - Cas d'usageClaude-Alain Glauser

Plan de Reprise d'Activité avec Azure Site RecoveryMicrosoft

Implentation d'une solution Cloud IAASmohamed hadrich

Mise en place d’une infrastructure cloud basée sur cloudstackchammem

Les BD NoSQLMinyar Sassi Hidri

IaaS et Cloud Open Source - Raphael Ferreira, eNovanceStefane Fermigier

Architecture Big Data open source S.M.A.C.KJulien Anguenot

Big data: NoSQL comme solutionJEMLI Fathi

Tendances (20)

Apache Cassandra - Concepts et fonctionnalités

Panorama des offres NoSQL disponibles dans Azure

Administration et supervision depuis le Cloud avec Azure Logs Analytics

Azure Service Fabric pour les développeurs

Modélisation, déploiement et gestion des infrastructures Cloud : outils et bo...

Les nouveautés SQL Server 2016

DataStax Enterprise BBL

Webinar - Enterprise Cloud Databases

Apache Kafka, Un système distribué de messagerie hautement performant

NoSql : conception des schémas, requêtage, et optimisation

NoSQL et Big Data

Bases de données NoSQL

DataStax Enterprise - Cas d'usage

Plan de Reprise d'Activité avec Azure Site Recovery

Implentation d'une solution Cloud IAAS

Mise en place d’une infrastructure cloud basée sur cloudstack

Les BD NoSQL

IaaS et Cloud Open Source - Raphael Ferreira, eNovance

Architecture Big Data open source S.M.A.C.K

Big data: NoSQL comme solution

En vedette

PortfolioMax Clee

Probabilidad o certeza gemelosJoanzapatero

TuentiLaumon

Caperucita Roja en versión de 3º Abiblioteca23de09

Le Buzz : Booster votre image grace au web 2.0KevinDescoubes

La ReproduccióNFernando Rodriguez

DominiosHomero J Simpson

Diagramme de constellationCanadian Patient Safety Institute

Lasmejoresfotos3gutierrez45

Presentación Power Point1Javier Suárez Fernández

Seminario Finalguestb6a537ed

El pensamiento sociopolítico de Antonio GramsciFernando Rodriguez

Mots Liste7mmebatchelor

¡Hola!Lospepitagalbus

El Social Trip #sienteteruel ha producido 104.399.751 impactos en TwitterCarmen Urbano

La méthode zSid Ahmed Benkraoua

PeliculasÁlvaro Fernández Quesada

Habilidades comunicativas para el siglo xxiColegio Padre Pedro Arrupe

Mi Vida Durante La Primer Parte Del AñOguest7bc89eb3

Actividades Tema 5FMiguelGS

En vedette (20)

Portfolio

Probabilidad o certeza gemelos

Tuenti

Caperucita Roja en versión de 3º A

Le Buzz : Booster votre image grace au web 2.0

La ReproduccióN

Dominios

Diagramme de constellation

Lasmejoresfotos3

Presentación Power Point1

Seminario Final

El pensamiento sociopolítico de Antonio Gramsci

Mots Liste7

¡Hola!Los

El Social Trip #sienteteruel ha producido 104.399.751 impactos en Twitter

La méthode z

Peliculas

Habilidades comunicativas para el siglo xxi

Mi Vida Durante La Primer Parte Del AñO

Actividades Tema 5

Similaire à Introduction à Cassandra

NoSQL: Quoi, quand et pour qui par Orlando Cassano du CETICLa FeWeb

NoSQL panorama - Jean Seiler SofteamTelecomValley

Couchbase Capella.pptxSaraHmida1

Discovery Session France: Atelier découverte de la Data VirtualizationDenodo

Cours Big Data Chap5Amal Abid

BlueData EPIC datasheet (en Français)BlueData, Inc.

HIF Paris 2014 - BROCADE - Le Réseau de Data Center « ON-DEMAND »Hitachi Data Systems France

Discovery Session France: Atelier découverte de la Data VirtualizationDenodo

OSA02 - Pas de transactionnel haute performance sans un couple machine logici...Nicolas Desachy

BigData_Chp5: Putting it all togetherLilia Sfaxi

DataStax et Apache Cassandra pour la gestion des flux IoTVictor Coustenoble

Introduction nosqlInes Slimene

Big data architecturesMariem Khalfaoui

20160216 - From BigData to BigProcessingPierre-Marie Brunet

#OSSPARIS19 - Stream processing : de la base de données classique au streamin...Paris Open Source Summit

Xebicon2019 m icroservicesCédrick Lunven

Avenir des grilles - F. DesprezFrederic Desprez

MySQL Innovation & Cloud Day - Document Store avec MySQL HeatWave Database Se...Frederic Descamps

Hadoop Hbase - IntroductionBlandine Larbret

Google spannerStéphane NOTTER

Similaire à Introduction à Cassandra (20)

NoSQL: Quoi, quand et pour qui par Orlando Cassano du CETIC

NoSQL panorama - Jean Seiler Softeam

Couchbase Capella.pptx

Discovery Session France: Atelier découverte de la Data Virtualization

Cours Big Data Chap5

BlueData EPIC datasheet (en Français)

HIF Paris 2014 - BROCADE - Le Réseau de Data Center « ON-DEMAND »

Discovery Session France: Atelier découverte de la Data Virtualization

OSA02 - Pas de transactionnel haute performance sans un couple machine logici...

BigData_Chp5: Putting it all together

DataStax et Apache Cassandra pour la gestion des flux IoT

Introduction nosql

Big data architectures

20160216 - From BigData to BigProcessing

#OSSPARIS19 - Stream processing : de la base de données classique au streamin...

Xebicon2019 m icroservices

Avenir des grilles - F. Desprez

MySQL Innovation & Cloud Day - Document Store avec MySQL HeatWave Database Se...

Hadoop Hbase - Introduction

Google spanner