Apache Cassandra
Une base de donnée pour des applications scalables et résistantes
Sylvain Lebresne (DataStax)
Webinar Big...
Big Data
2/18
Un peu d'histoire
3/18
Job Trends
4/18
Quelques utilisateurs
5/18
Industries et Cas d'utilisations
Tout ce qui requiert scalibilité et/ou haute disponibilité.
Finance
Media sociaux
Diverti...
Pourquoi Apache Cassandra?
Entièrement distribué, pas de SPOF
Multi-master, multi-DC
Scale linéairement
Performance de hau...
Disponibilité
"There is no such thing as standby infrastructure: there stuff you always use and
stuff that won't work when...
Partitionnement classique avec SPOF
9/18
Entièrement distribué, pas de SPOF
10/18
Tolérance aux pannes sur le terrain
11/18
Ajout de capacité transparent, sans interruption de service
Pas de SPOF, même temporairement -- Pas de "primary" replica
R...
Quid de la performance?
"Log-structured storage engine" pour minimisé les I/O aléatoires
Excellente performance en lecture...
Performance
http://vldb.org/pvldb/vol5/p1724_tilmannrabl_vldb2012.pdf
14/18
Scalabilité linéaire
http://techblog.netflix.com/2011/11/benchmarking-cassandra-scalability-on.html
15/18
Cassandra Query Language
CREATE TABLE users (
username text PRIMARY KEY,
fullname text,
password text,
email text,
picture...
DataStax
www.datastax.com
DataStax Entreprise Edition
DataStax OpsCenter
Support 24/7
Formation, conseil, documentation .....
Pour aller plus loin
Merci!
cassandra.apache.org
www.datastax.com/docs
planetcassandra.org
·
·
·
18/18
Prochain SlideShare
Chargement dans…5
×

Webinar Big Data Paris

619 vues

Publié le

Publié dans : Technologie
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
619
Sur SlideShare
0
Issues des intégrations
0
Intégrations
1
Actions
Partages
0
Téléchargements
7
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Webinar Big Data Paris

  1. 1. Apache Cassandra Une base de donnée pour des applications scalables et résistantes Sylvain Lebresne (DataStax) Webinar Big Data Paris // 11 Mars 2014
  2. 2. Big Data 2/18
  3. 3. Un peu d'histoire 3/18
  4. 4. Job Trends 4/18
  5. 5. Quelques utilisateurs 5/18
  6. 6. Industries et Cas d'utilisations Tout ce qui requiert scalibilité et/ou haute disponibilité. Finance Media sociaux Divertissement Énergie Sécurité Advertising Commerce en ligne ... · · · · · · · · Time series data Messagerie Ad tracking Data mining Stream d'activité Sessions utilisateur ... · · · · · · · 6/18
  7. 7. Pourquoi Apache Cassandra? Entièrement distribué, pas de SPOF Multi-master, multi-DC Scale linéairement Performance de haut niveau Larger-than-memory datasets Durable Cache intégré Consistence "réglable" · · · · · · · · 7/18
  8. 8. Disponibilité "There is no such thing as standby infrastructure: there stuff you always use and stuff that won't work when you need it" -- Ben Black: founder, Boundary; ex-AWS "The biggest problem with failover is that you're almost never using it until it really hurts. It's like backup that you never test" -- Rick Branson: instagram, ex-DataStax · · 8/18
  9. 9. Partitionnement classique avec SPOF 9/18
  10. 10. Entièrement distribué, pas de SPOF 10/18
  11. 11. Tolérance aux pannes sur le terrain 11/18
  12. 12. Ajout de capacité transparent, sans interruption de service Pas de SPOF, même temporairement -- Pas de "primary" replica Réplication synchonous/asynchronous configurable Tolère les pannes de façon transparente "smart" réplication pour éviter les pannes corrélées · · · · · 12/18
  13. 13. Quid de la performance? "Log-structured storage engine" pour minimisé les I/O aléatoires Excellente performance en lecture et en écriture "Row-level" isolation à l'aide d'algorithme non bloquant Compression Cache intégré · · · · · 13/18
  14. 14. Performance http://vldb.org/pvldb/vol5/p1724_tilmannrabl_vldb2012.pdf 14/18
  15. 15. Scalabilité linéaire http://techblog.netflix.com/2011/11/benchmarking-cassandra-scalability-on.html 15/18
  16. 16. Cassandra Query Language CREATE TABLE users ( username text PRIMARY KEY, fullname text, password text, email text, picture_profile blob, ) INSERT INTO users (username, fullname, password, email) VALUES ('tsmith', 'Tom Smith', 'Pa55wd!', 'tsmith@gmail.com') SELECT * FROM users WHERE username='tsmith' CQL Syntaxe familière, mais a dénormalisation est la norme (pas de jointure ni de sous-requêtes) Pour ne savoir plus, cherchez "the state of CQL" sur youtube. · · 16/18
  17. 17. DataStax www.datastax.com DataStax Entreprise Edition DataStax OpsCenter Support 24/7 Formation, conseil, documentation ... · Certified Cassandra Built-in Analytics Built-in Search Entreprise Security - - - - · · · 17/18
  18. 18. Pour aller plus loin Merci! cassandra.apache.org www.datastax.com/docs planetcassandra.org · · · 18/18

×