SlideShare une entreprise Scribd logo
NoSQL & BigData
Qui? Quand? Et Pour qui?

28/01/2014
Cassano Orlando
Quelques mots sur le CETIC
Centre R&D en ICT au Service des
entreprises

Académies

Industries
Génèse du mouvement NoSQL
•  Première	
  appari*on	
  du	
  terme	
  en	
  2009...	
  
...	
  même	
  si	
  certaines	
  technologies	
  sont	
  plus	
  anciennes	
  
•  Mouvement	
  lancé	
  par	
  les	
  entreprises	
  
•  Nouveaux	
  besoins	
  provenant	
  de	
  
l’explosion	
  des	
  données	
  
•  Les	
  RDBMS	
  classiques	
  ont	
  aGeint	
  leurs	
  
limites	
  
•  Le	
  NoSQL	
  propose	
  des	
  alterna*ves	
  au	
  
modèle	
  rela*onnel	
  
è	
  NoSQL	
  =	
  Not	
  Only	
  SQL	
  
Mais pourquoi ?
•  Traitement	
  sur	
  les	
  données	
  de	
  plus	
  en	
  plus	
  
efficace	
  
•  Temps	
  d’exécu*on	
  souvent	
  passé	
  en	
  accès	
  disque	
  
–  Les	
  disques	
  durs	
  sont	
  lents	
  
–  Les	
  alterna*ves	
  (SSD)	
  restent	
  onéreuses	
  

•  1	
  disque	
  dur	
  =	
  75MB/sec	
  
	
  1000	
  disques	
  durs	
  =	
  75GB/sec	
  
•  àBesoin	
  de	
  paralléliser	
  l’accès	
  aux	
  données	
  
structurées	
  
Mais pourquoi ?
•  Ensemble	
  des	
  modèles	
  non	
  rela*onnels	
  convenant	
  
aux	
  environnements	
  distribués	
  
•  Solu*on	
  aux	
  limites	
  du	
  modèle	
  rela*onnel	
  
–  Des	
  structures	
  rigide	
  de	
  données	
  
–  Le	
  temps	
  d'inser(on/de	
  lecture	
  augmente	
  grandement	
  
avec	
  le	
  nombre	
  d'enregistrements	
  
–  Par**onnement	
  difficile	
  à	
  meGre	
  en	
  œuvre	
  
–  Gain	
  non	
  linéaire	
  en	
  fonc*on	
  du	
  nombre	
  de	
  serveurs	
  
Stockage scalable
•  Scalabilité	
  ver*cale	
  	
  
Scaling	
  up	
  
–  Augmenta*on	
  de	
  la	
  capacité	
  matérielle	
  de	
  la	
  machine	
  
(fréquence	
  du	
  processeur,	
  mémoire,	
  taille/vitesse	
  du	
  disque)	
  
–  Solu*on	
  limitée	
  et	
  à	
  coût	
  croissant	
  en	
  fonc*on	
  de	
  la	
  scalabilité	
  
	
  

•  Scalabilité	
  horizontale	
  	
  
Scaling	
  out	
  

A-­‐Z
	
  

–  Augmenta*on	
  du	
  nombre	
  de	
  machines	
  
–  Nécessite	
  une	
  distribu*on	
  des	
  données	
  
sur	
  différentes	
  machines	
  (Sharding)	
  
A-­‐I
	
  

J-­‐P
	
  

Q-­‐Z
	
  
Théorème CAP
•  Nouvelles	
  contraintes	
  liées	
  aux	
  environnements	
  
distribués	
  
–  Respecte	
  au	
  plus	
  2	
  des	
  3	
  contraintes	
  du	
  théorème	
  CAP	
  
–  Les	
  objec*fs	
  des	
  systèmes	
  NoSQL	
  sont	
  différents	
  
Consistency	
  :	
  les	
  données	
  sont	
  vues	
  de	
  la	
  
même	
  manière	
  au	
  même	
  instant	
  par	
  tous	
  
les	
  nœuds	
  du	
  réseau	
  ;	
  
	
  

Availability	
  :	
  garan*e	
  d’obtenir	
  une	
  
réponse,	
  même	
  en	
  cas	
  de	
  panne	
  ;	
  
	
  

Par11on	
  tolerance	
  :	
  le	
  système	
  doit	
  
con*nuer	
  à	
  répondre	
  correctement	
  même	
  
si	
  une	
  par*e	
  de	
  l’infrastructure	
  est	
  
inaccessible.	
  

Consistency:	
  
Transac*ons	
  
ACID	
  

Par66on	
  
tolerance:	
  
Scaleout	
  
infini	
  

NO	
  
GO	
  

NoSQL	
  
DB	
  

Oracle	
  
RAC	
  

Availability	
  
(Redondance	
  
des	
  
données)	
  
La solution NoSQL
•  Objec*fs	
  sont	
  différentsàRelaxa*on	
  de	
  certaines	
  
contraintes	
  

–  DBMS:	
  Atomicity,	
  Consistency,	
  Isola*on,	
  Durability	
  (ACID)	
  
–  NoSQL	
  :	
  BASE	
  	
  

Basically	
  Available	
  :	
  le	
  système	
  
semble	
  fonc*onner	
  à	
  tout	
  
moment	
  ;	
  	
  
	
  

So9	
  state	
  :	
  le	
  système	
  n’a	
  pas	
  
à	
  être	
  cohérent	
  à	
  tout	
  instant	
  ;	
  
	
  

Eventually	
  consistent	
  :	
  la	
  
cohérence	
  sera	
  assurée	
  
ultérieurement	
  .	
  

Source:	
  Eric	
  Brewer	
  
BASE Vs. ACID
•  Ges*on	
  de	
  la	
  cohérence	
  selon	
  3	
  paramètres	
  
–  N: Le nombre de copies d’une donnée qui seront maintenues (nombre
de réplications)
–  R: Le nombre de copies qui seront interrogées lors d’une lecture
–  W: Le nombre d’écritures à effectuer avant marquer l’insertion
comme complétée
Configuration NRW

Résultat

W=N R=1

Optimisé pour la lecture – cohérence forte

W=1 R=N

Optimisé pour l’écriture – cohérence forte

W+R<=N

Une lecture peut ne pas voir le dernier état de la
donnée – Eventually consistent – disponibilité forte

W+R>N

Une lecture recevra au moins une fois le dernier état
de la donnée – consistance forte

9
Qui ?
•  U*lisé	
  par	
  «	
  les	
  géants	
  du	
  Web	
  »	
  pour	
  gérer	
  les	
  
grands	
  ensembles	
  de	
  données	
  
–  Google	
  :	
  BigTable	
  
–  Amazon	
  :	
  Dynamo	
  
–  	
  Yahoo!	
  :	
  HBase	
  
–  Microsoq	
  :	
  Azure	
  Storage	
  
–  Facebook	
  :	
  Cassandra	
  -­‐	
  HBase	
  
–  LinkedIn	
  :	
  Voldemort	
  
–  ...	
  
Quoi?
•  Différents	
  modèles	
  de	
  données	
  en	
  fonc*on	
  de	
  
l’applica*on	
  
•  DB	
  catégorisées	
  en	
  4	
  modèles	
  
–  Clé/Valeur	
  
–  Orienté	
  document	
  
–  Orienté	
  colonnes	
  
–  Orienté	
  graphe	
  

•  Extensions	
  du	
  modèle	
  	
  
clé/valeur	
  

Colonne1	
  :	
  Valeur
	
  

Clé
	
  

Valeur
	
  

Clé
	
  

Colonne	
  2:	
  Valeur
	
  

Colonne	
  3	
  :	
  Valeur
	
  

BDD	
  Clé/Valeur	
  

BDD	
  orientée	
  colonnes	
  

Nœud	
  2
	
  

Champ1:	
  Valeur
	
  

Clé
	
  

Champ2:	
  Valeur
	
  
Champ3:	
  Valeur
	
  

Nœud	
  1
	
  

Nœud	
  3
	
  

Champ4:	
  Valeur
	
  

Nœud	
  4
	
  
BDD	
  orientée	
  document	
  

BDD	
  orientée	
  graphe	
  
Clé
	
  

Valeur
	
  

Stockage Clé-Valeur

•  Une	
  clé	
  unique	
  dans	
  la	
  base	
  est	
  associée	
  à	
  une	
  valeur	
  
arbitraire	
  (en	
  bits)	
  
–  Similaire	
  à	
  une	
  Hashtable	
  distribuée	
  

•  Accès	
  aux	
  données	
  très	
  efficaces	
  
–  Pour	
  des	
  mul*ples	
  accès	
  aléatoires	
  
–  A	
  une	
  donnée	
  spécifiée...	
  Si	
  on	
  en	
  connait	
  la	
  clé	
  

•  Idéalement	
  parallélisable	
  (+	
  réplica*on	
  possible)	
  
•  Cohérance	
  forte	
  en	
  jouant	
  sur	
  les	
  paramètres	
  NRW	
  
•  Scalabilité	
  linéaire	
  

12
Champ1:	
  Valeur
	
  

Clé
	
  

Champ2:	
  Valeur
	
  
Champ3:	
  Valeur
	
  

Orientée documents

Champ4:	
  Valeur
	
  

•  Chaque	
  champ	
  au	
  sein	
  d’un	
  document	
  est	
  accessible	
  
•  Grande	
  flexibilité	
  dans	
  la	
  structure	
  des	
  documents	
  
–  Un	
  schéma	
  pour	
  chaque	
  document	
  
–  Généralement	
  des	
  documents	
  XML/JSON	
  

•  Modèle	
  le	
  plus	
  proche	
  du	
  modèle	
  rela*onnel	
  
•  Ajout,	
  modifica*on,	
  lecture	
  ou	
  suppression	
  de	
  
seulement	
  certains	
  champs	
  dans	
  un	
  document	
  (pas	
  
pour	
  toutes	
  les	
  solu*ons)	
  

13
Colonne1	
  :	
  Valeur
	
  

Clé
	
  

Colonne	
  2:	
  Valeur
	
  

Orientée colonnes

Colonne	
  3	
  :	
  Valeur
	
  

•  Le	
  modèle	
  de	
  données	
  
–  Ensemble	
  de	
  tables	
  contenant	
  une	
  liste	
  de	
  clés	
  
–  A	
  chaque	
  clé	
  est	
  associée	
  un	
  ensemble	
  fixe	
  de	
  familles	
  de	
  colonnes	
  
–  Chaque	
  famille	
  de	
  colonnes	
  peut	
  contenir	
  une	
  nombre	
  indéterminé	
  de	
  
colonnes	
  

• 
• 
• 
• 

Structure	
  flexible	
  pour	
  les	
  tables	
  
Bien	
  adapté	
  aux	
  rela*ons	
  one-­‐to-­‐many	
  
Stockage	
  des	
  données	
  de	
  façon	
  ver*cale	
  
Pas	
  de	
  coût	
  de	
  stockage	
  pour	
  les	
  valeurs	
  vide	
  /	
  «	
  null	
  »	
  
Column	
  1	
  :	
  Value
	
  

Key
	
  

Column	
  2:	
  Value
	
  

Column	
  3	
  :	
  Value
	
  

3




Orientée colonnes
, A
•  Vue	
  conceptuelle	
  de	
  la	
  table	
  

,
#
NoSQL: Quoi, quand et pour qui par Orlando Cassano du CETIC
•  Vue	
  physique	
  de	
  la	
  table	
  
Nœud	
  2
	
  
Nœud	
  1
	
  

Nœud	
  3
	
  

Graph oriented

Nœud	
  4
	
  

• 
• 
• 
• 
• 

Représenta*on	
  des	
  données	
  sous	
  forme	
  d'un	
  graphe	
  
Modèle	
  le	
  plus	
  “Human-­‐friendly”	
  
U*les	
  quand	
  on	
  doit	
  faire	
  face	
  à	
  des	
  JOIN	
  en	
  chaîne	
  
Idéales	
  pour	
  les	
  rela*ons	
  many-­‐to-­‐many	
  
Algorithms	
  de	
  parcours	
  de	
  graphe	
  pour	
  explorer	
  la	
  BDD	
  
(conduit	
  à	
  des	
  requêtes	
  complexes)	
  

16
Les modèles NoSQL : résumé
Et le BigData?
•  Scalabilité	
  au	
  niveau	
  

–  du	
  stockage	
  
–  de	
  la	
  capacité	
  de	
  traitement	
  

•  Volume	
  
•  Velocity,	
  vitesse	
  d’arrivée,	
  durée	
  de	
  traitement	
  
•  Variety,	
  hétérogénéité	
  
•  Et	
  encore	
  d’autres...	
  Variability,	
  validity,	
  veracity,	
  
value	
  ,	
  etc.	
  
•  Le	
  NoSQL	
  aide	
  à	
  tous	
  les	
  niveaux	
  de	
  la	
  pile	
  BigData	
  

Contenu connexe

Tendances

Les BD NoSQL
Les BD NoSQLLes BD NoSQL
Les BD NoSQL
Minyar Sassi Hidri
 
Cours Big Data Chap4 - Spark
Cours Big Data Chap4 - SparkCours Big Data Chap4 - Spark
Cours Big Data Chap4 - Spark
Amal Abid
 
Datastax Cassandra + Spark Streaming
Datastax Cassandra + Spark StreamingDatastax Cassandra + Spark Streaming
Datastax Cassandra + Spark Streaming
Victor Coustenoble
 
Chapitre 4 no sql
Chapitre 4 no sqlChapitre 4 no sql
Chapitre 4 no sql
Mouna Torjmen
 
Dojo 02 : Introduction au noSQL
Dojo 02 : Introduction au noSQLDojo 02 : Introduction au noSQL
Dojo 02 : Introduction au noSQL
SOAT
 
NoSql : conception des schémas, requêtage, et optimisation
NoSql : conception des schémas, requêtage, et optimisationNoSql : conception des schémas, requêtage, et optimisation
NoSql : conception des schémas, requêtage, et optimisation
Microsoft Technet France
 
Bases de Données non relationnelles, NoSQL (Introduction) 1er cours
Bases de Données non relationnelles, NoSQL (Introduction) 1er coursBases de Données non relationnelles, NoSQL (Introduction) 1er cours
Bases de Données non relationnelles, NoSQL (Introduction) 1er cours
Hatim CHAHDI
 
Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...
Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...
Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...
Valtech
 
BigData_Chp4: NOSQL
BigData_Chp4: NOSQLBigData_Chp4: NOSQL
BigData_Chp4: NOSQL
Lilia Sfaxi
 
Apache Cassandra - Concepts et fonctionnalités
Apache Cassandra - Concepts et fonctionnalitésApache Cassandra - Concepts et fonctionnalités
Apache Cassandra - Concepts et fonctionnalités
Romain Hardouin
 
Base de données NoSQL
Base de données NoSQLBase de données NoSQL
Base de données NoSQL
Oussama ARBI
 
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -introNosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
Olivier Mallassi
 
Introduction aux bases de données NoSQL
Introduction aux bases de données NoSQLIntroduction aux bases de données NoSQL
Introduction aux bases de données NoSQL
Antoine Augusti
 
Présentation des bases de données NoSql
Présentation des bases de données NoSqlPrésentation des bases de données NoSql
Présentation des bases de données NoSql
Sidi LEKHALIFA
 
Apache Kafka, Un système distribué de messagerie hautement performant
Apache Kafka, Un système distribué de messagerie hautement performantApache Kafka, Un système distribué de messagerie hautement performant
Apache Kafka, Un système distribué de messagerie hautement performant
ALTIC Altic
 
Introduction à Apache Cassandra — IppEvent chez OVH 2017-03-02
Introduction à Apache Cassandra — IppEvent chez OVH 2017-03-02Introduction à Apache Cassandra — IppEvent chez OVH 2017-03-02
Introduction à Apache Cassandra — IppEvent chez OVH 2017-03-02
Jérôme Mainaud
 
Les Base de Données NOSQL -Presentation -
Les Base de Données NOSQL -Presentation -Les Base de Données NOSQL -Presentation -
Les Base de Données NOSQL -Presentation -
IliasAEA
 
Big Data: Hadoop Map / Reduce sur Windows et Windows Azure
Big Data: Hadoop Map / Reduce sur Windows et Windows AzureBig Data: Hadoop Map / Reduce sur Windows et Windows Azure
Big Data: Hadoop Map / Reduce sur Windows et Windows Azure
Microsoft
 
Introduction à Cassandra
Introduction à CassandraIntroduction à Cassandra
Introduction à Cassandra
VMware Tanzu
 
Presentation cassandra
Presentation cassandraPresentation cassandra
Presentation cassandra
fatima zahra FANDI
 

Tendances (20)

Les BD NoSQL
Les BD NoSQLLes BD NoSQL
Les BD NoSQL
 
Cours Big Data Chap4 - Spark
Cours Big Data Chap4 - SparkCours Big Data Chap4 - Spark
Cours Big Data Chap4 - Spark
 
Datastax Cassandra + Spark Streaming
Datastax Cassandra + Spark StreamingDatastax Cassandra + Spark Streaming
Datastax Cassandra + Spark Streaming
 
Chapitre 4 no sql
Chapitre 4 no sqlChapitre 4 no sql
Chapitre 4 no sql
 
Dojo 02 : Introduction au noSQL
Dojo 02 : Introduction au noSQLDojo 02 : Introduction au noSQL
Dojo 02 : Introduction au noSQL
 
NoSql : conception des schémas, requêtage, et optimisation
NoSql : conception des schémas, requêtage, et optimisationNoSql : conception des schémas, requêtage, et optimisation
NoSql : conception des schémas, requêtage, et optimisation
 
Bases de Données non relationnelles, NoSQL (Introduction) 1er cours
Bases de Données non relationnelles, NoSQL (Introduction) 1er coursBases de Données non relationnelles, NoSQL (Introduction) 1er cours
Bases de Données non relationnelles, NoSQL (Introduction) 1er cours
 
Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...
Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...
Valtech - NoSQL, solution alternative ou complémentaire aux bases de données ...
 
BigData_Chp4: NOSQL
BigData_Chp4: NOSQLBigData_Chp4: NOSQL
BigData_Chp4: NOSQL
 
Apache Cassandra - Concepts et fonctionnalités
Apache Cassandra - Concepts et fonctionnalitésApache Cassandra - Concepts et fonctionnalités
Apache Cassandra - Concepts et fonctionnalités
 
Base de données NoSQL
Base de données NoSQLBase de données NoSQL
Base de données NoSQL
 
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -introNosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
 
Introduction aux bases de données NoSQL
Introduction aux bases de données NoSQLIntroduction aux bases de données NoSQL
Introduction aux bases de données NoSQL
 
Présentation des bases de données NoSql
Présentation des bases de données NoSqlPrésentation des bases de données NoSql
Présentation des bases de données NoSql
 
Apache Kafka, Un système distribué de messagerie hautement performant
Apache Kafka, Un système distribué de messagerie hautement performantApache Kafka, Un système distribué de messagerie hautement performant
Apache Kafka, Un système distribué de messagerie hautement performant
 
Introduction à Apache Cassandra — IppEvent chez OVH 2017-03-02
Introduction à Apache Cassandra — IppEvent chez OVH 2017-03-02Introduction à Apache Cassandra — IppEvent chez OVH 2017-03-02
Introduction à Apache Cassandra — IppEvent chez OVH 2017-03-02
 
Les Base de Données NOSQL -Presentation -
Les Base de Données NOSQL -Presentation -Les Base de Données NOSQL -Presentation -
Les Base de Données NOSQL -Presentation -
 
Big Data: Hadoop Map / Reduce sur Windows et Windows Azure
Big Data: Hadoop Map / Reduce sur Windows et Windows AzureBig Data: Hadoop Map / Reduce sur Windows et Windows Azure
Big Data: Hadoop Map / Reduce sur Windows et Windows Azure
 
Introduction à Cassandra
Introduction à CassandraIntroduction à Cassandra
Introduction à Cassandra
 
Presentation cassandra
Presentation cassandraPresentation cassandra
Presentation cassandra
 

En vedette

Why relationships are cool but "join" sucks
Why relationships are cool but "join" sucksWhy relationships are cool but "join" sucks
Why relationships are cool but "join" sucks
Luca Garulli
 
OrientDB vs Neo4j - and an introduction to NoSQL databases
OrientDB vs Neo4j - and an introduction to NoSQL databasesOrientDB vs Neo4j - and an introduction to NoSQL databases
OrientDB vs Neo4j - and an introduction to NoSQL databases
Curtis Mosters
 
OrientDB Distributed Architecture v2.0
OrientDB Distributed Architecture v2.0OrientDB Distributed Architecture v2.0
OrientDB Distributed Architecture v2.0
Orient Technologies
 
Programme art'tractivité
Programme art'tractivité Programme art'tractivité
Programme art'tractivité
Agence Souple/hop!
 
Arizona centenaire 12 02 1912
Arizona  centenaire 12 02 1912Arizona  centenaire 12 02 1912
Arizona centenaire 12 02 1912
raymondlucien
 
Tres Ejes en la Sociedad del Conocimiento
Tres Ejes en la Sociedad del ConocimientoTres Ejes en la Sociedad del Conocimiento
Tres Ejes en la Sociedad del Conocimiento
RVARQ Arquitectura
 
Polar sf-2015-complète
Polar sf-2015-complètePolar sf-2015-complète
Polar sf-2015-complète
Nicolas Boulesteix
 
Gisors bib-bibliographie-hemingway-2011
Gisors bib-bibliographie-hemingway-2011Gisors bib-bibliographie-hemingway-2011
Gisors bib-bibliographie-hemingway-2011
Nicolas Boulesteix
 
Robot de médiation culturelle - Ville d'autun
Robot de médiation culturelle - Ville d'autun   Robot de médiation culturelle - Ville d'autun
Robot de médiation culturelle - Ville d'autun
Les Interconnectés
 
Gisors bibliographie-fonds-local-t1-réed2012-gisors-complète
Gisors bibliographie-fonds-local-t1-réed2012-gisors-complèteGisors bibliographie-fonds-local-t1-réed2012-gisors-complète
Gisors bibliographie-fonds-local-t1-réed2012-gisors-complète
Nicolas Boulesteix
 
Disc dur, placa mare i cpu 2
Disc dur, placa mare i cpu 2Disc dur, placa mare i cpu 2
Disc dur, placa mare i cpu 2
alexiasoucheiron
 
Trabajo asalariado y capital
Trabajo asalariado y capitalTrabajo asalariado y capital
Trabajo asalariado y capital
Bella Romero Aguillón
 
PRO-SPARE, la place de marché pour industriels
PRO-SPARE, la place de marché pour industrielsPRO-SPARE, la place de marché pour industriels
PRO-SPARE, la place de marché pour industriels
Pierre Rupin
 
1415001360
14150013601415001360
1415001360
hamedt64
 
Bibliographie japon-2012-complète
Bibliographie japon-2012-complèteBibliographie japon-2012-complète
Bibliographie japon-2012-complète
Nicolas Boulesteix
 
Citoyenneté et empire à rome (ier ii ie s. ap. j.-c.)
Citoyenneté et empire à rome (ier ii ie s. ap. j.-c.)Citoyenneté et empire à rome (ier ii ie s. ap. j.-c.)
Citoyenneté et empire à rome (ier ii ie s. ap. j.-c.)
picmarion
 
Programme assur finance2013
Programme assur finance2013Programme assur finance2013
Programme assur finance2013
AssurFinance
 
Insertar un docs en tu blog
Insertar un docs en tu blogInsertar un docs en tu blog
Insertar un docs en tu blog
Camino López García
 
Las matemáticas ...
Las matemáticas ...Las matemáticas ...
Las matemáticas ...
Victor Avendaño
 
Buscando a dios
Buscando a diosBuscando a dios
Buscando a dios
Parroquia Les Alqueríes
 

En vedette (20)

Why relationships are cool but "join" sucks
Why relationships are cool but "join" sucksWhy relationships are cool but "join" sucks
Why relationships are cool but "join" sucks
 
OrientDB vs Neo4j - and an introduction to NoSQL databases
OrientDB vs Neo4j - and an introduction to NoSQL databasesOrientDB vs Neo4j - and an introduction to NoSQL databases
OrientDB vs Neo4j - and an introduction to NoSQL databases
 
OrientDB Distributed Architecture v2.0
OrientDB Distributed Architecture v2.0OrientDB Distributed Architecture v2.0
OrientDB Distributed Architecture v2.0
 
Programme art'tractivité
Programme art'tractivité Programme art'tractivité
Programme art'tractivité
 
Arizona centenaire 12 02 1912
Arizona  centenaire 12 02 1912Arizona  centenaire 12 02 1912
Arizona centenaire 12 02 1912
 
Tres Ejes en la Sociedad del Conocimiento
Tres Ejes en la Sociedad del ConocimientoTres Ejes en la Sociedad del Conocimiento
Tres Ejes en la Sociedad del Conocimiento
 
Polar sf-2015-complète
Polar sf-2015-complètePolar sf-2015-complète
Polar sf-2015-complète
 
Gisors bib-bibliographie-hemingway-2011
Gisors bib-bibliographie-hemingway-2011Gisors bib-bibliographie-hemingway-2011
Gisors bib-bibliographie-hemingway-2011
 
Robot de médiation culturelle - Ville d'autun
Robot de médiation culturelle - Ville d'autun   Robot de médiation culturelle - Ville d'autun
Robot de médiation culturelle - Ville d'autun
 
Gisors bibliographie-fonds-local-t1-réed2012-gisors-complète
Gisors bibliographie-fonds-local-t1-réed2012-gisors-complèteGisors bibliographie-fonds-local-t1-réed2012-gisors-complète
Gisors bibliographie-fonds-local-t1-réed2012-gisors-complète
 
Disc dur, placa mare i cpu 2
Disc dur, placa mare i cpu 2Disc dur, placa mare i cpu 2
Disc dur, placa mare i cpu 2
 
Trabajo asalariado y capital
Trabajo asalariado y capitalTrabajo asalariado y capital
Trabajo asalariado y capital
 
PRO-SPARE, la place de marché pour industriels
PRO-SPARE, la place de marché pour industrielsPRO-SPARE, la place de marché pour industriels
PRO-SPARE, la place de marché pour industriels
 
1415001360
14150013601415001360
1415001360
 
Bibliographie japon-2012-complète
Bibliographie japon-2012-complèteBibliographie japon-2012-complète
Bibliographie japon-2012-complète
 
Citoyenneté et empire à rome (ier ii ie s. ap. j.-c.)
Citoyenneté et empire à rome (ier ii ie s. ap. j.-c.)Citoyenneté et empire à rome (ier ii ie s. ap. j.-c.)
Citoyenneté et empire à rome (ier ii ie s. ap. j.-c.)
 
Programme assur finance2013
Programme assur finance2013Programme assur finance2013
Programme assur finance2013
 
Insertar un docs en tu blog
Insertar un docs en tu blogInsertar un docs en tu blog
Insertar un docs en tu blog
 
Las matemáticas ...
Las matemáticas ...Las matemáticas ...
Las matemáticas ...
 
Buscando a dios
Buscando a diosBuscando a dios
Buscando a dios
 

Similaire à NoSQL: Quoi, quand et pour qui par Orlando Cassano du CETIC

SGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDB
SGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDBSGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDB
SGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDB
Romain Cambien
 
BigData_Chp5: Putting it all together
BigData_Chp5: Putting it all togetherBigData_Chp5: Putting it all together
BigData_Chp5: Putting it all together
Lilia Sfaxi
 
MariaDB une base de donnees NewSQL
MariaDB une base de donnees NewSQLMariaDB une base de donnees NewSQL
MariaDB une base de donnees NewSQL
Christophe Villeneuve
 
Benchmarking NoSQL DataBase dans le cadre d'un projet IoT
Benchmarking NoSQL DataBase dans le cadre d'un projet IoTBenchmarking NoSQL DataBase dans le cadre d'un projet IoT
Benchmarking NoSQL DataBase dans le cadre d'un projet IoT
CHAKER ALLAOUI
 
Tours JUG (oct 2010) - NoSQL, des grands du Web aux entreprises
Tours JUG (oct 2010) - NoSQL, des grands du Web aux entreprisesTours JUG (oct 2010) - NoSQL, des grands du Web aux entreprises
Tours JUG (oct 2010) - NoSQL, des grands du Web aux entreprises
Michaël Figuière
 
Les bases de donnees nosql
Les bases de donnees nosqlLes bases de donnees nosql
Les bases de donnees nosql
zied kallel
 
DataStax Enterprise - La plateforme de base de données pour le Cloud
DataStax Enterprise - La plateforme de base de données pour le CloudDataStax Enterprise - La plateforme de base de données pour le Cloud
DataStax Enterprise - La plateforme de base de données pour le Cloud
Victor Coustenoble
 
No Sql - Olivier Mallassi - September 2010
No Sql - Olivier Mallassi - September 2010No Sql - Olivier Mallassi - September 2010
No Sql - Olivier Mallassi - September 2010
JUG Lausanne
 
result_b0XKKUdgN60FJduy1eRpdesfytres.pptx
result_b0XKKUdgN60FJduy1eRpdesfytres.pptxresult_b0XKKUdgN60FJduy1eRpdesfytres.pptx
result_b0XKKUdgN60FJduy1eRpdesfytres.pptx
thiombianoeulalie
 
DataStax et Cassandra dans Azure au Microsoft Techdays
DataStax et Cassandra dans Azure au Microsoft TechdaysDataStax et Cassandra dans Azure au Microsoft Techdays
DataStax et Cassandra dans Azure au Microsoft Techdays
Victor Coustenoble
 
Relational databases & NoSQL databases
Relational databases & NoSQL databasesRelational databases & NoSQL databases
Relational databases & NoSQL databases
Cédric Villa
 
Base de données graphe, Noe4j concepts et mise en oeuvre
Base de données graphe, Noe4j concepts et mise en oeuvreBase de données graphe, Noe4j concepts et mise en oeuvre
Base de données graphe, Noe4j concepts et mise en oeuvre
MICHRAFY MUSTAFA
 
Hadoop Hbase - Introduction
Hadoop Hbase - IntroductionHadoop Hbase - Introduction
Hadoop Hbase - Introduction
Blandine Larbret
 
Introduction nosql
Introduction nosqlIntroduction nosql
Introduction nosql
Ines Slimene
 
Database/ Bases de données
Database/ Bases de donnéesDatabase/ Bases de données
Database/ Bases de données
zied kallel
 
Webinar Degetel DataStax
Webinar Degetel DataStaxWebinar Degetel DataStax
Webinar Degetel DataStax
Victor Coustenoble
 
dbh.pdf
dbh.pdfdbh.pdf
dbh.pdf
DOUA9
 
Monter en charge, tester et surveiller avec une application Windows Azure : l...
Monter en charge, tester et surveiller avec une application Windows Azure : l...Monter en charge, tester et surveiller avec une application Windows Azure : l...
Monter en charge, tester et surveiller avec une application Windows Azure : l...
Microsoft Technet France
 
Panorama des offres NoSQL disponibles dans Azure
Panorama des offres NoSQL disponibles dans AzurePanorama des offres NoSQL disponibles dans Azure
Panorama des offres NoSQL disponibles dans Azure
Microsoft Décideurs IT
 
Panorama des offres NoSQL disponibles dans Azure
Panorama des offres NoSQL disponibles dans AzurePanorama des offres NoSQL disponibles dans Azure
Panorama des offres NoSQL disponibles dans Azure
Microsoft Technet France
 

Similaire à NoSQL: Quoi, quand et pour qui par Orlando Cassano du CETIC (20)

SGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDB
SGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDBSGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDB
SGBDR vs NoSQL, Différences et Uses Cases. Focus sur ArangoDB
 
BigData_Chp5: Putting it all together
BigData_Chp5: Putting it all togetherBigData_Chp5: Putting it all together
BigData_Chp5: Putting it all together
 
MariaDB une base de donnees NewSQL
MariaDB une base de donnees NewSQLMariaDB une base de donnees NewSQL
MariaDB une base de donnees NewSQL
 
Benchmarking NoSQL DataBase dans le cadre d'un projet IoT
Benchmarking NoSQL DataBase dans le cadre d'un projet IoTBenchmarking NoSQL DataBase dans le cadre d'un projet IoT
Benchmarking NoSQL DataBase dans le cadre d'un projet IoT
 
Tours JUG (oct 2010) - NoSQL, des grands du Web aux entreprises
Tours JUG (oct 2010) - NoSQL, des grands du Web aux entreprisesTours JUG (oct 2010) - NoSQL, des grands du Web aux entreprises
Tours JUG (oct 2010) - NoSQL, des grands du Web aux entreprises
 
Les bases de donnees nosql
Les bases de donnees nosqlLes bases de donnees nosql
Les bases de donnees nosql
 
DataStax Enterprise - La plateforme de base de données pour le Cloud
DataStax Enterprise - La plateforme de base de données pour le CloudDataStax Enterprise - La plateforme de base de données pour le Cloud
DataStax Enterprise - La plateforme de base de données pour le Cloud
 
No Sql - Olivier Mallassi - September 2010
No Sql - Olivier Mallassi - September 2010No Sql - Olivier Mallassi - September 2010
No Sql - Olivier Mallassi - September 2010
 
result_b0XKKUdgN60FJduy1eRpdesfytres.pptx
result_b0XKKUdgN60FJduy1eRpdesfytres.pptxresult_b0XKKUdgN60FJduy1eRpdesfytres.pptx
result_b0XKKUdgN60FJduy1eRpdesfytres.pptx
 
DataStax et Cassandra dans Azure au Microsoft Techdays
DataStax et Cassandra dans Azure au Microsoft TechdaysDataStax et Cassandra dans Azure au Microsoft Techdays
DataStax et Cassandra dans Azure au Microsoft Techdays
 
Relational databases & NoSQL databases
Relational databases & NoSQL databasesRelational databases & NoSQL databases
Relational databases & NoSQL databases
 
Base de données graphe, Noe4j concepts et mise en oeuvre
Base de données graphe, Noe4j concepts et mise en oeuvreBase de données graphe, Noe4j concepts et mise en oeuvre
Base de données graphe, Noe4j concepts et mise en oeuvre
 
Hadoop Hbase - Introduction
Hadoop Hbase - IntroductionHadoop Hbase - Introduction
Hadoop Hbase - Introduction
 
Introduction nosql
Introduction nosqlIntroduction nosql
Introduction nosql
 
Database/ Bases de données
Database/ Bases de donnéesDatabase/ Bases de données
Database/ Bases de données
 
Webinar Degetel DataStax
Webinar Degetel DataStaxWebinar Degetel DataStax
Webinar Degetel DataStax
 
dbh.pdf
dbh.pdfdbh.pdf
dbh.pdf
 
Monter en charge, tester et surveiller avec une application Windows Azure : l...
Monter en charge, tester et surveiller avec une application Windows Azure : l...Monter en charge, tester et surveiller avec une application Windows Azure : l...
Monter en charge, tester et surveiller avec une application Windows Azure : l...
 
Panorama des offres NoSQL disponibles dans Azure
Panorama des offres NoSQL disponibles dans AzurePanorama des offres NoSQL disponibles dans Azure
Panorama des offres NoSQL disponibles dans Azure
 
Panorama des offres NoSQL disponibles dans Azure
Panorama des offres NoSQL disponibles dans AzurePanorama des offres NoSQL disponibles dans Azure
Panorama des offres NoSQL disponibles dans Azure
 

Plus de La FeWeb

jQuery deffered objects
jQuery deffered objectsjQuery deffered objects
jQuery deffered objects
La FeWeb
 
Introduction to sketch - the designer's toolbox
Introduction to sketch - the designer's toolboxIntroduction to sketch - the designer's toolbox
Introduction to sketch - the designer's toolbox
La FeWeb
 
Introduction to Antetype - Web UX design tool
Introduction to Antetype - Web UX design toolIntroduction to Antetype - Web UX design tool
Introduction to Antetype - Web UX design tool
La FeWeb
 
NoSQL into E-Commerce: lessons learned
NoSQL into E-Commerce: lessons learnedNoSQL into E-Commerce: lessons learned
NoSQL into E-Commerce: lessons learned
La FeWeb
 
That's (g)it! par Sébastien Dawans CETIC
That's (g)it! par Sébastien Dawans CETICThat's (g)it! par Sébastien Dawans CETIC
That's (g)it! par Sébastien Dawans CETIC
La FeWeb
 
Usability & Wireframe par Nathalie Gouzée - Co-Founder Rubbik
Usability & Wireframe par Nathalie Gouzée - Co-Founder RubbikUsability & Wireframe par Nathalie Gouzée - Co-Founder Rubbik
Usability & Wireframe par Nathalie Gouzée - Co-Founder Rubbik
La FeWeb
 
Introduction to Emolytics par David Hachez, Co-Founder GetSmily
Introduction to Emolytics par David Hachez, Co-Founder GetSmilyIntroduction to Emolytics par David Hachez, Co-Founder GetSmily
Introduction to Emolytics par David Hachez, Co-Founder GetSmily
La FeWeb
 
Le community management pour les nuls par Louise Maton
Le community management pour les nuls par Louise MatonLe community management pour les nuls par Louise Maton
Le community management pour les nuls par Louise Maton
La FeWeb
 
RWD - Back to Basics par Ruben Pieraerts
RWD - Back to Basics par Ruben PieraertsRWD - Back to Basics par Ruben Pieraerts
RWD - Back to Basics par Ruben Pieraerts
La FeWeb
 
Twitter Bootstrap par Antoine Guédès et Cédric Dussart
Twitter Bootstrap par Antoine Guédès et Cédric DussartTwitter Bootstrap par Antoine Guédès et Cédric Dussart
Twitter Bootstrap par Antoine Guédès et Cédric Dussart
La FeWeb
 
Less CSS by Gauthier Eloy
Less CSS by Gauthier EloyLess CSS by Gauthier Eloy
Less CSS by Gauthier Eloy
La FeWeb
 

Plus de La FeWeb (11)

jQuery deffered objects
jQuery deffered objectsjQuery deffered objects
jQuery deffered objects
 
Introduction to sketch - the designer's toolbox
Introduction to sketch - the designer's toolboxIntroduction to sketch - the designer's toolbox
Introduction to sketch - the designer's toolbox
 
Introduction to Antetype - Web UX design tool
Introduction to Antetype - Web UX design toolIntroduction to Antetype - Web UX design tool
Introduction to Antetype - Web UX design tool
 
NoSQL into E-Commerce: lessons learned
NoSQL into E-Commerce: lessons learnedNoSQL into E-Commerce: lessons learned
NoSQL into E-Commerce: lessons learned
 
That's (g)it! par Sébastien Dawans CETIC
That's (g)it! par Sébastien Dawans CETICThat's (g)it! par Sébastien Dawans CETIC
That's (g)it! par Sébastien Dawans CETIC
 
Usability & Wireframe par Nathalie Gouzée - Co-Founder Rubbik
Usability & Wireframe par Nathalie Gouzée - Co-Founder RubbikUsability & Wireframe par Nathalie Gouzée - Co-Founder Rubbik
Usability & Wireframe par Nathalie Gouzée - Co-Founder Rubbik
 
Introduction to Emolytics par David Hachez, Co-Founder GetSmily
Introduction to Emolytics par David Hachez, Co-Founder GetSmilyIntroduction to Emolytics par David Hachez, Co-Founder GetSmily
Introduction to Emolytics par David Hachez, Co-Founder GetSmily
 
Le community management pour les nuls par Louise Maton
Le community management pour les nuls par Louise MatonLe community management pour les nuls par Louise Maton
Le community management pour les nuls par Louise Maton
 
RWD - Back to Basics par Ruben Pieraerts
RWD - Back to Basics par Ruben PieraertsRWD - Back to Basics par Ruben Pieraerts
RWD - Back to Basics par Ruben Pieraerts
 
Twitter Bootstrap par Antoine Guédès et Cédric Dussart
Twitter Bootstrap par Antoine Guédès et Cédric DussartTwitter Bootstrap par Antoine Guédès et Cédric Dussart
Twitter Bootstrap par Antoine Guédès et Cédric Dussart
 
Less CSS by Gauthier Eloy
Less CSS by Gauthier EloyLess CSS by Gauthier Eloy
Less CSS by Gauthier Eloy
 

NoSQL: Quoi, quand et pour qui par Orlando Cassano du CETIC

  • 1. NoSQL & BigData Qui? Quand? Et Pour qui? 28/01/2014 Cassano Orlando
  • 2. Quelques mots sur le CETIC Centre R&D en ICT au Service des entreprises Académies Industries
  • 3. Génèse du mouvement NoSQL •  Première  appari*on  du  terme  en  2009...   ...  même  si  certaines  technologies  sont  plus  anciennes   •  Mouvement  lancé  par  les  entreprises   •  Nouveaux  besoins  provenant  de   l’explosion  des  données   •  Les  RDBMS  classiques  ont  aGeint  leurs   limites   •  Le  NoSQL  propose  des  alterna*ves  au   modèle  rela*onnel   è  NoSQL  =  Not  Only  SQL  
  • 4. Mais pourquoi ? •  Traitement  sur  les  données  de  plus  en  plus   efficace   •  Temps  d’exécu*on  souvent  passé  en  accès  disque   –  Les  disques  durs  sont  lents   –  Les  alterna*ves  (SSD)  restent  onéreuses   •  1  disque  dur  =  75MB/sec    1000  disques  durs  =  75GB/sec   •  àBesoin  de  paralléliser  l’accès  aux  données   structurées  
  • 5. Mais pourquoi ? •  Ensemble  des  modèles  non  rela*onnels  convenant   aux  environnements  distribués   •  Solu*on  aux  limites  du  modèle  rela*onnel   –  Des  structures  rigide  de  données   –  Le  temps  d'inser(on/de  lecture  augmente  grandement   avec  le  nombre  d'enregistrements   –  Par**onnement  difficile  à  meGre  en  œuvre   –  Gain  non  linéaire  en  fonc*on  du  nombre  de  serveurs  
  • 6. Stockage scalable •  Scalabilité  ver*cale     Scaling  up   –  Augmenta*on  de  la  capacité  matérielle  de  la  machine   (fréquence  du  processeur,  mémoire,  taille/vitesse  du  disque)   –  Solu*on  limitée  et  à  coût  croissant  en  fonc*on  de  la  scalabilité     •  Scalabilité  horizontale     Scaling  out   A-­‐Z   –  Augmenta*on  du  nombre  de  machines   –  Nécessite  une  distribu*on  des  données   sur  différentes  machines  (Sharding)   A-­‐I   J-­‐P   Q-­‐Z  
  • 7. Théorème CAP •  Nouvelles  contraintes  liées  aux  environnements   distribués   –  Respecte  au  plus  2  des  3  contraintes  du  théorème  CAP   –  Les  objec*fs  des  systèmes  NoSQL  sont  différents   Consistency  :  les  données  sont  vues  de  la   même  manière  au  même  instant  par  tous   les  nœuds  du  réseau  ;     Availability  :  garan*e  d’obtenir  une   réponse,  même  en  cas  de  panne  ;     Par11on  tolerance  :  le  système  doit   con*nuer  à  répondre  correctement  même   si  une  par*e  de  l’infrastructure  est   inaccessible.   Consistency:   Transac*ons   ACID   Par66on   tolerance:   Scaleout   infini   NO   GO   NoSQL   DB   Oracle   RAC   Availability   (Redondance   des   données)  
  • 8. La solution NoSQL •  Objec*fs  sont  différentsàRelaxa*on  de  certaines   contraintes   –  DBMS:  Atomicity,  Consistency,  Isola*on,  Durability  (ACID)   –  NoSQL  :  BASE     Basically  Available  :  le  système   semble  fonc*onner  à  tout   moment  ;       So9  state  :  le  système  n’a  pas   à  être  cohérent  à  tout  instant  ;     Eventually  consistent  :  la   cohérence  sera  assurée   ultérieurement  .   Source:  Eric  Brewer  
  • 9. BASE Vs. ACID •  Ges*on  de  la  cohérence  selon  3  paramètres   –  N: Le nombre de copies d’une donnée qui seront maintenues (nombre de réplications) –  R: Le nombre de copies qui seront interrogées lors d’une lecture –  W: Le nombre d’écritures à effectuer avant marquer l’insertion comme complétée Configuration NRW Résultat W=N R=1 Optimisé pour la lecture – cohérence forte W=1 R=N Optimisé pour l’écriture – cohérence forte W+R<=N Une lecture peut ne pas voir le dernier état de la donnée – Eventually consistent – disponibilité forte W+R>N Une lecture recevra au moins une fois le dernier état de la donnée – consistance forte 9
  • 10. Qui ? •  U*lisé  par  «  les  géants  du  Web  »  pour  gérer  les   grands  ensembles  de  données   –  Google  :  BigTable   –  Amazon  :  Dynamo   –   Yahoo!  :  HBase   –  Microsoq  :  Azure  Storage   –  Facebook  :  Cassandra  -­‐  HBase   –  LinkedIn  :  Voldemort   –  ...  
  • 11. Quoi? •  Différents  modèles  de  données  en  fonc*on  de   l’applica*on   •  DB  catégorisées  en  4  modèles   –  Clé/Valeur   –  Orienté  document   –  Orienté  colonnes   –  Orienté  graphe   •  Extensions  du  modèle     clé/valeur   Colonne1  :  Valeur   Clé   Valeur   Clé   Colonne  2:  Valeur   Colonne  3  :  Valeur   BDD  Clé/Valeur   BDD  orientée  colonnes   Nœud  2   Champ1:  Valeur   Clé   Champ2:  Valeur   Champ3:  Valeur   Nœud  1   Nœud  3   Champ4:  Valeur   Nœud  4   BDD  orientée  document   BDD  orientée  graphe  
  • 12. Clé   Valeur   Stockage Clé-Valeur •  Une  clé  unique  dans  la  base  est  associée  à  une  valeur   arbitraire  (en  bits)   –  Similaire  à  une  Hashtable  distribuée   •  Accès  aux  données  très  efficaces   –  Pour  des  mul*ples  accès  aléatoires   –  A  une  donnée  spécifiée...  Si  on  en  connait  la  clé   •  Idéalement  parallélisable  (+  réplica*on  possible)   •  Cohérance  forte  en  jouant  sur  les  paramètres  NRW   •  Scalabilité  linéaire   12
  • 13. Champ1:  Valeur   Clé   Champ2:  Valeur   Champ3:  Valeur   Orientée documents Champ4:  Valeur   •  Chaque  champ  au  sein  d’un  document  est  accessible   •  Grande  flexibilité  dans  la  structure  des  documents   –  Un  schéma  pour  chaque  document   –  Généralement  des  documents  XML/JSON   •  Modèle  le  plus  proche  du  modèle  rela*onnel   •  Ajout,  modifica*on,  lecture  ou  suppression  de   seulement  certains  champs  dans  un  document  (pas   pour  toutes  les  solu*ons)   13
  • 14. Colonne1  :  Valeur   Clé   Colonne  2:  Valeur   Orientée colonnes Colonne  3  :  Valeur   •  Le  modèle  de  données   –  Ensemble  de  tables  contenant  une  liste  de  clés   –  A  chaque  clé  est  associée  un  ensemble  fixe  de  familles  de  colonnes   –  Chaque  famille  de  colonnes  peut  contenir  une  nombre  indéterminé  de   colonnes   •  •  •  •  Structure  flexible  pour  les  tables   Bien  adapté  aux  rela*ons  one-­‐to-­‐many   Stockage  des  données  de  façon  ver*cale   Pas  de  coût  de  stockage  pour  les  valeurs  vide  /  «  null  »  
  • 15. Column  1  :  Value   Key   Column  2:  Value   Column  3  :  Value   3 Orientée colonnes
  • 16. , A
  • 17. •  Vue  conceptuelle  de  la  table   ,
  • 18. #
  • 20. •  Vue  physique  de  la  table  
  • 21. Nœud  2   Nœud  1   Nœud  3   Graph oriented Nœud  4   •  •  •  •  •  Représenta*on  des  données  sous  forme  d'un  graphe   Modèle  le  plus  “Human-­‐friendly”   U*les  quand  on  doit  faire  face  à  des  JOIN  en  chaîne   Idéales  pour  les  rela*ons  many-­‐to-­‐many   Algorithms  de  parcours  de  graphe  pour  explorer  la  BDD   (conduit  à  des  requêtes  complexes)   16
  • 22. Les modèles NoSQL : résumé
  • 23. Et le BigData? •  Scalabilité  au  niveau   –  du  stockage   –  de  la  capacité  de  traitement   •  Volume   •  Velocity,  vitesse  d’arrivée,  durée  de  traitement   •  Variety,  hétérogénéité   •  Et  encore  d’autres...  Variability,  validity,  veracity,   value  ,  etc.   •  Le  NoSQL  aide  à  tous  les  niveaux  de  la  pile  BigData  
  • 24. La pile BigData BI     VISUALISATION   DATA  ANALYSIS   SCALABILITY   STORAGE   DATA  ACQUISITION    DATA  EXTRACTION   STRUCTURED     DATA   UNSTRUCTURED  DATA   WORKFLOW   PRE-­‐PROCESSING  AND  REQUEST  
  • 25. Traitement distribués •  Algorithme  Mapreduce  majoritairement  u*lisé   •  Convient  parfaitement  aux  infrastructures  de  Cloud   Compu*ng   •  Réduc*on  du  transfert  de  données  (share  nothing   architecture)   èLes  données  sont  traitées  là  où  elles  se  situent  
  • 26. Stockage scalable •  Systèmes  de  fichiers  distribués   –  Pas  de  modèle  pré-­‐défini   –  Agit  comme  un  système  de  fichier  classique   –  Réplica*on  des  données   –  Prêt  pour  du  traitement  en  parallèle  des  données   –  Solu*ons  pour  ajouter  un  modèle  sur  les  données   •  Hive  =  Requêtes  SQL  sur  les  fichiers  plats  distribués   •  Bases  de  données   •  RDBMS  distribués   •  NoSQL  
  • 27. Pour moi ? •  Pas  de  conversion  directe  entre  un   système  rela*onnel  et  le  NoSQL   •  Une  bonne  connaissance  de  l’applica*on   et  des  accès  aux  données  est  nécessaire     •  Emploi  de  NoSQL  lié  au  besoin  …      …  pas  uniquement  aux  performances   •  Pourquoi  pas  plusieurs  modèles  de  données  à   différents  niveaux  de  l’applica*on?  (solu*on  mixte)   •  Les  bases  de  données  rela*onnelles  restent  de  bons   candidats   22
  • 28. Merci Aéropôle de Charleroi-Gosselies Rue des Frères Wright, 29/3 B-6041 Gosselies info@cetic.be orlando.cassano@cetic.be www.cetic.be