Plateforme Big Data 
orientée BI 
avec 
Hadoop et Spark 
Charly CLAIRMONT 
CTO 
ALTIC 
http://altic.org 
charly.clairmont@...
petite bio 
Depuis 10 ans Altic 
Une évolution permanente avec les 
technologies suivantes : 
Un des animateurs de l'écosy...
Altic 
@Altic_Buzz 
Métier 
Informatique Décisionnelle 
Intégration de données 
Valeurs 
– Innovations 
– Open Source 
Une...
Notre approche 
historique de la BI 
● Intégration de données 
– Talend 
● Reporting : 
– JasperReports, 
– Birt 
● OLAP :...
Tout le monde parle de déluge de 
données ! 
Chez Altic nous aimerions déjà 
décloisonner l'entreprise ! 
Et lui rappeler ...
Toute organisation peut désormais 
avoir son « lac de données », 
construire une vision unifiée de ses 
clients, ses produ...
Le standard du Big Data : « Hadoop », et 
son compagnon par défaut « Spark »
Hadoop est robuste ! 
● Stable 
– Testé - Yahoo! (40 000 noeuds) 
● Fiable 
– Tolérant à la panne 
● Flexible 
– Schéma à ...
Hadoop, 
système d'exploitation de la donnée
Vous connaissez ?
Spark, Simple et rapide 
Hadoop Map / Reduce 
Iter. 1 
Lecture 
HDFS 
Écriture 
RAM 
Iter. 2 
Lecture 
RAM 
Écriture 
RAM ...
Spark, 
meilleur compagnon d'Hadoop
Construire sa 
plateforme Big Data
Une architecture BI à l'heure 
du Big Data
Collecter, Transformer, 
avec Talend Big Data 
Des jobs Talend Pig ! 
Des composants toujours plus riches
Hortonworks HDP, une 
distribution open source
Analyser de larges volume 
de données en SQL avec 
InfiniDB 
● Sans doute le 
moteur SQL pour 
Hadoop le plus 
performant ...
Reporting 
● JasperReports 
– Connecteur Hive 
– Connecteur HBase 
– Connecteur Avro 
● Birt 
– Connecteur pour 
Hive
Visualisation, Exploration 
Datameer Tableau Software 
Via Hive (Odbc, Jdbc)
Cas d'utilisation
Oui, mais 
concrètement...
Hadoop dans le monde bancaire : 
Crédit Mutuel Arkea 
– Groupe bancaire de plein exercice 
– 3.2 millions de sociétaires e...
Hadoop dans le monde bancaire : 
Crédit Mutuel Arkea 
● Offrir une meilleure expérience aux 
utilisateurs 
– Les clients p...
Quelle démarche pour 
votre projet Big Data !
Commencer petit !
Oublier les démarches 
classiques ! Trop long !
Oublier les démarches 
classiques ! Trop long !
Soyez Lean !
Big Data, BI, 
le tout en mode agile
Commencer petit !
Y aller pas à pas 
● Télécharger une VM prêt à l'emploi 
(Pseudo cluster) 
– Tester les démos / tutoriels 
– Essayer avec ...
Questions
Plateforme Big Data 
orientée BI 
avec 
Hadoop et Spark 
Merci ! 
Charly CLAIRMONT 
charly.clairmont@altic.org 
@egwada 
@...
Prochain SlideShare
Chargement dans…5
×

Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

1 155 vues

Publié le

Description de l'architecture bigdata chez Altic
Hortonworks HDP
Apache Spark
InfiniDB
Tableau Software
JasperReports
Birt
Talend

Publié dans : Technologie

Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

  1. 1. Plateforme Big Data orientée BI avec Hadoop et Spark Charly CLAIRMONT CTO ALTIC http://altic.org charly.clairmont@altic.org @egwada
  2. 2. petite bio Depuis 10 ans Altic Une évolution permanente avec les technologies suivantes : Un des animateurs de l'écosystème Hadoop en France Un groupe de plus en plus actif ! (messages échangés sur l'année)
  3. 3. Altic @Altic_Buzz Métier Informatique Décisionnelle Intégration de données Valeurs – Innovations – Open Source Une maîtrise de toute la chaîne de valeur du Big Data
  4. 4. Notre approche historique de la BI ● Intégration de données – Talend ● Reporting : – JasperReports, – Birt ● OLAP : – Mondrian, – Jedox ● Portail décisionnel : – SpagoBI, – JasperServer
  5. 5. Tout le monde parle de déluge de données ! Chez Altic nous aimerions déjà décloisonner l'entreprise ! Et lui rappeler qu'elle est une « Entreprise étendue »
  6. 6. Toute organisation peut désormais avoir son « lac de données », construire une vision unifiée de ses clients, ses produits, ses partenaires, ses processus
  7. 7. Le standard du Big Data : « Hadoop », et son compagnon par défaut « Spark »
  8. 8. Hadoop est robuste ! ● Stable – Testé - Yahoo! (40 000 noeuds) ● Fiable – Tolérant à la panne ● Flexible – Schéma à la lecture ! – Passage à l'échelle ● Économique – Prédictibilité des coûts
  9. 9. Hadoop, système d'exploitation de la donnée
  10. 10. Vous connaissez ?
  11. 11. Spark, Simple et rapide Hadoop Map / Reduce Iter. 1 Lecture HDFS Écriture RAM Iter. 2 Lecture RAM Écriture RAM . . . Lecture HDFS Écriture HDFS Lecture HDFS Écriture HDFS Iter. 1 Iter. 2 . . . Spark
  12. 12. Spark, meilleur compagnon d'Hadoop
  13. 13. Construire sa plateforme Big Data
  14. 14. Une architecture BI à l'heure du Big Data
  15. 15. Collecter, Transformer, avec Talend Big Data Des jobs Talend Pig ! Des composants toujours plus riches
  16. 16. Hortonworks HDP, une distribution open source
  17. 17. Analyser de larges volume de données en SQL avec InfiniDB ● Sans doute le moteur SQL pour Hadoop le plus performant du moment
  18. 18. Reporting ● JasperReports – Connecteur Hive – Connecteur HBase – Connecteur Avro ● Birt – Connecteur pour Hive
  19. 19. Visualisation, Exploration Datameer Tableau Software Via Hive (Odbc, Jdbc)
  20. 20. Cas d'utilisation
  21. 21. Oui, mais concrètement...
  22. 22. Hadoop dans le monde bancaire : Crédit Mutuel Arkea – Groupe bancaire de plein exercice – 3.2 millions de sociétaires et clients – 9000 salariés – 84 milliard d'euros de total de bilan (2011)
  23. 23. Hadoop dans le monde bancaire : Crédit Mutuel Arkea ● Offrir une meilleure expérience aux utilisateurs – Les clients peuvent accéder à leur historique de paiements depuis 2001 ! ● Dé-silotage l'organisation – Avoir une vision à 360° des clients, des produits http://www.journaldunet.com/solutions/dsi/big-data-dans-les-dsi/l
  24. 24. Quelle démarche pour votre projet Big Data !
  25. 25. Commencer petit !
  26. 26. Oublier les démarches classiques ! Trop long !
  27. 27. Oublier les démarches classiques ! Trop long !
  28. 28. Soyez Lean !
  29. 29. Big Data, BI, le tout en mode agile
  30. 30. Commencer petit !
  31. 31. Y aller pas à pas ● Télécharger une VM prêt à l'emploi (Pseudo cluster) – Tester les démos / tutoriels – Essayer avec vos données ● Passer à la vitesse supérieure avec une offre hébergée ● Formez vous, faites vous accompagner ● Lancez vous avec vos propres machines, hébergées ou non !
  32. 32. Questions
  33. 33. Plateforme Big Data orientée BI avec Hadoop et Spark Merci ! Charly CLAIRMONT charly.clairmont@altic.org @egwada @ALtic_Buzz

×