Plateforme Big Data 
orientée BI 
avec 
Hadoop et Spark 
Charly CLAIRMONT 
CTO 
ALTIC 
http://altic.org 
charly.clairmont@...
petite bio 
Depuis 10 ans Altic 
Une évolution permanente avec les 
technologies suivantes : 
Un des animateurs de l'écosy...
Altic 
@Altic_Buzz 
Métier 
Informatique Décisionnelle 
Intégration de données 
Valeurs 
– Innovations 
– Open Source 
Une...
Notre approche 
historique de la BI 
● Intégration de données 
– Talend 
● Reporting : 
– JasperReports, 
– Birt 
● OLAP :...
Tout le monde parle de déluge de 
données ! 
Chez Altic nous aimerions déjà 
décloisonner l'entreprise ! 
Et lui rappeler ...
Toute organisation peut désormais 
avoir son « lac de données », 
construire une vision unifiée de ses 
clients, ses produ...
Le standard du Big Data : « Hadoop », et 
son compagnon par défaut « Spark »
Hadoop est robuste ! 
● Stable 
– Testé - Yahoo! (40 000 noeuds) 
● Fiable 
– Tolérant à la panne 
● Flexible 
– Schéma à ...
Hadoop, 
système d'exploitation de la donnée
Vous connaissez ?
Spark, Simple et rapide 
Hadoop Map / Reduce 
Iter. 1 
Lecture 
HDFS 
Écriture 
RAM 
Iter. 2 
Lecture 
RAM 
Écriture 
RAM ...
Spark, 
meilleur compagnon d'Hadoop
Construire sa 
plateforme Big Data
Une architecture BI à l'heure 
du Big Data
Collecter, Transformer, 
avec Talend Big Data 
Des jobs Talend Pig ! 
Des composants toujours plus riches
Hortonworks HDP, une 
distribution open source
Analyser de larges volume 
de données en SQL avec 
InfiniDB 
● Sans doute le 
moteur SQL pour 
Hadoop le plus 
performant ...
Reporting 
● JasperReports 
– Connecteur Hive 
– Connecteur HBase 
– Connecteur Avro 
● Birt 
– Connecteur pour 
Hive
Visualisation, Exploration 
Datameer Tableau Software 
Via Hive (Odbc, Jdbc)
Cas d'utilisation
Oui, mais 
concrètement...
Hadoop dans le monde bancaire : 
Crédit Mutuel Arkea 
– Groupe bancaire de plein exercice 
– 3.2 millions de sociétaires e...
Hadoop dans le monde bancaire : 
Crédit Mutuel Arkea 
● Offrir une meilleure expérience aux 
utilisateurs 
– Les clients p...
Quelle démarche pour 
votre projet Big Data !
Commencer petit !
Oublier les démarches 
classiques ! Trop long !
Oublier les démarches 
classiques ! Trop long !
Soyez Lean !
Big Data, BI, 
le tout en mode agile
Commencer petit !
Y aller pas à pas 
● Télécharger une VM prêt à l'emploi 
(Pseudo cluster) 
– Tester les démos / tutoriels 
– Essayer avec ...
Questions
Plateforme Big Data 
orientée BI 
avec 
Hadoop et Spark 
Merci ! 
Charly CLAIRMONT 
charly.clairmont@altic.org 
@egwada 
@...
Prochain SlideShare
Chargement dans…5
×

Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

973 vues

Publié le

Description de l'architecture bigdata chez Altic
Hortonworks HDP
Apache Spark
InfiniDB
Tableau Software
JasperReports
Birt
Talend

Publié dans : Technologie

Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

  1. 1. Plateforme Big Data orientée BI avec Hadoop et Spark Charly CLAIRMONT CTO ALTIC http://altic.org charly.clairmont@altic.org @egwada
  2. 2. petite bio Depuis 10 ans Altic Une évolution permanente avec les technologies suivantes : Un des animateurs de l'écosystème Hadoop en France Un groupe de plus en plus actif ! (messages échangés sur l'année)
  3. 3. Altic @Altic_Buzz Métier Informatique Décisionnelle Intégration de données Valeurs – Innovations – Open Source Une maîtrise de toute la chaîne de valeur du Big Data
  4. 4. Notre approche historique de la BI ● Intégration de données – Talend ● Reporting : – JasperReports, – Birt ● OLAP : – Mondrian, – Jedox ● Portail décisionnel : – SpagoBI, – JasperServer
  5. 5. Tout le monde parle de déluge de données ! Chez Altic nous aimerions déjà décloisonner l'entreprise ! Et lui rappeler qu'elle est une « Entreprise étendue »
  6. 6. Toute organisation peut désormais avoir son « lac de données », construire une vision unifiée de ses clients, ses produits, ses partenaires, ses processus
  7. 7. Le standard du Big Data : « Hadoop », et son compagnon par défaut « Spark »
  8. 8. Hadoop est robuste ! ● Stable – Testé - Yahoo! (40 000 noeuds) ● Fiable – Tolérant à la panne ● Flexible – Schéma à la lecture ! – Passage à l'échelle ● Économique – Prédictibilité des coûts
  9. 9. Hadoop, système d'exploitation de la donnée
  10. 10. Vous connaissez ?
  11. 11. Spark, Simple et rapide Hadoop Map / Reduce Iter. 1 Lecture HDFS Écriture RAM Iter. 2 Lecture RAM Écriture RAM . . . Lecture HDFS Écriture HDFS Lecture HDFS Écriture HDFS Iter. 1 Iter. 2 . . . Spark
  12. 12. Spark, meilleur compagnon d'Hadoop
  13. 13. Construire sa plateforme Big Data
  14. 14. Une architecture BI à l'heure du Big Data
  15. 15. Collecter, Transformer, avec Talend Big Data Des jobs Talend Pig ! Des composants toujours plus riches
  16. 16. Hortonworks HDP, une distribution open source
  17. 17. Analyser de larges volume de données en SQL avec InfiniDB ● Sans doute le moteur SQL pour Hadoop le plus performant du moment
  18. 18. Reporting ● JasperReports – Connecteur Hive – Connecteur HBase – Connecteur Avro ● Birt – Connecteur pour Hive
  19. 19. Visualisation, Exploration Datameer Tableau Software Via Hive (Odbc, Jdbc)
  20. 20. Cas d'utilisation
  21. 21. Oui, mais concrètement...
  22. 22. Hadoop dans le monde bancaire : Crédit Mutuel Arkea – Groupe bancaire de plein exercice – 3.2 millions de sociétaires et clients – 9000 salariés – 84 milliard d'euros de total de bilan (2011)
  23. 23. Hadoop dans le monde bancaire : Crédit Mutuel Arkea ● Offrir une meilleure expérience aux utilisateurs – Les clients peuvent accéder à leur historique de paiements depuis 2001 ! ● Dé-silotage l'organisation – Avoir une vision à 360° des clients, des produits http://www.journaldunet.com/solutions/dsi/big-data-dans-les-dsi/l
  24. 24. Quelle démarche pour votre projet Big Data !
  25. 25. Commencer petit !
  26. 26. Oublier les démarches classiques ! Trop long !
  27. 27. Oublier les démarches classiques ! Trop long !
  28. 28. Soyez Lean !
  29. 29. Big Data, BI, le tout en mode agile
  30. 30. Commencer petit !
  31. 31. Y aller pas à pas ● Télécharger une VM prêt à l'emploi (Pseudo cluster) – Tester les démos / tutoriels – Essayer avec vos données ● Passer à la vitesse supérieure avec une offre hébergée ● Formez vous, faites vous accompagner ● Lancez vous avec vos propres machines, hébergées ou non !
  32. 32. Questions
  33. 33. Plateforme Big Data orientée BI avec Hadoop et Spark Merci ! Charly CLAIRMONT charly.clairmont@altic.org @egwada @ALtic_Buzz

×