Plateforme Big Data 
orientée BI 
avec 
Hadoop et Spark 
Charly CLAIRMONT 
CTO 
ALTIC 
http://altic.org 
charly.clairmont@altic.org 
@egwada
petite bio 
Depuis 10 ans Altic 
Une évolution permanente avec les 
technologies suivantes : 
Un des animateurs de l'écosystème Hadoop 
en France 
Un groupe de plus en plus actif ! 
(messages échangés sur l'année)
Altic 
@Altic_Buzz 
Métier 
Informatique Décisionnelle 
Intégration de données 
Valeurs 
– Innovations 
– Open Source 
Une maîtrise de toute la chaîne de valeur du Big Data
Notre approche 
historique de la BI 
● Intégration de données 
– Talend 
● Reporting : 
– JasperReports, 
– Birt 
● OLAP : 
– Mondrian, 
– Jedox 
● Portail décisionnel : 
– SpagoBI, 
– JasperServer
Tout le monde parle de déluge de 
données ! 
Chez Altic nous aimerions déjà 
décloisonner l'entreprise ! 
Et lui rappeler qu'elle est une 
« Entreprise étendue »
Toute organisation peut désormais 
avoir son « lac de données », 
construire une vision unifiée de ses 
clients, ses produits, ses partenaires, ses 
processus
Le standard du Big Data : « Hadoop », et 
son compagnon par défaut « Spark »
Hadoop est robuste ! 
● Stable 
– Testé - Yahoo! (40 000 noeuds) 
● Fiable 
– Tolérant à la panne 
● Flexible 
– Schéma à la lecture ! 
– Passage à l'échelle 
● Économique 
– Prédictibilité des 
coûts
Hadoop, 
système d'exploitation de la donnée
Vous connaissez ?
Spark, Simple et rapide 
Hadoop Map / Reduce 
Iter. 1 
Lecture 
HDFS 
Écriture 
RAM 
Iter. 2 
Lecture 
RAM 
Écriture 
RAM 
. . . 
Lecture 
HDFS 
Écriture 
HDFS 
Lecture 
HDFS 
Écriture 
HDFS 
Iter. 1 Iter. 2 . . . 
Spark
Spark, 
meilleur compagnon d'Hadoop
Construire sa 
plateforme Big Data
Une architecture BI à l'heure 
du Big Data
Collecter, Transformer, 
avec Talend Big Data 
Des jobs Talend Pig ! 
Des composants toujours plus riches
Hortonworks HDP, une 
distribution open source
Analyser de larges volume 
de données en SQL avec 
InfiniDB 
● Sans doute le 
moteur SQL pour 
Hadoop le plus 
performant du 
moment
Reporting 
● JasperReports 
– Connecteur Hive 
– Connecteur HBase 
– Connecteur Avro 
● Birt 
– Connecteur pour 
Hive
Visualisation, Exploration 
Datameer Tableau Software 
Via Hive (Odbc, Jdbc)
Cas d'utilisation
Oui, mais 
concrètement...
Hadoop dans le monde bancaire : 
Crédit Mutuel Arkea 
– Groupe bancaire de plein exercice 
– 3.2 millions de sociétaires et clients 
– 9000 salariés 
– 84 milliard d'euros de total de bilan 
(2011)
Hadoop dans le monde bancaire : 
Crédit Mutuel Arkea 
● Offrir une meilleure expérience aux 
utilisateurs 
– Les clients peuvent accéder à leur 
historique de paiements depuis 2001 ! 
● Dé-silotage l'organisation 
– Avoir une vision à 360° des clients, des 
produits 
http://www.journaldunet.com/solutions/dsi/big-data-dans-les-dsi/l
Quelle démarche pour 
votre projet Big Data !
Commencer petit !
Oublier les démarches 
classiques ! Trop long !
Oublier les démarches 
classiques ! Trop long !
Soyez Lean !
Big Data, BI, 
le tout en mode agile
Commencer petit !
Y aller pas à pas 
● Télécharger une VM prêt à l'emploi 
(Pseudo cluster) 
– Tester les démos / tutoriels 
– Essayer avec vos données 
● Passer à la vitesse supérieure avec une 
offre hébergée 
● Formez vous, faites vous accompagner 
● Lancez vous avec vos propres machines, 
hébergées ou non !
Questions
Plateforme Big Data 
orientée BI 
avec 
Hadoop et Spark 
Merci ! 
Charly CLAIRMONT 
charly.clairmont@altic.org 
@egwada 
@ALtic_Buzz

Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

  • 1.
    Plateforme Big Data orientée BI avec Hadoop et Spark Charly CLAIRMONT CTO ALTIC http://altic.org charly.clairmont@altic.org @egwada
  • 2.
    petite bio Depuis10 ans Altic Une évolution permanente avec les technologies suivantes : Un des animateurs de l'écosystème Hadoop en France Un groupe de plus en plus actif ! (messages échangés sur l'année)
  • 3.
    Altic @Altic_Buzz Métier Informatique Décisionnelle Intégration de données Valeurs – Innovations – Open Source Une maîtrise de toute la chaîne de valeur du Big Data
  • 4.
    Notre approche historiquede la BI ● Intégration de données – Talend ● Reporting : – JasperReports, – Birt ● OLAP : – Mondrian, – Jedox ● Portail décisionnel : – SpagoBI, – JasperServer
  • 5.
    Tout le mondeparle de déluge de données ! Chez Altic nous aimerions déjà décloisonner l'entreprise ! Et lui rappeler qu'elle est une « Entreprise étendue »
  • 6.
    Toute organisation peutdésormais avoir son « lac de données », construire une vision unifiée de ses clients, ses produits, ses partenaires, ses processus
  • 7.
    Le standard duBig Data : « Hadoop », et son compagnon par défaut « Spark »
  • 8.
    Hadoop est robuste! ● Stable – Testé - Yahoo! (40 000 noeuds) ● Fiable – Tolérant à la panne ● Flexible – Schéma à la lecture ! – Passage à l'échelle ● Économique – Prédictibilité des coûts
  • 9.
  • 10.
  • 11.
    Spark, Simple etrapide Hadoop Map / Reduce Iter. 1 Lecture HDFS Écriture RAM Iter. 2 Lecture RAM Écriture RAM . . . Lecture HDFS Écriture HDFS Lecture HDFS Écriture HDFS Iter. 1 Iter. 2 . . . Spark
  • 12.
  • 13.
  • 14.
    Une architecture BIà l'heure du Big Data
  • 15.
    Collecter, Transformer, avecTalend Big Data Des jobs Talend Pig ! Des composants toujours plus riches
  • 16.
    Hortonworks HDP, une distribution open source
  • 17.
    Analyser de largesvolume de données en SQL avec InfiniDB ● Sans doute le moteur SQL pour Hadoop le plus performant du moment
  • 18.
    Reporting ● JasperReports – Connecteur Hive – Connecteur HBase – Connecteur Avro ● Birt – Connecteur pour Hive
  • 19.
    Visualisation, Exploration DatameerTableau Software Via Hive (Odbc, Jdbc)
  • 20.
  • 21.
  • 22.
    Hadoop dans lemonde bancaire : Crédit Mutuel Arkea – Groupe bancaire de plein exercice – 3.2 millions de sociétaires et clients – 9000 salariés – 84 milliard d'euros de total de bilan (2011)
  • 23.
    Hadoop dans lemonde bancaire : Crédit Mutuel Arkea ● Offrir une meilleure expérience aux utilisateurs – Les clients peuvent accéder à leur historique de paiements depuis 2001 ! ● Dé-silotage l'organisation – Avoir une vision à 360° des clients, des produits http://www.journaldunet.com/solutions/dsi/big-data-dans-les-dsi/l
  • 24.
    Quelle démarche pour votre projet Big Data !
  • 25.
  • 26.
    Oublier les démarches classiques ! Trop long !
  • 27.
    Oublier les démarches classiques ! Trop long !
  • 28.
  • 29.
    Big Data, BI, le tout en mode agile
  • 30.
  • 31.
    Y aller pasà pas ● Télécharger une VM prêt à l'emploi (Pseudo cluster) – Tester les démos / tutoriels – Essayer avec vos données ● Passer à la vitesse supérieure avec une offre hébergée ● Formez vous, faites vous accompagner ● Lancez vous avec vos propres machines, hébergées ou non !
  • 32.
  • 33.
    Plateforme Big Data orientée BI avec Hadoop et Spark Merci ! Charly CLAIRMONT charly.clairmont@altic.org @egwada @ALtic_Buzz