Ce diaporama a bien été signalé.
Nous utilisons votre profil LinkedIn et vos données d’activité pour vous proposer des publicités personnalisées et pertinentes. Vous pouvez changer vos préférences de publicités à tout moment.

Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

1 307 vues

Publié le

Description de l'architecture bigdata chez Altic
Hortonworks HDP
Apache Spark
InfiniDB
Tableau Software
JasperReports
Birt
Talend

Publié dans : Technologie

Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

  1. 1. Plateforme Big Data orientée BI avec Hadoop et Spark Charly CLAIRMONT CTO ALTIC http://altic.org charly.clairmont@altic.org @egwada
  2. 2. petite bio Depuis 10 ans Altic Une évolution permanente avec les technologies suivantes : Un des animateurs de l'écosystème Hadoop en France Un groupe de plus en plus actif ! (messages échangés sur l'année)
  3. 3. Altic @Altic_Buzz Métier Informatique Décisionnelle Intégration de données Valeurs – Innovations – Open Source Une maîtrise de toute la chaîne de valeur du Big Data
  4. 4. Notre approche historique de la BI ● Intégration de données – Talend ● Reporting : – JasperReports, – Birt ● OLAP : – Mondrian, – Jedox ● Portail décisionnel : – SpagoBI, – JasperServer
  5. 5. Tout le monde parle de déluge de données ! Chez Altic nous aimerions déjà décloisonner l'entreprise ! Et lui rappeler qu'elle est une « Entreprise étendue »
  6. 6. Toute organisation peut désormais avoir son « lac de données », construire une vision unifiée de ses clients, ses produits, ses partenaires, ses processus
  7. 7. Le standard du Big Data : « Hadoop », et son compagnon par défaut « Spark »
  8. 8. Hadoop est robuste ! ● Stable – Testé - Yahoo! (40 000 noeuds) ● Fiable – Tolérant à la panne ● Flexible – Schéma à la lecture ! – Passage à l'échelle ● Économique – Prédictibilité des coûts
  9. 9. Hadoop, système d'exploitation de la donnée
  10. 10. Vous connaissez ?
  11. 11. Spark, Simple et rapide Hadoop Map / Reduce Iter. 1 Lecture HDFS Écriture RAM Iter. 2 Lecture RAM Écriture RAM . . . Lecture HDFS Écriture HDFS Lecture HDFS Écriture HDFS Iter. 1 Iter. 2 . . . Spark
  12. 12. Spark, meilleur compagnon d'Hadoop
  13. 13. Construire sa plateforme Big Data
  14. 14. Une architecture BI à l'heure du Big Data
  15. 15. Collecter, Transformer, avec Talend Big Data Des jobs Talend Pig ! Des composants toujours plus riches
  16. 16. Hortonworks HDP, une distribution open source
  17. 17. Analyser de larges volume de données en SQL avec InfiniDB ● Sans doute le moteur SQL pour Hadoop le plus performant du moment
  18. 18. Reporting ● JasperReports – Connecteur Hive – Connecteur HBase – Connecteur Avro ● Birt – Connecteur pour Hive
  19. 19. Visualisation, Exploration Datameer Tableau Software Via Hive (Odbc, Jdbc)
  20. 20. Cas d'utilisation
  21. 21. Oui, mais concrètement...
  22. 22. Hadoop dans le monde bancaire : Crédit Mutuel Arkea – Groupe bancaire de plein exercice – 3.2 millions de sociétaires et clients – 9000 salariés – 84 milliard d'euros de total de bilan (2011)
  23. 23. Hadoop dans le monde bancaire : Crédit Mutuel Arkea ● Offrir une meilleure expérience aux utilisateurs – Les clients peuvent accéder à leur historique de paiements depuis 2001 ! ● Dé-silotage l'organisation – Avoir une vision à 360° des clients, des produits http://www.journaldunet.com/solutions/dsi/big-data-dans-les-dsi/l
  24. 24. Quelle démarche pour votre projet Big Data !
  25. 25. Commencer petit !
  26. 26. Oublier les démarches classiques ! Trop long !
  27. 27. Oublier les démarches classiques ! Trop long !
  28. 28. Soyez Lean !
  29. 29. Big Data, BI, le tout en mode agile
  30. 30. Commencer petit !
  31. 31. Y aller pas à pas ● Télécharger une VM prêt à l'emploi (Pseudo cluster) – Tester les démos / tutoriels – Essayer avec vos données ● Passer à la vitesse supérieure avec une offre hébergée ● Formez vous, faites vous accompagner ● Lancez vous avec vos propres machines, hébergées ou non !
  32. 32. Questions
  33. 33. Plateforme Big Data orientée BI avec Hadoop et Spark Merci ! Charly CLAIRMONT charly.clairmont@altic.org @egwada @ALtic_Buzz

×