Comment bâtir un cloud hybride en mode IaaS ou SaaS et apporter le meilleur d...
Big Data Montée en compétence Hadoop
1. MONTER EN PUISSANCE ET EN
AUTONOMIE SUR UNE
PLATEFORME HADOOP ?
Romain Chaumais – romain.chaumais@ysance.com
2.
3. Notre métier
Agence conseil en Technologie Digitale
Conception, mise en œuvre et animation
de Plateformes Digitales
Organisée autour de 7 offres
Digital
Marketing Ecommerce CRM
Cloud
Computing
Business
Intelligence
Data
Management Big Data
4. Comment monter en puissance et en
autonomie sur une plateforme Hadoop ?
Romain Chaumais
12. Les bénéfices de la « base de données » Hadoop
12
Gestion des données
structurées, peu structurées
et non structurées
Massivement Scale-Out
(Gestion du temps
contraint)
Faible coût de
possession
Intégrée et compatible
avec l’écosystème BI
traditionnel
Pas de modèle de
données à priori
Grande capacité de
stockage
De plus en plus compatible
avec des usages temps réel
(Flume, Hbase, Impala)
27. Architecture logique & applicative
avec un ecosystème Hadoop
…
Cluster élastique : CPU / RAM / Disk / Network
Stockage HDFS / MAPRFS
Transformations Batch : Map Reduce (Hive /Pig)
Transactions Temps réel : Hbase / Cassandra / etc.
Moteur de recherche Temps réel : ElasticSearch/SolR
Requêtes Temps réel : Impala / Presto / Spark / etc.
Orchestrationdestraitements:ETL
Donnéessources
Ventes
Web.com
Logs
Autres …
API
Accès Apps tierces
Temps réel (R/W)
Browser
Apps Opérationnelles
HTML Temps réel
(Search / Pilotage)
HTTP/REST/JSON
Outils BI
Apps Analytiques
Données historisées
Pour les 3 BI
SQLODBC/JDBCFilesSystem/Shell
Fichiers
Échange de
données par fichiers
Input / Output
Shell
Interaction en ligne
de commande
Collecte et streaming : Flume, SyslogNG, Storm