SlideShare une entreprise Scribd logo
1  sur  39
MONTER EN PUISSANCE ET EN
AUTONOMIE SUR UNE
PLATEFORME HADOOP ?
Romain Chaumais – romain.chaumais@ysance.com
Notre métier
Agence conseil en Technologie Digitale
Conception, mise en œuvre et animation
de Plateformes Digitales
Organisée autour de 7 offres
Digital
Marketing Ecommerce CRM
Cloud
Computing
Business
Intelligence
Data
Management Big Data
Comment monter en puissance et en
autonomie sur une plateforme Hadoop ?
Romain Chaumais
CONSEIL #1
DÉMYSTIFIER LA BÊTE
CONSEIL #2
FAIRE COMME AVANT
Les bénéfices de la « base de données » Hadoop
12
Gestion des données
structurées, peu structurées
et non structurées
Massivement Scale-Out
(Gestion du temps
contraint)
Faible coût de
possession
Intégrée et compatible
avec l’écosystème BI
traditionnel
Pas de modèle de
données à priori
Grande capacité de
stockage
De plus en plus compatible
avec des usages temps réel
(Flume, Hbase, Impala)
CONSEIL #3
CHOUCHOUTER
LES ADMIN SYSTÈMES
CONSEIL #4
OSER SE JETTER À L’EAU
Architecture logique & applicative
avec un ecosystème Hadoop
…
Cluster élastique : CPU / RAM / Disk / Network
Stockage HDFS / MAPRFS
Transformations Batch : Map Reduce (Hive /Pig)
Transactions Temps réel : Hbase / Cassandra / etc.
Moteur de recherche Temps réel : ElasticSearch/SolR
Requêtes Temps réel : Impala / Presto / Spark / etc.
Orchestrationdestraitements:ETL
Donnéessources
Ventes
Web.com
Logs
Autres …
API
Accès Apps tierces
Temps réel (R/W)
Browser
Apps Opérationnelles
HTML Temps réel
(Search / Pilotage)
HTTP/REST/JSON
Outils BI
Apps Analytiques
Données historisées
Pour les 3 BI
SQLODBC/JDBCFilesSystem/Shell
Fichiers
Échange de
données par fichiers
Input / Output
Shell
Interaction en ligne
de commande
Collecte et streaming : Flume, SyslogNG, Storm
CONSEIL #5
CONSTRUIRE UNE
HISTOIRE D’AMOUR
CONSEIL #6
APPELER UN AMI
http://ysance.com/nous-contacter.htm
ET SI VOUS SUIVEZ BIEN TOUS CES CONSEILS …
#MYJOB
DOMPTEUR DE HADOOP
Merci
MERCI
Romain Chaumais – romain.chaumais@ysance.com

Contenu connexe

Tendances

RGPD : comment la virtualisation des données vous garantit conformité, gouver...
RGPD : comment la virtualisation des données vous garantit conformité, gouver...RGPD : comment la virtualisation des données vous garantit conformité, gouver...
RGPD : comment la virtualisation des données vous garantit conformité, gouver...
Denodo
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigData
Ludovic Piot
 
Webinar elastic stack telecom regulation by data
Webinar elastic stack telecom regulation by dataWebinar elastic stack telecom regulation by data
Webinar elastic stack telecom regulation by data
Yassine, LASRI
 

Tendances (20)

Petit-déjeuner OCTO : Hadoop, plateforme multi-tenant, à tout d'une grande !
Petit-déjeuner OCTO : Hadoop, plateforme multi-tenant, à tout d'une grande !Petit-déjeuner OCTO : Hadoop, plateforme multi-tenant, à tout d'une grande !
Petit-déjeuner OCTO : Hadoop, plateforme multi-tenant, à tout d'une grande !
 
DATA FORUM 2015 - Atelier ORACLE
DATA FORUM 2015 - Atelier ORACLEDATA FORUM 2015 - Atelier ORACLE
DATA FORUM 2015 - Atelier ORACLE
 
Découvrez les nouvelles fonctionnalités de Talend 6
Découvrez les nouvelles fonctionnalités de Talend 6Découvrez les nouvelles fonctionnalités de Talend 6
Découvrez les nouvelles fonctionnalités de Talend 6
 
[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend
 
Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...
Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...
Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...
 
La "Data science" au service des entreprises
La "Data science" au service des entreprisesLa "Data science" au service des entreprises
La "Data science" au service des entreprises
 
Meetup intro techno big data
Meetup intro techno big dataMeetup intro techno big data
Meetup intro techno big data
 
Afterwork hadoop
Afterwork hadoopAfterwork hadoop
Afterwork hadoop
 
Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...
Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...
Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...
 
BIG DATA - Cloud Computing
BIG DATA - Cloud ComputingBIG DATA - Cloud Computing
BIG DATA - Cloud Computing
 
Introduction à la big data V2
Introduction à la big data V2Introduction à la big data V2
Introduction à la big data V2
 
Talend - Collaboration IT et metiers autour de la donnee en libre-service - ...
Talend - Collaboration IT et metiers autour de la donnee en libre-service -  ...Talend - Collaboration IT et metiers autour de la donnee en libre-service -  ...
Talend - Collaboration IT et metiers autour de la donnee en libre-service - ...
 
Présentation de Talend Winter 2017
Présentation de Talend Winter 2017 Présentation de Talend Winter 2017
Présentation de Talend Winter 2017
 
RGPD : comment la virtualisation des données vous garantit conformité, gouver...
RGPD : comment la virtualisation des données vous garantit conformité, gouver...RGPD : comment la virtualisation des données vous garantit conformité, gouver...
RGPD : comment la virtualisation des données vous garantit conformité, gouver...
 
Démarche d'une data factory par Xebia
Démarche d'une data factory par XebiaDémarche d'une data factory par Xebia
Démarche d'une data factory par Xebia
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigData
 
Webinar elastic stack telecom regulation by data
Webinar elastic stack telecom regulation by dataWebinar elastic stack telecom regulation by data
Webinar elastic stack telecom regulation by data
 
IBM Data lake
IBM Data lakeIBM Data lake
IBM Data lake
 
[USI] Lambda-Architecture : comment réconcilier BigData et temps-réel
[USI] Lambda-Architecture : comment réconcilier BigData et temps-réel[USI] Lambda-Architecture : comment réconcilier BigData et temps-réel
[USI] Lambda-Architecture : comment réconcilier BigData et temps-réel
 
Webinaire Comment enrichir votre BI avec l’analyse en temps réel des CDR via ...
Webinaire Comment enrichir votre BI avec l’analyse en temps réel des CDR via ...Webinaire Comment enrichir votre BI avec l’analyse en temps réel des CDR via ...
Webinaire Comment enrichir votre BI avec l’analyse en temps réel des CDR via ...
 

En vedette

Introduction sur les problématiques d'une architecture distribuée
Introduction sur les problématiques d'une architecture distribuéeIntroduction sur les problématiques d'une architecture distribuée
Introduction sur les problématiques d'une architecture distribuée
Khanh Maudoux
 
HBase Sizing Notes
HBase Sizing NotesHBase Sizing Notes
HBase Sizing Notes
larsgeorge
 

En vedette (20)

Digital Data Factory - La DMP d'Ysance
Digital Data Factory - La DMP d'YsanceDigital Data Factory - La DMP d'Ysance
Digital Data Factory - La DMP d'Ysance
 
Social Networks and the Richness of Data
Social Networks and the Richness of DataSocial Networks and the Richness of Data
Social Networks and the Richness of Data
 
Hadoop unit
Hadoop unitHadoop unit
Hadoop unit
 
Ysance conference - cloud computing - aws - 3 mai 2010
Ysance   conference - cloud computing - aws - 3 mai 2010Ysance   conference - cloud computing - aws - 3 mai 2010
Ysance conference - cloud computing - aws - 3 mai 2010
 
Hadoop is dead - long live Hadoop | BiDaTA 2013 Genoa
Hadoop is dead - long live Hadoop | BiDaTA 2013 GenoaHadoop is dead - long live Hadoop | BiDaTA 2013 Genoa
Hadoop is dead - long live Hadoop | BiDaTA 2013 Genoa
 
From Batch to Realtime with Hadoop - Berlin Buzzwords - June 2012
From Batch to Realtime with Hadoop - Berlin Buzzwords - June 2012From Batch to Realtime with Hadoop - Berlin Buzzwords - June 2012
From Batch to Realtime with Hadoop - Berlin Buzzwords - June 2012
 
Introduction sur les problématiques d'une architecture distribuée
Introduction sur les problématiques d'une architecture distribuéeIntroduction sur les problématiques d'une architecture distribuée
Introduction sur les problématiques d'une architecture distribuée
 
Présentation Club STORM
Présentation Club STORMPrésentation Club STORM
Présentation Club STORM
 
HBase Applications - Atlanta HUG - May 2014
HBase Applications - Atlanta HUG - May 2014HBase Applications - Atlanta HUG - May 2014
HBase Applications - Atlanta HUG - May 2014
 
HBase Sizing Notes
HBase Sizing NotesHBase Sizing Notes
HBase Sizing Notes
 
Big Data is not Rocket Science
Big Data is not Rocket ScienceBig Data is not Rocket Science
Big Data is not Rocket Science
 
Phoenix - A High Performance Open Source SQL Layer over HBase
Phoenix - A High Performance Open Source SQL Layer over HBasePhoenix - A High Performance Open Source SQL Layer over HBase
Phoenix - A High Performance Open Source SQL Layer over HBase
 
Tech day hadoop, Spark
Tech day hadoop, SparkTech day hadoop, Spark
Tech day hadoop, Spark
 
HBase and Impala Notes - Munich HUG - 20131017
HBase and Impala Notes - Munich HUG - 20131017HBase and Impala Notes - Munich HUG - 20131017
HBase and Impala Notes - Munich HUG - 20131017
 
HBase Advanced Schema Design - Berlin Buzzwords - June 2012
HBase Advanced Schema Design - Berlin Buzzwords - June 2012HBase Advanced Schema Design - Berlin Buzzwords - June 2012
HBase Advanced Schema Design - Berlin Buzzwords - June 2012
 
Sept 17 2013 - THUG - HBase a Technical Introduction
Sept 17 2013 - THUG - HBase a Technical IntroductionSept 17 2013 - THUG - HBase a Technical Introduction
Sept 17 2013 - THUG - HBase a Technical Introduction
 
Soutenance ysance
Soutenance ysanceSoutenance ysance
Soutenance ysance
 
HBase Status Report - Hadoop Summit Europe 2014
HBase Status Report - Hadoop Summit Europe 2014HBase Status Report - Hadoop Summit Europe 2014
HBase Status Report - Hadoop Summit Europe 2014
 
HBase Sizing Guide
HBase Sizing GuideHBase Sizing Guide
HBase Sizing Guide
 
Near-realtime analytics with Kafka and HBase
Near-realtime analytics with Kafka and HBaseNear-realtime analytics with Kafka and HBase
Near-realtime analytics with Kafka and HBase
 

Similaire à Big Data Montée en compétence Hadoop

Similaire à Big Data Montée en compétence Hadoop (20)

BigData en France par Excelerate Systems
BigData en France par Excelerate Systems BigData en France par Excelerate Systems
BigData en France par Excelerate Systems
 
Quel hadoop (#quelhadoop)
Quel hadoop (#quelhadoop)Quel hadoop (#quelhadoop)
Quel hadoop (#quelhadoop)
 
Atelier DAM - All For Content 2021
Atelier DAM - All For Content 2021Atelier DAM - All For Content 2021
Atelier DAM - All For Content 2021
 
Gestion des ressources numériques : accélérez votre transformation digitale
Gestion des ressources numériques : accélérez votre transformation digitaleGestion des ressources numériques : accélérez votre transformation digitale
Gestion des ressources numériques : accélérez votre transformation digitale
 
Groupe Cyrès
Groupe Cyrès Groupe Cyrès
Groupe Cyrès
 
Big data
Big dataBig data
Big data
 
Introduction à Drupal. Pourquoi Drupal est, en toute objectivité, le meilleur...
Introduction à Drupal. Pourquoi Drupal est, en toute objectivité, le meilleur...Introduction à Drupal. Pourquoi Drupal est, en toute objectivité, le meilleur...
Introduction à Drupal. Pourquoi Drupal est, en toute objectivité, le meilleur...
 
Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark
Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache SparkPlateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark
Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark
 
2014 04-17-camoai-nord-it-days-6-technologies-clé sshare
2014 04-17-camoai-nord-it-days-6-technologies-clé sshare2014 04-17-camoai-nord-it-days-6-technologies-clé sshare
2014 04-17-camoai-nord-it-days-6-technologies-clé sshare
 
Tk05 Le Bureau Mobile 2.0 Fr
Tk05 Le Bureau Mobile 2.0 FrTk05 Le Bureau Mobile 2.0 Fr
Tk05 Le Bureau Mobile 2.0 Fr
 
Izzili-Aspaway : Retour d’expérience éditeur full Cloud & SaaS
Izzili-Aspaway : Retour d’expérience éditeur full Cloud & SaaSIzzili-Aspaway : Retour d’expérience éditeur full Cloud & SaaS
Izzili-Aspaway : Retour d’expérience éditeur full Cloud & SaaS
 
Les tendances du stockage de données en France face au digital
Les tendances du stockage de données en France face au digitalLes tendances du stockage de données en France face au digital
Les tendances du stockage de données en France face au digital
 
WEBINAIRE DAM 2020 Analyse - Tendances - Technologie - FR
WEBINAIRE DAM 2020 Analyse - Tendances - Technologie - FRWEBINAIRE DAM 2020 Analyse - Tendances - Technologie - FR
WEBINAIRE DAM 2020 Analyse - Tendances - Technologie - FR
 
Bluestone - Panorama des solutions analytiques existantes
Bluestone - Panorama des solutions analytiques existantesBluestone - Panorama des solutions analytiques existantes
Bluestone - Panorama des solutions analytiques existantes
 
WEBINAR - Enjeux du DAM PIM CMS en 2020, comment choisir la meilleure solution ?
WEBINAR - Enjeux du DAM PIM CMS en 2020, comment choisir la meilleure solution ?WEBINAR - Enjeux du DAM PIM CMS en 2020, comment choisir la meilleure solution ?
WEBINAR - Enjeux du DAM PIM CMS en 2020, comment choisir la meilleure solution ?
 
Présentation Big Data et REX Hadoop
Présentation Big Data et REX HadoopPrésentation Big Data et REX Hadoop
Présentation Big Data et REX Hadoop
 
Offrir de l'analytique en temps réel en un clic
Offrir de l'analytique en temps réel en un clicOffrir de l'analytique en temps réel en un clic
Offrir de l'analytique en temps réel en un clic
 
Drupal Ecommerce - fonctionnalités et atouts
Drupal Ecommerce - fonctionnalités et atoutsDrupal Ecommerce - fonctionnalités et atouts
Drupal Ecommerce - fonctionnalités et atouts
 
Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018
 
Comment bâtir un cloud hybride en mode IaaS ou SaaS et apporter le meilleur d...
Comment bâtir un cloud hybride en mode IaaS ou SaaS et apporter le meilleur d...Comment bâtir un cloud hybride en mode IaaS ou SaaS et apporter le meilleur d...
Comment bâtir un cloud hybride en mode IaaS ou SaaS et apporter le meilleur d...
 

Big Data Montée en compétence Hadoop

  • 1. MONTER EN PUISSANCE ET EN AUTONOMIE SUR UNE PLATEFORME HADOOP ? Romain Chaumais – romain.chaumais@ysance.com
  • 2.
  • 3. Notre métier Agence conseil en Technologie Digitale Conception, mise en œuvre et animation de Plateformes Digitales Organisée autour de 7 offres Digital Marketing Ecommerce CRM Cloud Computing Business Intelligence Data Management Big Data
  • 4. Comment monter en puissance et en autonomie sur une plateforme Hadoop ? Romain Chaumais
  • 6.
  • 7.
  • 8.
  • 9.
  • 11.
  • 12. Les bénéfices de la « base de données » Hadoop 12 Gestion des données structurées, peu structurées et non structurées Massivement Scale-Out (Gestion du temps contraint) Faible coût de possession Intégrée et compatible avec l’écosystème BI traditionnel Pas de modèle de données à priori Grande capacité de stockage De plus en plus compatible avec des usages temps réel (Flume, Hbase, Impala)
  • 13.
  • 14.
  • 15.
  • 17.
  • 18.
  • 19.
  • 20.
  • 21.
  • 22.
  • 23. CONSEIL #4 OSER SE JETTER À L’EAU
  • 24.
  • 25.
  • 26.
  • 27. Architecture logique & applicative avec un ecosystème Hadoop … Cluster élastique : CPU / RAM / Disk / Network Stockage HDFS / MAPRFS Transformations Batch : Map Reduce (Hive /Pig) Transactions Temps réel : Hbase / Cassandra / etc. Moteur de recherche Temps réel : ElasticSearch/SolR Requêtes Temps réel : Impala / Presto / Spark / etc. Orchestrationdestraitements:ETL Donnéessources Ventes Web.com Logs Autres … API Accès Apps tierces Temps réel (R/W) Browser Apps Opérationnelles HTML Temps réel (Search / Pilotage) HTTP/REST/JSON Outils BI Apps Analytiques Données historisées Pour les 3 BI SQLODBC/JDBCFilesSystem/Shell Fichiers Échange de données par fichiers Input / Output Shell Interaction en ligne de commande Collecte et streaming : Flume, SyslogNG, Storm
  • 28.
  • 30.
  • 31.
  • 32.
  • 33.
  • 34.
  • 35.
  • 36. CONSEIL #6 APPELER UN AMI http://ysance.com/nous-contacter.htm
  • 37. ET SI VOUS SUIVEZ BIEN TOUS CES CONSEILS …
  • 39. Merci MERCI Romain Chaumais – romain.chaumais@ysance.com