SlideShare une entreprise Scribd logo
1  sur  27
Télécharger pour lire hors ligne
Hortonworks
Architecture-Installation
A.Stitou Data Scientist
Project Manager
Sommaire
• Introduction
• Architecture
• Composants de la distribution
• Composants non Apach Hadoop
• Installation
Introduction
• Hortonworks a été formé en juin 2011 par des
membres de l’équipe Yahoo en charge du projet
Hadoop.
• but est de faciliter l’adoption de la plate-forme
Hadoop d’Apache, c’est pourquoi tous les
composants sont open source et sous licence
Apache.
• Cette distribution est la plus conforme à la plate-
forme Hadoop d’Apache et Hortonworks est le gros
contributeur Apache Hadoop.
Architecture
Architecture
Composants de la distribution
Hortonworks
• HDFS : stockage distribué. - MapReduce : Traitements parallélisés.
• HBase : Base NoSQL orientée colonnes sur HDFS.
• Pig : plate-forme de scripts d’interrogation HDFS.
• Hive : Requêtage et Méta-données HDFS.
• Oozie : Planification de traitements.
• ZooKeeper : Coordination du cluster.
• Ambari : Gestion et supervision.
• WebHDFS : Accès web aux données. - Ingestion de données :
• Talend Open Studio for Big Data.
• Sqoop : Interactions avec les SGBD.
• Flume : Gestion distribuée des logs.
• Mahout : Apprentissage
Composants non Apache Hadoop
• Hortonworks Cloudbreak (licence Apache) : Solution agnostique de
dimensionnement, de gestion et de monitoring d’un cluster HDP,
compatible avec Microsoft Azure, Amazon AWS, Google Cloud Platform,
OpenStack pour les offres cloud ainsi qu’Apache Ambari, Docker, Swarm et
Consul.
• Hortonworks SmartSense (nécessite une licence) : Maintenance
proactive d’un cluster HDP, recommandations, optimisation de l’utilisation
des ressources.
• Solr on YARN (licence Apache) : C’est une version entièrement
compatible avec Hadoop, ce qui permet de déployer Solr au sein du
cluster et évite de déployer des machines dédiées à Solr
Installation
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork
Hortonwork

Contenu connexe

Tendances

Hadoop Hbase - Introduction
Hadoop Hbase - IntroductionHadoop Hbase - Introduction
Hadoop Hbase - IntroductionBlandine Larbret
 
Hadoop et son écosystème
Hadoop et son écosystèmeHadoop et son écosystème
Hadoop et son écosystèmeKhanh Maudoux
 
TP1 Big Data - MapReduce
TP1 Big Data - MapReduceTP1 Big Data - MapReduce
TP1 Big Data - MapReduceAmal Abid
 
Installation hadoopv2.7.4-amal abid
Installation hadoopv2.7.4-amal abidInstallation hadoopv2.7.4-amal abid
Installation hadoopv2.7.4-amal abidAmal Abid
 
Hadoop Introduction in Paris
Hadoop Introduction in ParisHadoop Introduction in Paris
Hadoop Introduction in ParisTed Drake
 
Cours Big Data Chap2
Cours Big Data Chap2Cours Big Data Chap2
Cours Big Data Chap2Amal Abid
 
Stats web avec Hive chez Scoop.it
Stats web avec Hive chez Scoop.itStats web avec Hive chez Scoop.it
Stats web avec Hive chez Scoop.ithibnico
 
Spark une alternative à Hadoop MapReduce pour le Datamining
Spark une alternative à Hadoop MapReduce pour le DataminingSpark une alternative à Hadoop MapReduce pour le Datamining
Spark une alternative à Hadoop MapReduce pour le DataminingModern Data Stack France
 
Petit-déjeuner MapReduce-La révolution dans l’analyse des BigData
Petit-déjeuner MapReduce-La révolution dans l’analyse des BigDataPetit-déjeuner MapReduce-La révolution dans l’analyse des BigData
Petit-déjeuner MapReduce-La révolution dans l’analyse des BigDataMarc Bojoly
 
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -introNosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -introOlivier Mallassi
 
Mathias Herberts fait le retour d'expérience Hadoop au Crédit Mutuel Arkéa
Mathias Herberts fait le retour d'expérience Hadoop au Crédit Mutuel ArkéaMathias Herberts fait le retour d'expérience Hadoop au Crédit Mutuel Arkéa
Mathias Herberts fait le retour d'expérience Hadoop au Crédit Mutuel ArkéaModern Data Stack France
 
Hadoop MapReduce - OSDC FR 2009
Hadoop MapReduce - OSDC FR 2009Hadoop MapReduce - OSDC FR 2009
Hadoop MapReduce - OSDC FR 2009Olivier Grisel
 
BigData_TP3 : Spark
BigData_TP3 : SparkBigData_TP3 : Spark
BigData_TP3 : SparkLilia Sfaxi
 
Journées SQL 2014 - Hive ou la convergence entre datawarehouse et Big Data
Journées SQL 2014 - Hive ou la convergence entre datawarehouse et Big DataJournées SQL 2014 - Hive ou la convergence entre datawarehouse et Big Data
Journées SQL 2014 - Hive ou la convergence entre datawarehouse et Big DataDavid Joubert
 

Tendances (20)

Hadoop Hbase - Introduction
Hadoop Hbase - IntroductionHadoop Hbase - Introduction
Hadoop Hbase - Introduction
 
Hadoop et son écosystème
Hadoop et son écosystèmeHadoop et son écosystème
Hadoop et son écosystème
 
TP1 Big Data - MapReduce
TP1 Big Data - MapReduceTP1 Big Data - MapReduce
TP1 Big Data - MapReduce
 
Installation hadoopv2.7.4-amal abid
Installation hadoopv2.7.4-amal abidInstallation hadoopv2.7.4-amal abid
Installation hadoopv2.7.4-amal abid
 
Hadoop Introduction in Paris
Hadoop Introduction in ParisHadoop Introduction in Paris
Hadoop Introduction in Paris
 
Une introduction à HBase
Une introduction à HBaseUne introduction à HBase
Une introduction à HBase
 
Une introduction à Hive
Une introduction à HiveUne introduction à Hive
Une introduction à Hive
 
Cours Big Data Chap2
Cours Big Data Chap2Cours Big Data Chap2
Cours Big Data Chap2
 
Stats web avec Hive chez Scoop.it
Stats web avec Hive chez Scoop.itStats web avec Hive chez Scoop.it
Stats web avec Hive chez Scoop.it
 
Spark une alternative à Hadoop MapReduce pour le Datamining
Spark une alternative à Hadoop MapReduce pour le DataminingSpark une alternative à Hadoop MapReduce pour le Datamining
Spark une alternative à Hadoop MapReduce pour le Datamining
 
Petit-déjeuner MapReduce-La révolution dans l’analyse des BigData
Petit-déjeuner MapReduce-La révolution dans l’analyse des BigDataPetit-déjeuner MapReduce-La révolution dans l’analyse des BigData
Petit-déjeuner MapReduce-La révolution dans l’analyse des BigData
 
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -introNosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
Nosql, hadoop, map reduce, hbase, sqoop, voldemort, cassandra -intro
 
Mathias Herberts fait le retour d'expérience Hadoop au Crédit Mutuel Arkéa
Mathias Herberts fait le retour d'expérience Hadoop au Crédit Mutuel ArkéaMathias Herberts fait le retour d'expérience Hadoop au Crédit Mutuel Arkéa
Mathias Herberts fait le retour d'expérience Hadoop au Crédit Mutuel Arkéa
 
Hadoop MapReduce - OSDC FR 2009
Hadoop MapReduce - OSDC FR 2009Hadoop MapReduce - OSDC FR 2009
Hadoop MapReduce - OSDC FR 2009
 
Tech day hadoop, Spark
Tech day hadoop, SparkTech day hadoop, Spark
Tech day hadoop, Spark
 
HADOOP + R
HADOOP + RHADOOP + R
HADOOP + R
 
Introduction à HDFS
Introduction à HDFSIntroduction à HDFS
Introduction à HDFS
 
Introduction à Hadoop
Introduction à HadoopIntroduction à Hadoop
Introduction à Hadoop
 
BigData_TP3 : Spark
BigData_TP3 : SparkBigData_TP3 : Spark
BigData_TP3 : Spark
 
Journées SQL 2014 - Hive ou la convergence entre datawarehouse et Big Data
Journées SQL 2014 - Hive ou la convergence entre datawarehouse et Big DataJournées SQL 2014 - Hive ou la convergence entre datawarehouse et Big Data
Journées SQL 2014 - Hive ou la convergence entre datawarehouse et Big Data
 

Similaire à Hortonwork

Sahara : Hadoop as Service avec OpenStack
Sahara : Hadoop as Service avec OpenStackSahara : Hadoop as Service avec OpenStack
Sahara : Hadoop as Service avec OpenStackALTIC Altic
 
Solr + Hadoop - Fouillez facilement dans votre système Big Data
Solr + Hadoop - Fouillez facilement dans votre système Big DataSolr + Hadoop - Fouillez facilement dans votre système Big Data
Solr + Hadoop - Fouillez facilement dans votre système Big Datafrancelabs
 
Big Data, Hadoop & Spark
Big Data, Hadoop & SparkBig Data, Hadoop & Spark
Big Data, Hadoop & SparkAlexia Audevart
 
Aqui hadoop draft
Aqui hadoop draftAqui hadoop draft
Aqui hadoop draftEric Papet
 
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...Modern Data Stack France
 
Cy3907 formation-cloudera-administrator-training-for-apache-hadoop
Cy3907 formation-cloudera-administrator-training-for-apache-hadoopCy3907 formation-cloudera-administrator-training-for-apache-hadoop
Cy3907 formation-cloudera-administrator-training-for-apache-hadoopCERTyou Formation
 
Déployer facilement OpenStack et CEPH avec Bright OpenStack
Déployer facilement OpenStack et CEPH avec Bright OpenStackDéployer facilement OpenStack et CEPH avec Bright OpenStack
Déployer facilement OpenStack et CEPH avec Bright OpenStackCyril Baudillon
 
Social Network Analysis Utilizing Big Data Technology
Social Network Analysis Utilizing Big Data TechnologySocial Network Analysis Utilizing Big Data Technology
Social Network Analysis Utilizing Big Data TechnologyImad ALILAT
 
Apache Zeppelin @DevoxxFR 2016
Apache Zeppelin @DevoxxFR 2016Apache Zeppelin @DevoxxFR 2016
Apache Zeppelin @DevoxxFR 2016Duyhai Doan
 
TIAD 2016 : Accenture Devops Platform dans Microsoft Azure
TIAD 2016 : Accenture Devops Platform dans Microsoft AzureTIAD 2016 : Accenture Devops Platform dans Microsoft Azure
TIAD 2016 : Accenture Devops Platform dans Microsoft AzureThe Incredible Automation Day
 
L'avenir du web au prisme de la ressource
L'avenir du web au prisme de la ressourceL'avenir du web au prisme de la ressource
L'avenir du web au prisme de la ressourcePascale Laurent
 
Développement d'un moteur de recherche avec Zend Search
Développement d'un moteur de recherche avec Zend SearchDéveloppement d'un moteur de recherche avec Zend Search
Développement d'un moteur de recherche avec Zend SearchRobert Viseur
 
Alphorm.com Support de la Formation PHP MySQL
Alphorm.com Support de la Formation PHP MySQLAlphorm.com Support de la Formation PHP MySQL
Alphorm.com Support de la Formation PHP MySQLAlphorm
 
Déposer dans hal_2016_03_fr
Déposer dans hal_2016_03_frDéposer dans hal_2016_03_fr
Déposer dans hal_2016_03_frCéline SMITH
 

Similaire à Hortonwork (20)

Sahara : Hadoop as Service avec OpenStack
Sahara : Hadoop as Service avec OpenStackSahara : Hadoop as Service avec OpenStack
Sahara : Hadoop as Service avec OpenStack
 
Solr + Hadoop - Fouillez facilement dans votre système Big Data
Solr + Hadoop - Fouillez facilement dans votre système Big DataSolr + Hadoop - Fouillez facilement dans votre système Big Data
Solr + Hadoop - Fouillez facilement dans votre système Big Data
 
Hadoop unit
Hadoop unitHadoop unit
Hadoop unit
 
Hadoop unit
Hadoop unitHadoop unit
Hadoop unit
 
Big Data, Hadoop & Spark
Big Data, Hadoop & SparkBig Data, Hadoop & Spark
Big Data, Hadoop & Spark
 
Commencer avec Hadoop
Commencer avec HadoopCommencer avec Hadoop
Commencer avec Hadoop
 
Aqui hadoop draft
Aqui hadoop draftAqui hadoop draft
Aqui hadoop draft
 
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
Hug france - Administration Hadoop et retour d’expérience BI avec Impala, lim...
 
Cy3907 formation-cloudera-administrator-training-for-apache-hadoop
Cy3907 formation-cloudera-administrator-training-for-apache-hadoopCy3907 formation-cloudera-administrator-training-for-apache-hadoop
Cy3907 formation-cloudera-administrator-training-for-apache-hadoop
 
Déployer facilement OpenStack et CEPH avec Bright OpenStack
Déployer facilement OpenStack et CEPH avec Bright OpenStackDéployer facilement OpenStack et CEPH avec Bright OpenStack
Déployer facilement OpenStack et CEPH avec Bright OpenStack
 
Social Network Analysis Utilizing Big Data Technology
Social Network Analysis Utilizing Big Data TechnologySocial Network Analysis Utilizing Big Data Technology
Social Network Analysis Utilizing Big Data Technology
 
Hadoop
HadoopHadoop
Hadoop
 
Apache Zeppelin @DevoxxFR 2016
Apache Zeppelin @DevoxxFR 2016Apache Zeppelin @DevoxxFR 2016
Apache Zeppelin @DevoxxFR 2016
 
TIAD 2016 : Accenture Devops Platform dans Microsoft Azure
TIAD 2016 : Accenture Devops Platform dans Microsoft AzureTIAD 2016 : Accenture Devops Platform dans Microsoft Azure
TIAD 2016 : Accenture Devops Platform dans Microsoft Azure
 
L'avenir du web au prisme de la ressource
L'avenir du web au prisme de la ressourceL'avenir du web au prisme de la ressource
L'avenir du web au prisme de la ressource
 
Développement d'un moteur de recherche avec Zend Search
Développement d'un moteur de recherche avec Zend SearchDéveloppement d'un moteur de recherche avec Zend Search
Développement d'un moteur de recherche avec Zend Search
 
Alphorm.com Support de la Formation PHP MySQL
Alphorm.com Support de la Formation PHP MySQLAlphorm.com Support de la Formation PHP MySQL
Alphorm.com Support de la Formation PHP MySQL
 
Déposer dans hal_2016_03_fr
Déposer dans hal_2016_03_frDéposer dans hal_2016_03_fr
Déposer dans hal_2016_03_fr
 
Hadoop unit
Hadoop unitHadoop unit
Hadoop unit
 
Php dans le cloud
Php dans le cloudPhp dans le cloud
Php dans le cloud
 

Dernier

To_understand_transformers_together presentation
To_understand_transformers_together presentationTo_understand_transformers_together presentation
To_understand_transformers_together presentationbahija babzine
 
Bidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from TransformersBidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from Transformersbahija babzine
 
Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023France Travail
 
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...France Travail
 
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel AttalELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attalcontact Elabe
 
analyse husseindey AMIROUCHE Abdeslem.pptx
analyse husseindey AMIROUCHE Abdeslem.pptxanalyse husseindey AMIROUCHE Abdeslem.pptx
analyse husseindey AMIROUCHE Abdeslem.pptxHadJer61
 

Dernier (6)

To_understand_transformers_together presentation
To_understand_transformers_together presentationTo_understand_transformers_together presentation
To_understand_transformers_together presentation
 
Bidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from TransformersBidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from Transformers
 
Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023
 
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
 
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel AttalELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
 
analyse husseindey AMIROUCHE Abdeslem.pptx
analyse husseindey AMIROUCHE Abdeslem.pptxanalyse husseindey AMIROUCHE Abdeslem.pptx
analyse husseindey AMIROUCHE Abdeslem.pptx
 

Hortonwork

  • 2. Sommaire • Introduction • Architecture • Composants de la distribution • Composants non Apach Hadoop • Installation
  • 3. Introduction • Hortonworks a été formé en juin 2011 par des membres de l’équipe Yahoo en charge du projet Hadoop. • but est de faciliter l’adoption de la plate-forme Hadoop d’Apache, c’est pourquoi tous les composants sont open source et sous licence Apache. • Cette distribution est la plus conforme à la plate- forme Hadoop d’Apache et Hortonworks est le gros contributeur Apache Hadoop.
  • 6. Composants de la distribution Hortonworks • HDFS : stockage distribué. - MapReduce : Traitements parallélisés. • HBase : Base NoSQL orientée colonnes sur HDFS. • Pig : plate-forme de scripts d’interrogation HDFS. • Hive : Requêtage et Méta-données HDFS. • Oozie : Planification de traitements. • ZooKeeper : Coordination du cluster. • Ambari : Gestion et supervision. • WebHDFS : Accès web aux données. - Ingestion de données : • Talend Open Studio for Big Data. • Sqoop : Interactions avec les SGBD. • Flume : Gestion distribuée des logs. • Mahout : Apprentissage
  • 7. Composants non Apache Hadoop • Hortonworks Cloudbreak (licence Apache) : Solution agnostique de dimensionnement, de gestion et de monitoring d’un cluster HDP, compatible avec Microsoft Azure, Amazon AWS, Google Cloud Platform, OpenStack pour les offres cloud ainsi qu’Apache Ambari, Docker, Swarm et Consul. • Hortonworks SmartSense (nécessite une licence) : Maintenance proactive d’un cluster HDP, recommandations, optimisation de l’utilisation des ressources. • Solr on YARN (licence Apache) : C’est une version entièrement compatible avec Hadoop, ce qui permet de déployer Solr au sein du cluster et évite de déployer des machines dédiées à Solr