SlideShare une entreprise Scribd logo
1  sur  1
Simulation d’un cluster Hadoop en utilisant docker
1
Dans ce TP, nous allons déployer le framework Hadoop mais en utilisant des conteneurs Docker plutôt
qu’une machine virtuelle. Cette méthode permettra de réduire la lourdeur d'exécution observée lors de
l’utilisation des machines virtuelles.
Ce TP est largement inspiré du Tutoriel et du TP disponibles aux urls suivantes :
https://www.youtube.com/watch?v=PMQkrk8OEGk&list=PLl3CtU4THqPYFvrqtQ6v6aJOV3ZHM84jm&index=3
https://insatunisia.github.io/TP-BigData/tp1/
Grâce aux conteneurs Docker, nous allons pouvoir simuler le comportement d’un cluster hadoop. Pour
ceci, nous définirons un mini-cluster : une machine Maître et deux machines Esclaves hébergées chacune
dans un conteneur Docker. Ces machines pourront communiquer à travers un réseau qui les relie. Pour ce
faire, nous utiliserons l’image Docker intitulée « spark-hadoop »disponible sur Docker Hub. Hadoop
ainsi que plusieurs briques de son écosystème sont installés sur cette image.
La première étape à effectuer afin de pouvoir exploiter les conteneurs Docker consiste bien évidemment
à installer Docker sur votre machine. Afin de vérifier que Docker est bien installé ; taper sur l’invite de
commande la commande Docker suivante :
docker run hello-world
Pour faire les manipulations nécessaires pour la mise en place du cluster Hadoop, nous utiliserons les
commandes Docker.
Afin de télécharger l’image Docker, taper :
docker pull liliasfaxi/spark-hadoop:hv-2.7.2
Vérifier que l’image a bien été téléchargée en tapant :
docker images
Afin de créer le réseau et d’installer les 3 conteneurs du Master et des 2 Slaves à partir de l’image déjà
téléchargée, taper les commandes suivantes :
docker network create --driver=bridge hadoop
docker run -itd --net=hadoop -p 9870: 9870-p 8088:8088 -p 7077:7077 -p
16010:16010 --name hadoop-master --hostname hadoop-master liliasfaxi/spark-
hadoop:hv-2.7.2
docker run -itd -p 8040:8042 --net=hadoop --name hadoop-slave1 --hostname
hadoop-slave1 liliasfaxi/spark-hadoop:hv-2.7.2
docker run -itd -p 8041:8042 --net=hadoop --name hadoop-slave2 --hostname
hadoop-slave2 liliasfaxi/spark-hadoop:hv-2.7.2
Pour voir les conteneurs qui tournent, taper :
docker ps
Vous devriez trouver les trois conteneurs (1 Maître et deux Esclaves) déjà créés.
Pour visualiser la liste de tous les conteneurs Docker disponibles, taper : docker ps -a
Pour démarrer un conteneur Docker, il faudra taper :
docker container start <id_container> ou
docker start <nom container>
Comme la seule machine qui reçoit les requêtes est la machine Master, il faudra donc taper la commande
suivante pour pouvoir faire des manipulations sur HDFS :
docker exec -it hadoop-master bash
Une fois dans le shell du namenode, il faudra commencer par lancer hadoop et yarn en tapant :
./start-hadoop.sh

Contenu connexe

Tendances

Cours Big Data Chap4 - Spark
Cours Big Data Chap4 - SparkCours Big Data Chap4 - Spark
Cours Big Data Chap4 - SparkAmal Abid
 
BigData_Chp4: NOSQL
BigData_Chp4: NOSQLBigData_Chp4: NOSQL
BigData_Chp4: NOSQLLilia Sfaxi
 
BigData_Chp3: Data Processing
BigData_Chp3: Data ProcessingBigData_Chp3: Data Processing
BigData_Chp3: Data ProcessingLilia Sfaxi
 
Presentation Hadoop Québec
Presentation Hadoop QuébecPresentation Hadoop Québec
Presentation Hadoop QuébecMathieu Dumoulin
 
Installation hadoopv2.7.4-amal abid
Installation hadoopv2.7.4-amal abidInstallation hadoopv2.7.4-amal abid
Installation hadoopv2.7.4-amal abidAmal Abid
 
TP1 Big Data - MapReduce
TP1 Big Data - MapReduceTP1 Big Data - MapReduce
TP1 Big Data - MapReduceAmal Abid
 
BigData_TP3 : Spark
BigData_TP3 : SparkBigData_TP3 : Spark
BigData_TP3 : SparkLilia Sfaxi
 
Mise en oeuvre des Frameworks de Machines et Deep Learning pour les Applicati...
Mise en oeuvre des Frameworks de Machines et Deep Learning pour les Applicati...Mise en oeuvre des Frameworks de Machines et Deep Learning pour les Applicati...
Mise en oeuvre des Frameworks de Machines et Deep Learning pour les Applicati...ENSET, Université Hassan II Casablanca
 
BigData_TP2: Design Patterns dans Hadoop
BigData_TP2: Design Patterns dans HadoopBigData_TP2: Design Patterns dans Hadoop
BigData_TP2: Design Patterns dans HadoopLilia Sfaxi
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1Amal Abid
 
Hadoop Hbase - Introduction
Hadoop Hbase - IntroductionHadoop Hbase - Introduction
Hadoop Hbase - IntroductionBlandine Larbret
 
Tp Sql Server Integration Services 2008
Tp  Sql Server Integration Services  2008Tp  Sql Server Integration Services  2008
Tp Sql Server Integration Services 2008Abdelouahed Abdou
 

Tendances (20)

Cours Big Data Chap4 - Spark
Cours Big Data Chap4 - SparkCours Big Data Chap4 - Spark
Cours Big Data Chap4 - Spark
 
BigData_Chp4: NOSQL
BigData_Chp4: NOSQLBigData_Chp4: NOSQL
BigData_Chp4: NOSQL
 
BigData_Chp3: Data Processing
BigData_Chp3: Data ProcessingBigData_Chp3: Data Processing
BigData_Chp3: Data Processing
 
Presentation Hadoop Québec
Presentation Hadoop QuébecPresentation Hadoop Québec
Presentation Hadoop Québec
 
Chapitre 3 spark
Chapitre 3 sparkChapitre 3 spark
Chapitre 3 spark
 
Installation hadoopv2.7.4-amal abid
Installation hadoopv2.7.4-amal abidInstallation hadoopv2.7.4-amal abid
Installation hadoopv2.7.4-amal abid
 
Chapitre i-intro
Chapitre i-introChapitre i-intro
Chapitre i-intro
 
TP1 Big Data - MapReduce
TP1 Big Data - MapReduceTP1 Big Data - MapReduce
TP1 Big Data - MapReduce
 
Traitement distribue en BIg Data - KAFKA Broker and Kafka Streams
Traitement distribue en BIg Data - KAFKA Broker and Kafka StreamsTraitement distribue en BIg Data - KAFKA Broker and Kafka Streams
Traitement distribue en BIg Data - KAFKA Broker and Kafka Streams
 
Cours Big Data Part I
Cours Big Data Part ICours Big Data Part I
Cours Big Data Part I
 
Hadoop
HadoopHadoop
Hadoop
 
BigData_TP3 : Spark
BigData_TP3 : SparkBigData_TP3 : Spark
BigData_TP3 : Spark
 
Une introduction à Hive
Une introduction à HiveUne introduction à Hive
Une introduction à Hive
 
Mise en oeuvre des Frameworks de Machines et Deep Learning pour les Applicati...
Mise en oeuvre des Frameworks de Machines et Deep Learning pour les Applicati...Mise en oeuvre des Frameworks de Machines et Deep Learning pour les Applicati...
Mise en oeuvre des Frameworks de Machines et Deep Learning pour les Applicati...
 
BigData_TP2: Design Patterns dans Hadoop
BigData_TP2: Design Patterns dans HadoopBigData_TP2: Design Patterns dans Hadoop
BigData_TP2: Design Patterns dans Hadoop
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
 
Hadoop Hbase - Introduction
Hadoop Hbase - IntroductionHadoop Hbase - Introduction
Hadoop Hbase - Introduction
 
Tp Sql Server Integration Services 2008
Tp  Sql Server Integration Services  2008Tp  Sql Server Integration Services  2008
Tp Sql Server Integration Services 2008
 
Les BD NoSQL
Les BD NoSQLLes BD NoSQL
Les BD NoSQL
 
Une introduction à HBase
Une introduction à HBaseUne introduction à HBase
Une introduction à HBase
 

Similaire à Tp docker-v21

5390997 Support formation : Construire et administrer vos conteneurs avec Doc...
5390997 Support formation : Construire et administrer vos conteneurs avec Doc...5390997 Support formation : Construire et administrer vos conteneurs avec Doc...
5390997 Support formation : Construire et administrer vos conteneurs avec Doc...AbdellahELMAMOUN
 
Docker, mais qu’est-ce que c’est ?
Docker, mais qu’est-ce que c’est ?Docker, mais qu’est-ce que c’est ?
Docker, mais qu’est-ce que c’est ?Julien Maitrehenry
 
A la découverte de docker
A la découverte de dockerA la découverte de docker
A la découverte de dockerjean pasqualini
 
Oxalide Workshop #4 - Docker, des tours dans le petit bassin
Oxalide Workshop #4 - Docker, des tours dans le petit bassinOxalide Workshop #4 - Docker, des tours dans le petit bassin
Oxalide Workshop #4 - Docker, des tours dans le petit bassinLudovic Piot
 
Oxalide Workshop #4 - Docker, des tours dans le petit bassin
Oxalide Workshop #4 - Docker, des tours dans le petit bassinOxalide Workshop #4 - Docker, des tours dans le petit bassin
Oxalide Workshop #4 - Docker, des tours dans le petit bassinOxalide
 
docker-workshop-by-rbk.pdf jhuhiuguigugyug
docker-workshop-by-rbk.pdf jhuhiuguigugyugdocker-workshop-by-rbk.pdf jhuhiuguigugyug
docker-workshop-by-rbk.pdf jhuhiuguigugyugamine17157
 
optimadata.nl-Comment exécuter Postgres sur Docker partie 3.pdf
optimadata.nl-Comment exécuter Postgres sur Docker partie 3.pdfoptimadata.nl-Comment exécuter Postgres sur Docker partie 3.pdf
optimadata.nl-Comment exécuter Postgres sur Docker partie 3.pdfPascal Ponzoni
 
Docker en Production (Docker Paris)
Docker en Production (Docker Paris)Docker en Production (Docker Paris)
Docker en Production (Docker Paris)Jérôme Petazzoni
 
optimadata.nl-Comment exécuter Postgres sur Docker partie 1.pdf
optimadata.nl-Comment exécuter Postgres sur Docker partie 1.pdfoptimadata.nl-Comment exécuter Postgres sur Docker partie 1.pdf
optimadata.nl-Comment exécuter Postgres sur Docker partie 1.pdfPascal Ponzoni
 
optimadata.nl-Comment exécuter Postgres sur Docker partie 2.pdf
optimadata.nl-Comment exécuter Postgres sur Docker partie 2.pdfoptimadata.nl-Comment exécuter Postgres sur Docker partie 2.pdf
optimadata.nl-Comment exécuter Postgres sur Docker partie 2.pdfPascal Ponzoni
 
Docker, ça mange quoi au printemps
Docker, ça mange quoi au printempsDocker, ça mange quoi au printemps
Docker, ça mange quoi au printempsJulien Maitrehenry
 
Julien Maitrehenry - Docker, ça mange quoi au printemps
Julien Maitrehenry - Docker, ça mange quoi au printempsJulien Maitrehenry - Docker, ça mange quoi au printemps
Julien Maitrehenry - Docker, ça mange quoi au printempsWeb à Québec
 
Support : introduction à docker
Support : introduction à dockerSupport : introduction à docker
Support : introduction à dockerBoubker ABERWAG
 
Geek Time Mars 2017 : Workshop Docker
Geek Time Mars 2017 : Workshop DockerGeek Time Mars 2017 : Workshop Docker
Geek Time Mars 2017 : Workshop DockerNizar GARRACHE
 
Docker nice meetup #1 construire, déployer et exécuter vos applications, ...
Docker nice meetup #1   construire, déployer et exécuter vos applications, ...Docker nice meetup #1   construire, déployer et exécuter vos applications, ...
Docker nice meetup #1 construire, déployer et exécuter vos applications, ...adri1s
 
Docker Tours Meetup #1 - Introduction à Docker
Docker Tours Meetup #1 - Introduction à DockerDocker Tours Meetup #1 - Introduction à Docker
Docker Tours Meetup #1 - Introduction à DockerThibaut Marmin
 
Hadoop MapReduce.docx
Hadoop  MapReduce.docxHadoop  MapReduce.docx
Hadoop MapReduce.docxIssamHamdi
 
A la découverte de docker, 2ème partie
A la découverte de docker, 2ème partieA la découverte de docker, 2ème partie
A la découverte de docker, 2ème partieSamuel Desseaux
 

Similaire à Tp docker-v21 (20)

5390997 Support formation : Construire et administrer vos conteneurs avec Doc...
5390997 Support formation : Construire et administrer vos conteneurs avec Doc...5390997 Support formation : Construire et administrer vos conteneurs avec Doc...
5390997 Support formation : Construire et administrer vos conteneurs avec Doc...
 
Docker, mais qu’est-ce que c’est ?
Docker, mais qu’est-ce que c’est ?Docker, mais qu’est-ce que c’est ?
Docker, mais qu’est-ce que c’est ?
 
A la découverte de docker
A la découverte de dockerA la découverte de docker
A la découverte de docker
 
Oxalide Workshop #4 - Docker, des tours dans le petit bassin
Oxalide Workshop #4 - Docker, des tours dans le petit bassinOxalide Workshop #4 - Docker, des tours dans le petit bassin
Oxalide Workshop #4 - Docker, des tours dans le petit bassin
 
Oxalide Workshop #4 - Docker, des tours dans le petit bassin
Oxalide Workshop #4 - Docker, des tours dans le petit bassinOxalide Workshop #4 - Docker, des tours dans le petit bassin
Oxalide Workshop #4 - Docker, des tours dans le petit bassin
 
docker-workshop-by-rbk.pdf jhuhiuguigugyug
docker-workshop-by-rbk.pdf jhuhiuguigugyugdocker-workshop-by-rbk.pdf jhuhiuguigugyug
docker-workshop-by-rbk.pdf jhuhiuguigugyug
 
optimadata.nl-Comment exécuter Postgres sur Docker partie 3.pdf
optimadata.nl-Comment exécuter Postgres sur Docker partie 3.pdfoptimadata.nl-Comment exécuter Postgres sur Docker partie 3.pdf
optimadata.nl-Comment exécuter Postgres sur Docker partie 3.pdf
 
Docker en Production (Docker Paris)
Docker en Production (Docker Paris)Docker en Production (Docker Paris)
Docker en Production (Docker Paris)
 
optimadata.nl-Comment exécuter Postgres sur Docker partie 1.pdf
optimadata.nl-Comment exécuter Postgres sur Docker partie 1.pdfoptimadata.nl-Comment exécuter Postgres sur Docker partie 1.pdf
optimadata.nl-Comment exécuter Postgres sur Docker partie 1.pdf
 
optimadata.nl-Comment exécuter Postgres sur Docker partie 2.pdf
optimadata.nl-Comment exécuter Postgres sur Docker partie 2.pdfoptimadata.nl-Comment exécuter Postgres sur Docker partie 2.pdf
optimadata.nl-Comment exécuter Postgres sur Docker partie 2.pdf
 
Docker, ça mange quoi au printemps
Docker, ça mange quoi au printempsDocker, ça mange quoi au printemps
Docker, ça mange quoi au printemps
 
Julien Maitrehenry - Docker, ça mange quoi au printemps
Julien Maitrehenry - Docker, ça mange quoi au printempsJulien Maitrehenry - Docker, ça mange quoi au printemps
Julien Maitrehenry - Docker, ça mange quoi au printemps
 
Support : introduction à docker
Support : introduction à dockerSupport : introduction à docker
Support : introduction à docker
 
Snort implementation
Snort implementationSnort implementation
Snort implementation
 
Geek Time Mars 2017 : Workshop Docker
Geek Time Mars 2017 : Workshop DockerGeek Time Mars 2017 : Workshop Docker
Geek Time Mars 2017 : Workshop Docker
 
Docker nice meetup #1 construire, déployer et exécuter vos applications, ...
Docker nice meetup #1   construire, déployer et exécuter vos applications, ...Docker nice meetup #1   construire, déployer et exécuter vos applications, ...
Docker nice meetup #1 construire, déployer et exécuter vos applications, ...
 
docker.pdf
docker.pdfdocker.pdf
docker.pdf
 
Docker Tours Meetup #1 - Introduction à Docker
Docker Tours Meetup #1 - Introduction à DockerDocker Tours Meetup #1 - Introduction à Docker
Docker Tours Meetup #1 - Introduction à Docker
 
Hadoop MapReduce.docx
Hadoop  MapReduce.docxHadoop  MapReduce.docx
Hadoop MapReduce.docx
 
A la découverte de docker, 2ème partie
A la découverte de docker, 2ème partieA la découverte de docker, 2ème partie
A la découverte de docker, 2ème partie
 

Tp docker-v21

  • 1. Simulation d’un cluster Hadoop en utilisant docker 1 Dans ce TP, nous allons déployer le framework Hadoop mais en utilisant des conteneurs Docker plutôt qu’une machine virtuelle. Cette méthode permettra de réduire la lourdeur d'exécution observée lors de l’utilisation des machines virtuelles. Ce TP est largement inspiré du Tutoriel et du TP disponibles aux urls suivantes : https://www.youtube.com/watch?v=PMQkrk8OEGk&list=PLl3CtU4THqPYFvrqtQ6v6aJOV3ZHM84jm&index=3 https://insatunisia.github.io/TP-BigData/tp1/ Grâce aux conteneurs Docker, nous allons pouvoir simuler le comportement d’un cluster hadoop. Pour ceci, nous définirons un mini-cluster : une machine Maître et deux machines Esclaves hébergées chacune dans un conteneur Docker. Ces machines pourront communiquer à travers un réseau qui les relie. Pour ce faire, nous utiliserons l’image Docker intitulée « spark-hadoop »disponible sur Docker Hub. Hadoop ainsi que plusieurs briques de son écosystème sont installés sur cette image. La première étape à effectuer afin de pouvoir exploiter les conteneurs Docker consiste bien évidemment à installer Docker sur votre machine. Afin de vérifier que Docker est bien installé ; taper sur l’invite de commande la commande Docker suivante : docker run hello-world Pour faire les manipulations nécessaires pour la mise en place du cluster Hadoop, nous utiliserons les commandes Docker. Afin de télécharger l’image Docker, taper : docker pull liliasfaxi/spark-hadoop:hv-2.7.2 Vérifier que l’image a bien été téléchargée en tapant : docker images Afin de créer le réseau et d’installer les 3 conteneurs du Master et des 2 Slaves à partir de l’image déjà téléchargée, taper les commandes suivantes : docker network create --driver=bridge hadoop docker run -itd --net=hadoop -p 9870: 9870-p 8088:8088 -p 7077:7077 -p 16010:16010 --name hadoop-master --hostname hadoop-master liliasfaxi/spark- hadoop:hv-2.7.2 docker run -itd -p 8040:8042 --net=hadoop --name hadoop-slave1 --hostname hadoop-slave1 liliasfaxi/spark-hadoop:hv-2.7.2 docker run -itd -p 8041:8042 --net=hadoop --name hadoop-slave2 --hostname hadoop-slave2 liliasfaxi/spark-hadoop:hv-2.7.2 Pour voir les conteneurs qui tournent, taper : docker ps Vous devriez trouver les trois conteneurs (1 Maître et deux Esclaves) déjà créés. Pour visualiser la liste de tous les conteneurs Docker disponibles, taper : docker ps -a Pour démarrer un conteneur Docker, il faudra taper : docker container start <id_container> ou docker start <nom container> Comme la seule machine qui reçoit les requêtes est la machine Master, il faudra donc taper la commande suivante pour pouvoir faire des manipulations sur HDFS : docker exec -it hadoop-master bash Une fois dans le shell du namenode, il faudra commencer par lancer hadoop et yarn en tapant : ./start-hadoop.sh