SlideShare une entreprise Scribd logo
1  sur  37
LOGO
Mise en place d’une
architecture BIG DATA basée
sur le Cloud computing
Société d’accueil : Innova-TUNISIA
Présentée par :
Hachem SELMI
Ahmed DRIDI
Sous l’encadrement de:
Houssem TAYARI(ISET)
Khaled MANSOURI(Innova)
Institut supérieur des études technologiques de
CHARGUIA
Année universitaire : 2014-2015
Conclusion
Réalisation
Architecture et choix technologiques
Big Data et cloud computing
Introduction
Plan
Présentation générale
Cadre du stage
Présentation générale
Divers sources d’informations
Données
massives
1
Présentation générale
2
98,000 comptes Twitter sont crées
695,000 statuts Facebook
11 millions messages instantanés
698,445 recherches sur Google
168 millions mails envoyés
Chaque
60
Secondes
Conclusion
Réalisation
Architecture et choix technologique
Big data et cloud computing
Introduction
Plan
Présentation générale
Cadre du stage
Introduction
3
Explosion de volume de l’information
La nécessité d’une nouvelle
technologie qui peut traiter un
grand volume de données.
Evolution des systèmes d’information des
entreprises
variété et complexité des données
BIG DATA
Conclusion
Réalisation
Architecture et Choix technologique
Big Data et cloud computing
Introduction
Plan
Présentation Générale
Cadre du stage
Cadre du stage
Organisme d’accueil
4
INNOVA-TUNISIA est un acteur
dynamique dans les métiers du
conseil et l’études systèmes
informatiques et internet.
Son équipe se compose du responsable développement, du
coordinateur communication chargé d’affaires, des programmeurs de
logiciels, des chefs de projets et du directeur général.
Depuis 2010, Innova Tunisia s’est spécialisée dans la veille et le
monitoring Internet avec un premier produit WebJort, puis en 2012
avec la solution WebRadar introduite sur le marché Tunisien.
Cadre du stage
Web Radar
5
Toutes les données publiques
Produites par la presse électronique, les réseaux
sociaux, les blogs, les forums
en temps réel
…qui collecte
Cadre du stage
WebRadar
6
…qui organise
par date, pays, ville, langue, média, sujet, thème,
personne, organisme, marque, sentiment,…
…qui mesure
fréquence, audience, crédibilité,
redondance, tonalité, influence, …
Cadre du stage
WebRadar
7
Cadre du stage
Critique de WebRadar
Des données …
Des données …
Des données…
DES DONNEES!!
8
Cadre du stage
Critique de WebRadar
Avec l’architecture actuelle de WebRadar avec la présence évolutive des
informations et données collectées, Innova rencontre plusieurs difficultés
pour stocker , traiter et analyser ces données!!!
9
Cadre du stage
Solution proposée
Des nouvelles approches
liées au concept de
l'informatique décisionnelle.
Une infrastructure dédiée à
l’analyse et le traitement
des données massives.
Architecture Big Data basée
sur le cloud computing.
10
Conclusion
Réalisation
Architecture et choix technologique
Big data et cloud computing
Cadre du stage
Plan
Introduction
Big data et cloud computing
C’est quoi la Big Data ?
Big Data
Vélocité
Volume
Variété
11
Big data et cloud computing
Décisionnel classique et big data
Décisionnel
classique
Volume limité
Données
structurés
Statistique
descriptive
Big Data
Volume
gigantesque
Données
structurés
Semi structurés
Hétérogènes
Statistique en
temps réel
12
Big data et cloud computing
C’est quoi le cloud computing ?
L’utilisation de la mémoire et des capacités de calcul et de
stockage d’ordinateurs et de serveurs répartis dans le monde, et
liés par un réseau ,tel Internet
13
Big data et cloud computing
Pourquoi ??????
Répartition
des
données
Récupération
des
données
14
Conclusion
Réalisation
Architecture et choix technologiques
Big data et cloud computing
Cadre du stage
Plan
Introduction
Architecture et choix technologiques
Ancienne architecture
15
Nouvelle architecture
16
Architecture et choix technologiques
Choix technologiques
17
Architecture et choix technologiques
Conclusion
Réalisation
Architecture et choix technologique
Big data et cloud computing
Cadre du stage
Plan
Introduction
Réalisation
L’infrastructure virtuelle
Création des machines virtuelles
Installation et configuration de
système d’exploitation Debian
Configuration d’un réseau LAN
Installation et configuration de
l’écosystème Hadoop
18
Réalisation
Configuration Hadoop
19
Réalisation
Migration Sql >>Sql
Importation des données de la base de données Mysql de WebRadar
vers la base de données Mysql existante dans notre cluster avec l’outil
Python.
20
Réalisation
Migration Sql >>Sql
21
Migration Sql >>NoSql
Réalisation
Migration des données de la base de données relationnel vers la base
de données Nosql (MongoDB) en utilisant l’outil Mongify
22
Réalisation
Migration Sql >>NoSql
23
Réalisation
Migration Sql >>NoSql
24
Migration Sql >>NoSql
Réalisation
25
Réalisation
Migration Sql >>NoSql
26
Réalisation
Réplication de données
La réplication de données après la migration Sql >> NoSql.
27
Réalisation
Réplication de données
28
Conclusion générale
Notre projet de fin d’étude est déroulé avec la découverte des nouvelles
technologies:
 La Big Data
 Cloud Computing
 Les bases de données Nosql
Le stage a été une bonne occasion pour intégrer des nouveaux concepts et
connaitre des nouvelles sources fiables.
LOGO
Merci pour votre
attention !

Contenu connexe

Tendances

Chp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleChp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleLilia Sfaxi
 
rapport PFE ingénieur génie logiciel INSAT
rapport PFE ingénieur génie logiciel INSATrapport PFE ingénieur génie logiciel INSAT
rapport PFE ingénieur génie logiciel INSATSiwar GUEMRI
 
BigData_TP1: Initiation à Hadoop et Map-Reduce
BigData_TP1: Initiation à Hadoop et Map-ReduceBigData_TP1: Initiation à Hadoop et Map-Reduce
BigData_TP1: Initiation à Hadoop et Map-ReduceLilia Sfaxi
 
Conception et réalisation d'une application de gestion intégrée au sein de la...
Conception et réalisation d'une application de gestion intégrée au sein de la...Conception et réalisation d'une application de gestion intégrée au sein de la...
Conception et réalisation d'une application de gestion intégrée au sein de la...Addi Ait-Mlouk
 
BigData_Chp4: NOSQL
BigData_Chp4: NOSQLBigData_Chp4: NOSQL
BigData_Chp4: NOSQLLilia Sfaxi
 
Cours Big Data Chap2
Cours Big Data Chap2Cours Big Data Chap2
Cours Big Data Chap2Amal Abid
 
Présentation PFE (Conception et développement d'une application web && mobile...
Présentation PFE (Conception et développement d'une application web && mobile...Présentation PFE (Conception et développement d'une application web && mobile...
Présentation PFE (Conception et développement d'une application web && mobile...Ramzi Noumairi
 
Rapport pfe Conceptionet Developpement d'une Application web et Mobile
Rapport pfe Conceptionet Developpement d'une Application web et  Mobile Rapport pfe Conceptionet Developpement d'une Application web et  Mobile
Rapport pfe Conceptionet Developpement d'une Application web et Mobile Raoua Bennasr
 
Rapport de projet de conception et de développement
Rapport de projet de conception et de développementRapport de projet de conception et de développement
Rapport de projet de conception et de développementDonia Hammami
 
RapportPFE_IngenieurInformatique_ESPRIT
RapportPFE_IngenieurInformatique_ESPRITRapportPFE_IngenieurInformatique_ESPRIT
RapportPFE_IngenieurInformatique_ESPRITLina Meddeb
 
Présentation Big Data DFCG
Présentation Big Data DFCGPrésentation Big Data DFCG
Présentation Big Data DFCGMicropole Group
 
Conception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseConception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseAbderrahmane Filali
 
GESTION ELECTRONIQUE DE DOCUMENT
GESTION ELECTRONIQUE DE DOCUMENTGESTION ELECTRONIQUE DE DOCUMENT
GESTION ELECTRONIQUE DE DOCUMENTSerge Wallas
 
Conception et réalisation d’un Système d’information des étudiants du départe...
Conception et réalisation d’un Système d’information des étudiants du départe...Conception et réalisation d’un Système d’information des étudiants du départe...
Conception et réalisation d’un Système d’information des étudiants du départe...Ilyas CHAOUA
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesLilia Sfaxi
 
Rapport- Conception et réalisation d'une plateforme social learning
Rapport- Conception et réalisation d'une plateforme social learningRapport- Conception et réalisation d'une plateforme social learning
Rapport- Conception et réalisation d'une plateforme social learningRouâa Ben Hammouda
 
rapport de projet de fin d'étude_PFE
rapport de projet de fin d'étude_PFErapport de projet de fin d'étude_PFE
rapport de projet de fin d'étude_PFEDonia Hammami
 
Pfe conception et développement d'une application web GMAO JEE
Pfe conception et développement d'une application web GMAO JEEPfe conception et développement d'une application web GMAO JEE
Pfe conception et développement d'une application web GMAO JEEOussama Djerba
 

Tendances (20)

Chp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleChp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation Multidimensionnelle
 
rapport PFE ingénieur génie logiciel INSAT
rapport PFE ingénieur génie logiciel INSATrapport PFE ingénieur génie logiciel INSAT
rapport PFE ingénieur génie logiciel INSAT
 
BigData_TP1: Initiation à Hadoop et Map-Reduce
BigData_TP1: Initiation à Hadoop et Map-ReduceBigData_TP1: Initiation à Hadoop et Map-Reduce
BigData_TP1: Initiation à Hadoop et Map-Reduce
 
Conception et réalisation d'une application de gestion intégrée au sein de la...
Conception et réalisation d'une application de gestion intégrée au sein de la...Conception et réalisation d'une application de gestion intégrée au sein de la...
Conception et réalisation d'une application de gestion intégrée au sein de la...
 
BigData_Chp4: NOSQL
BigData_Chp4: NOSQLBigData_Chp4: NOSQL
BigData_Chp4: NOSQL
 
Cours Big Data Chap2
Cours Big Data Chap2Cours Big Data Chap2
Cours Big Data Chap2
 
Présentation PFE
Présentation PFEPrésentation PFE
Présentation PFE
 
Présentation PFE (Conception et développement d'une application web && mobile...
Présentation PFE (Conception et développement d'une application web && mobile...Présentation PFE (Conception et développement d'une application web && mobile...
Présentation PFE (Conception et développement d'une application web && mobile...
 
Rapport pfe Conceptionet Developpement d'une Application web et Mobile
Rapport pfe Conceptionet Developpement d'une Application web et  Mobile Rapport pfe Conceptionet Developpement d'une Application web et  Mobile
Rapport pfe Conceptionet Developpement d'une Application web et Mobile
 
Rapport de projet de conception et de développement
Rapport de projet de conception et de développementRapport de projet de conception et de développement
Rapport de projet de conception et de développement
 
RapportPFE_IngenieurInformatique_ESPRIT
RapportPFE_IngenieurInformatique_ESPRITRapportPFE_IngenieurInformatique_ESPRIT
RapportPFE_IngenieurInformatique_ESPRIT
 
Présentation Big Data DFCG
Présentation Big Data DFCGPrésentation Big Data DFCG
Présentation Big Data DFCG
 
Conception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data WarehouseConception et Réalisation d'un Data Warehouse
Conception et Réalisation d'un Data Warehouse
 
Rapport PFE
Rapport PFERapport PFE
Rapport PFE
 
GESTION ELECTRONIQUE DE DOCUMENT
GESTION ELECTRONIQUE DE DOCUMENTGESTION ELECTRONIQUE DE DOCUMENT
GESTION ELECTRONIQUE DE DOCUMENT
 
Conception et réalisation d’un Système d’information des étudiants du départe...
Conception et réalisation d’un Système d’information des étudiants du départe...Conception et réalisation d’un Système d’information des étudiants du départe...
Conception et réalisation d’un Système d’information des étudiants du départe...
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
 
Rapport- Conception et réalisation d'une plateforme social learning
Rapport- Conception et réalisation d'une plateforme social learningRapport- Conception et réalisation d'une plateforme social learning
Rapport- Conception et réalisation d'une plateforme social learning
 
rapport de projet de fin d'étude_PFE
rapport de projet de fin d'étude_PFErapport de projet de fin d'étude_PFE
rapport de projet de fin d'étude_PFE
 
Pfe conception et développement d'une application web GMAO JEE
Pfe conception et développement d'une application web GMAO JEEPfe conception et développement d'une application web GMAO JEE
Pfe conception et développement d'une application web GMAO JEE
 

En vedette

2743557 dossier-ppe-robot-suiveur-de-ligne
2743557 dossier-ppe-robot-suiveur-de-ligne2743557 dossier-ppe-robot-suiveur-de-ligne
2743557 dossier-ppe-robot-suiveur-de-ligneAziz ShadowStokes
 
Présentation de la cnss et de son système de contrôle et d’inspection
Présentation de la cnss et de son système de contrôle et d’inspectionPrésentation de la cnss et de son système de contrôle et d’inspection
Présentation de la cnss et de son système de contrôle et d’inspectionSaid Mahmoudi
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataLilia Sfaxi
 
ROBOT à base d'Android - Présentation PFE
ROBOT à base d'Android - Présentation PFEROBOT à base d'Android - Présentation PFE
ROBOT à base d'Android - Présentation PFEHoussem Eddine LASSOUED
 
Réunion Visual Decision 2013 04 16
Réunion Visual Decision 2013 04 16Réunion Visual Decision 2013 04 16
Réunion Visual Decision 2013 04 16visual_decision
 
Estructura para la publicación de articulos revista de semilleros de investig...
Estructura para la publicación de articulos revista de semilleros de investig...Estructura para la publicación de articulos revista de semilleros de investig...
Estructura para la publicación de articulos revista de semilleros de investig...Katerin Johana Hernández Causil
 
Unidad 2
Unidad 2Unidad 2
Unidad 2rgemelo
 
Office 365, retour client ! - 2SeeU
Office 365, retour client ! - 2SeeUOffice 365, retour client ! - 2SeeU
Office 365, retour client ! - 2SeeUJoris Faure
 
Présentation Cityzeo
Présentation CityzeoPrésentation Cityzeo
Présentation CityzeoCityzeo
 
PDJ_EDinstitut_Mai_2010
PDJ_EDinstitut_Mai_2010PDJ_EDinstitut_Mai_2010
PDJ_EDinstitut_Mai_2010EDinstitut
 
Travail en classe
Travail en classeTravail en classe
Travail en classelililou44
 
D:\ë§tîlø§ dé mü§îçå[o.p.d.]
D:\ë§tîlø§ dé mü§îçå[o.p.d.]D:\ë§tîlø§ dé mü§îçå[o.p.d.]
D:\ë§tîlø§ dé mü§îçå[o.p.d.]ozma112
 
Leidy xiomara macias quintero
Leidy xiomara macias quinteroLeidy xiomara macias quintero
Leidy xiomara macias quinteroxiomara012
 

En vedette (20)

2743557 dossier-ppe-robot-suiveur-de-ligne
2743557 dossier-ppe-robot-suiveur-de-ligne2743557 dossier-ppe-robot-suiveur-de-ligne
2743557 dossier-ppe-robot-suiveur-de-ligne
 
Présentation de la cnss et de son système de contrôle et d’inspection
Présentation de la cnss et de son système de contrôle et d’inspectionPrésentation de la cnss et de son système de contrôle et d’inspection
Présentation de la cnss et de son système de contrôle et d’inspection
 
Etude sur le Big Data
Etude sur le Big DataEtude sur le Big Data
Etude sur le Big Data
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big Data
 
ROBOT à base d'Android - Présentation PFE
ROBOT à base d'Android - Présentation PFEROBOT à base d'Android - Présentation PFE
ROBOT à base d'Android - Présentation PFE
 
Cómic 6
Cómic 6Cómic 6
Cómic 6
 
Réunion Visual Decision 2013 04 16
Réunion Visual Decision 2013 04 16Réunion Visual Decision 2013 04 16
Réunion Visual Decision 2013 04 16
 
Estructura para la publicación de articulos revista de semilleros de investig...
Estructura para la publicación de articulos revista de semilleros de investig...Estructura para la publicación de articulos revista de semilleros de investig...
Estructura para la publicación de articulos revista de semilleros de investig...
 
Portafolio
PortafolioPortafolio
Portafolio
 
Terremoto
TerremotoTerremoto
Terremoto
 
Unidad 2
Unidad 2Unidad 2
Unidad 2
 
Ud alimentation
Ud alimentationUd alimentation
Ud alimentation
 
Salidas profesionales
Salidas profesionalesSalidas profesionales
Salidas profesionales
 
Office 365, retour client ! - 2SeeU
Office 365, retour client ! - 2SeeUOffice 365, retour client ! - 2SeeU
Office 365, retour client ! - 2SeeU
 
Passe composé
Passe composéPasse composé
Passe composé
 
Présentation Cityzeo
Présentation CityzeoPrésentation Cityzeo
Présentation Cityzeo
 
PDJ_EDinstitut_Mai_2010
PDJ_EDinstitut_Mai_2010PDJ_EDinstitut_Mai_2010
PDJ_EDinstitut_Mai_2010
 
Travail en classe
Travail en classeTravail en classe
Travail en classe
 
D:\ë§tîlø§ dé mü§îçå[o.p.d.]
D:\ë§tîlø§ dé mü§îçå[o.p.d.]D:\ë§tîlø§ dé mü§îçå[o.p.d.]
D:\ë§tîlø§ dé mü§îçå[o.p.d.]
 
Leidy xiomara macias quintero
Leidy xiomara macias quinteroLeidy xiomara macias quintero
Leidy xiomara macias quintero
 

Similaire à Présentation PFE Hachem Selmi et Ahmed Dridi Big data

Cloud computing
Cloud computingCloud computing
Cloud computingvcoulombe
 
Petit-déjeuner OCTO Technology : Calculez vos indicateurs en temps réel ave...
Petit-déjeuner OCTO Technology :  Calculez vos indicateurs en temps réel ave...Petit-déjeuner OCTO Technology :  Calculez vos indicateurs en temps réel ave...
Petit-déjeuner OCTO Technology : Calculez vos indicateurs en temps réel ave...OCTO Technology
 
Baina bigdata le futur eldorado
Baina bigdata le futur eldoradoBaina bigdata le futur eldorado
Baina bigdata le futur eldoradoKarim Baïna
 
L'entreprise et la Réingénierie Informatique dans le Cloud Computing
L'entreprise et la Réingénierie Informatique dans le Cloud ComputingL'entreprise et la Réingénierie Informatique dans le Cloud Computing
L'entreprise et la Réingénierie Informatique dans le Cloud ComputingNounou Alioui
 
De nouvelles plateformes technologiques pour les CLOM
De nouvelles plateformes technologiques pour les CLOMDe nouvelles plateformes technologiques pour les CLOM
De nouvelles plateformes technologiques pour les CLOMClaude Coulombe
 
Projet sur le Cloud Computing
Projet sur le Cloud ComputingProjet sur le Cloud Computing
Projet sur le Cloud ComputingTsubichi
 
Groupe Cyrès
Groupe Cyrès Groupe Cyrès
Groupe Cyrès Cyrès
 
Introduction au Cloud Computing
Introduction au Cloud ComputingIntroduction au Cloud Computing
Introduction au Cloud ComputingMarc Rousselet
 
La Data Virtualization par Orano : cas d'usage à la Hague et démo de Denodo
La Data Virtualization par Orano : cas d'usage à la Hague et démo de DenodoLa Data Virtualization par Orano : cas d'usage à la Hague et démo de Denodo
La Data Virtualization par Orano : cas d'usage à la Hague et démo de DenodoDenodo
 
Extranet communautaire #cloud
Extranet communautaire #cloudExtranet communautaire #cloud
Extranet communautaire #cloudEric Herschkorn
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data VirtualizationDenodo
 
Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDenodo
 
Les clés de succès pour moderniser votre architecture de données en 2022
Les clés de succès pour moderniser votre architecture de données en 2022Les clés de succès pour moderniser votre architecture de données en 2022
Les clés de succès pour moderniser votre architecture de données en 2022Denodo
 
Edge Datacenters : préparez-vous à un monde où tout devient intelligent
Edge Datacenters : préparez-vous à un monde où tout devient intelligentEdge Datacenters : préparez-vous à un monde où tout devient intelligent
Edge Datacenters : préparez-vous à un monde où tout devient intelligentJoanna Kempa
 
Qu'est-ce que le cloud ?
Qu'est-ce que le cloud ?Qu'est-ce que le cloud ?
Qu'est-ce que le cloud ?Vincent Misson
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data VirtualizationDenodo
 
Parcours de formations DATA ACADEMY
Parcours de formations DATA ACADEMYParcours de formations DATA ACADEMY
Parcours de formations DATA ACADEMYTechnofutur TIC
 

Similaire à Présentation PFE Hachem Selmi et Ahmed Dridi Big data (20)

Cloud computing
Cloud computingCloud computing
Cloud computing
 
Petit-déjeuner OCTO Technology : Calculez vos indicateurs en temps réel ave...
Petit-déjeuner OCTO Technology :  Calculez vos indicateurs en temps réel ave...Petit-déjeuner OCTO Technology :  Calculez vos indicateurs en temps réel ave...
Petit-déjeuner OCTO Technology : Calculez vos indicateurs en temps réel ave...
 
Iot & cloud
Iot & cloudIot & cloud
Iot & cloud
 
Baina bigdata le futur eldorado
Baina bigdata le futur eldoradoBaina bigdata le futur eldorado
Baina bigdata le futur eldorado
 
L'entreprise et la Réingénierie Informatique dans le Cloud Computing
L'entreprise et la Réingénierie Informatique dans le Cloud ComputingL'entreprise et la Réingénierie Informatique dans le Cloud Computing
L'entreprise et la Réingénierie Informatique dans le Cloud Computing
 
De nouvelles plateformes technologiques pour les CLOM
De nouvelles plateformes technologiques pour les CLOMDe nouvelles plateformes technologiques pour les CLOM
De nouvelles plateformes technologiques pour les CLOM
 
Projet sur le Cloud Computing
Projet sur le Cloud ComputingProjet sur le Cloud Computing
Projet sur le Cloud Computing
 
Groupe Cyrès
Groupe Cyrès Groupe Cyrès
Groupe Cyrès
 
Introduction au Cloud Computing
Introduction au Cloud ComputingIntroduction au Cloud Computing
Introduction au Cloud Computing
 
La Data Virtualization par Orano : cas d'usage à la Hague et démo de Denodo
La Data Virtualization par Orano : cas d'usage à la Hague et démo de DenodoLa Data Virtualization par Orano : cas d'usage à la Hague et démo de Denodo
La Data Virtualization par Orano : cas d'usage à la Hague et démo de Denodo
 
Extranet communautaire #cloud
Extranet communautaire #cloudExtranet communautaire #cloud
Extranet communautaire #cloud
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data Virtualization
 
Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data Virtualization
 
Les clés de succès pour moderniser votre architecture de données en 2022
Les clés de succès pour moderniser votre architecture de données en 2022Les clés de succès pour moderniser votre architecture de données en 2022
Les clés de succès pour moderniser votre architecture de données en 2022
 
Edge Datacenters : préparez-vous à un monde où tout devient intelligent
Edge Datacenters : préparez-vous à un monde où tout devient intelligentEdge Datacenters : préparez-vous à un monde où tout devient intelligent
Edge Datacenters : préparez-vous à un monde où tout devient intelligent
 
Qu'est-ce que le cloud ?
Qu'est-ce que le cloud ?Qu'est-ce que le cloud ?
Qu'est-ce que le cloud ?
 
Cloud club alliances
Cloud club alliancesCloud club alliances
Cloud club alliances
 
Session découverte de la Data Virtualization
Session découverte de la Data VirtualizationSession découverte de la Data Virtualization
Session découverte de la Data Virtualization
 
Cloud Computing
Cloud ComputingCloud Computing
Cloud Computing
 
Parcours de formations DATA ACADEMY
Parcours de formations DATA ACADEMYParcours de formations DATA ACADEMY
Parcours de formations DATA ACADEMY
 

Présentation PFE Hachem Selmi et Ahmed Dridi Big data

Notes de l'éditeur

  1. Bonjour, Nous tenons pour commencer à vous adresser, chers membres du jury, nos sincères remerciements pour votre lecture, votre présence aujourd’hui et les remarques qui viendront enrichir ce travail que nous aurons plaisir à partager et discuter avec vous.
  2. Tout au long de cette présentation on va suivre le plan suivant, On va commencer par une présentation générale puis on va introduire notre projet Ensuite on va présenter l’organisme d’accueil ainsi qu’une étude de cadre du stage Puis on va définir le concept de big data et cloud computing Apres ca on va entamer les parties Architecture et les technologies qu’on a choisi , et dans la partie qui suit on va mettre l’accent sur la réalisation de notre architecture et on va finir par une conlusion .
  3. Aujourd’hui les données ouvrent de nouvelles perspectives de connaissances aux sciences économiques et sociales et fournissent une autre forme de création de valeur aux entreprise. Les sources de données peuvent être de forme très diverse tel que media sociaux , image ,bases de données messageries journaux électrique aussi des capteurs et des caméra de surveillance et des saigneux GPS. cette diversité de source de données peut générer plusieurs type de données -structurées -semi structurées -non structurées
  4. Chaque 60 secondes : 98,000 comptes Twitter sont crées 695,000 statut Facebook 11 million messages instantanés 698,445 recherche sur Google 168 million mail envoyés Avec une prévision d’une croissance de 800% des quantités de données à traiter d’ici à 5 ans.
  5. Dans nos jours, on remarque une Explosion de volume de l’information et une Evolution des systèmes d’information des entreprises ainsi que une variété et la complexité des données, tous ces facteurs nous poussent pour trouver une nouvelle technologie nommée: Big data afin de traiter toutes ces masses de volumes.
  6. Nous sommes accueillis pendant notre projet de fin d’études chez Innova-tunisia, un acteur dynamique dans les métiers de conseils et des systemes informatiques et internet.
  7. Dans ce cadre, webradar est une application de media-monitoring qui surveille en Tunisie près de 100 journaux électroniques, 1500 pages Facebook, 2000 utilisateurs Twitter, 500
  8. Voila un exemple d’une analyse du web tunisien pour montrer les personnes les plus mentionnées par les utilisateurs de facebook En 2013.
  9. Innova rencontre souvent des problèmes liés a son produit WebRadar qui est accablé par la masse très élevée des données collectées quotidiennement du web.
  10. Nos recherches se sont donc dirigee vers l'etude
  11. La big data est une nouvelle technologie libérée par le volume de donnée accessible, la capacité à exploiter la variété des données la vélocité de traitement
  12. Voila une comparaison entre l’informatique décisionnel et le big data
  13. L’architecture actuelle se compose essentiellement par trois serveurs connectés entre eux. Les outils logiciels nécessaires pour le fonctionnement du WebRadar sont également installés et configurés sur les trois serveurs de sorte que lorsque un service fonctionne tous les autres services seront non utilisés ou ils ne répondent pas convenablement. Ainsi, une modification dans une base de données de volume important peut interrompre le fonctionnement de toute l’architecture.
  14. Afin de lutter contre les inconvénients de l’architecture actuelle on a proposé une nouvelle pour répondre aux besoin de l’outil WebRadar Ce cluster est constitué de postes standards équipés de système d'exploitation Debian ce qui nous a permis de tester la virtualisation du cluster, solution incontournable pour faire du Big Data sur le cloud. Ce schéma présente les différentes machines (maître et esclave) du cluster et les rôles qui leurs sont associés dans le cadre de notre architecture.
  15. On a choisi des différentes technologies pour les utilisées dans notre architecture comme VmWare qu’il nous a permis de tester la virtualisation de cluster avec le système d ’exploitation debian 7,8 Et mongoDB qui est un SGBD orientée NoSql caractérisé par sa rapidité Et MongiFy qui est un outil de migration des données de l’Sql vers le NoSql Et Hadoop qui va jouer le rôle d’analyse des données collectées et qui va simuler toutes les machines virtuelles comme étant une seule machine.
  16. La premiere étape dans la partie réalisation consiste a la …
  17. Afin de préparer le processus que inova va le suivre pour la migration de la solution WebRadar on a installé et configuré l’écosystème hadoop qui va jouer le rôle d’analyse des données collectées et qui va simuler toutes les machines virtuelles comme étant une seule machine.
  18. Comme vous connaissez Mysql ne supporte pas l’import d’une base de données qui possède une taille > à 2mo donc pour migré les données de la base de donnée de l’ancienne architecture du WebRadar vers notre nouvelle architecture on a utiliser l’outil Python et sql object pour qu’on puisse importer des bases de données de grande tailles
  19. Et voila l’exemple de migration
  20. Pour traduire notre base de données vers le NoSql nous aurons besoin de deux choses
  21. Un fichier de configuration de bases de données utilisé par Mongify pour localiser les connexions à la base de donnée sql et mongoDb
  22. Là on trouve que les connexions sont établies avec succées
  23. Et un autre fichier de traduction des données utilisée pour traduire nos données SQL avant de les enregistrer dans MongoDB
  24. Une fois que les données sont traduites dans le fichier de traduction de mongify on déplace les données vers MongoDB avec la commande process de mongify
  25. Après la migration de données vers le noSql l’étape suivante consiste à répliquer les données sous la formes d’un instance master et des instance slave
  26. Apres les configurations nécessaires pour l’instance master et l’instance Slave on a passer pour tester la réplication en ajoutant un enregistrement dans la base de données imdb dans la table aka_name, apres on lance l’instance slave et on affiche les enregistrement de aka_name on remarque l’ajout de l’enregistrement. Comme ça on a arrivé a dupliquer les données sur toutes les machines pour qu’on puisse les récupérer lors d’une perte.