Présentation PFE Hachem Selmi et Ahmed Dridi Big data

LOGO
Mise en place d’une
architecture BIG DATA basée
sur le Cloud computing
Société d’accueil : Innova-TUNISIA
Présentée par :
Hachem SELMI
Ahmed DRIDI
Sous l’encadrement de:
Houssem TAYARI(ISET)
Khaled MANSOURI(Innova)
Institut supérieur des études technologiques de
CHARGUIA
Année universitaire : 2014-2015

Conclusion
Réalisation
Architecture et choix technologiques
Big Data et cloud computing
Introduction
Plan
Présentation générale
Cadre du stage

Divers sources d’informations
Données
massives
1

2
98,000 comptes Twitter sont crées
695,000 statuts Facebook
11 millions messages instantanés
698,445 recherches sur Google
168 millions mails envoyés
Chaque
60
Secondes

Conclusion
Réalisation
Architecture et choix technologique
Big data et cloud computing
Introduction
Plan
Cadre du stage

Introduction
3
Explosion de volume de l’information
La nécessité d’une nouvelle
technologie qui peut traiter un
grand volume de données.
Evolution des systèmes d’information des
entreprises
variété et complexité des données
BIG DATA

Conclusion
Réalisation
Architecture et Choix technologique
Big Data et cloud computing
Introduction
Plan
Présentation Générale
Cadre du stage

Cadre du stage
Organisme d’accueil
4
INNOVA-TUNISIA est un acteur
dynamique dans les métiers du
conseil et l’études systèmes
informatiques et internet.
Son équipe se compose du responsable développement, du
coordinateur communication chargé d’affaires, des programmeurs de
logiciels, des chefs de projets et du directeur général.
Depuis 2010, Innova Tunisia s’est spécialisée dans la veille et le
monitoring Internet avec un premier produit WebJort, puis en 2012
avec la solution WebRadar introduite sur le marché Tunisien.

Cadre du stage
Web Radar
5
Toutes les données publiques
Produites par la presse électronique, les réseaux
sociaux, les blogs, les forums
en temps réel
…qui collecte

Cadre du stage
WebRadar
6
…qui organise
par date, pays, ville, langue, média, sujet, thème,
personne, organisme, marque, sentiment,…
…qui mesure
fréquence, audience, crédibilité,
redondance, tonalité, influence, …

Cadre du stage
Critique de WebRadar
Des données …
Des données …
Des données…
DES DONNEES!!
8

Cadre du stage
Critique de WebRadar
Avec l’architecture actuelle de WebRadar avec la présence évolutive des
informations et données collectées, Innova rencontre plusieurs difficultés
pour stocker , traiter et analyser ces données!!!
9

Cadre du stage
Solution proposée
Des nouvelles approches
liées au concept de
l'informatique décisionnelle.
Une infrastructure dédiée à
l’analyse et le traitement
des données massives.
Architecture Big Data basée
sur le cloud computing.
10

Conclusion
Réalisation
Architecture et choix technologique
Cadre du stage
Plan
Introduction

C’est quoi la Big Data ?
Big Data
Vélocité
Volume
Variété
11

Décisionnel classique et big data
Décisionnel
classique
Volume limité
Données
structurés
Statistique
descriptive
Big Data
Volume
gigantesque
Données
structurés
Semi structurés
Hétérogènes
Statistique en
temps réel
12

C’est quoi le cloud computing ?
L’utilisation de la mémoire et des capacités de calcul et de
stockage d’ordinateurs et de serveurs répartis dans le monde, et
liés par un réseau ,tel Internet
13

Pourquoi ??????
Répartition
des
données
Récupération
des
données
14

Conclusion
Réalisation
Cadre du stage
Plan
Introduction

Ancienne architecture
15

Nouvelle architecture
16

Choix technologiques
17

Réalisation
L’infrastructure virtuelle
Création des machines virtuelles
Installation et configuration de
système d’exploitation Debian
Configuration d’un réseau LAN
Installation et configuration de
l’écosystème Hadoop
18

Réalisation
Configuration Hadoop
19

Réalisation
Migration Sql >>Sql
Importation des données de la base de données Mysql de WebRadar
vers la base de données Mysql existante dans notre cluster avec l’outil
Python.
20

Réalisation
Migration Sql >>Sql
21

Migration Sql >>NoSql
Réalisation
Migration des données de la base de données relationnel vers la base
de données Nosql (MongoDB) en utilisant l’outil Mongify
22

Réalisation
23

Réalisation
24

Réalisation
25

Réalisation
26

Réalisation
Réplication de données
La réplication de données après la migration Sql >> NoSql.
27

Réalisation
Réplication de données
28

Conclusion générale
Notre projet de fin d’étude est déroulé avec la découverte des nouvelles
technologies:
 La Big Data
 Cloud Computing
 Les bases de données Nosql
Le stage a été une bonne occasion pour intégrer des nouveaux concepts et
connaitre des nouvelles sources fiables.

LOGO
Merci pour votre
attention !

Présentation PFE Hachem Selmi et Ahmed Dridi Big data

Recommandé

Recommandé

Contenu connexe

Tendances

Tendances (20)

En vedette

En vedette (20)

Similaire à Présentation PFE Hachem Selmi et Ahmed Dridi Big data

Similaire à Présentation PFE Hachem Selmi et Ahmed Dridi Big data (20)

Présentation PFE Hachem Selmi et Ahmed Dridi Big data

Notes de l'éditeur