SlideShare une entreprise Scribd logo
INTRODUCTION DU SUJET
AIT EL MOUDEN Zakariyaa
Définition
 Les big data, littéralement les « grosses données »,
ou mégadonnées, désignent des ensembles de données qui
deviennent tellement volumineux qu'ils en deviennent
difficiles à travailler avec des outils classiques de gestion
de base de données ou de gestion de l'information.
-wikipédia-
2
D’où vient les données ?
 Les applications et les services professionnels:
- ERP ’Entreprise Resource planning’
en français « progiciel de gestion intégré » (PGI) : Ce type de
logiciel correspond, pour une organisation, au support de base
capable d'assurer une « gestion intégrée», définie comme étant
l'interconnexion et l'intégration de l'ensemble des fonctions de
l'entreprise dans un système informatique centralisé (et
généralement configuré selon le mode client-serveur).
Les sources de production des données :
3
- CRM ’Customer Relationship Management’
en français « La gestion de la relation client » (GRC) : est l'ensemble
des outils et techniques destinés à capter, traiter, analyser les
informations relatives aux clients et aux prospects, dans le but de les
fidéliser en leur offrant le meilleur service
- SCM ‘supply chain management’
en français «gestion de la chaîne logistique» (GCL)
vise à garantir l'organisation et la qualité du service logistique en
conformité avec les dispositions figurant au cahier des charges
logistique.
- les outils de production de contenu et de bureautique (série
office) ou les intranets, etc.
Les sources de production des données : (suite)
4
 Le Web
En utilisant le Web, Les entreprises et les organisations créent
un volume considérable de données (sites d’actualités, e-
commerce, publicités … )
Avec l’utilisation des moteurs de recherche et les annuaires
dans le web, le nombre des données crées est de plus en plus
innombrables.
"Nous créons actuellement en deux jours autant d'information
que nous en avions créée depuis la naissance de la civilisation
jusqu'en 2003".
rappelait récemment Eric Schmidt, Chairman de Google.
Les sources de production des données : (suite)
5
 Les Media sociaux
Avec le développement des outils d’expression (le Web 2.0) ces
dix dernières années, le volume des données produites à eu une
croissance phénoménale.
exemples :
Réseaux sociaux : facebook, twitter, youtube, etc
Plateformes de partage : SlideShare, Flickr, Instagram, etc
Statistique :
Chaque minute, plus de 30 heures de vidéo sont uploadées sur
YouTube, 2 millions de posts sont publiés sur Facebook et
100.000 tweets diffusés sur Twitter.
Les sources de production des données : (suite)
6
 Le Mobile
Avec l’évolution du mobile, et l’apparition du ‘smartphone’, Le
téléphone mobile est devenu une source respectable de
production des données.
Les statistiques prouvent qu’ il y a actuellement 4 fois plus de
téléphone mobiles en usage que des ordinateurs et tablettes.
Statistique :
A la fin 2013, l'App Store de Apple et Google Play auront
dépassé les 50 milliards d'applications téléchargées.
Les sources de production des données : (suite)
7
 Internet des objets (IdO)
en anglais « Internet Of Things » (IoT)
un réseau qui permet, via des systèmes d’identification
électronique normalisés et sans fil, d’identifier et de
communiquer numériquement avec des objets physiques afin de
pouvoir mesurer et échanger des données entre les mondes
physiques et virtuels.
L'internet des objets est considéré comme la troisième
évolution de l'Internet, baptisée Web 3.0
Les sources de production des données : (suite)
8
Les catégories des données
 Données Structurées
les informations structurées sont disposées de façon à être traitées
automatiquement et efficacement par un logiciel, mais non
nécessairement par un humain.
La ligne de code Java : int salaire = 6000; String nom=« Ali";
est un exemple simple d’informations structurées ,nous connaissons
les valeurs, dont le nom est associé à la fonction. Nous pouvons ici
supposer que le nom de l’individu est Jean et que son salaire est de
6 000 Dh.
Par opposition, la chaîne de caractères « Ali gagne un salaire de
60 000 dirhams » n’est pas structurée, car nous ne pouvons nous
attendre à ce qu’un logiciel puisse lire et comprendre une phrase
écrite en français.
9
Les catégories des données (suite)
 Le plus souvent, nous disposons les informations structurées
dans des tableaux, comme dans une base de données
relationnelle
Nom Salaire
Ali 6000
Mohammed 7000
10
Les catégories des données (suite)
 Les données non structurées
Il est impossible de tout stocker sous la forme d’informations
structurées (p. ex. lettres, courriels, livres, rapports, collections
d’images ou de vidéos, brevets, images satellites, offres de service
et CV, appels d’offre). Il s’agit pourtant d’informations que les
organisations doivent traiter.
 Les big data sont généralement des données semi structurées.
11
Les dimensions du BIG DATA
Les
dimensions
du big data
Volume
Vitesse
Variété
Véracité
Visibilité
Valeur
12
 Le Volume : Le premier concept qui intervient dans la notion
du big data, données en petabyte( 1015 bytes )
 La Vitesse : Analyse et exploitation des données en temps réel.
 La Variété : Les données sont non structurées, et de plus sont de
formats différents (images, texte, sons, vidéos , etc.)
 La Valeur : Les données concernées sont de valeur importante
dans l’entreprise.
Les 4v principaux
13
Pourquoi la notion du big data est
récente ?
 L’expression « Big data » fait finalement son apparition en
octobre 1997 dans la bibliothèque numérique de l’ACM*, au sein
d’articles scientifiques qui pointent du doigt les défis
technologiques à visualiser les « grands ensembles de données ».
Le Big data est né, et avec lui ses nombreux défis..
*Association For Computing Machinery, association américaine à but non
lucratif fondée en 1947 et vouée à l’informatique. Sa bibliothèque
numérique est particulièrement riche quand il s’agit de retracer l’histoire
de la discipline.
14
Facteurs de naissance du Big data
 Le cout du stockage : Ce concept n’est plus un problème majeur
pour les entreprises avec l’apparition du Cloud Computing.
 Réseaux à très haut débit (THD) : Le stockage des données dans
des serveurs distants n’est pas une vrai solution sans un réseau
hait débit pour atteindre ces données avec une transparence à la
localisation.
 Evolution des technologie de gestion et d’analyse des données :
Analyse et gestion en temps réel
15
Usages des Big Data
 Optimisation
Optimisation du temps de calcul, recherche, traitement des
données, etc.
exemple:
Une société de de fabrication d’éoliennes nommée Vestas ,
utilise les ‘ big data analytics ’ d’IBM pour décider la localisation
d’éoliennes en optimisant le temps de traitement des données
variées et non structurées (données météorologiques et géo
spatiales, des images satellites, etc. )
>> résultat fournit en quelques heures, au lieu des études qui
prennent des semaines sur terrain.
16
 Tracer et cibler
Les big data permettent d’analyser la situation et le contexte de
millier de personnes en temps réel.
Application : (big data dans l’aéroport)
les passagers doivent obligatoirement passer un certain
nombre de tests de sécurité (ce qui génère du stress, des temps
d’attente).
Une application de géolocalisation dans l’aéroport pourrait
offrir aux passagers, en retour de leurs données émises, un guide
interactif du lieu, des informations sur les temps d’attente aux
différents postes de sécurité, sur les horaires des vols et portes
d’embarquement, alors ils peuvent exploiter leurs temps
d’attente dans des boutiques ou des restaurants, etc.
17
Usages des Big Data (suite)
Usages des Big Data (suite)
 Prévoir et prédire
L’analyse prédictive permet de faire des projections ultra
réalistes pour identifier des nouvelles sources d’opportunités (ou
des menaces) et ainsi anticiper les réponses adaptées à la
situation réelle.
Exemple :
‘Flu Trends’ est un modèle de Google qui permet d’estimer la
propagation des cas réels de grippe en fonction des recherches
sur Internet, prenant en compte le fait que tous les internautes
qui tapent « grippe » sur leur clavier ne sont pas nécessairement
malades.
 Automobile et Autres usages …
18
Visualisation des données
 Pourquoi on visualise les données ?
‘’ Une image (data visualisation) vaut mieux qu'un long (big)
discours (data) ‘’
Une visualisation intelligente et utilisable des analytics sont un
facteur clé dans le déploiement du Big Data dans les entreprises.
Le développement des infographies va d'ailleurs de pair avec le
développement des techniques d'exploitation des données.
19
Visualisation des données (suite)
La visualisation des big data permet :
 La prise de décision
Une Data Visualisation de qualité donnera aux managers le
moyen de manipuler de larges volumes de données pour faire
émerger des tendances, ou encore répondre à des questions
spécifiques.
Grâce à des outils de comparaison et de croisement dynamiques,
les managers peuvent faire apparaître des informations perdues
sous le flot de données, qui ne peuvent se révéler qu’après avoir
été visualisées.
20
Visualisation des données (suite)
 se concentrer sur l’essentiel, plus rapidement
La principale raison pour laquelle la Data Visualisation est
demandée par les entreprises est la confusion qui accompagne la
surcharge de données : celles-ci sont éparpillées dans des feuilles
de calculs, des bases de données, des espaces de stockages… Leur
interprétation devient difficile. A l’inverse, le but de la Data
Visualisation va à l’essentiel en regroupant toutes ces données
sur un seul écran, et en les traitant intelligemment grâce à des
filtres, des groupes et des classements pertinents.
21
Visualisation des données (suite)
22
Exemple :
 Fichier visualisé :
Les misérables de Victor Hugo
 Nombre de nœuds : 77
 Nombre des liens : 254
 Algorithme de spatialisation :
Force Atlas
 Outil de visualisation :
Gephi 0.8.1
Visualisation des données (suite)
 Même fichier avec d’autres algorithmes de spatialisation :
23
Fruchterman-Reingold Force Atlas 2
Conclusion
 Avec la notion du big data, les problèmes volume des
données, variance, hétérogénéité, le temps d’analyse
des données et plein d’autres problèmes ne sont plus
de la même complexité qu’avant. C’est la nouvelle
génération des données.
24
Références
 www.wiki.gephi.org
 www.awt.be
 http://physicsbjj.perso.sfr.fr/
 www.wikipedia.org
 le big data, Christophe de Maistre
25
Chapitre suivant :
Algorithmes de spatialisation

Contenu connexe

Tendances

BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big Data
Lilia Sfaxi
 
Chapitre 2 hadoop
Chapitre 2 hadoopChapitre 2 hadoop
Chapitre 2 hadoop
Mouna Torjmen
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
Lilia Sfaxi
 
Big Data... Big Analytics à travers les âges, les industries et les technologies
Big Data... Big Analytics à travers les âges, les industries et les technologiesBig Data... Big Analytics à travers les âges, les industries et les technologies
Big Data... Big Analytics à travers les âges, les industries et les technologies
Hassan Lâasri
 
TP1 Big Data - MapReduce
TP1 Big Data - MapReduceTP1 Big Data - MapReduce
TP1 Big Data - MapReduce
Amal Abid
 
Chapitre i-intro
Chapitre i-introChapitre i-intro
Chapitre i-intro
WaelKhemakhem
 
Big data
Big dataBig data
Big data
Yosra ADDALI
 
BigData_TP1: Initiation à Hadoop et Map-Reduce
BigData_TP1: Initiation à Hadoop et Map-ReduceBigData_TP1: Initiation à Hadoop et Map-Reduce
BigData_TP1: Initiation à Hadoop et Map-Reduce
Lilia Sfaxi
 
BigData_Chp5: Putting it all together
BigData_Chp5: Putting it all togetherBigData_Chp5: Putting it all together
BigData_Chp5: Putting it all together
Lilia Sfaxi
 
BigData_Chp3: Data Processing
BigData_Chp3: Data ProcessingBigData_Chp3: Data Processing
BigData_Chp3: Data Processing
Lilia Sfaxi
 
Introduction au big data
Introduction au big dataIntroduction au big data
Introduction au big data
Abdelghani Azri
 
Big data et le marketing
Big data et le marketingBig data et le marketing
Big data et le marketing
Khaled Fayala
 
DataWarehouse
DataWarehouseDataWarehouse
DataWarehouse
nzuguem
 
Big Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendancesBig Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendances
Jean-Michel Franco
 
Projet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesProjet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de données
Jean-Marc Dupont
 
Cours Big Data Part I
Cours Big Data Part ICours Big Data Part I
Cours Big Data Part I
Mohamed Faïçal ESSALIFI
 
Introduction à la big data v3
Introduction à la big data v3 Introduction à la big data v3
Introduction à la big data v3
Mehdi TAZI
 
Partie2BI-DW2019
Partie2BI-DW2019Partie2BI-DW2019
Partie2BI-DW2019
Aziz Darouichi
 
Cours Big Data Chap2
Cours Big Data Chap2Cours Big Data Chap2
Cours Big Data Chap2
Amal Abid
 
Data mining - Introduction générale
Data mining - Introduction généraleData mining - Introduction générale
Data mining - Introduction générale
Mohamed Heny SELMI
 

Tendances (20)

BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big Data
 
Chapitre 2 hadoop
Chapitre 2 hadoopChapitre 2 hadoop
Chapitre 2 hadoop
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
 
Big Data... Big Analytics à travers les âges, les industries et les technologies
Big Data... Big Analytics à travers les âges, les industries et les technologiesBig Data... Big Analytics à travers les âges, les industries et les technologies
Big Data... Big Analytics à travers les âges, les industries et les technologies
 
TP1 Big Data - MapReduce
TP1 Big Data - MapReduceTP1 Big Data - MapReduce
TP1 Big Data - MapReduce
 
Chapitre i-intro
Chapitre i-introChapitre i-intro
Chapitre i-intro
 
Big data
Big dataBig data
Big data
 
BigData_TP1: Initiation à Hadoop et Map-Reduce
BigData_TP1: Initiation à Hadoop et Map-ReduceBigData_TP1: Initiation à Hadoop et Map-Reduce
BigData_TP1: Initiation à Hadoop et Map-Reduce
 
BigData_Chp5: Putting it all together
BigData_Chp5: Putting it all togetherBigData_Chp5: Putting it all together
BigData_Chp5: Putting it all together
 
BigData_Chp3: Data Processing
BigData_Chp3: Data ProcessingBigData_Chp3: Data Processing
BigData_Chp3: Data Processing
 
Introduction au big data
Introduction au big dataIntroduction au big data
Introduction au big data
 
Big data et le marketing
Big data et le marketingBig data et le marketing
Big data et le marketing
 
DataWarehouse
DataWarehouseDataWarehouse
DataWarehouse
 
Big Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendancesBig Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendances
 
Projet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesProjet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de données
 
Cours Big Data Part I
Cours Big Data Part ICours Big Data Part I
Cours Big Data Part I
 
Introduction à la big data v3
Introduction à la big data v3 Introduction à la big data v3
Introduction à la big data v3
 
Partie2BI-DW2019
Partie2BI-DW2019Partie2BI-DW2019
Partie2BI-DW2019
 
Cours Big Data Chap2
Cours Big Data Chap2Cours Big Data Chap2
Cours Big Data Chap2
 
Data mining - Introduction générale
Data mining - Introduction généraleData mining - Introduction générale
Data mining - Introduction générale
 

En vedette

Application Mobile "Livre des histoires " avec Corona sdk
Application Mobile "Livre des histoires " avec Corona sdkApplication Mobile "Livre des histoires " avec Corona sdk
Application Mobile "Livre des histoires " avec Corona sdk
Nazih Heni
 
Point de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big DataPoint de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big Data
Nicolas Peene
 
Confessions of a horrified audience
Confessions of a horrified audienceConfessions of a horrified audience
Confessions of a horrified audience
Metamorph Training Pvt Ltd
 
AIR POWERED ENGINE PPT
AIR POWERED ENGINE PPTAIR POWERED ENGINE PPT
Big data et marketing :Vers une analyse prédictif de d'acte d'achat
Big data et marketing :Vers une analyse prédictif de d'acte d'achatBig data et marketing :Vers une analyse prédictif de d'acte d'achat
Big data et marketing :Vers une analyse prédictif de d'acte d'achat
fifi75
 
Final Project presentation on Image processing based intelligent traffic cont...
Final Project presentation on Image processing based intelligent traffic cont...Final Project presentation on Image processing based intelligent traffic cont...
Final Project presentation on Image processing based intelligent traffic cont...
Louise Antonio
 
Big Data
Big DataBig Data
Big Data
NGDATA
 
Soft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMPSoft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMP
Soft Computing
 
Big data ppt
Big data pptBig data ppt
Big data ppt
IDBI Bank Ltd.
 
Big data ppt
Big  data pptBig  data ppt
Big data ppt
Nasrin Hussain
 
What is Big Data?
What is Big Data?What is Big Data?
What is Big Data?
Bernard Marr
 

En vedette (11)

Application Mobile "Livre des histoires " avec Corona sdk
Application Mobile "Livre des histoires " avec Corona sdkApplication Mobile "Livre des histoires " avec Corona sdk
Application Mobile "Livre des histoires " avec Corona sdk
 
Point de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big DataPoint de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big Data
 
Confessions of a horrified audience
Confessions of a horrified audienceConfessions of a horrified audience
Confessions of a horrified audience
 
AIR POWERED ENGINE PPT
AIR POWERED ENGINE PPTAIR POWERED ENGINE PPT
AIR POWERED ENGINE PPT
 
Big data et marketing :Vers une analyse prédictif de d'acte d'achat
Big data et marketing :Vers une analyse prédictif de d'acte d'achatBig data et marketing :Vers une analyse prédictif de d'acte d'achat
Big data et marketing :Vers une analyse prédictif de d'acte d'achat
 
Final Project presentation on Image processing based intelligent traffic cont...
Final Project presentation on Image processing based intelligent traffic cont...Final Project presentation on Image processing based intelligent traffic cont...
Final Project presentation on Image processing based intelligent traffic cont...
 
Big Data
Big DataBig Data
Big Data
 
Soft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMPSoft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMP
 
Big data ppt
Big data pptBig data ppt
Big data ppt
 
Big data ppt
Big  data pptBig  data ppt
Big data ppt
 
What is Big Data?
What is Big Data?What is Big Data?
What is Big Data?
 

Similaire à Introduction au BIG DATA

Introduction
IntroductionIntroduction
Introduction
Ines Slimene
 
Analyse spatiale en Big data
Analyse spatiale en Big dataAnalyse spatiale en Big data
Analyse spatiale en Big data
Soufiane ElATEF✔️
 
Big data-2-170220212621
Big data-2-170220212621Big data-2-170220212621
Big data-2-170220212621
Haifa Akermi
 
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...
Altares D&B
 
BigData BigBuzz @ Le Node
BigData BigBuzz @ Le Node BigData BigBuzz @ Le Node
BigData BigBuzz @ Le Node
Excelerate Systems
 
BigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems FranceBigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems France
Excelerate Systems
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel business
Mouhsine LAKHDISSI
 
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
IBM France Lab
 
BIG DATA
BIG DATABIG DATA
BIG DATA
laurence allard
 
Baina bigdata le futur eldorado
Baina bigdata le futur eldoradoBaina bigdata le futur eldorado
Baina bigdata le futur eldorado
Karim Baïna
 
cdg69-i-int-2017-sujet-projet_etude-isi-sic.pdf
cdg69-i-int-2017-sujet-projet_etude-isi-sic.pdfcdg69-i-int-2017-sujet-projet_etude-isi-sic.pdf
cdg69-i-int-2017-sujet-projet_etude-isi-sic.pdf
ZkSadrati
 
Introduction au Big data
Introduction au Big data Introduction au Big data
Introduction au Big data
fatimabenjelloun1
 
La Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance clientLa Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance client
Denodo
 
EXTRA-Présentation generale 180923.pptx
EXTRA-Présentation generale 180923.pptxEXTRA-Présentation generale 180923.pptx
EXTRA-Présentation generale 180923.pptx
Infopole1
 
Big data
Big dataBig data
Big data
Karima GHALI
 
dt_medecine_personalis.pptx
dt_medecine_personalis.pptxdt_medecine_personalis.pptx
dt_medecine_personalis.pptx
nour91922
 
La data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeurLa data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeur
Microsoft Ideas
 
La technologie des mégadonnées (big data)
La technologie des mégadonnées (big data)La technologie des mégadonnées (big data)
La technologie des mégadonnées (big data)
Nicolae Sfetcu
 
Etude AKOYA Big Data
Etude AKOYA Big DataEtude AKOYA Big Data
Etude AKOYA Big Data
Jocelyn Muret
 
Qu'est ce que le big data - Présentation AIMM 30 octobre
Qu'est ce que le big data - Présentation AIMM 30 octobreQu'est ce que le big data - Présentation AIMM 30 octobre
Qu'est ce que le big data - Présentation AIMM 30 octobre
Simon Boucher
 

Similaire à Introduction au BIG DATA (20)

Introduction
IntroductionIntroduction
Introduction
 
Analyse spatiale en Big data
Analyse spatiale en Big dataAnalyse spatiale en Big data
Analyse spatiale en Big data
 
Big data-2-170220212621
Big data-2-170220212621Big data-2-170220212621
Big data-2-170220212621
 
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...
 
BigData BigBuzz @ Le Node
BigData BigBuzz @ Le Node BigData BigBuzz @ Le Node
BigData BigBuzz @ Le Node
 
BigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems FranceBigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems France
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel business
 
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
 
BIG DATA
BIG DATABIG DATA
BIG DATA
 
Baina bigdata le futur eldorado
Baina bigdata le futur eldoradoBaina bigdata le futur eldorado
Baina bigdata le futur eldorado
 
cdg69-i-int-2017-sujet-projet_etude-isi-sic.pdf
cdg69-i-int-2017-sujet-projet_etude-isi-sic.pdfcdg69-i-int-2017-sujet-projet_etude-isi-sic.pdf
cdg69-i-int-2017-sujet-projet_etude-isi-sic.pdf
 
Introduction au Big data
Introduction au Big data Introduction au Big data
Introduction au Big data
 
La Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance clientLa Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance client
 
EXTRA-Présentation generale 180923.pptx
EXTRA-Présentation generale 180923.pptxEXTRA-Présentation generale 180923.pptx
EXTRA-Présentation generale 180923.pptx
 
Big data
Big dataBig data
Big data
 
dt_medecine_personalis.pptx
dt_medecine_personalis.pptxdt_medecine_personalis.pptx
dt_medecine_personalis.pptx
 
La data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeurLa data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeur
 
La technologie des mégadonnées (big data)
La technologie des mégadonnées (big data)La technologie des mégadonnées (big data)
La technologie des mégadonnées (big data)
 
Etude AKOYA Big Data
Etude AKOYA Big DataEtude AKOYA Big Data
Etude AKOYA Big Data
 
Qu'est ce que le big data - Présentation AIMM 30 octobre
Qu'est ce que le big data - Présentation AIMM 30 octobreQu'est ce que le big data - Présentation AIMM 30 octobre
Qu'est ce que le big data - Présentation AIMM 30 octobre
 

Plus de Zakariyaa AIT ELMOUDEN

Les réseaux informatiques 3
Les réseaux informatiques 3Les réseaux informatiques 3
Les réseaux informatiques 3
Zakariyaa AIT ELMOUDEN
 
Les réseaux informatiques 2
Les réseaux informatiques 2Les réseaux informatiques 2
Les réseaux informatiques 2
Zakariyaa AIT ELMOUDEN
 
Exercices : Algorithmes et Langage C
Exercices : Algorithmes et Langage CExercices : Algorithmes et Langage C
Exercices : Algorithmes et Langage C
Zakariyaa AIT ELMOUDEN
 
Algorithmique
AlgorithmiqueAlgorithmique
Algorithmique
Zakariyaa AIT ELMOUDEN
 
Introduction aux réseaux informatiques
Introduction aux réseaux informatiquesIntroduction aux réseaux informatiques
Introduction aux réseaux informatiques
Zakariyaa AIT ELMOUDEN
 
Langage HTML
Langage HTMLLangage HTML
Introduction au Web
Introduction au WebIntroduction au Web
Introduction au Web
Zakariyaa AIT ELMOUDEN
 
QCM Sécurité Informatique
QCM Sécurité InformatiqueQCM Sécurité Informatique
QCM Sécurité Informatique
Zakariyaa AIT ELMOUDEN
 
Excel : Les fonctions mathématiques
Excel : Les fonctions mathématiquesExcel : Les fonctions mathématiques
Excel : Les fonctions mathématiques
Zakariyaa AIT ELMOUDEN
 
Atelier EXCEL : Les fonctions financières
Atelier EXCEL :  Les fonctions financièresAtelier EXCEL :  Les fonctions financières
Atelier EXCEL : Les fonctions financières
Zakariyaa AIT ELMOUDEN
 
Installer et configurer NAGIOS sous linux
Installer et configurer NAGIOS sous linuxInstaller et configurer NAGIOS sous linux
Installer et configurer NAGIOS sous linux
Zakariyaa AIT ELMOUDEN
 

Plus de Zakariyaa AIT ELMOUDEN (11)

Les réseaux informatiques 3
Les réseaux informatiques 3Les réseaux informatiques 3
Les réseaux informatiques 3
 
Les réseaux informatiques 2
Les réseaux informatiques 2Les réseaux informatiques 2
Les réseaux informatiques 2
 
Exercices : Algorithmes et Langage C
Exercices : Algorithmes et Langage CExercices : Algorithmes et Langage C
Exercices : Algorithmes et Langage C
 
Algorithmique
AlgorithmiqueAlgorithmique
Algorithmique
 
Introduction aux réseaux informatiques
Introduction aux réseaux informatiquesIntroduction aux réseaux informatiques
Introduction aux réseaux informatiques
 
Langage HTML
Langage HTMLLangage HTML
Langage HTML
 
Introduction au Web
Introduction au WebIntroduction au Web
Introduction au Web
 
QCM Sécurité Informatique
QCM Sécurité InformatiqueQCM Sécurité Informatique
QCM Sécurité Informatique
 
Excel : Les fonctions mathématiques
Excel : Les fonctions mathématiquesExcel : Les fonctions mathématiques
Excel : Les fonctions mathématiques
 
Atelier EXCEL : Les fonctions financières
Atelier EXCEL :  Les fonctions financièresAtelier EXCEL :  Les fonctions financières
Atelier EXCEL : Les fonctions financières
 
Installer et configurer NAGIOS sous linux
Installer et configurer NAGIOS sous linuxInstaller et configurer NAGIOS sous linux
Installer et configurer NAGIOS sous linux
 

Introduction au BIG DATA

  • 1. INTRODUCTION DU SUJET AIT EL MOUDEN Zakariyaa
  • 2. Définition  Les big data, littéralement les « grosses données », ou mégadonnées, désignent des ensembles de données qui deviennent tellement volumineux qu'ils en deviennent difficiles à travailler avec des outils classiques de gestion de base de données ou de gestion de l'information. -wikipédia- 2
  • 3. D’où vient les données ?  Les applications et les services professionnels: - ERP ’Entreprise Resource planning’ en français « progiciel de gestion intégré » (PGI) : Ce type de logiciel correspond, pour une organisation, au support de base capable d'assurer une « gestion intégrée», définie comme étant l'interconnexion et l'intégration de l'ensemble des fonctions de l'entreprise dans un système informatique centralisé (et généralement configuré selon le mode client-serveur). Les sources de production des données : 3
  • 4. - CRM ’Customer Relationship Management’ en français « La gestion de la relation client » (GRC) : est l'ensemble des outils et techniques destinés à capter, traiter, analyser les informations relatives aux clients et aux prospects, dans le but de les fidéliser en leur offrant le meilleur service - SCM ‘supply chain management’ en français «gestion de la chaîne logistique» (GCL) vise à garantir l'organisation et la qualité du service logistique en conformité avec les dispositions figurant au cahier des charges logistique. - les outils de production de contenu et de bureautique (série office) ou les intranets, etc. Les sources de production des données : (suite) 4
  • 5.  Le Web En utilisant le Web, Les entreprises et les organisations créent un volume considérable de données (sites d’actualités, e- commerce, publicités … ) Avec l’utilisation des moteurs de recherche et les annuaires dans le web, le nombre des données crées est de plus en plus innombrables. "Nous créons actuellement en deux jours autant d'information que nous en avions créée depuis la naissance de la civilisation jusqu'en 2003". rappelait récemment Eric Schmidt, Chairman de Google. Les sources de production des données : (suite) 5
  • 6.  Les Media sociaux Avec le développement des outils d’expression (le Web 2.0) ces dix dernières années, le volume des données produites à eu une croissance phénoménale. exemples : Réseaux sociaux : facebook, twitter, youtube, etc Plateformes de partage : SlideShare, Flickr, Instagram, etc Statistique : Chaque minute, plus de 30 heures de vidéo sont uploadées sur YouTube, 2 millions de posts sont publiés sur Facebook et 100.000 tweets diffusés sur Twitter. Les sources de production des données : (suite) 6
  • 7.  Le Mobile Avec l’évolution du mobile, et l’apparition du ‘smartphone’, Le téléphone mobile est devenu une source respectable de production des données. Les statistiques prouvent qu’ il y a actuellement 4 fois plus de téléphone mobiles en usage que des ordinateurs et tablettes. Statistique : A la fin 2013, l'App Store de Apple et Google Play auront dépassé les 50 milliards d'applications téléchargées. Les sources de production des données : (suite) 7
  • 8.  Internet des objets (IdO) en anglais « Internet Of Things » (IoT) un réseau qui permet, via des systèmes d’identification électronique normalisés et sans fil, d’identifier et de communiquer numériquement avec des objets physiques afin de pouvoir mesurer et échanger des données entre les mondes physiques et virtuels. L'internet des objets est considéré comme la troisième évolution de l'Internet, baptisée Web 3.0 Les sources de production des données : (suite) 8
  • 9. Les catégories des données  Données Structurées les informations structurées sont disposées de façon à être traitées automatiquement et efficacement par un logiciel, mais non nécessairement par un humain. La ligne de code Java : int salaire = 6000; String nom=« Ali"; est un exemple simple d’informations structurées ,nous connaissons les valeurs, dont le nom est associé à la fonction. Nous pouvons ici supposer que le nom de l’individu est Jean et que son salaire est de 6 000 Dh. Par opposition, la chaîne de caractères « Ali gagne un salaire de 60 000 dirhams » n’est pas structurée, car nous ne pouvons nous attendre à ce qu’un logiciel puisse lire et comprendre une phrase écrite en français. 9
  • 10. Les catégories des données (suite)  Le plus souvent, nous disposons les informations structurées dans des tableaux, comme dans une base de données relationnelle Nom Salaire Ali 6000 Mohammed 7000 10
  • 11. Les catégories des données (suite)  Les données non structurées Il est impossible de tout stocker sous la forme d’informations structurées (p. ex. lettres, courriels, livres, rapports, collections d’images ou de vidéos, brevets, images satellites, offres de service et CV, appels d’offre). Il s’agit pourtant d’informations que les organisations doivent traiter.  Les big data sont généralement des données semi structurées. 11
  • 12. Les dimensions du BIG DATA Les dimensions du big data Volume Vitesse Variété Véracité Visibilité Valeur 12
  • 13.  Le Volume : Le premier concept qui intervient dans la notion du big data, données en petabyte( 1015 bytes )  La Vitesse : Analyse et exploitation des données en temps réel.  La Variété : Les données sont non structurées, et de plus sont de formats différents (images, texte, sons, vidéos , etc.)  La Valeur : Les données concernées sont de valeur importante dans l’entreprise. Les 4v principaux 13
  • 14. Pourquoi la notion du big data est récente ?  L’expression « Big data » fait finalement son apparition en octobre 1997 dans la bibliothèque numérique de l’ACM*, au sein d’articles scientifiques qui pointent du doigt les défis technologiques à visualiser les « grands ensembles de données ». Le Big data est né, et avec lui ses nombreux défis.. *Association For Computing Machinery, association américaine à but non lucratif fondée en 1947 et vouée à l’informatique. Sa bibliothèque numérique est particulièrement riche quand il s’agit de retracer l’histoire de la discipline. 14
  • 15. Facteurs de naissance du Big data  Le cout du stockage : Ce concept n’est plus un problème majeur pour les entreprises avec l’apparition du Cloud Computing.  Réseaux à très haut débit (THD) : Le stockage des données dans des serveurs distants n’est pas une vrai solution sans un réseau hait débit pour atteindre ces données avec une transparence à la localisation.  Evolution des technologie de gestion et d’analyse des données : Analyse et gestion en temps réel 15
  • 16. Usages des Big Data  Optimisation Optimisation du temps de calcul, recherche, traitement des données, etc. exemple: Une société de de fabrication d’éoliennes nommée Vestas , utilise les ‘ big data analytics ’ d’IBM pour décider la localisation d’éoliennes en optimisant le temps de traitement des données variées et non structurées (données météorologiques et géo spatiales, des images satellites, etc. ) >> résultat fournit en quelques heures, au lieu des études qui prennent des semaines sur terrain. 16
  • 17.  Tracer et cibler Les big data permettent d’analyser la situation et le contexte de millier de personnes en temps réel. Application : (big data dans l’aéroport) les passagers doivent obligatoirement passer un certain nombre de tests de sécurité (ce qui génère du stress, des temps d’attente). Une application de géolocalisation dans l’aéroport pourrait offrir aux passagers, en retour de leurs données émises, un guide interactif du lieu, des informations sur les temps d’attente aux différents postes de sécurité, sur les horaires des vols et portes d’embarquement, alors ils peuvent exploiter leurs temps d’attente dans des boutiques ou des restaurants, etc. 17 Usages des Big Data (suite)
  • 18. Usages des Big Data (suite)  Prévoir et prédire L’analyse prédictive permet de faire des projections ultra réalistes pour identifier des nouvelles sources d’opportunités (ou des menaces) et ainsi anticiper les réponses adaptées à la situation réelle. Exemple : ‘Flu Trends’ est un modèle de Google qui permet d’estimer la propagation des cas réels de grippe en fonction des recherches sur Internet, prenant en compte le fait que tous les internautes qui tapent « grippe » sur leur clavier ne sont pas nécessairement malades.  Automobile et Autres usages … 18
  • 19. Visualisation des données  Pourquoi on visualise les données ? ‘’ Une image (data visualisation) vaut mieux qu'un long (big) discours (data) ‘’ Une visualisation intelligente et utilisable des analytics sont un facteur clé dans le déploiement du Big Data dans les entreprises. Le développement des infographies va d'ailleurs de pair avec le développement des techniques d'exploitation des données. 19
  • 20. Visualisation des données (suite) La visualisation des big data permet :  La prise de décision Une Data Visualisation de qualité donnera aux managers le moyen de manipuler de larges volumes de données pour faire émerger des tendances, ou encore répondre à des questions spécifiques. Grâce à des outils de comparaison et de croisement dynamiques, les managers peuvent faire apparaître des informations perdues sous le flot de données, qui ne peuvent se révéler qu’après avoir été visualisées. 20
  • 21. Visualisation des données (suite)  se concentrer sur l’essentiel, plus rapidement La principale raison pour laquelle la Data Visualisation est demandée par les entreprises est la confusion qui accompagne la surcharge de données : celles-ci sont éparpillées dans des feuilles de calculs, des bases de données, des espaces de stockages… Leur interprétation devient difficile. A l’inverse, le but de la Data Visualisation va à l’essentiel en regroupant toutes ces données sur un seul écran, et en les traitant intelligemment grâce à des filtres, des groupes et des classements pertinents. 21
  • 22. Visualisation des données (suite) 22 Exemple :  Fichier visualisé : Les misérables de Victor Hugo  Nombre de nœuds : 77  Nombre des liens : 254  Algorithme de spatialisation : Force Atlas  Outil de visualisation : Gephi 0.8.1
  • 23. Visualisation des données (suite)  Même fichier avec d’autres algorithmes de spatialisation : 23 Fruchterman-Reingold Force Atlas 2
  • 24. Conclusion  Avec la notion du big data, les problèmes volume des données, variance, hétérogénéité, le temps d’analyse des données et plein d’autres problèmes ne sont plus de la même complexité qu’avant. C’est la nouvelle génération des données. 24
  • 25. Références  www.wiki.gephi.org  www.awt.be  http://physicsbjj.perso.sfr.fr/  www.wikipedia.org  le big data, Christophe de Maistre 25