SlideShare une entreprise Scribd logo
1  sur  22
Le
BIG DATA
JOURNEES PORTES OUVERTES
2
👤
Koffi SANI
Ingénieur Conseil, Technologies et Innovations,
Expertise Consulting
En ligne sur @koffisani et www.koffisani.dev
Plan
○ DEFINITION
○ TECHNOLOGIES
○ COMPETENCES
○ APPLICATIONS
○ ACTEURS
○ FORMATIONS
○ DEBOUCHES
3
Définition
Mégadonnées, données massives, données
volumineuses
4
- En effet, nous procréons environ 2,5 trillions (10^18) d’octets de données tous les jours. Ce sont
les informations provenant de partout : messages que nous nous envoyons, vidéos que nous
publions, informations climatiques, signaux GPS, enregistrements transactionnels d’achats en ligne et
bien d’autres encore. Ces données sont baptisées Big Data ou volumes massifs de données. Les
géants du Web, au premier rang desquels Yahoo (mais aussi Facebook et Google), ont été les tous
premiers à déployer ce type de technologie.
Définition
5
Aucune définition universelle
- Cependant, aucune définition précise ou universelle ne peut être donnée au Big
Data. Etant un objet complexe polymorphe, sa définition varie selon les communautés
qui s’y intéressent en tant qu’usager ou fournisseur de services.
“
Données présentant une grande
variété, arrivant en volumes
croissants, à grande vitesse.
C’est ce que l’on appelle les trois « V ».
6
-- Définition de Gartner, 2001
Les 3 V
7
1 2 3
Technologies
Hadoop
Hadoop
○ Framework logiciel libre destiné à
faciliter la création d’applications
distribuées.
9
○ Permet aux entreprises de stocker et
traiter de vastes quantités de données
rapidement.
Compétences
10
Les données ne sont pas
toujours en ordre
Analyse
11
Bases de données et
internet
12
Mathématiques et
statistiques
13
14
Dans le monde réel
Quelques utilisations
pratiques du Big Data
15
- Afin de permettre à tout un chacun de trouver les lieux qui l’intéressent dans les
plus grandes villes du monde, Yelp a trouvé un usage détourné très ingénieux du
Big Data. La fonctionnalité World Map permet de trier les lieux d’une ville en
fonction des mots utilisés dans les avis laissés par les visiteurs. Il suffit de
choisir un mot, et les différents endroits de la ville sont classés par rapport au
nombre de fois que le mot a été utilisé dans les critiques des utilisateurs.
Quelques utilisations
pratiques du Big Data
16
- Traditionnellement, les panneaux publicitaires sont facturés en
fonction du nombre d’impressions, à un tarif proportionnel au nombre
de vues quotidiennes. Ce nombre est défini par une estimation
jusqu’à présent totalement arbitraire. Toutefois, grâce au Big Data,
l’entreprise de marketing Route est désormais en mesure d’évaluer
le niveau d’exposition d’une publicité avec précision. Afin de
mesurer le nombre de personnes qui verront une publicité affichée
sur un bus, un arrêt de bus ou un banc public, la firme utilise un
système de tracking oculaire, un GPS, et analyse les cycles de
trafic pour définir un prix adapté au potentiel publicitaire de l’espace
proposé.
Quelques utilisations
pratiques du Big Data
17
- L’application WeatherSignal utilise
les capteurs intégrés aux
smartphones Android afin de
collecter des données
météorologiques en temps réel.
Grâce au baromètre, à
l’hygromètre, au thermomètre et au
posemètre des téléphones Android,
l’application récupère des données
du monde entier et les exploite pour
prédire la météo à venir.
Les acteurs
Oracle HP IBM
18
Google Facebook LinkedIn
Des acteurs IT traditionnels
SAP
Des acteurs IT du web
Formations (sur le continent)
19
AIMS Dans 6 pays en Afrique
MSc. Big Data, MSc.
Machine Intelligence
INP-HB (avec ENSEA et l’X) Côte d’Ivoire MSc. Data Science
University of Rwanda Rwanda
MSc. Data Science
(diverse applications)
Débouchés
20
○ Data analyst
○ Data scientists
○ Web marketing specialist
○ Statisticien
○ Data Engineer
○ Growth Hacker
○ …
21
22
Thanks!
Questions?
○ @koffisani
○ koffi@koffisani.dev
○ www.koffisani.dev

Contenu connexe

Similaire à Brève introduction au Big data

Adwebmaroc Programmatique Real Time Bidding Mobile
Adwebmaroc Programmatique Real Time Bidding MobileAdwebmaroc Programmatique Real Time Bidding Mobile
Adwebmaroc Programmatique Real Time Bidding MobileMouna Ouajid Berrada
 
BIG DATA : ÇA Y EST… ON SAIT À QUOI ÇA SERT !
BIG DATA : ÇA Y EST… ON SAIT À QUOI ÇA SERT !BIG DATA : ÇA Y EST… ON SAIT À QUOI ÇA SERT !
BIG DATA : ÇA Y EST… ON SAIT À QUOI ÇA SERT !Grégory Duval
 
La veille Né Kid du 03.12.08 : Google
La veille Né Kid du 03.12.08 : GoogleLa veille Né Kid du 03.12.08 : Google
La veille Né Kid du 03.12.08 : GoogleNé Kid
 
Pourquoi le mobile est différent
Pourquoi le mobile est différentPourquoi le mobile est différent
Pourquoi le mobile est différentJean-Marie Gilliot
 
Big data et marketing digital
Big data et marketing digital Big data et marketing digital
Big data et marketing digital Hamza Sossey
 
Mobsuccess : epic mobile advertising
Mobsuccess : epic mobile advertisingMobsuccess : epic mobile advertising
Mobsuccess : epic mobile advertisingMOBSUCCESS
 
Makazi livre-blanc-du-data-marketing-fr
Makazi livre-blanc-du-data-marketing-frMakazi livre-blanc-du-data-marketing-fr
Makazi livre-blanc-du-data-marketing-frfranck camby
 
Internet Mobile : Quelles sont les nouvelles stratégies média des entreprises...
Internet Mobile : Quelles sont les nouvelles stratégies média des entreprises...Internet Mobile : Quelles sont les nouvelles stratégies média des entreprises...
Internet Mobile : Quelles sont les nouvelles stratégies média des entreprises...Alexandre Pinot
 
Data Center as a Strategic Asset
Data Center as a Strategic AssetData Center as a Strategic Asset
Data Center as a Strategic AssetEquinix
 
Big data-2-170220212621
Big data-2-170220212621Big data-2-170220212621
Big data-2-170220212621Haifa Akermi
 
Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessVincent de Stoecklin
 
Perspectives n°17 aout-septembre 2013 - athénéa conseils
Perspectives n°17   aout-septembre 2013 - athénéa conseilsPerspectives n°17   aout-septembre 2013 - athénéa conseils
Perspectives n°17 aout-septembre 2013 - athénéa conseilsYoann DUCUING
 
Les tendances mobiles 2014 par azetone
Les tendances mobiles 2014 par azetoneLes tendances mobiles 2014 par azetone
Les tendances mobiles 2014 par azetonePhilippe Dumont
 
La cartographie nationale à l'ère de collaboration et de la création de conna...
La cartographie nationale à l'ère de collaboration et de la création de conna...La cartographie nationale à l'ère de collaboration et de la création de conna...
La cartographie nationale à l'ère de collaboration et de la création de conna...ACSG Section Montréal
 
Digitalisation de la societe et impact sur l'informatique d'entreprise
Digitalisation de la societe et impact sur l'informatique d'entrepriseDigitalisation de la societe et impact sur l'informatique d'entreprise
Digitalisation de la societe et impact sur l'informatique d'entrepriseCharlets Jean-Philippe
 

Similaire à Brève introduction au Big data (20)

bgi-data-1 (1).pptx
bgi-data-1 (1).pptxbgi-data-1 (1).pptx
bgi-data-1 (1).pptx
 
Adwebmaroc Programmatique Real Time Bidding Mobile
Adwebmaroc Programmatique Real Time Bidding MobileAdwebmaroc Programmatique Real Time Bidding Mobile
Adwebmaroc Programmatique Real Time Bidding Mobile
 
BIG DATA : ÇA Y EST… ON SAIT À QUOI ÇA SERT !
BIG DATA : ÇA Y EST… ON SAIT À QUOI ÇA SERT !BIG DATA : ÇA Y EST… ON SAIT À QUOI ÇA SERT !
BIG DATA : ÇA Y EST… ON SAIT À QUOI ÇA SERT !
 
La veille Né Kid du 03.12.08 : Google
La veille Né Kid du 03.12.08 : GoogleLa veille Né Kid du 03.12.08 : Google
La veille Né Kid du 03.12.08 : Google
 
Pourquoi le mobile est différent
Pourquoi le mobile est différentPourquoi le mobile est différent
Pourquoi le mobile est différent
 
BIG DATA
BIG DATABIG DATA
BIG DATA
 
Big data et marketing digital
Big data et marketing digital Big data et marketing digital
Big data et marketing digital
 
Mobsuccess : epic mobile advertising
Mobsuccess : epic mobile advertisingMobsuccess : epic mobile advertising
Mobsuccess : epic mobile advertising
 
Makazi livre-blanc-du-data-marketing-fr
Makazi livre-blanc-du-data-marketing-frMakazi livre-blanc-du-data-marketing-fr
Makazi livre-blanc-du-data-marketing-fr
 
Internet Mobile : Quelles sont les nouvelles stratégies média des entreprises...
Internet Mobile : Quelles sont les nouvelles stratégies média des entreprises...Internet Mobile : Quelles sont les nouvelles stratégies média des entreprises...
Internet Mobile : Quelles sont les nouvelles stratégies média des entreprises...
 
Data Center as a Strategic Asset
Data Center as a Strategic AssetData Center as a Strategic Asset
Data Center as a Strategic Asset
 
Big data-2-170220212621
Big data-2-170220212621Big data-2-170220212621
Big data-2-170220212621
 
Big data
Big dataBig data
Big data
 
Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-business
 
Perspectives n°17 aout-septembre 2013 - athénéa conseils
Perspectives n°17   aout-septembre 2013 - athénéa conseilsPerspectives n°17   aout-septembre 2013 - athénéa conseils
Perspectives n°17 aout-septembre 2013 - athénéa conseils
 
MAGCOM n°4
MAGCOM n°4MAGCOM n°4
MAGCOM n°4
 
Le Big Data
Le Big DataLe Big Data
Le Big Data
 
Les tendances mobiles 2014 par azetone
Les tendances mobiles 2014 par azetoneLes tendances mobiles 2014 par azetone
Les tendances mobiles 2014 par azetone
 
La cartographie nationale à l'ère de collaboration et de la création de conna...
La cartographie nationale à l'ère de collaboration et de la création de conna...La cartographie nationale à l'ère de collaboration et de la création de conna...
La cartographie nationale à l'ère de collaboration et de la création de conna...
 
Digitalisation de la societe et impact sur l'informatique d'entreprise
Digitalisation de la societe et impact sur l'informatique d'entrepriseDigitalisation de la societe et impact sur l'informatique d'entreprise
Digitalisation de la societe et impact sur l'informatique d'entreprise
 

Brève introduction au Big data

  • 2. 2 👤 Koffi SANI Ingénieur Conseil, Technologies et Innovations, Expertise Consulting En ligne sur @koffisani et www.koffisani.dev
  • 3. Plan ○ DEFINITION ○ TECHNOLOGIES ○ COMPETENCES ○ APPLICATIONS ○ ACTEURS ○ FORMATIONS ○ DEBOUCHES 3
  • 4. Définition Mégadonnées, données massives, données volumineuses 4 - En effet, nous procréons environ 2,5 trillions (10^18) d’octets de données tous les jours. Ce sont les informations provenant de partout : messages que nous nous envoyons, vidéos que nous publions, informations climatiques, signaux GPS, enregistrements transactionnels d’achats en ligne et bien d’autres encore. Ces données sont baptisées Big Data ou volumes massifs de données. Les géants du Web, au premier rang desquels Yahoo (mais aussi Facebook et Google), ont été les tous premiers à déployer ce type de technologie.
  • 5. Définition 5 Aucune définition universelle - Cependant, aucune définition précise ou universelle ne peut être donnée au Big Data. Etant un objet complexe polymorphe, sa définition varie selon les communautés qui s’y intéressent en tant qu’usager ou fournisseur de services.
  • 6. “ Données présentant une grande variété, arrivant en volumes croissants, à grande vitesse. C’est ce que l’on appelle les trois « V ». 6 -- Définition de Gartner, 2001
  • 9. Hadoop ○ Framework logiciel libre destiné à faciliter la création d’applications distribuées. 9 ○ Permet aux entreprises de stocker et traiter de vastes quantités de données rapidement.
  • 11. Les données ne sont pas toujours en ordre Analyse 11
  • 12. Bases de données et internet 12
  • 15. Quelques utilisations pratiques du Big Data 15 - Afin de permettre à tout un chacun de trouver les lieux qui l’intéressent dans les plus grandes villes du monde, Yelp a trouvé un usage détourné très ingénieux du Big Data. La fonctionnalité World Map permet de trier les lieux d’une ville en fonction des mots utilisés dans les avis laissés par les visiteurs. Il suffit de choisir un mot, et les différents endroits de la ville sont classés par rapport au nombre de fois que le mot a été utilisé dans les critiques des utilisateurs.
  • 16. Quelques utilisations pratiques du Big Data 16 - Traditionnellement, les panneaux publicitaires sont facturés en fonction du nombre d’impressions, à un tarif proportionnel au nombre de vues quotidiennes. Ce nombre est défini par une estimation jusqu’à présent totalement arbitraire. Toutefois, grâce au Big Data, l’entreprise de marketing Route est désormais en mesure d’évaluer le niveau d’exposition d’une publicité avec précision. Afin de mesurer le nombre de personnes qui verront une publicité affichée sur un bus, un arrêt de bus ou un banc public, la firme utilise un système de tracking oculaire, un GPS, et analyse les cycles de trafic pour définir un prix adapté au potentiel publicitaire de l’espace proposé.
  • 17. Quelques utilisations pratiques du Big Data 17 - L’application WeatherSignal utilise les capteurs intégrés aux smartphones Android afin de collecter des données météorologiques en temps réel. Grâce au baromètre, à l’hygromètre, au thermomètre et au posemètre des téléphones Android, l’application récupère des données du monde entier et les exploite pour prédire la météo à venir.
  • 18. Les acteurs Oracle HP IBM 18 Google Facebook LinkedIn Des acteurs IT traditionnels SAP Des acteurs IT du web
  • 19. Formations (sur le continent) 19 AIMS Dans 6 pays en Afrique MSc. Big Data, MSc. Machine Intelligence INP-HB (avec ENSEA et l’X) Côte d’Ivoire MSc. Data Science University of Rwanda Rwanda MSc. Data Science (diverse applications)
  • 21. ○ Data analyst ○ Data scientists ○ Web marketing specialist ○ Statisticien ○ Data Engineer ○ Growth Hacker ○ … 21

Notes de l'éditeur

  1. - En effet, nous procréons environ 2,5 trillions (10^18) d’octets de données tous les jours. Ce sont les informations provenant de partout : messages que nous nous envoyons, vidéos que nous publions, informations climatiques, signaux GPS, enregistrements transactionnels d’achats en ligne et bien d’autres encore. Ces données sont baptisées Big Data ou volumes massifs de données. Les géants du Web, au premier rang desquels Yahoo (mais aussi Facebook et Google), ont été les tous premiers à déployer ce type de technologie. - Cependant, aucune définition précise ou universelle ne peut être donnée au Big Data. Etant un objet complexe polymorphe, sa définition varie selon les communautés qui s’y intéressent en tant qu’usager ou fournisseur de services.
  2. - En effet, nous procréons environ 2,5 trillions (10^18) d’octets de données tous les jours. Ce sont les informations provenant de partout : messages que nous nous envoyons, vidéos que nous publions, informations climatiques, signaux GPS, enregistrements transactionnels d’achats en ligne et bien d’autres encore. Ces données sont baptisées Big Data ou volumes massifs de données. Les géants du Web, au premier rang desquels Yahoo (mais aussi Facebook et Google), ont été les tous premiers à déployer ce type de technologie. - Cependant, aucune définition précise ou universelle ne peut être donnée au Big Data. Etant un objet complexe polymorphe, sa définition varie selon les communautés qui s’y intéressent en tant qu’usager ou fournisseur de services.
  3. composé de jeux de données complexes, provenant essentiellement de nouvelles sources. données sont si volumineux que les logiciels de traitement des données classiques sont incapables de les traiter.
  4. Variété : Il ne s'agit pas de données relationnelles traditionnelles, ces données sont brutes, semi-structurées, voire non structurées (cependant, les données non structurées devront, pour utilisation, être structurées47). Ce sont des données complexes provenant du web (Web mining), au format texte (text mining) et images (image mining). Elles peuvent être publiques (open data, Web des données), géo-démographiques par îlot (adresses IP), ou relever de la propriété des consommateurs[réf. nécessaire]. Ce qui les rend difficilement utilisables avec les outils traditionnels. Volume : les données numériques créées dans le monde seraient passées de 1,2 zettaoctet par an en 2010 à 1,8 zettaoctet en 201143, puis 2,8 zettaoctets en 2012 et s'élèveront à 40 zettaoctets en 2020. À titre d'exemple, Twitter générait en janvier 2013, 7 téraoctets de données chaque jour et Facebook 10 téraoctets44. En 2014, Facebook Hive générait 4 000 To de data par jour Vitesse : La vélocité représente la fréquence à laquelle les données sont à la fois générées, capturées, partagées et mises à jour49. Des flux croissants de données doivent être analysés en quasi-temps réel (fouille de flots de données) pour répondre aux besoins des processus chrono-sensibles50. Par exemple, les systèmes mis en place par la bourse et les entreprises doivent être capables de traiter ces données avant qu’un nouveau cycle de génération n’ait commencé, avec le risque pour l'Homme de perdre une grande partie de la maîtrise du système quand les principaux opérateurs deviennent des machine capables de lancer des ordres d'achat ou de vente à la nanoseconde (trading haute fréquence) sans disposer de tous les critères pertinents d'analyse pour le moyen et long terme.
  5. Hadoop est un framework logiciel open source permettant de stocker des données, et de lancer ds applications sur des grappes de machines standards.
  6. Afin de permettre à tout un chacun de trouver les lieux qui l’intéressent dans les plus grandes villes du monde, Yelp a trouvé un usage détourné très ingénieux du Big Data. La fonctionnalité World Map permet de trier les lieux d’une ville en fonction des mots utilisés dans les avis laissés par les visiteurs. Il suffit de choisir un mot, et les différents endroits de la ville sont classés par rapport au nombre de fois que le mot a été utilisé dans les critiques des utilisateurs. Traditionnellement, les panneaux publicitaires sont facturés en fonction du nombre d’impressions, à un tarif proportionnel au nombre de vues quotidiennes. Ce nombre est défini par une estimation jusqu’à présent totalement arbitraire. Toutefois, grâce au Big Data, l’entreprise de marketing Route est désormais en mesure d’évaluer le niveau d’exposition d’une publicité avec précision. Afin de mesurer le nombre de personnes qui verront une publicité affichée sur un bus, un arrêt de bus ou un banc public, la firme utilise un système de tracking oculaire, un GPS, et analyse les cycles de trafic pour définir un prix adapté au potentiel publicitaire de l’espace proposé. L’application WeatherSignal utilise les capteurs intégrés aux smartphones Android afin de collecter des données météorologiques en temps réel. Grâce au baromètre, à l’hygromètre, au thermomètre et au posemètre des téléphones Android, l’application récupère des données du monde entier et les exploite pour prédire la météo à venir.
  7. Afin de permettre à tout un chacun de trouver les lieux qui l’intéressent dans les plus grandes villes du monde, Yelp a trouvé un usage détourné très ingénieux du Big Data. La fonctionnalité World Map permet de trier les lieux d’une ville en fonction des mots utilisés dans les avis laissés par les visiteurs. Il suffit de choisir un mot, et les différents endroits de la ville sont classés par rapport au nombre de fois que le mot a été utilisé dans les critiques des utilisateurs. Traditionnellement, les panneaux publicitaires sont facturés en fonction du nombre d’impressions, à un tarif proportionnel au nombre de vues quotidiennes. Ce nombre est défini par une estimation jusqu’à présent totalement arbitraire. Toutefois, grâce au Big Data, l’entreprise de marketing Route est désormais en mesure d’évaluer le niveau d’exposition d’une publicité avec précision. Afin de mesurer le nombre de personnes qui verront une publicité affichée sur un bus, un arrêt de bus ou un banc public, la firme utilise un système de tracking oculaire, un GPS, et analyse les cycles de trafic pour définir un prix adapté au potentiel publicitaire de l’espace proposé. L’application WeatherSignal utilise les capteurs intégrés aux smartphones Android afin de collecter des données météorologiques en temps réel. Grâce au baromètre, à l’hygromètre, au thermomètre et au posemètre des téléphones Android, l’application récupère des données du monde entier et les exploite pour prédire la météo à venir.
  8. Afin de permettre à tout un chacun de trouver les lieux qui l’intéressent dans les plus grandes villes du monde, Yelp a trouvé un usage détourné très ingénieux du Big Data. La fonctionnalité World Map permet de trier les lieux d’une ville en fonction des mots utilisés dans les avis laissés par les visiteurs. Il suffit de choisir un mot, et les différents endroits de la ville sont classés par rapport au nombre de fois que le mot a été utilisé dans les critiques des utilisateurs. Traditionnellement, les panneaux publicitaires sont facturés en fonction du nombre d’impressions, à un tarif proportionnel au nombre de vues quotidiennes. Ce nombre est défini par une estimation jusqu’à présent totalement arbitraire. Toutefois, grâce au Big Data, l’entreprise de marketing Route est désormais en mesure d’évaluer le niveau d’exposition d’une publicité avec précision. Afin de mesurer le nombre de personnes qui verront une publicité affichée sur un bus, un arrêt de bus ou un banc public, la firme utilise un système de tracking oculaire, un GPS, et analyse les cycles de trafic pour définir un prix adapté au potentiel publicitaire de l’espace proposé. L’application WeatherSignal utilise les capteurs intégrés aux smartphones Android afin de collecter des données météorologiques en temps réel. Grâce au baromètre, à l’hygromètre, au thermomètre et au posemètre des téléphones Android, l’application récupère des données du monde entier et les exploite pour prédire la météo à venir.
  9. Plein d’autres à trouver sur Google