SlideShare une entreprise Scribd logo
Big Data
Tendances, perspectives et cas d’usage
20/03/2014
Jean-Michel Franco
Directeur de l’innovation et des solutions
jean-michel.franco@businessdecision.com
Twitter : @jmichel_franco
© 2
Définition
03/2014 Big Data
Les challenges incluent la collecte, la curation, le
stockage, l’enrichissement, le croisement, la partage,
l’analyse et la visualisation.
Le « Big Data » vise à tirer un avantage
concurrentiel au travers de méthodes de
collecte, d’analyse et d’exploitation des données
qu’on ne pouvait utiliser jusqu’à présent du fait des
contraintes économiques, fonctionnelles et
techniques liées aux volumétries, à la
vitesse de traitement et à la variété des
données à considérer.
Source “The 451 Group” & Gartner
Source Wikipedia
© 3
Le Big data : une cible mouvante…
… mais qui désormais nous concerne tous
03/2014 Big Data
1950 1960 1970 1980 1990 2000 2010
100 Pétas
20 Pétas
Assurances
600 MB
Voyages
807 MB
Transports
80 GB
40 Pétas
60 Pétas
1 Péta = 1.000.000.000.000.000 octets (1015) = 1.000.000 Giga octets = 1000 téra octets
80 Pétas
Banque
450 GB
Retail
180 TB Medias
100 PB
Medias
25 PB
© 4
Popularité
Information disponible
Notre enjeu : le principe de la longue traîne, appliqué à la gestion de
l’information
La gestion de l’information telle qu’on la connait
- capital informationnel constitué sur la base des SI internes
de l’entreprise
- information exploitée transversalement uniquement en temps différé
- information modélisée à priori
La gestion de l’information telle qu’on la voudrait
La gestion de l’information telle qu’on la connait
+ information générés par les humains
+ information gérée par les machines
+ information en « juste à temps » (vitesse)
+ information modélisable, assemblable, et extensible
au fil de l’eau (élasticité)
03/2014 Big Data
© 5
Exemple d’innovation dans la distribution:
Au plus près du terrain et de la demande client
La grande distribution a été pionnière dans la mise en œuvre de data warehouses d’entreprise,
notamment pour l’analyse des données extraites des tickets de caisse.
Mais il devient nécessaire de tirer encore plus de valeur de ces données, d’approfondir les
capacités d’analyse et de les rendre « actionnables » .
Gestion plus fine et dynamique des prix de vente
Personnalisation des offres pour les programmes de fidélité
Gestion proactive des fraudes
Ajustement de l’offre et de la demande, par zone géographique
Gestion du on line multi-canal (e-commerce, magasins, drive)
03/2014 Big Data
© 6
• Passer d’une économie de l’attention à une économie de l’intention
• Tester le bien fondé des offres, les remettre en cause en permanence
• Offrir le même niveau de service au travers des canaux d’interaction
• Mieux “maitriser” les recommandations associées aux hôtels du groupe et les interactions avec les
promoteurs et détracteurs
Exemple d’innovation dans le secteur de l’hôtellerie:
recommandations temps réel
Améliorer le taux de transformation (ROI en neuf mois)
Capacité à tester les nouvelles offres, et de les retirer si peu
efficaces
Capacité d’écoute, de réactivité et d’ « influence » sur les
promoteurs et détracteurs
Fédération de la connaissance client pour s’adapter aux
changements d’organisation et intégrer les médias sociaux
Offre et communication personnalisée pour chaque client
03/2014 Big Data
© 7
Exemple d’innovation dans les utilities :
Le « Smart Watering »
(*) Source : SIA conseil
En France , 25% de l’eau injectée sur le réseau est perdue en fuites et fraudes ; Le manque à
gagner pour les citoyens s’élève à 2,4 milliards d’euros par an. (*)
Les canaux numériques et l’Internet des objets ouvrent de nouvelles opportunités pour
collecter/exploiter les données, et les mettre à disposition de tous
Informations en temps réel sur les débits et la qualité de l’eau
Services à valeur ajoutée pour les consommateurs et les
collectivités
Détection au plus tôt des problèmes sur le réseau et en bout
de chaine
Engagement commun au principe de consommation
responsable
Automatisation du processus de collecte
03/2014 Big Data
© 8
Exemple d’innovation dans le secteur des assurances :
innover par de nouvelles offres
Une start-up dédiée à l’assurance des exploitations agricoles face aux aléas du climat.
La collecte d’un ensemble d’informations à un niveau très fin sur les températures,
l’humidité, les précipitations…
Des offres personnalisées pour chaque agriculture en fonction des
spécificités de son exploitation et de son environnement
Gestion des sinistres totalement dématérialisés : paiement
automatisé en fonction des conditions
Un potentiel de déploiement sans limites géographiques, permettant
d’atteindre des marchés encore peu exploités
03/2014 Big Data
© 9
Exemple d’innovation dans le secteur des
assurances : gestion des fraudes
Appliquer les principes du Scoring Crédit pour analyser les déclarations de sinistre.
Exploitation des données non structurées pour mettre en exergue les incohérences dans les déclarations
L’aide à la décision poussée sur le terrain au plus près des clients
Taux de succès des investigations : de 50 à 85%
25% des dossiers sont réglés dès le première étape, contre 4%
auparavant
Le scoring influence la suite du processus et améliore son efficacité
(aide à la décision « actionnable »)
Le système est actif lors de la déclaration de sinistre, ce qui incite le
client à renoncer à poursuivre s’il se sent suspecté
03/2014 Big Data
© 10
Exemple d’innovation dans le secteur des utilities -> un « datalab »
pour découvrir les données concurrence et les croiser avec les données internes
Lyonnaise des Eaux est leader sur la qualité de l’eau et cherche à conforter son
leadership en se dotant d’un outil de benchmark permettant l’analyse de ses
performances et la comparaison avec les autres délégataires et régies.
Récupérer des données publiques à partir de sources de données non
structurées et externe au S.I (site web http://www.sante.gouv.fr)
Création d’un « datalab » sur le cloud permettant à un « data
scientist » de qualifier la qualité de données et de les
rapprocher avec les données internes de l’entreprise
03/2014 Big Data
© 11
Data
Warehouse
Systèmes
transactionnels
Systèmes
décisionnels
d’entreprise
Big Data
De la BI telle qu’on la connait au Big Data : à la recherche de la
« longue traine »
Exploiter et fédérer les données « non
structurées »
Documents, contenu
numérique riche…
Données publiques du
web et réseaux sociaux
Aller puiser la connaissance dans de nouvelles
sources de données structurées
Capteurs, Internet des
objets
Données externes
Etendre les principes fondateurs des concepts du
Data Warehouse et l’Information Management :
Immédiateté Précision Agilité
03/2014 Big Data
© 12
Big Data : pour qui, pour quoi ?
Industrie
• Produit comme un service
• Qualité, innovation R&D
• Maintenance préventive
Assurance
• Fraudes et risques
• Recommandation client
• Tarification à l’usage,
personnalisation
Secteur public
• Services informationnels
• Fraudes, abus
• Sécurité publique
• Personnalisation de la
relation citoyen
Distribution
• Offres temps réel et service
personnalisés
• Optimisation de
l’expérience magasin
• Pricing dynamique
Santé
• Gestion des effets
indésirables
• Traitements personnalisés.
• Amélioration des
diagnostics
Telecom
• Parcours clients multi-
canaux
• Partage de données de
géo localisation
• Fraudes et analyse du
comportement client
Banques
• Parcours clients multi-
canaux
• Fraude, anti blanchiment
• Partage des données
consommateurs pour
personnalisation
Transports, loisirs
• Planification et gestion des
evts liés à la logistique
• Service client temps réel
• Economie d’énergie
• Pricing dynamique
Produits gde conso.
• Analyse de sentiments et
retour produits
• Relation personnalisée
avec le consommateur
• Produit comme un service
03/2014 Big Data
Des arômes et ingrédients qui se déclinent dans tous les secteurs d’activité
© 13
Le Big Data, appliqué au rôle d’étudiant, ça donnerait quoi ?
http://www.knewton.com/platform/resources/
03/2014 Big Data
© 14
Le big data : avec quelles données ?
Tous secteurs confondus
Banque et services financiers
03/2014 Big Data
© 15
Le big data : Pour quoi faire ?
La relation client avant tout, puis l’efficacité des processus et l’innovation
0 10 20 30 40 50 60
Expérience client
Efficacité des processus
Innovation produit
Marketing ciblé
Réduction des coûts
Gestion des risques
Monétisation de l'information
Governance et réglementations
Sécurité
Autres
03/2014 Big Data
Sources : Gartner
© 16
Si l’information devient un actif, alors il faut s’organiser et se
spécialiser en conséquence
03/2014 Big Data
Sources : R Casonato/Gartner : Addressing the Big Data Skills Crisis
© 1703/2014 Big Data
“Institutions are becoming naked, and if you're going to be naked … fitness
is no longer optional. If you're going to be naked, you better get buff.”
Vers un monde de plus en plus transparent… pour le meilleur et pour
le pire
Don Tapscott : four principles for the open world
• Ne pas utiliser la donnée au-
delà d’un périmètre bien
délimité
• Traitez les autres comme
vous accepteriez d’être
traités
• Solliciter le consentement,
partagez les résultats et les
bénéfices avec vos
partenaires
Source : F Buytendijk
Définir au plus tôt son
éthique vis-à-vis du big data
© 18
Quelles technologies pour le Big Data ?
Sources : Ray Wang
03/2014 Big Data
© 19
Appliances
Bases de
données
analytiques
In memory
analytics
In memory
Extreme
processing
Moteurs de
recherche
NoSQL
Zoom sur Les technologies de gestion des données (« stockage ») :
la taille unique n’existe pas, la solution dépend des usages
03/2014 Big Data
réinventer les
principes
fondateurs des
bases de données
Le Hardware à
la rescousse du
software
Spécialiser la
base de
données à
chaque cas
d’usage
Traiter
l’information
comme elle vient
au fil de l’eau
S’affranchir des
contraintes
mécaniques
Appliquer les
principes du net
à l’informatique
d’entreprise
© 20
Appliances
Bases de
données
analytiques
In memory
analytics
In memory
Extreme
processing
Moteurs de
recherche
No SQLExalead
Endeca (Oracle)
Data Explorer(IBM)
Autonomy (HP)
Teradata
Pure Data (IBM)
Exadata (Oracle)
Vertica /
Autonomy (HP)
Paraccel (Actian)
Sybase IQ (SAP)
Infobright
Bases Olap
Streams (IBM)
Times Ten (Oracle)
Aleri et Hana (SAP)
Teracota (Software
AG)
Streambase (Tibco)
SQLServer 2014 (MS)
Exalytics (Oracle)
Hana (SAP)
xVelocity
(Microsoft)
DB2 BLU (IBM)
SAS LASR Analytic
Server…
Hadoop (IBM, MS,
Oracle, Intel,
Cloudera,
Hortonworks),
Mongo DB, Cassandra
Lotus Domino
Les technologies de gestion des données : exemple
03/2014 Big Data
© 21
Appliances
Bases de
données
analytiques
In memory
analytics
In memory
Extreme
processing
Moteurs de
recherche
NoSQL
Volume
Temps
Réel
(Vitesse)
Variété
Les technologies de gestion des données (« stockage ») :
la taille unique n’existe pas, tout dépend des usages
03/2014 Big Data
© 22
La technologie phare du Big Data
Hadoop
Distributed File
System (HDFS)
File Sharing & Data
Protection Across
Physical Servers
MapReduce
Distributed Computing
Across Physical Servers
Hadoop est un framework Java qui
permet de constituer une plateforme
Big Data complète
 Adaptable sur des très gros
volumes
 Tolérant aux pannes
 Open source
 Hardware « banalisé »
CORE HADOOP COMPONENTS
03/2014 Big Data
© 23
Pourquoi Hadoop ?
Source : P Russom – TDWI Best practices report ; Integrating Hadoop into BI & Data Warehousing
03/2014 Big Data
© 24
Hadoop : freins et axes d’amélioration
Source : P Russom – TDWI Best practices report ; Integrating Hadoop into BI & Data Warehousing
03/2014 Big Data
© 25
Quelles évolutions pour Hadoop ?
Intégrer le temps réel
(Fast Data)
• Base Colonne (Hbase)
• Spark (in memory)
• Storm-Yarn :
• Calculs en temps réel sur les
données
• Gestion des données au fil
de l’eau (streams)
Faciliter les accès aux
données structurées et
l’interactivité avec SQL
• Impala (Cloudera)
• Drill (Mapr)
• Stinger (Hortonworks)
• Evolutions Hive, Hadapt
Ecosytème « on top »
autour de Hadoop
• Intégration de données
(Talend, Syncsort,
Revelytix…)
• Accès aux données
(Datameer, Karmasphere…)
• Data mining ( R, Weka )
03/2014 Big Data
© 26
Big Data
Tendances, perspectives et cas d’usage
20/03/2014
Jean-Michel Franco
Directeur de l’innovation et des solutions
jean-michel.franco@businessdecision.com
Twitter : @jmichel_franco
© 27
Table ronde
Big Data et industrie, services et retail
20/03/2014
© 28
Table ronde : Big Data et industrie, services, retail
Avec
Denis Weiss
DSI
La poste Industrie
Michael Lanotte
Responsable R&D
Itron
Jérôme Cornillet
Business Solutions Manager
Sas
Jean-Pierre Lartige
Délégué Poitou Charentes
Orange
Baptiste Jouffroy
Sales Manager Europe
GE Intelligent Platforms
Jean-Michel Franco
Directeur Innovation
Business & Decision
03/2014 Table ronde : Big Data et industrie
© 29
Imagination at work.
Baptiste Jouffroy
20 mars 2014
Big Data
GE Intelligent Platforms
03/2014 Table ronde : Big Data et industrie (General Electric)
© 30
Le Big Data pour l’Industrie
De quoi s’agit-il?
Equipements et Processus
Temps réel
Haute fréquence
Température
Pression
Vitesse
Jusquà la milliseconde
Des Millions d’échantillons
archivés plusieurs années
Modélisation, Analyse
Prédictive et
Diagnostic
Définition1 Type de
données
2
Echantillonnage3 Archivage et Analyse Prédictive4
03/2014 Table ronde : Big Data et industrie (General Electric)
© 31
Objectifs : Analogie
Big Data
 Google
 Facebook
 Amazon
Que vont acheter les
adolescents en Europe ?
Mon compresseur
opère-t-il dans de
bonnes conditions ?
Big Data
Industriel
 Machines
 Capteurs
 Temps Réel
03/2014 Table ronde : Big Data et industrie (General Electric)
© 32
Le Big Data pour l’Industrie
De quoi s’agit-il?
03/2014 Table ronde : Big Data et industrie (General Electric)
Réduire les arrêts non programmés
Améliorer la fiabilités des équipements
Réduire les pertes de production
Optimiser les coûts de maintenance
© 33
Michaël Lanotte / Responsable R&D Itron v1.1
BIG DATA & COMPTEURS INTELLIGENTS
03/2014 Table ronde : Big Data et industrie (Itron)
© 34
Vélocité
s, min, h, jour
Le contexte client
Les compteurs communicants
* = VolumeVariété
Alarmes & Logs
Profil de consommation
Qualimétrie réseau
Performance
Index de facturation
…
5 milliards / jour
* Profil de consommation 10min
sur 35M de compteurs
03/2014 Table ronde : Big Data et industrie (Itron)
© 35
» Des centaines de produits sous test…
…des milliers de lignes de LOG à la seconde
» Une masse de données
à transformer en informations utiles
Analyser en temps réel
Cas d’utilisation 1 – Indexer, rechercher & corréler des données non fonctionnelles (logs)
Notre centre d’essai de performance & d’endurance
Un outil d’analyse des logs
Indexer
Rechercher
Corréler
03/2014 Table ronde : Big Data et industrie (Itron)
© 36
» Expertise sur l’amélioration des performances de collecte terrain
» Analyse de l’indicateur horaire de qualité des communications CPL
• 1 site avec 280 compteurs sur 5 mois => 1.000.000 mesures
Projet pilote dans le comptage communicant
Mettre en valeur des données en masse
Cas d’utilisation 2 – Qualité des communications CPL
Utilisation d’une représentation graphique pour faciliter l’analyse
» Suite à l’application de nouveaux paramètres optimisés
• Pics moins nombreux & moins prononcés, meilleure performance (+ vert)
Mai’12Jan’12 Changement paramètres
le 20/03/12
03/2014 Table ronde : Big Data et industrie (Itron)
© 37
Flux Vision
Une solution Orange Data & Analytics
Jean-Pierre Lartige - Orange 20 Mars 2014
© 38
Une exploitation des données des mobiles totalement anonymes !
Mesure des flux de population
Flux de véhicules sur les axes routiers
Mouvements de foules sur des évènements
Analyse des typologies de population
Une version complètement adaptée au tourisme
Au service du marketing et de la vente
03/2014 Table ronde : Big Data et industrie ( Orange)
© 39
Cas d’usage pour un distributeur
03/2014 Table ronde : Big Data et industrie (Orange)
© 40
Flux Vision : indicateurs statistiques permettant l'analyse de la
mobilité d’une population
?
?
?
?
 Zone : IRIS
 Fréquentation (personnes différentes)
 Fréquence
 Durée de la présence
 Tranche horaire
 Lieu de résidence, lieu de travail
 Origine / destination
 Résidents / touristes
 Profils socio-demo
 Prédiction de trafic
 Fréquentation indoor
 Webservice France entière
03/2014 Table ronde : Big Data et industrie (Orange)
© 41
Visualisation des données
03/2014 Table ronde : Big Data et industrie (Orange)
© 42
Les + de Flux Vision
fiabilité des résultats (volumes, événements réseaux)
fraicheur des données (jursqu’au temps réel)
personnalisation des rapports
respect de la loi et de la vie privée des clients Orange
une offre compétitive et complémentaire
CNIL
1
2
3
4
5
03/2014 Table ronde : Big Data et industrie (Orange)

Contenu connexe

Tendances

Technologies pour le Big Data
Technologies pour le Big DataTechnologies pour le Big Data
Technologies pour le Big Data
Minyar Sassi Hidri
 
BIG DATA
BIG DATABIG DATA
BIG DATA
laurence allard
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
Lilia Sfaxi
 
Big data
Big dataBig data
Big data
Karima GHALI
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
Lilia Sfaxi
 
Cours Big Data Part I
Cours Big Data Part ICours Big Data Part I
Cours Big Data Part I
Mohamed Faïçal ESSALIFI
 
Etude sur le Big Data
Etude sur le Big DataEtude sur le Big Data
Etude sur le Big Data
Nexialog Consulting
 
Introduction à la big data V2
Introduction à la big data V2Introduction à la big data V2
Introduction à la big data V2
Mehdi TAZI
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
Lilia Sfaxi
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big Data
Lilia Sfaxi
 
DataWarehouse
DataWarehouseDataWarehouse
DataWarehouse
nzuguem
 
La Big Data et ses applications
La Big Data et ses applicationsLa Big Data et ses applications
La Big Data et ses applications
Affinity Engine
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
Amal Abid
 
bgi-data-1 (1).pptx
bgi-data-1 (1).pptxbgi-data-1 (1).pptx
bgi-data-1 (1).pptx
ImedMessaoudi2
 
Chapitre 2 hadoop
Chapitre 2 hadoopChapitre 2 hadoop
Chapitre 2 hadoop
Mouna Torjmen
 
Introduction à la big data v3
Introduction à la big data v3 Introduction à la big data v3
Introduction à la big data v3
Mehdi TAZI
 
Mémoire de fin d'étude - La big data et les réseaux sociaux
Mémoire de fin d'étude - La big data et les réseaux sociauxMémoire de fin d'étude - La big data et les réseaux sociaux
Mémoire de fin d'étude - La big data et les réseaux sociaux
Chloé Marty
 
Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture
Lilia Sfaxi
 
Introduction au big data
Introduction au big dataIntroduction au big data
Introduction au big data
Abdelghani Azri
 

Tendances (20)

Technologies pour le Big Data
Technologies pour le Big DataTechnologies pour le Big Data
Technologies pour le Big Data
 
BIG DATA
BIG DATABIG DATA
BIG DATA
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
 
Big data
Big dataBig data
Big data
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
 
Cours Big Data Part I
Cours Big Data Part ICours Big Data Part I
Cours Big Data Part I
 
Etude sur le Big Data
Etude sur le Big DataEtude sur le Big Data
Etude sur le Big Data
 
Introduction à la big data V2
Introduction à la big data V2Introduction à la big data V2
Introduction à la big data V2
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big Data
 
Bi
BiBi
Bi
 
DataWarehouse
DataWarehouseDataWarehouse
DataWarehouse
 
La Big Data et ses applications
La Big Data et ses applicationsLa Big Data et ses applications
La Big Data et ses applications
 
Cours Big Data Chap1
Cours Big Data Chap1Cours Big Data Chap1
Cours Big Data Chap1
 
bgi-data-1 (1).pptx
bgi-data-1 (1).pptxbgi-data-1 (1).pptx
bgi-data-1 (1).pptx
 
Chapitre 2 hadoop
Chapitre 2 hadoopChapitre 2 hadoop
Chapitre 2 hadoop
 
Introduction à la big data v3
Introduction à la big data v3 Introduction à la big data v3
Introduction à la big data v3
 
Mémoire de fin d'étude - La big data et les réseaux sociaux
Mémoire de fin d'étude - La big data et les réseaux sociauxMémoire de fin d'étude - La big data et les réseaux sociaux
Mémoire de fin d'étude - La big data et les réseaux sociaux
 
Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture
 
Introduction au big data
Introduction au big dataIntroduction au big data
Introduction au big data
 

En vedette

Un introduction à Pig
Un introduction à PigUn introduction à Pig
Un introduction à Pig
Modern Data Stack France
 
Une introduction à Hive
Une introduction à HiveUne introduction à Hive
Une introduction à Hive
Modern Data Stack France
 
Valtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entrepriseValtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech
 
The Truth Behind The Greatest Assassinations In American
The Truth Behind The Greatest Assassinations In AmericanThe Truth Behind The Greatest Assassinations In American
The Truth Behind The Greatest Assassinations In American
guest25e0a66
 
Filmindustry 131019052154-phpapp01 ir n
Filmindustry 131019052154-phpapp01 ir nFilmindustry 131019052154-phpapp01 ir n
Filmindustry 131019052154-phpapp01 ir n
haverstockmedia
 
Memoire recherche
Memoire rechercheMemoire recherche
Memoire recherche
tmauriac
 
Conférence Big Data HEC Paris 2015
Conférence Big Data HEC Paris 2015Conférence Big Data HEC Paris 2015
Conférence Big Data HEC Paris 2015
Francois Cazals
 
Hive ppt (1)
Hive ppt (1)Hive ppt (1)
Hive ppt (1)
marwa baich
 
Introduction to Apache Pig
Introduction to Apache PigIntroduction to Apache Pig
Introduction to Apache Pig
Jason Shao
 
Introduction to Pig
Introduction to PigIntroduction to Pig
Introduction to Pig
Prashanth Babu
 
Big data et marketing :Vers une analyse prédictif de d'acte d'achat
Big data et marketing :Vers une analyse prédictif de d'acte d'achatBig data et marketing :Vers une analyse prédictif de d'acte d'achat
Big data et marketing :Vers une analyse prédictif de d'acte d'achat
fifi75
 
Bases de données NoSQL
Bases de données NoSQLBases de données NoSQL
Bases de données NoSQL
Samy Dindane
 
Big Data Analytics for connected home
Big Data Analytics for connected homeBig Data Analytics for connected home
Big Data Analytics for connected home
Héloïse Nonne
 
NoSql : conception des schémas, requêtage, et optimisation
NoSql : conception des schémas, requêtage, et optimisationNoSql : conception des schémas, requêtage, et optimisation
NoSql : conception des schémas, requêtage, et optimisation
Microsoft Technet France
 
Une introduction à MapReduce
Une introduction à MapReduceUne introduction à MapReduce
Une introduction à MapReduce
Modern Data Stack France
 
Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark
Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache SparkPlateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark
Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark
ALTIC Altic
 
Présentation Big Data et REX Hadoop
Présentation Big Data et REX HadoopPrésentation Big Data et REX Hadoop
Présentation Big Data et REX Hadoop
Joseph Glorieux
 
Enquête RegionsJob : emploi et réseaux sociaux, deuxième édition
Enquête RegionsJob : emploi et réseaux sociaux, deuxième éditionEnquête RegionsJob : emploi et réseaux sociaux, deuxième édition
Enquête RegionsJob : emploi et réseaux sociaux, deuxième édition
HelloWork
 
Casablanca Hadoop & Big Data Meetup - Introduction à Hadoop
Casablanca Hadoop & Big Data Meetup - Introduction à HadoopCasablanca Hadoop & Big Data Meetup - Introduction à Hadoop
Casablanca Hadoop & Big Data Meetup - Introduction à Hadoop
Benoît de CHATEAUVIEUX
 

En vedette (20)

Un introduction à Pig
Un introduction à PigUn introduction à Pig
Un introduction à Pig
 
Une introduction à Hive
Une introduction à HiveUne introduction à Hive
Une introduction à Hive
 
Valtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entrepriseValtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entreprise
 
I love BIG DATA
I love BIG DATAI love BIG DATA
I love BIG DATA
 
The Truth Behind The Greatest Assassinations In American
The Truth Behind The Greatest Assassinations In AmericanThe Truth Behind The Greatest Assassinations In American
The Truth Behind The Greatest Assassinations In American
 
Filmindustry 131019052154-phpapp01 ir n
Filmindustry 131019052154-phpapp01 ir nFilmindustry 131019052154-phpapp01 ir n
Filmindustry 131019052154-phpapp01 ir n
 
Memoire recherche
Memoire rechercheMemoire recherche
Memoire recherche
 
Conférence Big Data HEC Paris 2015
Conférence Big Data HEC Paris 2015Conférence Big Data HEC Paris 2015
Conférence Big Data HEC Paris 2015
 
Hive ppt (1)
Hive ppt (1)Hive ppt (1)
Hive ppt (1)
 
Introduction to Apache Pig
Introduction to Apache PigIntroduction to Apache Pig
Introduction to Apache Pig
 
Introduction to Pig
Introduction to PigIntroduction to Pig
Introduction to Pig
 
Big data et marketing :Vers une analyse prédictif de d'acte d'achat
Big data et marketing :Vers une analyse prédictif de d'acte d'achatBig data et marketing :Vers une analyse prédictif de d'acte d'achat
Big data et marketing :Vers une analyse prédictif de d'acte d'achat
 
Bases de données NoSQL
Bases de données NoSQLBases de données NoSQL
Bases de données NoSQL
 
Big Data Analytics for connected home
Big Data Analytics for connected homeBig Data Analytics for connected home
Big Data Analytics for connected home
 
NoSql : conception des schémas, requêtage, et optimisation
NoSql : conception des schémas, requêtage, et optimisationNoSql : conception des schémas, requêtage, et optimisation
NoSql : conception des schémas, requêtage, et optimisation
 
Une introduction à MapReduce
Une introduction à MapReduceUne introduction à MapReduce
Une introduction à MapReduce
 
Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark
Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache SparkPlateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark
Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark
 
Présentation Big Data et REX Hadoop
Présentation Big Data et REX HadoopPrésentation Big Data et REX Hadoop
Présentation Big Data et REX Hadoop
 
Enquête RegionsJob : emploi et réseaux sociaux, deuxième édition
Enquête RegionsJob : emploi et réseaux sociaux, deuxième éditionEnquête RegionsJob : emploi et réseaux sociaux, deuxième édition
Enquête RegionsJob : emploi et réseaux sociaux, deuxième édition
 
Casablanca Hadoop & Big Data Meetup - Introduction à Hadoop
Casablanca Hadoop & Big Data Meetup - Introduction à HadoopCasablanca Hadoop & Big Data Meetup - Introduction à Hadoop
Casablanca Hadoop & Big Data Meetup - Introduction à Hadoop
 

Similaire à Big Data : concepts, cas d'usage et tendances

Le Big Data dans la Banque et l'Assurance
Le Big Data dans la Banque et l'AssuranceLe Big Data dans la Banque et l'Assurance
Le Big Data dans la Banque et l'Assurance
AMNIS Consulting
 
Etude Apec - Les métiers de la data
Etude Apec - Les métiers de la dataEtude Apec - Les métiers de la data
Etude Apec - Les métiers de la data
Apec
 
Pilotage & Performance 2012
Pilotage & Performance 2012Pilotage & Performance 2012
Pilotage & Performance 2012
Business & Decision
 
Soft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMPSoft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMP
Soft Computing
 
Magellan Partners - Valoriser l’expérience client et augmenter la rentabilité...
Magellan Partners - Valoriser l’expérience client et augmenter la rentabilité...Magellan Partners - Valoriser l’expérience client et augmenter la rentabilité...
Magellan Partners - Valoriser l’expérience client et augmenter la rentabilité...
Magellan Consulting
 
Webinaire Business&Decision - Trifacta
Webinaire  Business&Decision - TrifactaWebinaire  Business&Decision - Trifacta
Webinaire Business&Decision - Trifacta
Victor Coustenoble
 
Ch&cie présentation du big data dans l'assurance
Ch&cie présentation du big data dans l'assuranceCh&cie présentation du big data dans l'assurance
Ch&cie présentation du big data dans l'assurance
Betito Yan
 
Big data et marketing digital
Big data et marketing digital Big data et marketing digital
Big data et marketing digital
Hamza Sossey
 
Big Data: quelle valeur pour l'entreprise
Big Data: quelle valeur pour l'entrepriseBig Data: quelle valeur pour l'entreprise
Big Data: quelle valeur pour l'entreprise
Genève Lab
 
Exploitez le Big Data dans le cadre de votre stratégie MDM
Exploitez le Big Data dans le cadre de votre stratégie MDMExploitez le Big Data dans le cadre de votre stratégie MDM
Exploitez le Big Data dans le cadre de votre stratégie MDM
Jean-Michel Franco
 
Les 4 étapes clés pour transformer les données client en valeur
Les 4 étapes clés pour transformer les données client en valeurLes 4 étapes clés pour transformer les données client en valeur
Les 4 étapes clés pour transformer les données client en valeur
Jean-Michel Franco
 
Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?
Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?
Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?
Stéphane Chappellier
 
Livre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligenceLivre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligence
Hélène Etienne
 
Séminaire RCU
Séminaire RCUSéminaire RCU
Séminaire RCU
Soft Computing
 
[Fr] Information builders - MDM et Big Data
[Fr] Information builders - MDM et Big Data[Fr] Information builders - MDM et Big Data
[Fr] Information builders - MDM et Big Data
Yann Gourvennec
 
Formation M2i - Placer la Data au cœur de la stratégie de l'entreprise
Formation M2i - Placer la Data au cœur de la stratégie de l'entrepriseFormation M2i - Placer la Data au cœur de la stratégie de l'entreprise
Formation M2i - Placer la Data au cœur de la stratégie de l'entreprise
M2i Formation
 
Think tank data IA Talks - April 2019 I Nouamne Cherkaoui - Mick Levy - Arnau...
Think tank data IA Talks - April 2019 I Nouamne Cherkaoui - Mick Levy - Arnau...Think tank data IA Talks - April 2019 I Nouamne Cherkaoui - Mick Levy - Arnau...
Think tank data IA Talks - April 2019 I Nouamne Cherkaoui - Mick Levy - Arnau...
Nouamane Cherkaoui
 
Gestion des données clients et leur exploitation, un enjeu dans la transforma...
Gestion des données clients et leur exploitation, un enjeu dans la transforma...Gestion des données clients et leur exploitation, un enjeu dans la transforma...
Gestion des données clients et leur exploitation, un enjeu dans la transforma...
Pitney Bowes
 
19/10/17 Séminaire Référentiel Client Unique
19/10/17 Séminaire Référentiel Client Unique19/10/17 Séminaire Référentiel Client Unique
19/10/17 Séminaire Référentiel Client Unique
Soft Computing
 
Point de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big DataPoint de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big Data
Nicolas Peene
 

Similaire à Big Data : concepts, cas d'usage et tendances (20)

Le Big Data dans la Banque et l'Assurance
Le Big Data dans la Banque et l'AssuranceLe Big Data dans la Banque et l'Assurance
Le Big Data dans la Banque et l'Assurance
 
Etude Apec - Les métiers de la data
Etude Apec - Les métiers de la dataEtude Apec - Les métiers de la data
Etude Apec - Les métiers de la data
 
Pilotage & Performance 2012
Pilotage & Performance 2012Pilotage & Performance 2012
Pilotage & Performance 2012
 
Soft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMPSoft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMP
 
Magellan Partners - Valoriser l’expérience client et augmenter la rentabilité...
Magellan Partners - Valoriser l’expérience client et augmenter la rentabilité...Magellan Partners - Valoriser l’expérience client et augmenter la rentabilité...
Magellan Partners - Valoriser l’expérience client et augmenter la rentabilité...
 
Webinaire Business&Decision - Trifacta
Webinaire  Business&Decision - TrifactaWebinaire  Business&Decision - Trifacta
Webinaire Business&Decision - Trifacta
 
Ch&cie présentation du big data dans l'assurance
Ch&cie présentation du big data dans l'assuranceCh&cie présentation du big data dans l'assurance
Ch&cie présentation du big data dans l'assurance
 
Big data et marketing digital
Big data et marketing digital Big data et marketing digital
Big data et marketing digital
 
Big Data: quelle valeur pour l'entreprise
Big Data: quelle valeur pour l'entrepriseBig Data: quelle valeur pour l'entreprise
Big Data: quelle valeur pour l'entreprise
 
Exploitez le Big Data dans le cadre de votre stratégie MDM
Exploitez le Big Data dans le cadre de votre stratégie MDMExploitez le Big Data dans le cadre de votre stratégie MDM
Exploitez le Big Data dans le cadre de votre stratégie MDM
 
Les 4 étapes clés pour transformer les données client en valeur
Les 4 étapes clés pour transformer les données client en valeurLes 4 étapes clés pour transformer les données client en valeur
Les 4 étapes clés pour transformer les données client en valeur
 
Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?
Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?
Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?
 
Livre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligenceLivre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligence
 
Séminaire RCU
Séminaire RCUSéminaire RCU
Séminaire RCU
 
[Fr] Information builders - MDM et Big Data
[Fr] Information builders - MDM et Big Data[Fr] Information builders - MDM et Big Data
[Fr] Information builders - MDM et Big Data
 
Formation M2i - Placer la Data au cœur de la stratégie de l'entreprise
Formation M2i - Placer la Data au cœur de la stratégie de l'entrepriseFormation M2i - Placer la Data au cœur de la stratégie de l'entreprise
Formation M2i - Placer la Data au cœur de la stratégie de l'entreprise
 
Think tank data IA Talks - April 2019 I Nouamne Cherkaoui - Mick Levy - Arnau...
Think tank data IA Talks - April 2019 I Nouamne Cherkaoui - Mick Levy - Arnau...Think tank data IA Talks - April 2019 I Nouamne Cherkaoui - Mick Levy - Arnau...
Think tank data IA Talks - April 2019 I Nouamne Cherkaoui - Mick Levy - Arnau...
 
Gestion des données clients et leur exploitation, un enjeu dans la transforma...
Gestion des données clients et leur exploitation, un enjeu dans la transforma...Gestion des données clients et leur exploitation, un enjeu dans la transforma...
Gestion des données clients et leur exploitation, un enjeu dans la transforma...
 
19/10/17 Séminaire Référentiel Client Unique
19/10/17 Séminaire Référentiel Client Unique19/10/17 Séminaire Référentiel Client Unique
19/10/17 Séminaire Référentiel Client Unique
 
Point de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big DataPoint de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big Data
 

Plus de Jean-Michel Franco

A commonsense approach to data
A commonsense approach to dataA commonsense approach to data
A commonsense approach to data
Jean-Michel Franco
 
Prendre la data par le bon sens
Prendre la data par le bon sensPrendre la data par le bon sens
Prendre la data par le bon sens
Jean-Michel Franco
 
Reveal the Intelligence in your Data with Talend Data Fabric
Reveal the Intelligence in your Data with Talend Data FabricReveal the Intelligence in your Data with Talend Data Fabric
Reveal the Intelligence in your Data with Talend Data Fabric
Jean-Michel Franco
 
Dévoilez l'essentiel de vos données avec Talend
Dévoilez l'essentiel de vos données avec TalendDévoilez l'essentiel de vos données avec Talend
Dévoilez l'essentiel de vos données avec Talend
Jean-Michel Franco
 
3 Steps to Turning CCPA & Data Privacy into Personalized Customer Experiences
3 Steps to Turning CCPA & Data Privacy into Personalized Customer Experiences3 Steps to Turning CCPA & Data Privacy into Personalized Customer Experiences
3 Steps to Turning CCPA & Data Privacy into Personalized Customer Experiences
Jean-Michel Franco
 
Delivering data governance with a Yes
Delivering data governance with a YesDelivering data governance with a Yes
Delivering data governance with a Yes
Jean-Michel Franco
 
Delivering data you can trust with Talend 2019
Delivering data you can trust with Talend 2019 Delivering data you can trust with Talend 2019
Delivering data you can trust with Talend 2019
Jean-Michel Franco
 
Delivering data you can trust for data privacy
Delivering data you can trust for data privacy Delivering data you can trust for data privacy
Delivering data you can trust for data privacy
Jean-Michel Franco
 
Deliver Data Governance with a “Yes”
Deliver Data Governance with a “Yes”Deliver Data Governance with a “Yes”
Deliver Data Governance with a “Yes”
Jean-Michel Franco
 
Libérez vos données avec un catalogue de données
Libérez vos données avec un catalogue de donnéesLibérez vos données avec un catalogue de données
Libérez vos données avec un catalogue de données
Jean-Michel Franco
 
Liberating data with Talend Data Catalog
Liberating data with Talend Data CatalogLiberating data with Talend Data Catalog
Liberating data with Talend Data Catalog
Jean-Michel Franco
 
Delivering Analytics at Scale with a Governed Data Lake
Delivering Analytics at Scale with a Governed Data LakeDelivering Analytics at Scale with a Governed Data Lake
Delivering Analytics at Scale with a Governed Data Lake
Jean-Michel Franco
 
GDPR Benhmark: 70% of companies failing on their own GDPR compliance claims
GDPR Benhmark: 70%  of companies failing on their own GDPR compliance claimsGDPR Benhmark: 70%  of companies failing on their own GDPR compliance claims
GDPR Benhmark: 70% of companies failing on their own GDPR compliance claims
Jean-Michel Franco
 
Enacting the data subjects access rights for gdpr with data services and data...
Enacting the data subjects access rights for gdpr with data services and data...Enacting the data subjects access rights for gdpr with data services and data...
Enacting the data subjects access rights for gdpr with data services and data...
Jean-Michel Franco
 
Operationalising gdpr compliance with data management
Operationalising gdpr compliance with data managementOperationalising gdpr compliance with data management
Operationalising gdpr compliance with data management
Jean-Michel Franco
 
Make Data Better Together
Make Data Better Together Make Data Better Together
Make Data Better Together
Jean-Michel Franco
 
Delivering analytics at scale with a governed data lake
Delivering analytics at scale with a governed data lakeDelivering analytics at scale with a governed data lake
Delivering analytics at scale with a governed data lake
Jean-Michel Franco
 
Enacting the Data Subjects Access Rights for GDPR with Data Services and Data...
Enacting the Data Subjects Access Rights for GDPR with Data Services and Data...Enacting the Data Subjects Access Rights for GDPR with Data Services and Data...
Enacting the Data Subjects Access Rights for GDPR with Data Services and Data...
Jean-Michel Franco
 
Créer la vue 360° des employés
Créer la vue 360° des employés Créer la vue 360° des employés
Créer la vue 360° des employés
Jean-Michel Franco
 
Are Your Data Ready for GDPR? (with MAPR and Talend)
Are Your Data Ready for GDPR? (with MAPR and Talend)Are Your Data Ready for GDPR? (with MAPR and Talend)
Are Your Data Ready for GDPR? (with MAPR and Talend)
Jean-Michel Franco
 

Plus de Jean-Michel Franco (20)

A commonsense approach to data
A commonsense approach to dataA commonsense approach to data
A commonsense approach to data
 
Prendre la data par le bon sens
Prendre la data par le bon sensPrendre la data par le bon sens
Prendre la data par le bon sens
 
Reveal the Intelligence in your Data with Talend Data Fabric
Reveal the Intelligence in your Data with Talend Data FabricReveal the Intelligence in your Data with Talend Data Fabric
Reveal the Intelligence in your Data with Talend Data Fabric
 
Dévoilez l'essentiel de vos données avec Talend
Dévoilez l'essentiel de vos données avec TalendDévoilez l'essentiel de vos données avec Talend
Dévoilez l'essentiel de vos données avec Talend
 
3 Steps to Turning CCPA & Data Privacy into Personalized Customer Experiences
3 Steps to Turning CCPA & Data Privacy into Personalized Customer Experiences3 Steps to Turning CCPA & Data Privacy into Personalized Customer Experiences
3 Steps to Turning CCPA & Data Privacy into Personalized Customer Experiences
 
Delivering data governance with a Yes
Delivering data governance with a YesDelivering data governance with a Yes
Delivering data governance with a Yes
 
Delivering data you can trust with Talend 2019
Delivering data you can trust with Talend 2019 Delivering data you can trust with Talend 2019
Delivering data you can trust with Talend 2019
 
Delivering data you can trust for data privacy
Delivering data you can trust for data privacy Delivering data you can trust for data privacy
Delivering data you can trust for data privacy
 
Deliver Data Governance with a “Yes”
Deliver Data Governance with a “Yes”Deliver Data Governance with a “Yes”
Deliver Data Governance with a “Yes”
 
Libérez vos données avec un catalogue de données
Libérez vos données avec un catalogue de donnéesLibérez vos données avec un catalogue de données
Libérez vos données avec un catalogue de données
 
Liberating data with Talend Data Catalog
Liberating data with Talend Data CatalogLiberating data with Talend Data Catalog
Liberating data with Talend Data Catalog
 
Delivering Analytics at Scale with a Governed Data Lake
Delivering Analytics at Scale with a Governed Data LakeDelivering Analytics at Scale with a Governed Data Lake
Delivering Analytics at Scale with a Governed Data Lake
 
GDPR Benhmark: 70% of companies failing on their own GDPR compliance claims
GDPR Benhmark: 70%  of companies failing on their own GDPR compliance claimsGDPR Benhmark: 70%  of companies failing on their own GDPR compliance claims
GDPR Benhmark: 70% of companies failing on their own GDPR compliance claims
 
Enacting the data subjects access rights for gdpr with data services and data...
Enacting the data subjects access rights for gdpr with data services and data...Enacting the data subjects access rights for gdpr with data services and data...
Enacting the data subjects access rights for gdpr with data services and data...
 
Operationalising gdpr compliance with data management
Operationalising gdpr compliance with data managementOperationalising gdpr compliance with data management
Operationalising gdpr compliance with data management
 
Make Data Better Together
Make Data Better Together Make Data Better Together
Make Data Better Together
 
Delivering analytics at scale with a governed data lake
Delivering analytics at scale with a governed data lakeDelivering analytics at scale with a governed data lake
Delivering analytics at scale with a governed data lake
 
Enacting the Data Subjects Access Rights for GDPR with Data Services and Data...
Enacting the Data Subjects Access Rights for GDPR with Data Services and Data...Enacting the Data Subjects Access Rights for GDPR with Data Services and Data...
Enacting the Data Subjects Access Rights for GDPR with Data Services and Data...
 
Créer la vue 360° des employés
Créer la vue 360° des employés Créer la vue 360° des employés
Créer la vue 360° des employés
 
Are Your Data Ready for GDPR? (with MAPR and Talend)
Are Your Data Ready for GDPR? (with MAPR and Talend)Are Your Data Ready for GDPR? (with MAPR and Talend)
Are Your Data Ready for GDPR? (with MAPR and Talend)
 

Big Data : concepts, cas d'usage et tendances

  • 1. Big Data Tendances, perspectives et cas d’usage 20/03/2014 Jean-Michel Franco Directeur de l’innovation et des solutions jean-michel.franco@businessdecision.com Twitter : @jmichel_franco
  • 2. © 2 Définition 03/2014 Big Data Les challenges incluent la collecte, la curation, le stockage, l’enrichissement, le croisement, la partage, l’analyse et la visualisation. Le « Big Data » vise à tirer un avantage concurrentiel au travers de méthodes de collecte, d’analyse et d’exploitation des données qu’on ne pouvait utiliser jusqu’à présent du fait des contraintes économiques, fonctionnelles et techniques liées aux volumétries, à la vitesse de traitement et à la variété des données à considérer. Source “The 451 Group” & Gartner Source Wikipedia
  • 3. © 3 Le Big data : une cible mouvante… … mais qui désormais nous concerne tous 03/2014 Big Data 1950 1960 1970 1980 1990 2000 2010 100 Pétas 20 Pétas Assurances 600 MB Voyages 807 MB Transports 80 GB 40 Pétas 60 Pétas 1 Péta = 1.000.000.000.000.000 octets (1015) = 1.000.000 Giga octets = 1000 téra octets 80 Pétas Banque 450 GB Retail 180 TB Medias 100 PB Medias 25 PB
  • 4. © 4 Popularité Information disponible Notre enjeu : le principe de la longue traîne, appliqué à la gestion de l’information La gestion de l’information telle qu’on la connait - capital informationnel constitué sur la base des SI internes de l’entreprise - information exploitée transversalement uniquement en temps différé - information modélisée à priori La gestion de l’information telle qu’on la voudrait La gestion de l’information telle qu’on la connait + information générés par les humains + information gérée par les machines + information en « juste à temps » (vitesse) + information modélisable, assemblable, et extensible au fil de l’eau (élasticité) 03/2014 Big Data
  • 5. © 5 Exemple d’innovation dans la distribution: Au plus près du terrain et de la demande client La grande distribution a été pionnière dans la mise en œuvre de data warehouses d’entreprise, notamment pour l’analyse des données extraites des tickets de caisse. Mais il devient nécessaire de tirer encore plus de valeur de ces données, d’approfondir les capacités d’analyse et de les rendre « actionnables » . Gestion plus fine et dynamique des prix de vente Personnalisation des offres pour les programmes de fidélité Gestion proactive des fraudes Ajustement de l’offre et de la demande, par zone géographique Gestion du on line multi-canal (e-commerce, magasins, drive) 03/2014 Big Data
  • 6. © 6 • Passer d’une économie de l’attention à une économie de l’intention • Tester le bien fondé des offres, les remettre en cause en permanence • Offrir le même niveau de service au travers des canaux d’interaction • Mieux “maitriser” les recommandations associées aux hôtels du groupe et les interactions avec les promoteurs et détracteurs Exemple d’innovation dans le secteur de l’hôtellerie: recommandations temps réel Améliorer le taux de transformation (ROI en neuf mois) Capacité à tester les nouvelles offres, et de les retirer si peu efficaces Capacité d’écoute, de réactivité et d’ « influence » sur les promoteurs et détracteurs Fédération de la connaissance client pour s’adapter aux changements d’organisation et intégrer les médias sociaux Offre et communication personnalisée pour chaque client 03/2014 Big Data
  • 7. © 7 Exemple d’innovation dans les utilities : Le « Smart Watering » (*) Source : SIA conseil En France , 25% de l’eau injectée sur le réseau est perdue en fuites et fraudes ; Le manque à gagner pour les citoyens s’élève à 2,4 milliards d’euros par an. (*) Les canaux numériques et l’Internet des objets ouvrent de nouvelles opportunités pour collecter/exploiter les données, et les mettre à disposition de tous Informations en temps réel sur les débits et la qualité de l’eau Services à valeur ajoutée pour les consommateurs et les collectivités Détection au plus tôt des problèmes sur le réseau et en bout de chaine Engagement commun au principe de consommation responsable Automatisation du processus de collecte 03/2014 Big Data
  • 8. © 8 Exemple d’innovation dans le secteur des assurances : innover par de nouvelles offres Une start-up dédiée à l’assurance des exploitations agricoles face aux aléas du climat. La collecte d’un ensemble d’informations à un niveau très fin sur les températures, l’humidité, les précipitations… Des offres personnalisées pour chaque agriculture en fonction des spécificités de son exploitation et de son environnement Gestion des sinistres totalement dématérialisés : paiement automatisé en fonction des conditions Un potentiel de déploiement sans limites géographiques, permettant d’atteindre des marchés encore peu exploités 03/2014 Big Data
  • 9. © 9 Exemple d’innovation dans le secteur des assurances : gestion des fraudes Appliquer les principes du Scoring Crédit pour analyser les déclarations de sinistre. Exploitation des données non structurées pour mettre en exergue les incohérences dans les déclarations L’aide à la décision poussée sur le terrain au plus près des clients Taux de succès des investigations : de 50 à 85% 25% des dossiers sont réglés dès le première étape, contre 4% auparavant Le scoring influence la suite du processus et améliore son efficacité (aide à la décision « actionnable ») Le système est actif lors de la déclaration de sinistre, ce qui incite le client à renoncer à poursuivre s’il se sent suspecté 03/2014 Big Data
  • 10. © 10 Exemple d’innovation dans le secteur des utilities -> un « datalab » pour découvrir les données concurrence et les croiser avec les données internes Lyonnaise des Eaux est leader sur la qualité de l’eau et cherche à conforter son leadership en se dotant d’un outil de benchmark permettant l’analyse de ses performances et la comparaison avec les autres délégataires et régies. Récupérer des données publiques à partir de sources de données non structurées et externe au S.I (site web http://www.sante.gouv.fr) Création d’un « datalab » sur le cloud permettant à un « data scientist » de qualifier la qualité de données et de les rapprocher avec les données internes de l’entreprise 03/2014 Big Data
  • 11. © 11 Data Warehouse Systèmes transactionnels Systèmes décisionnels d’entreprise Big Data De la BI telle qu’on la connait au Big Data : à la recherche de la « longue traine » Exploiter et fédérer les données « non structurées » Documents, contenu numérique riche… Données publiques du web et réseaux sociaux Aller puiser la connaissance dans de nouvelles sources de données structurées Capteurs, Internet des objets Données externes Etendre les principes fondateurs des concepts du Data Warehouse et l’Information Management : Immédiateté Précision Agilité 03/2014 Big Data
  • 12. © 12 Big Data : pour qui, pour quoi ? Industrie • Produit comme un service • Qualité, innovation R&D • Maintenance préventive Assurance • Fraudes et risques • Recommandation client • Tarification à l’usage, personnalisation Secteur public • Services informationnels • Fraudes, abus • Sécurité publique • Personnalisation de la relation citoyen Distribution • Offres temps réel et service personnalisés • Optimisation de l’expérience magasin • Pricing dynamique Santé • Gestion des effets indésirables • Traitements personnalisés. • Amélioration des diagnostics Telecom • Parcours clients multi- canaux • Partage de données de géo localisation • Fraudes et analyse du comportement client Banques • Parcours clients multi- canaux • Fraude, anti blanchiment • Partage des données consommateurs pour personnalisation Transports, loisirs • Planification et gestion des evts liés à la logistique • Service client temps réel • Economie d’énergie • Pricing dynamique Produits gde conso. • Analyse de sentiments et retour produits • Relation personnalisée avec le consommateur • Produit comme un service 03/2014 Big Data Des arômes et ingrédients qui se déclinent dans tous les secteurs d’activité
  • 13. © 13 Le Big Data, appliqué au rôle d’étudiant, ça donnerait quoi ? http://www.knewton.com/platform/resources/ 03/2014 Big Data
  • 14. © 14 Le big data : avec quelles données ? Tous secteurs confondus Banque et services financiers 03/2014 Big Data
  • 15. © 15 Le big data : Pour quoi faire ? La relation client avant tout, puis l’efficacité des processus et l’innovation 0 10 20 30 40 50 60 Expérience client Efficacité des processus Innovation produit Marketing ciblé Réduction des coûts Gestion des risques Monétisation de l'information Governance et réglementations Sécurité Autres 03/2014 Big Data Sources : Gartner
  • 16. © 16 Si l’information devient un actif, alors il faut s’organiser et se spécialiser en conséquence 03/2014 Big Data Sources : R Casonato/Gartner : Addressing the Big Data Skills Crisis
  • 17. © 1703/2014 Big Data “Institutions are becoming naked, and if you're going to be naked … fitness is no longer optional. If you're going to be naked, you better get buff.” Vers un monde de plus en plus transparent… pour le meilleur et pour le pire Don Tapscott : four principles for the open world • Ne pas utiliser la donnée au- delà d’un périmètre bien délimité • Traitez les autres comme vous accepteriez d’être traités • Solliciter le consentement, partagez les résultats et les bénéfices avec vos partenaires Source : F Buytendijk Définir au plus tôt son éthique vis-à-vis du big data
  • 18. © 18 Quelles technologies pour le Big Data ? Sources : Ray Wang 03/2014 Big Data
  • 19. © 19 Appliances Bases de données analytiques In memory analytics In memory Extreme processing Moteurs de recherche NoSQL Zoom sur Les technologies de gestion des données (« stockage ») : la taille unique n’existe pas, la solution dépend des usages 03/2014 Big Data réinventer les principes fondateurs des bases de données Le Hardware à la rescousse du software Spécialiser la base de données à chaque cas d’usage Traiter l’information comme elle vient au fil de l’eau S’affranchir des contraintes mécaniques Appliquer les principes du net à l’informatique d’entreprise
  • 20. © 20 Appliances Bases de données analytiques In memory analytics In memory Extreme processing Moteurs de recherche No SQLExalead Endeca (Oracle) Data Explorer(IBM) Autonomy (HP) Teradata Pure Data (IBM) Exadata (Oracle) Vertica / Autonomy (HP) Paraccel (Actian) Sybase IQ (SAP) Infobright Bases Olap Streams (IBM) Times Ten (Oracle) Aleri et Hana (SAP) Teracota (Software AG) Streambase (Tibco) SQLServer 2014 (MS) Exalytics (Oracle) Hana (SAP) xVelocity (Microsoft) DB2 BLU (IBM) SAS LASR Analytic Server… Hadoop (IBM, MS, Oracle, Intel, Cloudera, Hortonworks), Mongo DB, Cassandra Lotus Domino Les technologies de gestion des données : exemple 03/2014 Big Data
  • 21. © 21 Appliances Bases de données analytiques In memory analytics In memory Extreme processing Moteurs de recherche NoSQL Volume Temps Réel (Vitesse) Variété Les technologies de gestion des données (« stockage ») : la taille unique n’existe pas, tout dépend des usages 03/2014 Big Data
  • 22. © 22 La technologie phare du Big Data Hadoop Distributed File System (HDFS) File Sharing & Data Protection Across Physical Servers MapReduce Distributed Computing Across Physical Servers Hadoop est un framework Java qui permet de constituer une plateforme Big Data complète  Adaptable sur des très gros volumes  Tolérant aux pannes  Open source  Hardware « banalisé » CORE HADOOP COMPONENTS 03/2014 Big Data
  • 23. © 23 Pourquoi Hadoop ? Source : P Russom – TDWI Best practices report ; Integrating Hadoop into BI & Data Warehousing 03/2014 Big Data
  • 24. © 24 Hadoop : freins et axes d’amélioration Source : P Russom – TDWI Best practices report ; Integrating Hadoop into BI & Data Warehousing 03/2014 Big Data
  • 25. © 25 Quelles évolutions pour Hadoop ? Intégrer le temps réel (Fast Data) • Base Colonne (Hbase) • Spark (in memory) • Storm-Yarn : • Calculs en temps réel sur les données • Gestion des données au fil de l’eau (streams) Faciliter les accès aux données structurées et l’interactivité avec SQL • Impala (Cloudera) • Drill (Mapr) • Stinger (Hortonworks) • Evolutions Hive, Hadapt Ecosytème « on top » autour de Hadoop • Intégration de données (Talend, Syncsort, Revelytix…) • Accès aux données (Datameer, Karmasphere…) • Data mining ( R, Weka ) 03/2014 Big Data
  • 26. © 26 Big Data Tendances, perspectives et cas d’usage 20/03/2014 Jean-Michel Franco Directeur de l’innovation et des solutions jean-michel.franco@businessdecision.com Twitter : @jmichel_franco
  • 27. © 27 Table ronde Big Data et industrie, services et retail 20/03/2014
  • 28. © 28 Table ronde : Big Data et industrie, services, retail Avec Denis Weiss DSI La poste Industrie Michael Lanotte Responsable R&D Itron Jérôme Cornillet Business Solutions Manager Sas Jean-Pierre Lartige Délégué Poitou Charentes Orange Baptiste Jouffroy Sales Manager Europe GE Intelligent Platforms Jean-Michel Franco Directeur Innovation Business & Decision 03/2014 Table ronde : Big Data et industrie
  • 29. © 29 Imagination at work. Baptiste Jouffroy 20 mars 2014 Big Data GE Intelligent Platforms 03/2014 Table ronde : Big Data et industrie (General Electric)
  • 30. © 30 Le Big Data pour l’Industrie De quoi s’agit-il? Equipements et Processus Temps réel Haute fréquence Température Pression Vitesse Jusquà la milliseconde Des Millions d’échantillons archivés plusieurs années Modélisation, Analyse Prédictive et Diagnostic Définition1 Type de données 2 Echantillonnage3 Archivage et Analyse Prédictive4 03/2014 Table ronde : Big Data et industrie (General Electric)
  • 31. © 31 Objectifs : Analogie Big Data  Google  Facebook  Amazon Que vont acheter les adolescents en Europe ? Mon compresseur opère-t-il dans de bonnes conditions ? Big Data Industriel  Machines  Capteurs  Temps Réel 03/2014 Table ronde : Big Data et industrie (General Electric)
  • 32. © 32 Le Big Data pour l’Industrie De quoi s’agit-il? 03/2014 Table ronde : Big Data et industrie (General Electric) Réduire les arrêts non programmés Améliorer la fiabilités des équipements Réduire les pertes de production Optimiser les coûts de maintenance
  • 33. © 33 Michaël Lanotte / Responsable R&D Itron v1.1 BIG DATA & COMPTEURS INTELLIGENTS 03/2014 Table ronde : Big Data et industrie (Itron)
  • 34. © 34 Vélocité s, min, h, jour Le contexte client Les compteurs communicants * = VolumeVariété Alarmes & Logs Profil de consommation Qualimétrie réseau Performance Index de facturation … 5 milliards / jour * Profil de consommation 10min sur 35M de compteurs 03/2014 Table ronde : Big Data et industrie (Itron)
  • 35. © 35 » Des centaines de produits sous test… …des milliers de lignes de LOG à la seconde » Une masse de données à transformer en informations utiles Analyser en temps réel Cas d’utilisation 1 – Indexer, rechercher & corréler des données non fonctionnelles (logs) Notre centre d’essai de performance & d’endurance Un outil d’analyse des logs Indexer Rechercher Corréler 03/2014 Table ronde : Big Data et industrie (Itron)
  • 36. © 36 » Expertise sur l’amélioration des performances de collecte terrain » Analyse de l’indicateur horaire de qualité des communications CPL • 1 site avec 280 compteurs sur 5 mois => 1.000.000 mesures Projet pilote dans le comptage communicant Mettre en valeur des données en masse Cas d’utilisation 2 – Qualité des communications CPL Utilisation d’une représentation graphique pour faciliter l’analyse » Suite à l’application de nouveaux paramètres optimisés • Pics moins nombreux & moins prononcés, meilleure performance (+ vert) Mai’12Jan’12 Changement paramètres le 20/03/12 03/2014 Table ronde : Big Data et industrie (Itron)
  • 37. © 37 Flux Vision Une solution Orange Data & Analytics Jean-Pierre Lartige - Orange 20 Mars 2014
  • 38. © 38 Une exploitation des données des mobiles totalement anonymes ! Mesure des flux de population Flux de véhicules sur les axes routiers Mouvements de foules sur des évènements Analyse des typologies de population Une version complètement adaptée au tourisme Au service du marketing et de la vente 03/2014 Table ronde : Big Data et industrie ( Orange)
  • 39. © 39 Cas d’usage pour un distributeur 03/2014 Table ronde : Big Data et industrie (Orange)
  • 40. © 40 Flux Vision : indicateurs statistiques permettant l'analyse de la mobilité d’une population ? ? ? ?  Zone : IRIS  Fréquentation (personnes différentes)  Fréquence  Durée de la présence  Tranche horaire  Lieu de résidence, lieu de travail  Origine / destination  Résidents / touristes  Profils socio-demo  Prédiction de trafic  Fréquentation indoor  Webservice France entière 03/2014 Table ronde : Big Data et industrie (Orange)
  • 41. © 41 Visualisation des données 03/2014 Table ronde : Big Data et industrie (Orange)
  • 42. © 42 Les + de Flux Vision fiabilité des résultats (volumes, événements réseaux) fraicheur des données (jursqu’au temps réel) personnalisation des rapports respect de la loi et de la vie privée des clients Orange une offre compétitive et complémentaire CNIL 1 2 3 4 5 03/2014 Table ronde : Big Data et industrie (Orange)