SlideShare une entreprise Scribd logo
© Soft Computing – www.softcomputing.com
Du Data Mining à la Data Science :
Comment passer du Data Mining traditionnel à la Data Science ?
24/09/2015
© 2
Du Data Mining à la Data Science
Séminaire le 24 septembre 2015
Comment passer du Data Mining traditionnel à la Data Science ?
Quels bénéfices ? Quels impacts ? Quels R.O.I. ?
Modalités :
Ce séminaire aura lieu dans les
locaux de Soft Computing.
Ou via notre site:
www.softcomputing.com
Soft Computing vous invite à un séminaire qui abordera les questions suivantes :
• Quels impacts sur le quotidien du Data Miner : quelles sont les techniques/outils à maitriser ?
• Quelles sont les possibilités et les nouvelles perspectives d'analyse offertes par le Big Data ?
• Quels sont les pièges à éviter ?
Agenda :
08h45 – 09h00 : Accueil des participants
09h00 – 11h00 : Séminaire
 La donnée et son exploitation : quels enjeux pour les entreprises ?
 Data Miner vs Data Scientist : quelles compétences, quelles
différences ?
 Les nouvelles possibilités d'analyse et les méthodologies associées
pour quels cas d'utilisation ?
 Les retours d'expériences, les compétences requises, délais et ROI.
A propos
Soft Computing est une entreprise de Services du Numérique spécialiste en Digital, Big Data, et CRM, réunissant près de 400 consultants, délivrant des
prestations de Conseil, de Technologie et de Marketing Services.
Soft Computing est coté sur NYSE Euronext Paris - Code ISIN : FR0000075517 - Symbole : SFT.
Cet événement est réservé aux clients et prospects Soft Computing. Pour tout autre profil, l'inscription sera soumise à validation.
Soft Computing |55 quai de Grenelle|75015 Paris|01 73 00 55 00 | www.softcomputing.com
© 3
Présentation des intervenants
Eric Fischmeister
Président
efr@softcomputing.com
01 73 00 57 59
Hélène Hamon
Directrice adjointe du pôle
Marketing Services
hhm@softcomputing.com
01 73 00 55 88
Sylvain Bellier
Directeur du pôle Marketing Services
sbe@softcomputing.com
01 73 00 56 06
Eric Fischmeister
Président
efr@softcomputing.com
01 73 00 57 59
© 4
SOMMAIRESommaire
1. Introduction
2. L’écosystème : Le décor et quoi de neuf ?
3. Data Miner vs Data Scientist : quelles compétences, quelles
différences ?
4. Les nouvelles possibilités d’analyses et les méthodologies
associées : quels cas d’utilisation ?
5. Les retours d’expériences : quelle démarche, le délai, les coûts ?
6. Conclusion
© 5
Carte d’identité
© 6
Compétences : un mix unique de compétences pointues
Digital
Marketing
Data
Science
Project
Management
Information
Technologies
Digital - Big Data - CRM
© 7
Mission : transformer la data en performance
Business
IT
Imaginer, bâtir et opérer
des programmes de conquête et de fidélisation
cross-canaux, rentables et innovants
Concevoir, développer et déployer
des solutions Digitales, Big Data et CRM
performantes, pragmatiques et adaptées
AMOA
© 8
Delivery : continuum de services et souplesse
Think Build Run
Délégation
d’expertise
Mode
Projet
Centre de
services
© 9
Programme relationnel
multi-devices et
remarketing.
Ecoute et analyse des
sentiments des clients
sur les réseaux sociaux.
Centre de services de
gestion des campagnes
marketing multicanal.
Data Management
Platform et marketing
multicanal temps réel.
Centre de services
datamining, campagnes
ciblées et reportings.
Gestion des opérations
marketing ciblées.
Data Management
Platform, CRM et
web analytics.
Conception de
l’architecture
décisionnelle hybride
big data –
datawarehouse.
Centre de services
gestion de campagnes
marketing et
connaissance clients.
Convergence des
pratiques et des outils
marketing on et offline.
Mise en place d’une
Data Management
Platform (DMP) et de
use cases marketing.
Déploiement d’une
plate-forme CRM multi-
marques multi-pays.
Personnalisation temps
réel des contenus et
valorisation d’audience.
Définition d’une
stratégie de Business
Intelligence.
Pilotage de la qualité
de l’expérience client.
Extraits de références 2014-2015
© 10
Experts reconnus
blog.softcomputing.com/
fr.slideshare.net/softcomputing
twitter.com/#!/SoftComputing
linkedin.com/company/soft-computing
facebook.com/softcomputing
softcomputing.com/fr/news/
InformerEcrire Enseigner
© 11
SOMMAIRESommaire
1. Introduction
2. L’écosystème : Le décor et quoi de neuf ?
3. Data Miner vs Data Scientist : quelles compétences, quelles
différences ?
4. Les nouvelles possibilités d’analyses et les méthodologies
associées : quels cas d’utilisation ?
5. Les retours d’expériences : quelle démarche, le délai, les coûts ?
6. Conclusion
© 12
Humilité
© 13
Big Data : ça reste à la mode
© 14
Oui, mais on aborde la vallée des désillusions
Big Data
© 15
Malgré tout en France, 2 ans d’expérimentation et de maturation
© 16
Notre vision sur les grands segments de marché
Expérimentation Industrialisation
Transport
Retail GSA
Retail GSS
Banque &
Assurance
Utilities
(yc Telco)
© 17
SOMMAIRESommaire
Les réponses dans les
utilisations marketing
Acquisition
Développement
Fidélisation
R.O.I. / R.O.E
© 19
Enjeu # 1 : Rendre tangible et lisible l’expérience omnicanal
© 20
Enjeu # 2 : Opérer et exécuter autrement les processus marketing
© 21
Enjeu # 3 : Optimisation et analyse de la contribution des
différents leviers d’acquisition et de fidélisation
© 22
Comment ?
© 23
Données :
DigitalesCRM
Réponse # 1 : Une acceptation commune dans la démarche
R.O.I.
Connaissance
Productivité opérationnelle
Analyses ad’hoc
Vision produit Vision clients
Technologies
1
2
3
4
ModélisationRéconciliation
Externes
© 24
Réponse # 2 : Des REX sur un segment (sur) peuplé qui émergent
Xaas
Hardware
Projets Open SourceDistributions
Données AnalyseVisualisation Application
EMR
Bigquery
Professionnal services (tec & biz)
© 25
Réponse # 3 : Baissent des coûts
5 nœuds
1 namenode, 20 cœurs, 192 Go ram
4 datanodes, 64 cœurs, 64 Gb ram, 10 To DD
© 26
Réponse # 4 : Autonome
© 27
Réponse # 5 : Des compétences qui crantent et qui (commencent)
à travailler ensemble
Marketing Datascience Programmation
© 28
Accélérer
© 29
SOMMAIRESommaire
1. Introduction
2. L’écosystème : Le décor et quoi de neuf ?
3. Data Miner vs Data Scientist : quelles compétences, quelles
différences ?
4. Les nouvelles possibilités d’analyses et les méthodologies
associées : quels cas d’utilisation ?
5. Les retours d’expériences : quelle démarche, le délai, les coûts ?
6. Conclusion
© 30
DATAMINING VS DATA SCIENCE :
BIG BANG ?
© 31
Les données analysées AVANT
Univers de données Format et stockage
Historique
Important sur les
données agrégées
Faible sur les
données unitaires
© 32
Les analyses
Segmentation RFM,
valeur…
Etude d’impact de
lancement d’offre,
programme de
fidélisation
Score d’appétence,
de rétention…
Géomarketing :
typologies de zone
d’implantation,
optimisation de
réseau de points de
vente…
Prévision des ventes,
des résiliations…
Mesure de dispositif
de marketing
relationnel
AVANT
© 33
Les méthodologies
Régression logistique
Modèle
ARIMA/SARIMA
Analyse des
correspondances
multiples
Analyse Factorielle
Analyse en
composantes
principales
…
AVANT
© 34
Les outils
Accès aux
données
Manipulation
de données
Analytic Restitution
AVANT
© 35
L’organisation des projets AVANT
Marketing Data Miner
 Définit le besoin
 Exploite les résultats
et met en œuvre les
actions
 Définit l’approche
méthodologique
 Réalise les analyses
© 36
Les charges
Définition de
la démarche
et des
indicateurs
Extraction
des données
Construction
de la matrice
d’études
Analyse/
Modélisation
Présentation
des résultats
2 jours 5 jours 10 jours 15 jours 10 jours
Exemple pour la mise en place d’une segmentation :
= 42 jours
+ aléa
AVANT
© 37
Les compétences attendues pour un
Datamininer
Maitrise des outils Maitrise des méthodes Sens Business
AVANT
© 38
Quelles évolutions/ Quels impacts avec l’arrivée du Big Data ?
© 39
Marketing
SI
Data Scientist
© 40
Au démarrage du Big data
• Des données brutes /
non structurées
• Accès/manipulation de
données via Impala, Hive
© 41
Big data 2014
Démocratisation
Big data 2015
Démocratisation
© 42
Les données analysées 2015
Périmètre
Format et stockage
Historique
Important sur les
données agrégées
Important sur les
données unitaires
© 43
Les nouvelles analyses
Analyse de parcours
omnicanal
Analyse de
sentiments
Moteur de
substitution
Analyses multi
fonctions : logistique,
client, yield…
Scores à la volée
Moteur de
recommandations
2015
© 44
Les nouvelles méthodologies utilisées
Random Forest
Boosting Gradient
Machine
Textmining
Réseau Bayesien
ACP
avec rotation
Sequential Pattern
Analysis
2015
© 45
Les outils
Accès aux
données
Manipulation
de données
Analytic Restitution
2015
© 46
L’organisation des projets 2015
Marketing
Data ScienceProgrammation
 Définit le besoin
 Exploite
 Explore
 Transforme
 Modélise
 Nettoie
 Optimise
 Industrialise
© 47
Les charges
Exemple pour la mise en place d’une segmentation :
Définition de
la démarche
et des
indicateurs
Extraction
des données
Construction
de la matrice
d’études
Analyse/
Modélisation
Présentation
des résultats
2 jours 3 jours 6 jours 8 jours 3 jours = 22 jours
2015
© 48
Les compétences attendues pour un Data
Scientist
Maitrise
des outils
Maitrise des
nouvelles méthodes
Sens
Business
GESTION DE PROJET
2015
© 49
SOMMAIRESommaire
1. Introduction
2. L’écosystème : Le décor et quoi de neuf ?
3. Data Miner vs Data Scientist : quelles compétences, quelles
différences ?
4. Les nouvelles possibilités d’analyses et les méthodologies
associées : quels cas d’utilisation ?
5. Les retours d’expériences : quelle démarche, le délai, les
coûts ?
6. Conclusion
© 50
Données :
DigitalesCRM
Penser applications opérationnelles et débuter simple
R.O.I.
Connaissance
Productivité opérationnelle
Analyses ad’hoc
Vision produit Vision clients
Technologies
1
2
3
4
ModélisationRéconciliation
Externes
© 51
Une démarche itérative et cocréative
 Une approche pour :
– Identifier vos enjeux et vos besoins et les décliner en plan d’expérimentation,
– Benchmarker, tester et valoriser la création de valeur
– Préparer une éventuelle industrialisation
Mettre en œuvre la
plateforme2
Présentation, ajustement ,
validation de l’apport de valeur,
plans test
3
Représentants
métiers
Définition des cas
d’usages
Réaliser les cas d’usage
métiers et benchmark avt -
après
4
1
Représentants
métiers / SI
Recueil de l’existant et des
besoins métier et SI
Représentants
métiers
Recommandation et plans d’actions en
vu de l’industrialisation
5
2
Décile
Lift
© 52
Aligner les compétences
Marketing Datascience Programmation
© 53
Imaginer des plannings de réalisation à moins de 6 mois et
contributeurs associés
Run
Initialisation du centre de services
Conception et réalisation « large »
Maintenance
Monitoring applications
Administration
Gestion des projets de setup
Gestion du centre de servicesProgram Management
Gestion des projets d’évolutions
BusinessIT
Gestiondeprojetet
deservices
Setup
Sprints algorithme sur le
« lab »
Mise en place
architecture
Définition du SLA
Conception et réalisation « fast »
Tests
Sprints d’amélioration algorithme sur le « lab »
Surveillance de la santé de l’algorithme « lab »
Infra
Hard & soft
Hébergement et monitoring
Data
exploration
M1 M2 M3 M4 M5
© 54
Anticiper hybride dans l’industrialisationSystèmessources
SystèmesbancairesdeproductionExternes
ETL Appliance
Entrepôt
Vision unique
du client
Datamarts
Sandbox
Entrepôt Hadoop
Usages
Reporting
Tableaux de
bord
Cubes OLAP
Statistique
(SAS...)
Systèmes
front-end
Base
métier
Données de référence
Synthèses transactions
Données externes
structurées
Données externes
peu structurées
Données
volumétrie importante
Réintégration données
après pré-traitement
Sasde
sécurité
Accès
Accès
Accès
Données externes
à la demande
Eléments de ciblage (dont scores)
Extractions Métiers (dont scores, segmentations...)
Base
métier
Base
métier
Base
métier
Base
métier
Base
métier
Web Services
Services temps réel
À destination des front-end
© 55
Combien ça coûte ?
X * 100 K€ / an
Batch
As a service
X * 1 M€ / an
Industrialisation
Temps réel
Datawahouse+big data
© 56
Cibler des R.O.I. < 6 mois
© 57
SOMMAIRESommaire
1. Introduction
2. L’écosystème : Le décor et quoi de neuf ?
3. Data Miner vs Data Scientist : quelles compétences, quelles
différences ?
4. Les nouvelles possibilités d’analyses et les méthodologies
associées : quels cas d’utilisation ?
5. Les retours d’expériences : quelle démarche, le délai, les coûts ?
6. Conclusion
© 58
Offre de services
S
ensibilisation
tratégie
andbox
R
oadmap
ollout
un
© 59

Contenu connexe

Tendances

Moteur de Recommandation
Moteur de RecommandationMoteur de Recommandation
Moteur de Recommandation
Soft Computing
 
Data Science
Data ScienceData Science
Data Science
Soft Computing
 
Des reportings efficients pour des analyses pertinentes
Des reportings efficients pour des analyses pertinentesDes reportings efficients pour des analyses pertinentes
Des reportings efficients pour des analyses pertinentes
Soft Computing
 
Soft Marketing Ready : une solution tout-en-un pour les Directions Marketing ...
Soft Marketing Ready : une solution tout-en-un pour les Directions Marketing ...Soft Marketing Ready : une solution tout-en-un pour les Directions Marketing ...
Soft Marketing Ready : une solution tout-en-un pour les Directions Marketing ...
Soft Computing
 
BigData selon IBM
BigData selon IBM BigData selon IBM
BigData selon IBM
Solutions IT et Business
 
27/04/17 Séminaire Données Personnelles
27/04/17 Séminaire Données Personnelles27/04/17 Séminaire Données Personnelles
27/04/17 Séminaire Données Personnelles
Soft Computing
 
06/07/17 Table ronde Data Transformation Program
06/07/17 Table ronde Data Transformation Program06/07/17 Table ronde Data Transformation Program
06/07/17 Table ronde Data Transformation Program
Soft Computing
 
16/04/19 Matinale Experts Marketing Omnicanal
16/04/19 Matinale Experts Marketing Omnicanal16/04/19 Matinale Experts Marketing Omnicanal
16/04/19 Matinale Experts Marketing Omnicanal
Soft Computing
 
Données Personnelles
Données PersonnellesDonnées Personnelles
Données Personnelles
Soft Computing
 
05/10/17 Matinale Qlik Sense
05/10/17 Matinale Qlik Sense05/10/17 Matinale Qlik Sense
05/10/17 Matinale Qlik Sense
Soft Computing
 
29/06/17 Matinale Python
29/06/17 Matinale Python29/06/17 Matinale Python
29/06/17 Matinale Python
Soft Computing
 
01/06/2017 Matinale Activation Client personnalisée et Délivrabilité
01/06/2017 Matinale Activation Client personnalisée et Délivrabilité01/06/2017 Matinale Activation Client personnalisée et Délivrabilité
01/06/2017 Matinale Activation Client personnalisée et Délivrabilité
Soft Computing
 
Séminaire RCU
Séminaire RCUSéminaire RCU
Séminaire RCU
Soft Computing
 
Du datamining à la datascience
Du datamining à la datascienceDu datamining à la datascience
Du datamining à la datascience
Soft Computing
 
Salon Big Data 2015 : Big Data et Marketing Digital, Retours d’expérience en ...
Salon Big Data 2015 : Big Data et Marketing Digital, Retours d’expérience en ...Salon Big Data 2015 : Big Data et Marketing Digital, Retours d’expérience en ...
Salon Big Data 2015 : Big Data et Marketing Digital, Retours d’expérience en ...
Soft Computing
 
Machine Learning
Machine LearningMachine Learning
Machine Learning
Soft Computing
 
Matinale Technologique SAS
Matinale Technologique SASMatinale Technologique SAS
Matinale Technologique SAS
Soft Computing
 
La datavisualisation
La datavisualisationLa datavisualisation
La datavisualisation
Soft Computing
 
Salon e-Marketing 2015 : La donnée, accélérateur de toutes les convergences ...
Salon e-Marketing 2015 :  La donnée, accélérateur de toutes les convergences ...Salon e-Marketing 2015 :  La donnée, accélérateur de toutes les convergences ...
Salon e-Marketing 2015 : La donnée, accélérateur de toutes les convergences ...
Soft Computing
 
La Gouvernance des Données
La Gouvernance des DonnéesLa Gouvernance des Données
La Gouvernance des Données
Soft Computing
 

Tendances (20)

Moteur de Recommandation
Moteur de RecommandationMoteur de Recommandation
Moteur de Recommandation
 
Data Science
Data ScienceData Science
Data Science
 
Des reportings efficients pour des analyses pertinentes
Des reportings efficients pour des analyses pertinentesDes reportings efficients pour des analyses pertinentes
Des reportings efficients pour des analyses pertinentes
 
Soft Marketing Ready : une solution tout-en-un pour les Directions Marketing ...
Soft Marketing Ready : une solution tout-en-un pour les Directions Marketing ...Soft Marketing Ready : une solution tout-en-un pour les Directions Marketing ...
Soft Marketing Ready : une solution tout-en-un pour les Directions Marketing ...
 
BigData selon IBM
BigData selon IBM BigData selon IBM
BigData selon IBM
 
27/04/17 Séminaire Données Personnelles
27/04/17 Séminaire Données Personnelles27/04/17 Séminaire Données Personnelles
27/04/17 Séminaire Données Personnelles
 
06/07/17 Table ronde Data Transformation Program
06/07/17 Table ronde Data Transformation Program06/07/17 Table ronde Data Transformation Program
06/07/17 Table ronde Data Transformation Program
 
16/04/19 Matinale Experts Marketing Omnicanal
16/04/19 Matinale Experts Marketing Omnicanal16/04/19 Matinale Experts Marketing Omnicanal
16/04/19 Matinale Experts Marketing Omnicanal
 
Données Personnelles
Données PersonnellesDonnées Personnelles
Données Personnelles
 
05/10/17 Matinale Qlik Sense
05/10/17 Matinale Qlik Sense05/10/17 Matinale Qlik Sense
05/10/17 Matinale Qlik Sense
 
29/06/17 Matinale Python
29/06/17 Matinale Python29/06/17 Matinale Python
29/06/17 Matinale Python
 
01/06/2017 Matinale Activation Client personnalisée et Délivrabilité
01/06/2017 Matinale Activation Client personnalisée et Délivrabilité01/06/2017 Matinale Activation Client personnalisée et Délivrabilité
01/06/2017 Matinale Activation Client personnalisée et Délivrabilité
 
Séminaire RCU
Séminaire RCUSéminaire RCU
Séminaire RCU
 
Du datamining à la datascience
Du datamining à la datascienceDu datamining à la datascience
Du datamining à la datascience
 
Salon Big Data 2015 : Big Data et Marketing Digital, Retours d’expérience en ...
Salon Big Data 2015 : Big Data et Marketing Digital, Retours d’expérience en ...Salon Big Data 2015 : Big Data et Marketing Digital, Retours d’expérience en ...
Salon Big Data 2015 : Big Data et Marketing Digital, Retours d’expérience en ...
 
Machine Learning
Machine LearningMachine Learning
Machine Learning
 
Matinale Technologique SAS
Matinale Technologique SASMatinale Technologique SAS
Matinale Technologique SAS
 
La datavisualisation
La datavisualisationLa datavisualisation
La datavisualisation
 
Salon e-Marketing 2015 : La donnée, accélérateur de toutes les convergences ...
Salon e-Marketing 2015 :  La donnée, accélérateur de toutes les convergences ...Salon e-Marketing 2015 :  La donnée, accélérateur de toutes les convergences ...
Salon e-Marketing 2015 : La donnée, accélérateur de toutes les convergences ...
 
La Gouvernance des Données
La Gouvernance des DonnéesLa Gouvernance des Données
La Gouvernance des Données
 

Similaire à Du Data Mining à la Data Science

Réseaux Sociaux, CRM/PRM et Digital
Réseaux Sociaux, CRM/PRM et DigitalRéseaux Sociaux, CRM/PRM et Digital
Réseaux Sociaux, CRM/PRM et Digital
Soft Computing
 
19/10/17 Séminaire Référentiel Client Unique
19/10/17 Séminaire Référentiel Client Unique19/10/17 Séminaire Référentiel Client Unique
19/10/17 Séminaire Référentiel Client Unique
Soft Computing
 
CRM & DMP : le digital au service d’une animation client omnicanal et temps réel
CRM & DMP : le digital au service d’une animation client omnicanal et temps réelCRM & DMP : le digital au service d’une animation client omnicanal et temps réel
CRM & DMP : le digital au service d’une animation client omnicanal et temps réel
Soft Computing
 
25/01/18 Matinale Data Science
25/01/18 Matinale Data Science25/01/18 Matinale Data Science
25/01/18 Matinale Data Science
Soft Computing
 
Outils de Vente : Du CRM à la Digitalisation de l'Animation Commerciale
Outils de Vente : Du CRM à la Digitalisation de l'Animation CommercialeOutils de Vente : Du CRM à la Digitalisation de l'Animation Commerciale
Outils de Vente : Du CRM à la Digitalisation de l'Animation Commerciale
Soft Computing
 
Élaboration d'une stratégie de modernisation par Chris Koppe
Élaboration d'une stratégie de modernisation par Chris KoppeÉlaboration d'une stratégie de modernisation par Chris Koppe
Élaboration d'une stratégie de modernisation par Chris Koppe
Fresche Solutions
 
[Fr] Information builders - MDM et Big Data
[Fr] Information builders - MDM et Big Data[Fr] Information builders - MDM et Big Data
[Fr] Information builders - MDM et Big Data
Yann Gourvennec
 
23/11/17 Matinale Usages Réactivation et SMS Enrichi
23/11/17 Matinale Usages Réactivation et SMS Enrichi23/11/17 Matinale Usages Réactivation et SMS Enrichi
23/11/17 Matinale Usages Réactivation et SMS Enrichi
Soft Computing
 
Pilotage de gestion, data et machine learning by Mindoo Management
Pilotage de gestion, data et machine learning by Mindoo ManagementPilotage de gestion, data et machine learning by Mindoo Management
Pilotage de gestion, data et machine learning by Mindoo Management
Cyril Lagrange
 
Ccimp rdv tic cahier des charges erp 2014
Ccimp rdv tic cahier des charges erp 2014Ccimp rdv tic cahier des charges erp 2014
Ccimp rdv tic cahier des charges erp 2014
COMPETITIC
 
Synthèse Solucom - Energéticiens et monde digital : une relation en mode combat?
Synthèse Solucom - Energéticiens et monde digital : une relation en mode combat?Synthèse Solucom - Energéticiens et monde digital : une relation en mode combat?
Synthèse Solucom - Energéticiens et monde digital : une relation en mode combat?
Wavestone
 
17/05/18 Matinale Usages Activation Omnicanal
17/05/18 Matinale Usages Activation Omnicanal17/05/18 Matinale Usages Activation Omnicanal
17/05/18 Matinale Usages Activation Omnicanal
Soft Computing
 
Optimiser l’intégration globale des données grâce à la Data Virtualization
Optimiser l’intégration globale des données grâce à la Data VirtualizationOptimiser l’intégration globale des données grâce à la Data Virtualization
Optimiser l’intégration globale des données grâce à la Data Virtualization
Denodo
 
Décisionnel Agile : les conditions du succès
Décisionnel Agile : les conditions du succèsDécisionnel Agile : les conditions du succès
Décisionnel Agile : les conditions du succès
Jean-Michel Franco
 
Big Data - Quel usage au sein des projets internet
Big Data - Quel usage au sein des projets internetBig Data - Quel usage au sein des projets internet
Big Data - Quel usage au sein des projets internet
EOLAS, groupe Business & Decision
 
DATA FORUM MICROPOLE 2015 - Information Builders
 DATA FORUM MICROPOLE 2015 -  Information Builders DATA FORUM MICROPOLE 2015 -  Information Builders
DATA FORUM MICROPOLE 2015 - Information Builders
Micropole Group
 
Matinale du MDM 2014
Matinale du MDM 2014Matinale du MDM 2014
Matinale du MDM 2014
Business & Decision
 
Future Marketing 3 - Slideshow intégral de l'événement
Future Marketing 3 - Slideshow intégral de l'événementFuture Marketing 3 - Slideshow intégral de l'événement
Future Marketing 3 - Slideshow intégral de l'événement
Loyalty Company
 
Offre onepoint - Data science et big data
Offre onepoint  - Data science et big data Offre onepoint  - Data science et big data
Offre onepoint - Data science et big data
GroupeONEPOINT
 
Comment coupler votre Webanalytics et votre CRM ?
Comment coupler votre Webanalytics et votre CRM ?Comment coupler votre Webanalytics et votre CRM ?
Comment coupler votre Webanalytics et votre CRM ?
Soft Computing
 

Similaire à Du Data Mining à la Data Science (20)

Réseaux Sociaux, CRM/PRM et Digital
Réseaux Sociaux, CRM/PRM et DigitalRéseaux Sociaux, CRM/PRM et Digital
Réseaux Sociaux, CRM/PRM et Digital
 
19/10/17 Séminaire Référentiel Client Unique
19/10/17 Séminaire Référentiel Client Unique19/10/17 Séminaire Référentiel Client Unique
19/10/17 Séminaire Référentiel Client Unique
 
CRM & DMP : le digital au service d’une animation client omnicanal et temps réel
CRM & DMP : le digital au service d’une animation client omnicanal et temps réelCRM & DMP : le digital au service d’une animation client omnicanal et temps réel
CRM & DMP : le digital au service d’une animation client omnicanal et temps réel
 
25/01/18 Matinale Data Science
25/01/18 Matinale Data Science25/01/18 Matinale Data Science
25/01/18 Matinale Data Science
 
Outils de Vente : Du CRM à la Digitalisation de l'Animation Commerciale
Outils de Vente : Du CRM à la Digitalisation de l'Animation CommercialeOutils de Vente : Du CRM à la Digitalisation de l'Animation Commerciale
Outils de Vente : Du CRM à la Digitalisation de l'Animation Commerciale
 
Élaboration d'une stratégie de modernisation par Chris Koppe
Élaboration d'une stratégie de modernisation par Chris KoppeÉlaboration d'une stratégie de modernisation par Chris Koppe
Élaboration d'une stratégie de modernisation par Chris Koppe
 
[Fr] Information builders - MDM et Big Data
[Fr] Information builders - MDM et Big Data[Fr] Information builders - MDM et Big Data
[Fr] Information builders - MDM et Big Data
 
23/11/17 Matinale Usages Réactivation et SMS Enrichi
23/11/17 Matinale Usages Réactivation et SMS Enrichi23/11/17 Matinale Usages Réactivation et SMS Enrichi
23/11/17 Matinale Usages Réactivation et SMS Enrichi
 
Pilotage de gestion, data et machine learning by Mindoo Management
Pilotage de gestion, data et machine learning by Mindoo ManagementPilotage de gestion, data et machine learning by Mindoo Management
Pilotage de gestion, data et machine learning by Mindoo Management
 
Ccimp rdv tic cahier des charges erp 2014
Ccimp rdv tic cahier des charges erp 2014Ccimp rdv tic cahier des charges erp 2014
Ccimp rdv tic cahier des charges erp 2014
 
Synthèse Solucom - Energéticiens et monde digital : une relation en mode combat?
Synthèse Solucom - Energéticiens et monde digital : une relation en mode combat?Synthèse Solucom - Energéticiens et monde digital : une relation en mode combat?
Synthèse Solucom - Energéticiens et monde digital : une relation en mode combat?
 
17/05/18 Matinale Usages Activation Omnicanal
17/05/18 Matinale Usages Activation Omnicanal17/05/18 Matinale Usages Activation Omnicanal
17/05/18 Matinale Usages Activation Omnicanal
 
Optimiser l’intégration globale des données grâce à la Data Virtualization
Optimiser l’intégration globale des données grâce à la Data VirtualizationOptimiser l’intégration globale des données grâce à la Data Virtualization
Optimiser l’intégration globale des données grâce à la Data Virtualization
 
Décisionnel Agile : les conditions du succès
Décisionnel Agile : les conditions du succèsDécisionnel Agile : les conditions du succès
Décisionnel Agile : les conditions du succès
 
Big Data - Quel usage au sein des projets internet
Big Data - Quel usage au sein des projets internetBig Data - Quel usage au sein des projets internet
Big Data - Quel usage au sein des projets internet
 
DATA FORUM MICROPOLE 2015 - Information Builders
 DATA FORUM MICROPOLE 2015 -  Information Builders DATA FORUM MICROPOLE 2015 -  Information Builders
DATA FORUM MICROPOLE 2015 - Information Builders
 
Matinale du MDM 2014
Matinale du MDM 2014Matinale du MDM 2014
Matinale du MDM 2014
 
Future Marketing 3 - Slideshow intégral de l'événement
Future Marketing 3 - Slideshow intégral de l'événementFuture Marketing 3 - Slideshow intégral de l'événement
Future Marketing 3 - Slideshow intégral de l'événement
 
Offre onepoint - Data science et big data
Offre onepoint  - Data science et big data Offre onepoint  - Data science et big data
Offre onepoint - Data science et big data
 
Comment coupler votre Webanalytics et votre CRM ?
Comment coupler votre Webanalytics et votre CRM ?Comment coupler votre Webanalytics et votre CRM ?
Comment coupler votre Webanalytics et votre CRM ?
 

Plus de Soft Computing

07/12/17 Séminaire Expérience Client
07/12/17 Séminaire Expérience Client07/12/17 Séminaire Expérience Client
07/12/17 Séminaire Expérience Client
Soft Computing
 
28/09/2017 Séminaire Data & Activation Client
28/09/2017 Séminaire Data & Activation Client28/09/2017 Séminaire Data & Activation Client
28/09/2017 Séminaire Data & Activation Client
Soft Computing
 
Phygital
PhygitalPhygital
Phygital
Soft Computing
 
Séminaire Expérience Client
Séminaire Expérience ClientSéminaire Expérience Client
Séminaire Expérience Client
Soft Computing
 
Matinale Technologique Adobe Campaign
Matinale Technologique Adobe CampaignMatinale Technologique Adobe Campaign
Matinale Technologique Adobe Campaign
Soft Computing
 
Expérience Client
Expérience ClientExpérience Client
Expérience Client
Soft Computing
 
Digital In Store
Digital In StoreDigital In Store
Digital In Store
Soft Computing
 

Plus de Soft Computing (7)

07/12/17 Séminaire Expérience Client
07/12/17 Séminaire Expérience Client07/12/17 Séminaire Expérience Client
07/12/17 Séminaire Expérience Client
 
28/09/2017 Séminaire Data & Activation Client
28/09/2017 Séminaire Data & Activation Client28/09/2017 Séminaire Data & Activation Client
28/09/2017 Séminaire Data & Activation Client
 
Phygital
PhygitalPhygital
Phygital
 
Séminaire Expérience Client
Séminaire Expérience ClientSéminaire Expérience Client
Séminaire Expérience Client
 
Matinale Technologique Adobe Campaign
Matinale Technologique Adobe CampaignMatinale Technologique Adobe Campaign
Matinale Technologique Adobe Campaign
 
Expérience Client
Expérience ClientExpérience Client
Expérience Client
 
Digital In Store
Digital In StoreDigital In Store
Digital In Store
 

Du Data Mining à la Data Science

  • 1. © Soft Computing – www.softcomputing.com Du Data Mining à la Data Science : Comment passer du Data Mining traditionnel à la Data Science ? 24/09/2015
  • 2. © 2 Du Data Mining à la Data Science Séminaire le 24 septembre 2015 Comment passer du Data Mining traditionnel à la Data Science ? Quels bénéfices ? Quels impacts ? Quels R.O.I. ? Modalités : Ce séminaire aura lieu dans les locaux de Soft Computing. Ou via notre site: www.softcomputing.com Soft Computing vous invite à un séminaire qui abordera les questions suivantes : • Quels impacts sur le quotidien du Data Miner : quelles sont les techniques/outils à maitriser ? • Quelles sont les possibilités et les nouvelles perspectives d'analyse offertes par le Big Data ? • Quels sont les pièges à éviter ? Agenda : 08h45 – 09h00 : Accueil des participants 09h00 – 11h00 : Séminaire  La donnée et son exploitation : quels enjeux pour les entreprises ?  Data Miner vs Data Scientist : quelles compétences, quelles différences ?  Les nouvelles possibilités d'analyse et les méthodologies associées pour quels cas d'utilisation ?  Les retours d'expériences, les compétences requises, délais et ROI. A propos Soft Computing est une entreprise de Services du Numérique spécialiste en Digital, Big Data, et CRM, réunissant près de 400 consultants, délivrant des prestations de Conseil, de Technologie et de Marketing Services. Soft Computing est coté sur NYSE Euronext Paris - Code ISIN : FR0000075517 - Symbole : SFT. Cet événement est réservé aux clients et prospects Soft Computing. Pour tout autre profil, l'inscription sera soumise à validation. Soft Computing |55 quai de Grenelle|75015 Paris|01 73 00 55 00 | www.softcomputing.com
  • 3. © 3 Présentation des intervenants Eric Fischmeister Président efr@softcomputing.com 01 73 00 57 59 Hélène Hamon Directrice adjointe du pôle Marketing Services hhm@softcomputing.com 01 73 00 55 88 Sylvain Bellier Directeur du pôle Marketing Services sbe@softcomputing.com 01 73 00 56 06 Eric Fischmeister Président efr@softcomputing.com 01 73 00 57 59
  • 4. © 4 SOMMAIRESommaire 1. Introduction 2. L’écosystème : Le décor et quoi de neuf ? 3. Data Miner vs Data Scientist : quelles compétences, quelles différences ? 4. Les nouvelles possibilités d’analyses et les méthodologies associées : quels cas d’utilisation ? 5. Les retours d’expériences : quelle démarche, le délai, les coûts ? 6. Conclusion
  • 6. © 6 Compétences : un mix unique de compétences pointues Digital Marketing Data Science Project Management Information Technologies Digital - Big Data - CRM
  • 7. © 7 Mission : transformer la data en performance Business IT Imaginer, bâtir et opérer des programmes de conquête et de fidélisation cross-canaux, rentables et innovants Concevoir, développer et déployer des solutions Digitales, Big Data et CRM performantes, pragmatiques et adaptées AMOA
  • 8. © 8 Delivery : continuum de services et souplesse Think Build Run Délégation d’expertise Mode Projet Centre de services
  • 9. © 9 Programme relationnel multi-devices et remarketing. Ecoute et analyse des sentiments des clients sur les réseaux sociaux. Centre de services de gestion des campagnes marketing multicanal. Data Management Platform et marketing multicanal temps réel. Centre de services datamining, campagnes ciblées et reportings. Gestion des opérations marketing ciblées. Data Management Platform, CRM et web analytics. Conception de l’architecture décisionnelle hybride big data – datawarehouse. Centre de services gestion de campagnes marketing et connaissance clients. Convergence des pratiques et des outils marketing on et offline. Mise en place d’une Data Management Platform (DMP) et de use cases marketing. Déploiement d’une plate-forme CRM multi- marques multi-pays. Personnalisation temps réel des contenus et valorisation d’audience. Définition d’une stratégie de Business Intelligence. Pilotage de la qualité de l’expérience client. Extraits de références 2014-2015
  • 11. © 11 SOMMAIRESommaire 1. Introduction 2. L’écosystème : Le décor et quoi de neuf ? 3. Data Miner vs Data Scientist : quelles compétences, quelles différences ? 4. Les nouvelles possibilités d’analyses et les méthodologies associées : quels cas d’utilisation ? 5. Les retours d’expériences : quelle démarche, le délai, les coûts ? 6. Conclusion
  • 13. © 13 Big Data : ça reste à la mode
  • 14. © 14 Oui, mais on aborde la vallée des désillusions Big Data
  • 15. © 15 Malgré tout en France, 2 ans d’expérimentation et de maturation
  • 16. © 16 Notre vision sur les grands segments de marché Expérimentation Industrialisation Transport Retail GSA Retail GSS Banque & Assurance Utilities (yc Telco)
  • 17. © 17 SOMMAIRESommaire Les réponses dans les utilisations marketing
  • 19. © 19 Enjeu # 1 : Rendre tangible et lisible l’expérience omnicanal
  • 20. © 20 Enjeu # 2 : Opérer et exécuter autrement les processus marketing
  • 21. © 21 Enjeu # 3 : Optimisation et analyse de la contribution des différents leviers d’acquisition et de fidélisation
  • 23. © 23 Données : DigitalesCRM Réponse # 1 : Une acceptation commune dans la démarche R.O.I. Connaissance Productivité opérationnelle Analyses ad’hoc Vision produit Vision clients Technologies 1 2 3 4 ModélisationRéconciliation Externes
  • 24. © 24 Réponse # 2 : Des REX sur un segment (sur) peuplé qui émergent Xaas Hardware Projets Open SourceDistributions Données AnalyseVisualisation Application EMR Bigquery Professionnal services (tec & biz)
  • 25. © 25 Réponse # 3 : Baissent des coûts 5 nœuds 1 namenode, 20 cœurs, 192 Go ram 4 datanodes, 64 cœurs, 64 Gb ram, 10 To DD
  • 26. © 26 Réponse # 4 : Autonome
  • 27. © 27 Réponse # 5 : Des compétences qui crantent et qui (commencent) à travailler ensemble Marketing Datascience Programmation
  • 29. © 29 SOMMAIRESommaire 1. Introduction 2. L’écosystème : Le décor et quoi de neuf ? 3. Data Miner vs Data Scientist : quelles compétences, quelles différences ? 4. Les nouvelles possibilités d’analyses et les méthodologies associées : quels cas d’utilisation ? 5. Les retours d’expériences : quelle démarche, le délai, les coûts ? 6. Conclusion
  • 30. © 30 DATAMINING VS DATA SCIENCE : BIG BANG ?
  • 31. © 31 Les données analysées AVANT Univers de données Format et stockage Historique Important sur les données agrégées Faible sur les données unitaires
  • 32. © 32 Les analyses Segmentation RFM, valeur… Etude d’impact de lancement d’offre, programme de fidélisation Score d’appétence, de rétention… Géomarketing : typologies de zone d’implantation, optimisation de réseau de points de vente… Prévision des ventes, des résiliations… Mesure de dispositif de marketing relationnel AVANT
  • 33. © 33 Les méthodologies Régression logistique Modèle ARIMA/SARIMA Analyse des correspondances multiples Analyse Factorielle Analyse en composantes principales … AVANT
  • 34. © 34 Les outils Accès aux données Manipulation de données Analytic Restitution AVANT
  • 35. © 35 L’organisation des projets AVANT Marketing Data Miner  Définit le besoin  Exploite les résultats et met en œuvre les actions  Définit l’approche méthodologique  Réalise les analyses
  • 36. © 36 Les charges Définition de la démarche et des indicateurs Extraction des données Construction de la matrice d’études Analyse/ Modélisation Présentation des résultats 2 jours 5 jours 10 jours 15 jours 10 jours Exemple pour la mise en place d’une segmentation : = 42 jours + aléa AVANT
  • 37. © 37 Les compétences attendues pour un Datamininer Maitrise des outils Maitrise des méthodes Sens Business AVANT
  • 38. © 38 Quelles évolutions/ Quels impacts avec l’arrivée du Big Data ?
  • 40. © 40 Au démarrage du Big data • Des données brutes / non structurées • Accès/manipulation de données via Impala, Hive
  • 41. © 41 Big data 2014 Démocratisation Big data 2015 Démocratisation
  • 42. © 42 Les données analysées 2015 Périmètre Format et stockage Historique Important sur les données agrégées Important sur les données unitaires
  • 43. © 43 Les nouvelles analyses Analyse de parcours omnicanal Analyse de sentiments Moteur de substitution Analyses multi fonctions : logistique, client, yield… Scores à la volée Moteur de recommandations 2015
  • 44. © 44 Les nouvelles méthodologies utilisées Random Forest Boosting Gradient Machine Textmining Réseau Bayesien ACP avec rotation Sequential Pattern Analysis 2015
  • 45. © 45 Les outils Accès aux données Manipulation de données Analytic Restitution 2015
  • 46. © 46 L’organisation des projets 2015 Marketing Data ScienceProgrammation  Définit le besoin  Exploite  Explore  Transforme  Modélise  Nettoie  Optimise  Industrialise
  • 47. © 47 Les charges Exemple pour la mise en place d’une segmentation : Définition de la démarche et des indicateurs Extraction des données Construction de la matrice d’études Analyse/ Modélisation Présentation des résultats 2 jours 3 jours 6 jours 8 jours 3 jours = 22 jours 2015
  • 48. © 48 Les compétences attendues pour un Data Scientist Maitrise des outils Maitrise des nouvelles méthodes Sens Business GESTION DE PROJET 2015
  • 49. © 49 SOMMAIRESommaire 1. Introduction 2. L’écosystème : Le décor et quoi de neuf ? 3. Data Miner vs Data Scientist : quelles compétences, quelles différences ? 4. Les nouvelles possibilités d’analyses et les méthodologies associées : quels cas d’utilisation ? 5. Les retours d’expériences : quelle démarche, le délai, les coûts ? 6. Conclusion
  • 50. © 50 Données : DigitalesCRM Penser applications opérationnelles et débuter simple R.O.I. Connaissance Productivité opérationnelle Analyses ad’hoc Vision produit Vision clients Technologies 1 2 3 4 ModélisationRéconciliation Externes
  • 51. © 51 Une démarche itérative et cocréative  Une approche pour : – Identifier vos enjeux et vos besoins et les décliner en plan d’expérimentation, – Benchmarker, tester et valoriser la création de valeur – Préparer une éventuelle industrialisation Mettre en œuvre la plateforme2 Présentation, ajustement , validation de l’apport de valeur, plans test 3 Représentants métiers Définition des cas d’usages Réaliser les cas d’usage métiers et benchmark avt - après 4 1 Représentants métiers / SI Recueil de l’existant et des besoins métier et SI Représentants métiers Recommandation et plans d’actions en vu de l’industrialisation 5 2 Décile Lift
  • 52. © 52 Aligner les compétences Marketing Datascience Programmation
  • 53. © 53 Imaginer des plannings de réalisation à moins de 6 mois et contributeurs associés Run Initialisation du centre de services Conception et réalisation « large » Maintenance Monitoring applications Administration Gestion des projets de setup Gestion du centre de servicesProgram Management Gestion des projets d’évolutions BusinessIT Gestiondeprojetet deservices Setup Sprints algorithme sur le « lab » Mise en place architecture Définition du SLA Conception et réalisation « fast » Tests Sprints d’amélioration algorithme sur le « lab » Surveillance de la santé de l’algorithme « lab » Infra Hard & soft Hébergement et monitoring Data exploration M1 M2 M3 M4 M5
  • 54. © 54 Anticiper hybride dans l’industrialisationSystèmessources SystèmesbancairesdeproductionExternes ETL Appliance Entrepôt Vision unique du client Datamarts Sandbox Entrepôt Hadoop Usages Reporting Tableaux de bord Cubes OLAP Statistique (SAS...) Systèmes front-end Base métier Données de référence Synthèses transactions Données externes structurées Données externes peu structurées Données volumétrie importante Réintégration données après pré-traitement Sasde sécurité Accès Accès Accès Données externes à la demande Eléments de ciblage (dont scores) Extractions Métiers (dont scores, segmentations...) Base métier Base métier Base métier Base métier Base métier Web Services Services temps réel À destination des front-end
  • 55. © 55 Combien ça coûte ? X * 100 K€ / an Batch As a service X * 1 M€ / an Industrialisation Temps réel Datawahouse+big data
  • 56. © 56 Cibler des R.O.I. < 6 mois
  • 57. © 57 SOMMAIRESommaire 1. Introduction 2. L’écosystème : Le décor et quoi de neuf ? 3. Data Miner vs Data Scientist : quelles compétences, quelles différences ? 4. Les nouvelles possibilités d’analyses et les méthodologies associées : quels cas d’utilisation ? 5. Les retours d’expériences : quelle démarche, le délai, les coûts ? 6. Conclusion
  • 58. © 58 Offre de services S ensibilisation tratégie andbox R oadmap ollout un
  • 59. © 59