L'avènement du Digital s'accompagne d'une démultiplication de données à analyser : structurées et non structurées.
Parallèlement, les entreprises sont à la recherche de sources d'avantage concurrentielles et d'identification de nouveaux débouchés marketing associés à un enjeu de défendre leur part de marché.
Celles-ci sont conscientes, que la valorisation de leurs données constituera la réponse.
Afin de pouvoir analyser ces mines de données, les technologies ont fortement évoluées :
• Mise en place de Big Data pour stocker d'importantes volumétries de données,
• Parallélisation des traitements pour permettre de réduire les délais de réalisation,
• Développement de nouveaux algorithmes qui offrent de nouvelles perspectives d'analyse,
• Evolution des outils statistiques.
Dans ce contexte de mutation technologique et à l'heure du temps réel, quels impacts pour le Data Mining ?
• Quels impacts sur le quotidien du Data Miner : quelles sont les techniques/outils à maitriser ?
• Quelles sont les possibilités et les nouvelles perspectives d'analyse offertes par le Big Data ?
• Quels sont les pièges à éviter ?
Des reportings efficients pour des analyses pertinentes
Du datamining à la datascience
1. Soft Computing – 55, quai de Grenelle – 75015 Paris – tél. +33 (0)1 73 00 55 00 – www.softcomputing.com
Soft Computing
Séminaire
« Data Mining VS Data Science »
Paris, le 05 mars 2015
2. Comment passer du Data Mining traditionnel à la Data Science ?
Quels bénéfices ? Quels impacts ? Quels R.O.I. ?
Séminaire le 05 mars 2015
Du Data Mining à la Data Science
Soft Computing |55 quai de Grenelle|75015 Paris|01 73 00 55 00 | www.softcomputing.com
A propos
Soft Computing est une société spécialisée en CRM, Big Data et Digital, réunissant près de 400 consultants, délivrant des prestations de Conseil, de
Technologie et de Marketing Services.
Soft Computing est coté à Paris dans le compartiment C de NYSE Euronext (ISIN : FR0000075517, Symbole : SFT).
Cet événement est réservé aux clients et prospects Soft Computing. Pour tout autre profil, l'inscription sera soumise à validation.
Agenda :
08h45 – 09h00 : Accueil des participant
09h00 – 11h00 : Séminaire
• La donnée et son exploitation : quels enjeux pour les entreprises ?
• Data Miner vs Data Scientist : quelles compétences, quelles différences?
• Les nouvelles possibilités d'analyse et les méthodologies associées pour quels cas d'utilisation ?
• Les retours d'expériences, les compétences requises, délais et ROI.
• Conclusion.
Soft Computing vous invite à un séminaire qui abordera les questions suivantes :
• Quels impacts sur le quotidien du Data Miner : quelles sont les techniques/outils à maitriser ?
• Quelles sont les possibilités et les nouvelles perspectives d'analyse offertes par le Big Data ?
• Quels sont les pièges à éviter ?
3. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 3
SOMMAIRESOMMAIRE
1. A propos de Soft Computing
2. La donnée et son exploitation : quels enjeux pour les
entreprises ?
3. Data Miner vs Data Scientist : quelles compétences, quelles
différences ?
4. Les nouvelles possibilités d’analyses et les méthodologies
associées : quels cas d’utilisation ?
5. Les retours d’expériences : quelle démarche, le délai, les coûts ?
5. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 5
Continuum de services
Think Build
Business
IT
Imaginer, bâtir et opérer
des programmes de conquête et de fidélisation
cross-canaux, rentables et innovants
Concevoir, développer et déployer
des solutions Digitales, Big Data et CRM
performantes, pragmatiques et adaptées
Run
6. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 6
Extraits de références 2013
Centre de services de
gestion des campagnes
marketing multicanal.
Ecoute et analyse des
sentiments des clients sur
les réseaux sociaux.
Programme relationnel
multi-devices.
Maintien en conditions
opérationnelles et
évolution du SI marketing
on et offline.
Gestion opérationnelle
des plates-formes
analytiques et marketing
ciblé.
Dispositif d’acquisition de
prospects sur tablette en
magasin.
Cadrage, conception et
déploiement d’un service
client pro-actif.
Centre de services de
datamining, de
campagnes ciblées et de
diffusion des reportings.
Personnalisation en temps
réel des contenus et
valorisation d’audience.
Déploiement d’un outil
d’automatisation des
forces de ventes.
Définition d’une stratégie
de Business Intelligence.
Applications mobiles et
personnalisation.
Pilotage de la qualité de
l’expérience client.
Optimisation des parcours
client et du taux de
transformation sur
Internet.
Référentiel client
transversal multicanal et
multiservice.
7. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 7
Experts reconnus
EnseignerEcrire Echanger
http://blog.softcomputing.com/
https://twitter.com/#!/SoftComputing
http://www.facebook.com/softcomputing
http://www.softcomputing.com/fr/news/
http://fr.slideshare.net/softcomputing
http://www.linkedin.com/company/soft-
computing
http://www.viadeo.com/fr/company/soft-
computing
https://plus.google.com/+Softcomputing/
8. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 8
SOMMAIRESOMMAIRE
1. A propos de Soft Computing
2. La donnée et son exploitation : quels enjeux pour les
entreprises ?
3. Data Miner vs Data Scientist : quelles compétences, quelles
différences ?
4. Les nouvelles possibilités d’analyses et les méthodologies
associées : quels cas d’utilisation ?
5. Les retours d’expériences : quelle démarche, le délai, les coûts ?
10. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 10
…devenu en 2010
Digital Dad (ou
mom)
Digital Native
né en 1980…
Oui, le client a changé
18. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 18
Dans quels domaines le marketing doit-il concentrer ses investissements ?
Les priorités du marketing changent
25. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 25
Les compétences requises évoluent aussi
Quelles sont les 3 plus importantes compétences d’un directeur marketing
27. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 27
SOMMAIRESOMMAIRE
1. A propos de Soft Computing
2. La donnée et son exploitation : quels enjeux pour les
entreprises ?
3. Data Miner vs Data Scientist : quelles compétences, quelles
différences ?
4. Les nouvelles possibilités d’analyses et les méthodologies
associées : quels cas d’utilisation ?
5. Les retours d’expériences : quelle démarche, le délai, les coûts ?
29. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 29
Les données analysées
AVANT
Périmètre
Univers de données
Format et stockage
Historique
Plusieurs mois
30. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 30
Les analyses
AVANT
Segmentation
Valeur, RFM, comportementale, style de consommation, marché, relationnelle,…
Score
De prospection, rétention, endormissement, appétence (cross sell , up sell, canaux..),
cycle d’achat, valeur future …
Etude d’impact
De programme de fidélisation, déréférencement, lancement d’offre, dispositif de
Marketing direct
Prévision
Prévision de vente, prévision de résiliation, prévision d’appels , durée de vie…
Etude géomarketing
Typologies de zone d’implantation , des études d’optimisation des réseaux de points de
vente physique….
Fraude
Modèles de détection des comportements atypiques
31. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 31
Les méthodologies
AVANT
Régression
logistique
Modèle
ARIMA/SARIMA
Analyse des
correspondances
multiples
Analyse
Factorielle
Analyse en
composantes
principales
…
32. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 32
Les outils
AVANT
Accès aux
données
Manipulation
de données
Analytics Restitution
33. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 33
L’organisation des projets et les charges
AVANT
Définition de
la démarche
et des
indicateurs
Extraction
des données
Construction
de la matrice
d’études
Analyse/
Modélisation
Présentation
des résultats
2 jours 5 jours 10 jours 15 jours 10 jours
Exemple pour la mise en place d’une segmentation :
= 42 jours
34. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 34
Les compétences attendues pour un Datamininer
Maitrise des outils Maitrise des méthodes Sens Business
AVANT
36. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 36
Au démarrage du Big data
• Des données brutes /
non structurées
• Accès/manipulation
de données via
Impala, Hive
38. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 38
Les données analysées
2015
Périmètre clients
Univers de données
Format et stockage
Historique
Plusieurs années
39. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 39
Les nouvelles analyses
2015
Analyse de
parcours web
Analyse de
sentiments
Segmentation
multicanal
Segmentation
Style de
consommation
Scores à la volée
Moteur de
recommandations
40. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 40
Les nouvelles méthodologies utilisées
2015
Random Forest
Boosting Gradient
Machine
Textmining
Réseau Bayesien
ACP
avec rotation
Sequential
Pattern Analysis
41. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 41
Les outils
2015
Accès aux
données
Manipulation
de données
Analytics Restitution
42. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 42
L’organisation des projets et les charges
2015
Exemple pour la mise en place d’une segmentation :
Définition de
la démarche
et des
indicateurs
Extraction
des données
Construction
de la matrice
d’études
Analyse/
Modélisation
Présentation
des résultats
2 jours 3 jours 6 jours 8 jours 3 jours = 22 jours
43. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 43
Les compétences attendues pour un Data Scientist
Maitrise des outils Maitrise des nouvelles
méthodes
Sens Business
Maintenant
GESTION DE PROJET
44. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 44
SOMMAIRESOMMAIRE
1. A propos de Soft Computing
2. La donnée et son exploitation : quels enjeux pour les
entreprises ?
3. Data Miner vs Data Scientist : quelles compétences, quelles
différences ?
4. Les nouvelles possibilités d’analyses et les méthodologies
associées : quels cas d’utilisation ?
5. Les retours d’expériences : quelle démarche, le délai, les coûts ?
45. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 45
Un nouvel environnement
Données Web/
SC
Données
exogènes
Données non
structurées
Importante
volumétrie de
données
Plus de
contrainte de
stockage
Temps réel
Nouvelles
méthodes
46. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 46
Les nouveaux besoins d’analyse
Améliorer la
performance de
détection avec des
données exogènes
Proposer des produits
de substitution
Améliorer la
performance de
détection et les temps
de traitement avec de
nouvelles méthodes
Analyser les sentiments
Identifier les
influenceurs
Appréhender les styles
de consommation
Identifier et optimiser
les parcours Web
… …
47. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 47
SOMMAIRESOMMAIRE
1. A propos de Soft Computing
2. La donnée et son exploitation : quels enjeux pour les
entreprises ?
3. Data Miner vs Data Scientist : quelles compétences, quelles
différences ?
4. Les nouvelles possibilités d’analyses et les méthodologies
associées : quels cas d’utilisation ?
5. Les retours d’expériences : quelle démarche, le délai, les
coûts ?
48. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 48
Données :
DigitalesCRM
Penser applications opérationnelles et débuter simple
R.O.I.
Connaissance
Productivité
opérationnelle
Analyses ad’hoc
Vision produit Vision clients
Technologies
1
2
3
4
DataminingRéconciliation
Externes
49. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 49
Une démarche itérative et cocréative
• Une approche pour :
– Identifier vos enjeux et vos besoins et les décliner en plan d’expérimentation,
– Benchmarker, tester et valoriser la création de valeur
– Préparer une éventuelle industrialisation
Mettre en œuvre la
plateforme2
Présentation, ajustement ,
validation de l’apport de
valeur, plans test
3
Représentants
métiers
Définition des cas
d’usages
Réaliser les cas d’usage
métiers et benchmark avt
- après
4
1
Représentants
métiers / SI
Recueil de l’existant et des
besoins métier et SI
Représentants
métiers
Recommandation et plans d’actions
en vu de l’industrialisation
5
2
Décile
Lift
50. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 50
Architecture de travail
Lab data Large Data Fast Data
Prototyper l’algorithme
Produire les résultats
Suivre et optimiser la
performance de
l’algorithme
Proposer les résultats
Intégrer l’algorithme
Développer l’algorithme
51. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 51
Planning et contributeurs
Run
Initialisation du centre de services
Conception et réalisation « large »
Maintenance
Monitoring applications
Administration
Gestion des projets de setup
Gestion du centre de servicesProgram Management
Gestion des projets d’évolutions
BusinessIT
Gestiondeprojet
etdeservices
Setup
Sprints algorithme sur le
« lab »
Mise en place
architecture
Définition du
SLA
Conception et réalisation « fast »
Tests
Sprints d’amélioration algorithme sur le « lab »
Surveillance de la santé de l’algorithme « lab »
Infra
Hard & soft
Hébergement et monitoring
Data
exploration
M1 M2 M3 M4 M5
53. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 53
Combien ça coûte ?
X*100 K€ / an
Batch
As a service
X* 1 M€ / an
Industrialisation
Temps réel
Datawahouse+big data