© Soft Computing – www.softcomputing.com
Du Data Mining à la Data Science :
Comment passer du Data Mining traditionnel à l...
© 2
Du Data Mining à la Data Science
Séminaire le 24 septembre 2015
Comment passer du Data Mining traditionnel à la Data S...
© 3
Présentation des intervenants
Eric Fischmeister
Président
efr@softcomputing.com
01 73 00 57 59
Hélène Hamon
Directrice...
© 4
SOMMAIRESommaire
1. Introduction
2. L’écosystème : Le décor et quoi de neuf ?
3. Data Miner vs Data Scientist : quelle...
© 5
Carte d’identité
© 6
Compétences : un mix unique de compétences pointues
Digital
Marketing
Data
Science
Project
Management
Information
Tech...
© 7
Mission : transformer la data en performance
Business
IT
Imaginer, bâtir et opérer
des programmes de conquête et de fi...
© 8
Delivery : continuum de services et souplesse
Think Build Run
Délégation
d’expertise
Mode
Projet
Centre de
services
© 9
Programme relationnel
multi-devices et
remarketing.
Ecoute et analyse des
sentiments des clients
sur les réseaux socia...
© 10
Experts reconnus
blog.softcomputing.com/
fr.slideshare.net/softcomputing
twitter.com/#!/SoftComputing
linkedin.com/co...
© 11
SOMMAIRESommaire
1. Introduction
2. L’écosystème : Le décor et quoi de neuf ?
3. Data Miner vs Data Scientist : quell...
© 12
Humilité
© 13
Big Data : ça reste à la mode
© 14
Oui, mais on aborde la vallée des désillusions
Big Data
© 15
Malgré tout en France, 2 ans d’expérimentation et de maturation
© 16
Notre vision sur les grands segments de marché
Expérimentation Industrialisation
Transport
Retail GSA
Retail GSS
Banq...
© 17
SOMMAIRESommaire
Les réponses dans les
utilisations marketing
Acquisition
Développement
Fidélisation
R.O.I. / R.O.E
© 19
Enjeu # 1 : Rendre tangible et lisible l’expérience omnicanal
© 20
Enjeu # 2 : Opérer et exécuter autrement les processus marketing
© 21
Enjeu # 3 : Optimisation et analyse de la contribution des
différents leviers d’acquisition et de fidélisation
© 22
Comment ?
© 23
Données :
DigitalesCRM
Réponse # 1 : Une acceptation commune dans la démarche
R.O.I.
Connaissance
Productivité opérat...
© 24
Réponse # 2 : Des REX sur un segment (sur) peuplé qui émergent
Xaas
Hardware
Projets Open SourceDistributions
Données...
© 25
Réponse # 3 : Baissent des coûts
5 nœuds
1 namenode, 20 cœurs, 192 Go ram
4 datanodes, 64 cœurs, 64 Gb ram, 10 To DD
© 26
Réponse # 4 : Autonome
© 27
Réponse # 5 : Des compétences qui crantent et qui (commencent)
à travailler ensemble
Marketing Datascience Programmat...
© 28
Accélérer
© 29
SOMMAIRESommaire
1. Introduction
2. L’écosystème : Le décor et quoi de neuf ?
3. Data Miner vs Data Scientist : quell...
© 30
DATAMINING VS DATA SCIENCE :
BIG BANG ?
© 31
Les données analysées AVANT
Univers de données Format et stockage
Historique
Important sur les
données agrégées
Fai...
© 32
Les analyses
Segmentation RFM,
valeur…
Etude d’impact de
lancement d’offre,
programme de
fidélisation
Score d’appéten...
© 33
Les méthodologies
Régression logistique
Modèle
ARIMA/SARIMA
Analyse des
correspondances
multiples
Analyse Factorielle...
© 34
Les outils
Accès aux
données
Manipulation
de données
Analytic Restitution
AVANT
© 35
L’organisation des projets AVANT
Marketing Data Miner
 Définit le besoin
 Exploite les résultats
et met en œuvre le...
© 36
Les charges
Définition de
la démarche
et des
indicateurs
Extraction
des données
Construction
de la matrice
d’études
A...
© 37
Les compétences attendues pour un
Datamininer
Maitrise des outils Maitrise des méthodes Sens Business
AVANT
© 38
Quelles évolutions/ Quels impacts avec l’arrivée du Big Data ?
© 39
Marketing
SI
Data Scientist
© 40
Au démarrage du Big data
• Des données brutes /
non structurées
• Accès/manipulation de
données via Impala, Hive
© 41
Big data 2014
Démocratisation
Big data 2015
Démocratisation
© 42
Les données analysées 2015
Périmètre
Format et stockage
Historique
Important sur les
données agrégées
Important sur...
© 43
Les nouvelles analyses
Analyse de parcours
omnicanal
Analyse de
sentiments
Moteur de
substitution
Analyses multi
fonc...
© 44
Les nouvelles méthodologies utilisées
Random Forest
Boosting Gradient
Machine
Textmining
Réseau Bayesien
ACP
avec rot...
© 45
Les outils
Accès aux
données
Manipulation
de données
Analytic Restitution
2015
© 46
L’organisation des projets 2015
Marketing
Data ScienceProgrammation
 Définit le besoin
 Exploite
 Explore
 Transf...
© 47
Les charges
Exemple pour la mise en place d’une segmentation :
Définition de
la démarche
et des
indicateurs
Extractio...
© 48
Les compétences attendues pour un Data
Scientist
Maitrise
des outils
Maitrise des
nouvelles méthodes
Sens
Business
GE...
© 49
SOMMAIRESommaire
1. Introduction
2. L’écosystème : Le décor et quoi de neuf ?
3. Data Miner vs Data Scientist : quell...
© 50
Données :
DigitalesCRM
Penser applications opérationnelles et débuter simple
R.O.I.
Connaissance
Productivité opérati...
© 51
Une démarche itérative et cocréative
 Une approche pour :
– Identifier vos enjeux et vos besoins et les décliner en ...
© 52
Aligner les compétences
Marketing Datascience Programmation
© 53
Imaginer des plannings de réalisation à moins de 6 mois et
contributeurs associés
Run
Initialisation du centre de ser...
© 54
Anticiper hybride dans l’industrialisationSystèmessources
SystèmesbancairesdeproductionExternes
ETL Appliance
Entrepô...
© 55
Combien ça coûte ?
X * 100 K€ / an
Batch
As a service
X * 1 M€ / an
Industrialisation
Temps réel
Datawahouse+big data
© 56
Cibler des R.O.I. < 6 mois
© 57
SOMMAIRESommaire
1. Introduction
2. L’écosystème : Le décor et quoi de neuf ?
3. Data Miner vs Data Scientist : quell...
© 58
Offre de services
S
ensibilisation
tratégie
andbox
R
oadmap
ollout
un
© 59
Prochain SlideShare
Chargement dans…5
×

Du Data Mining à la Data Science

1 837 vues

Publié le

L’avènement du Digital s’accompagne d’une démultiplication de données à analyser : structurées et non structurées.
Parallèlement, les entreprises sont à la recherche de sources d’avantages concurrentiels et d’identification de nouveaux débouchés marketing associés à un enjeu de défendre leur part de marché. Celles-ci sont conscientes, que la valorisation de leurs données constituera la réponse.

Afin de pouvoir analyser ces mines de données, les technologies ont fortement évolué :
• Mise en place de Big Data pour stocker d’importantes volumétries de données ;
• Parallélisation/montée en mémoire des traitements pour permettre de réduire les délais de réalisation ;
• Développement de nouveaux algorithmes qui offrent de nouvelles perspectives d’analyses ;
• Evolution des outils statistiques.

Dans ce contexte de mutations technologiques et à l’heure du temps réel, quels sont les impacts pour le Data Mining?

Nous vous invitons à un séminaire gratuit qui abordera les questions suivantes :
• Quels impacts sur le quotidien du Data Miner : quelles sont les techniques/outils à maîtriser ?
• Quelles sont les possibilités et les nouvelles perspectives d’analyse offertes par le Big Data ?
• Quels sont les pièges à éviter ?

Publié dans : Technologie
0 commentaire
3 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
1 837
Sur SlideShare
0
Issues des intégrations
0
Intégrations
19
Actions
Partages
0
Téléchargements
86
Commentaires
0
J’aime
3
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Du Data Mining à la Data Science

  1. 1. © Soft Computing – www.softcomputing.com Du Data Mining à la Data Science : Comment passer du Data Mining traditionnel à la Data Science ? 24/09/2015
  2. 2. © 2 Du Data Mining à la Data Science Séminaire le 24 septembre 2015 Comment passer du Data Mining traditionnel à la Data Science ? Quels bénéfices ? Quels impacts ? Quels R.O.I. ? Modalités : Ce séminaire aura lieu dans les locaux de Soft Computing. Ou via notre site: www.softcomputing.com Soft Computing vous invite à un séminaire qui abordera les questions suivantes : • Quels impacts sur le quotidien du Data Miner : quelles sont les techniques/outils à maitriser ? • Quelles sont les possibilités et les nouvelles perspectives d'analyse offertes par le Big Data ? • Quels sont les pièges à éviter ? Agenda : 08h45 – 09h00 : Accueil des participants 09h00 – 11h00 : Séminaire  La donnée et son exploitation : quels enjeux pour les entreprises ?  Data Miner vs Data Scientist : quelles compétences, quelles différences ?  Les nouvelles possibilités d'analyse et les méthodologies associées pour quels cas d'utilisation ?  Les retours d'expériences, les compétences requises, délais et ROI. A propos Soft Computing est une entreprise de Services du Numérique spécialiste en Digital, Big Data, et CRM, réunissant près de 400 consultants, délivrant des prestations de Conseil, de Technologie et de Marketing Services. Soft Computing est coté sur NYSE Euronext Paris - Code ISIN : FR0000075517 - Symbole : SFT. Cet événement est réservé aux clients et prospects Soft Computing. Pour tout autre profil, l'inscription sera soumise à validation. Soft Computing |55 quai de Grenelle|75015 Paris|01 73 00 55 00 | www.softcomputing.com
  3. 3. © 3 Présentation des intervenants Eric Fischmeister Président efr@softcomputing.com 01 73 00 57 59 Hélène Hamon Directrice adjointe du pôle Marketing Services hhm@softcomputing.com 01 73 00 55 88 Sylvain Bellier Directeur du pôle Marketing Services sbe@softcomputing.com 01 73 00 56 06 Eric Fischmeister Président efr@softcomputing.com 01 73 00 57 59
  4. 4. © 4 SOMMAIRESommaire 1. Introduction 2. L’écosystème : Le décor et quoi de neuf ? 3. Data Miner vs Data Scientist : quelles compétences, quelles différences ? 4. Les nouvelles possibilités d’analyses et les méthodologies associées : quels cas d’utilisation ? 5. Les retours d’expériences : quelle démarche, le délai, les coûts ? 6. Conclusion
  5. 5. © 5 Carte d’identité
  6. 6. © 6 Compétences : un mix unique de compétences pointues Digital Marketing Data Science Project Management Information Technologies Digital - Big Data - CRM
  7. 7. © 7 Mission : transformer la data en performance Business IT Imaginer, bâtir et opérer des programmes de conquête et de fidélisation cross-canaux, rentables et innovants Concevoir, développer et déployer des solutions Digitales, Big Data et CRM performantes, pragmatiques et adaptées AMOA
  8. 8. © 8 Delivery : continuum de services et souplesse Think Build Run Délégation d’expertise Mode Projet Centre de services
  9. 9. © 9 Programme relationnel multi-devices et remarketing. Ecoute et analyse des sentiments des clients sur les réseaux sociaux. Centre de services de gestion des campagnes marketing multicanal. Data Management Platform et marketing multicanal temps réel. Centre de services datamining, campagnes ciblées et reportings. Gestion des opérations marketing ciblées. Data Management Platform, CRM et web analytics. Conception de l’architecture décisionnelle hybride big data – datawarehouse. Centre de services gestion de campagnes marketing et connaissance clients. Convergence des pratiques et des outils marketing on et offline. Mise en place d’une Data Management Platform (DMP) et de use cases marketing. Déploiement d’une plate-forme CRM multi- marques multi-pays. Personnalisation temps réel des contenus et valorisation d’audience. Définition d’une stratégie de Business Intelligence. Pilotage de la qualité de l’expérience client. Extraits de références 2014-2015
  10. 10. © 10 Experts reconnus blog.softcomputing.com/ fr.slideshare.net/softcomputing twitter.com/#!/SoftComputing linkedin.com/company/soft-computing facebook.com/softcomputing softcomputing.com/fr/news/ InformerEcrire Enseigner
  11. 11. © 11 SOMMAIRESommaire 1. Introduction 2. L’écosystème : Le décor et quoi de neuf ? 3. Data Miner vs Data Scientist : quelles compétences, quelles différences ? 4. Les nouvelles possibilités d’analyses et les méthodologies associées : quels cas d’utilisation ? 5. Les retours d’expériences : quelle démarche, le délai, les coûts ? 6. Conclusion
  12. 12. © 12 Humilité
  13. 13. © 13 Big Data : ça reste à la mode
  14. 14. © 14 Oui, mais on aborde la vallée des désillusions Big Data
  15. 15. © 15 Malgré tout en France, 2 ans d’expérimentation et de maturation
  16. 16. © 16 Notre vision sur les grands segments de marché Expérimentation Industrialisation Transport Retail GSA Retail GSS Banque & Assurance Utilities (yc Telco)
  17. 17. © 17 SOMMAIRESommaire Les réponses dans les utilisations marketing
  18. 18. Acquisition Développement Fidélisation R.O.I. / R.O.E
  19. 19. © 19 Enjeu # 1 : Rendre tangible et lisible l’expérience omnicanal
  20. 20. © 20 Enjeu # 2 : Opérer et exécuter autrement les processus marketing
  21. 21. © 21 Enjeu # 3 : Optimisation et analyse de la contribution des différents leviers d’acquisition et de fidélisation
  22. 22. © 22 Comment ?
  23. 23. © 23 Données : DigitalesCRM Réponse # 1 : Une acceptation commune dans la démarche R.O.I. Connaissance Productivité opérationnelle Analyses ad’hoc Vision produit Vision clients Technologies 1 2 3 4 ModélisationRéconciliation Externes
  24. 24. © 24 Réponse # 2 : Des REX sur un segment (sur) peuplé qui émergent Xaas Hardware Projets Open SourceDistributions Données AnalyseVisualisation Application EMR Bigquery Professionnal services (tec & biz)
  25. 25. © 25 Réponse # 3 : Baissent des coûts 5 nœuds 1 namenode, 20 cœurs, 192 Go ram 4 datanodes, 64 cœurs, 64 Gb ram, 10 To DD
  26. 26. © 26 Réponse # 4 : Autonome
  27. 27. © 27 Réponse # 5 : Des compétences qui crantent et qui (commencent) à travailler ensemble Marketing Datascience Programmation
  28. 28. © 28 Accélérer
  29. 29. © 29 SOMMAIRESommaire 1. Introduction 2. L’écosystème : Le décor et quoi de neuf ? 3. Data Miner vs Data Scientist : quelles compétences, quelles différences ? 4. Les nouvelles possibilités d’analyses et les méthodologies associées : quels cas d’utilisation ? 5. Les retours d’expériences : quelle démarche, le délai, les coûts ? 6. Conclusion
  30. 30. © 30 DATAMINING VS DATA SCIENCE : BIG BANG ?
  31. 31. © 31 Les données analysées AVANT Univers de données Format et stockage Historique Important sur les données agrégées Faible sur les données unitaires
  32. 32. © 32 Les analyses Segmentation RFM, valeur… Etude d’impact de lancement d’offre, programme de fidélisation Score d’appétence, de rétention… Géomarketing : typologies de zone d’implantation, optimisation de réseau de points de vente… Prévision des ventes, des résiliations… Mesure de dispositif de marketing relationnel AVANT
  33. 33. © 33 Les méthodologies Régression logistique Modèle ARIMA/SARIMA Analyse des correspondances multiples Analyse Factorielle Analyse en composantes principales … AVANT
  34. 34. © 34 Les outils Accès aux données Manipulation de données Analytic Restitution AVANT
  35. 35. © 35 L’organisation des projets AVANT Marketing Data Miner  Définit le besoin  Exploite les résultats et met en œuvre les actions  Définit l’approche méthodologique  Réalise les analyses
  36. 36. © 36 Les charges Définition de la démarche et des indicateurs Extraction des données Construction de la matrice d’études Analyse/ Modélisation Présentation des résultats 2 jours 5 jours 10 jours 15 jours 10 jours Exemple pour la mise en place d’une segmentation : = 42 jours + aléa AVANT
  37. 37. © 37 Les compétences attendues pour un Datamininer Maitrise des outils Maitrise des méthodes Sens Business AVANT
  38. 38. © 38 Quelles évolutions/ Quels impacts avec l’arrivée du Big Data ?
  39. 39. © 39 Marketing SI Data Scientist
  40. 40. © 40 Au démarrage du Big data • Des données brutes / non structurées • Accès/manipulation de données via Impala, Hive
  41. 41. © 41 Big data 2014 Démocratisation Big data 2015 Démocratisation
  42. 42. © 42 Les données analysées 2015 Périmètre Format et stockage Historique Important sur les données agrégées Important sur les données unitaires
  43. 43. © 43 Les nouvelles analyses Analyse de parcours omnicanal Analyse de sentiments Moteur de substitution Analyses multi fonctions : logistique, client, yield… Scores à la volée Moteur de recommandations 2015
  44. 44. © 44 Les nouvelles méthodologies utilisées Random Forest Boosting Gradient Machine Textmining Réseau Bayesien ACP avec rotation Sequential Pattern Analysis 2015
  45. 45. © 45 Les outils Accès aux données Manipulation de données Analytic Restitution 2015
  46. 46. © 46 L’organisation des projets 2015 Marketing Data ScienceProgrammation  Définit le besoin  Exploite  Explore  Transforme  Modélise  Nettoie  Optimise  Industrialise
  47. 47. © 47 Les charges Exemple pour la mise en place d’une segmentation : Définition de la démarche et des indicateurs Extraction des données Construction de la matrice d’études Analyse/ Modélisation Présentation des résultats 2 jours 3 jours 6 jours 8 jours 3 jours = 22 jours 2015
  48. 48. © 48 Les compétences attendues pour un Data Scientist Maitrise des outils Maitrise des nouvelles méthodes Sens Business GESTION DE PROJET 2015
  49. 49. © 49 SOMMAIRESommaire 1. Introduction 2. L’écosystème : Le décor et quoi de neuf ? 3. Data Miner vs Data Scientist : quelles compétences, quelles différences ? 4. Les nouvelles possibilités d’analyses et les méthodologies associées : quels cas d’utilisation ? 5. Les retours d’expériences : quelle démarche, le délai, les coûts ? 6. Conclusion
  50. 50. © 50 Données : DigitalesCRM Penser applications opérationnelles et débuter simple R.O.I. Connaissance Productivité opérationnelle Analyses ad’hoc Vision produit Vision clients Technologies 1 2 3 4 ModélisationRéconciliation Externes
  51. 51. © 51 Une démarche itérative et cocréative  Une approche pour : – Identifier vos enjeux et vos besoins et les décliner en plan d’expérimentation, – Benchmarker, tester et valoriser la création de valeur – Préparer une éventuelle industrialisation Mettre en œuvre la plateforme2 Présentation, ajustement , validation de l’apport de valeur, plans test 3 Représentants métiers Définition des cas d’usages Réaliser les cas d’usage métiers et benchmark avt - après 4 1 Représentants métiers / SI Recueil de l’existant et des besoins métier et SI Représentants métiers Recommandation et plans d’actions en vu de l’industrialisation 5 2 Décile Lift
  52. 52. © 52 Aligner les compétences Marketing Datascience Programmation
  53. 53. © 53 Imaginer des plannings de réalisation à moins de 6 mois et contributeurs associés Run Initialisation du centre de services Conception et réalisation « large » Maintenance Monitoring applications Administration Gestion des projets de setup Gestion du centre de servicesProgram Management Gestion des projets d’évolutions BusinessIT Gestiondeprojetet deservices Setup Sprints algorithme sur le « lab » Mise en place architecture Définition du SLA Conception et réalisation « fast » Tests Sprints d’amélioration algorithme sur le « lab » Surveillance de la santé de l’algorithme « lab » Infra Hard & soft Hébergement et monitoring Data exploration M1 M2 M3 M4 M5
  54. 54. © 54 Anticiper hybride dans l’industrialisationSystèmessources SystèmesbancairesdeproductionExternes ETL Appliance Entrepôt Vision unique du client Datamarts Sandbox Entrepôt Hadoop Usages Reporting Tableaux de bord Cubes OLAP Statistique (SAS...) Systèmes front-end Base métier Données de référence Synthèses transactions Données externes structurées Données externes peu structurées Données volumétrie importante Réintégration données après pré-traitement Sasde sécurité Accès Accès Accès Données externes à la demande Eléments de ciblage (dont scores) Extractions Métiers (dont scores, segmentations...) Base métier Base métier Base métier Base métier Base métier Web Services Services temps réel À destination des front-end
  55. 55. © 55 Combien ça coûte ? X * 100 K€ / an Batch As a service X * 1 M€ / an Industrialisation Temps réel Datawahouse+big data
  56. 56. © 56 Cibler des R.O.I. < 6 mois
  57. 57. © 57 SOMMAIRESommaire 1. Introduction 2. L’écosystème : Le décor et quoi de neuf ? 3. Data Miner vs Data Scientist : quelles compétences, quelles différences ? 4. Les nouvelles possibilités d’analyses et les méthodologies associées : quels cas d’utilisation ? 5. Les retours d’expériences : quelle démarche, le délai, les coûts ? 6. Conclusion
  58. 58. © 58 Offre de services S ensibilisation tratégie andbox R oadmap ollout un
  59. 59. © 59

×