Du datamining à la datascience

1 733 vues

Publié le

L'avènement du Digital s'accompagne d'une démultiplication de données à analyser : structurées et non structurées.
Parallèlement, les entreprises sont à la recherche de sources d'avantage concurrentielles et d'identification de nouveaux débouchés marketing associés à un enjeu de défendre leur part de marché.
Celles-ci sont conscientes, que la valorisation de leurs données constituera la réponse.

Afin de pouvoir analyser ces mines de données, les technologies ont fortement évoluées :
• Mise en place de Big Data pour stocker d'importantes volumétries de données,
• Parallélisation des traitements pour permettre de réduire les délais de réalisation,
• Développement de nouveaux algorithmes qui offrent de nouvelles perspectives d'analyse,
• Evolution des outils statistiques.

Dans ce contexte de mutation technologique et à l'heure du temps réel, quels impacts pour le Data Mining ?

• Quels impacts sur le quotidien du Data Miner : quelles sont les techniques/outils à maitriser ?
• Quelles sont les possibilités et les nouvelles perspectives d'analyse offertes par le Big Data ?
• Quels sont les pièges à éviter ?

Publié dans : Technologie
0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
1 733
Sur SlideShare
0
Issues des intégrations
0
Intégrations
10
Actions
Partages
0
Téléchargements
52
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Du datamining à la datascience

  1. 1. Soft Computing – 55, quai de Grenelle – 75015 Paris – tél. +33 (0)1 73 00 55 00 – www.softcomputing.com Soft Computing Séminaire « Data Mining VS Data Science » Paris, le 05 mars 2015
  2. 2. Comment passer du Data Mining traditionnel à la Data Science ? Quels bénéfices ? Quels impacts ? Quels R.O.I. ? Séminaire le 05 mars 2015 Du Data Mining à la Data Science Soft Computing |55 quai de Grenelle|75015 Paris|01 73 00 55 00 | www.softcomputing.com A propos Soft Computing est une société spécialisée en CRM, Big Data et Digital, réunissant près de 400 consultants, délivrant des prestations de Conseil, de Technologie et de Marketing Services. Soft Computing est coté à Paris dans le compartiment C de NYSE Euronext (ISIN : FR0000075517, Symbole : SFT). Cet événement est réservé aux clients et prospects Soft Computing. Pour tout autre profil, l'inscription sera soumise à validation. Agenda : 08h45 – 09h00 : Accueil des participant 09h00 – 11h00 : Séminaire • La donnée et son exploitation : quels enjeux pour les entreprises ? • Data Miner vs Data Scientist : quelles compétences, quelles différences? • Les nouvelles possibilités d'analyse et les méthodologies associées pour quels cas d'utilisation ? • Les retours d'expériences, les compétences requises, délais et ROI. • Conclusion. Soft Computing vous invite à un séminaire qui abordera les questions suivantes : • Quels impacts sur le quotidien du Data Miner : quelles sont les techniques/outils à maitriser ? • Quelles sont les possibilités et les nouvelles perspectives d'analyse offertes par le Big Data ? • Quels sont les pièges à éviter ?
  3. 3. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 3 SOMMAIRESOMMAIRE 1. A propos de Soft Computing 2. La donnée et son exploitation : quels enjeux pour les entreprises ? 3. Data Miner vs Data Scientist : quelles compétences, quelles différences ? 4. Les nouvelles possibilités d’analyses et les méthodologies associées : quels cas d’utilisation ? 5. Les retours d’expériences : quelle démarche, le délai, les coûts ?
  4. 4. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 4 Carte d’identité
  5. 5. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 5 Continuum de services Think Build Business IT Imaginer, bâtir et opérer des programmes de conquête et de fidélisation cross-canaux, rentables et innovants Concevoir, développer et déployer des solutions Digitales, Big Data et CRM performantes, pragmatiques et adaptées Run
  6. 6. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 6 Extraits de références 2013 Centre de services de gestion des campagnes marketing multicanal. Ecoute et analyse des sentiments des clients sur les réseaux sociaux. Programme relationnel multi-devices. Maintien en conditions opérationnelles et évolution du SI marketing on et offline. Gestion opérationnelle des plates-formes analytiques et marketing ciblé. Dispositif d’acquisition de prospects sur tablette en magasin. Cadrage, conception et déploiement d’un service client pro-actif. Centre de services de datamining, de campagnes ciblées et de diffusion des reportings. Personnalisation en temps réel des contenus et valorisation d’audience. Déploiement d’un outil d’automatisation des forces de ventes. Définition d’une stratégie de Business Intelligence. Applications mobiles et personnalisation. Pilotage de la qualité de l’expérience client. Optimisation des parcours client et du taux de transformation sur Internet. Référentiel client transversal multicanal et multiservice.
  7. 7. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 7 Experts reconnus EnseignerEcrire Echanger http://blog.softcomputing.com/ https://twitter.com/#!/SoftComputing http://www.facebook.com/softcomputing http://www.softcomputing.com/fr/news/ http://fr.slideshare.net/softcomputing http://www.linkedin.com/company/soft- computing http://www.viadeo.com/fr/company/soft- computing https://plus.google.com/+Softcomputing/
  8. 8. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 8 SOMMAIRESOMMAIRE 1. A propos de Soft Computing 2. La donnée et son exploitation : quels enjeux pour les entreprises ? 3. Data Miner vs Data Scientist : quelles compétences, quelles différences ? 4. Les nouvelles possibilités d’analyses et les méthodologies associées : quels cas d’utilisation ? 5. Les retours d’expériences : quelle démarche, le délai, les coûts ?
  9. 9. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 9 SOMMAIRESOMMAIRE Une révolution sous nos yeux
  10. 10. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 10 …devenu en 2010 Digital Dad (ou mom) Digital Native né en 1980… Oui, le client a changé
  11. 11. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 11 Oui, ça s’accélère 8 des 10 premiers sites web ont moins de 10 ans
  12. 12. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 12 Son mode de consommation change 2005 2015
  13. 13. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 13 Son mode d’expression change 2005 2015
  14. 14. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 14 Sa relation à l’annonceur change 2005 2015
  15. 15. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 15 Son univers de choix change 2005 2015
  16. 16. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 16 Facteurs de succès : bouleversés 2005 2015
  17. 17. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 17 SOMMAIRESOMMAIRE Quelles conséquences sur le marketing ?
  18. 18. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 18 Dans quels domaines le marketing doit-il concentrer ses investissements ? Les priorités du marketing changent
  19. 19. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 19 Individualisé Segment Individu 2005 2015
  20. 20. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 20 Mobile 2005 2015 Portable Multi-device
  21. 21. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 21 Omnicanal 2005 2015 Centré canal et campagne Centré client et expérience
  22. 22. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 22 Contextuel 2005 2015 Ciblé Localisé
  23. 23. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 23 Temps réel 2005 2015 Au jour A la seconde
  24. 24. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 24 Social 2005 2015 Client Influenceur
  25. 25. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 25 Les compétences requises évoluent aussi Quelles sont les 3 plus importantes compétences d’un directeur marketing
  26. 26. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 26 La donnée au coeur Données Création Social Web Marketing Mobilité Média
  27. 27. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 27 SOMMAIRESOMMAIRE 1. A propos de Soft Computing 2. La donnée et son exploitation : quels enjeux pour les entreprises ? 3. Data Miner vs Data Scientist : quelles compétences, quelles différences ? 4. Les nouvelles possibilités d’analyses et les méthodologies associées : quels cas d’utilisation ? 5. Les retours d’expériences : quelle démarche, le délai, les coûts ?
  28. 28. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 28 DATAMINING VS DATA SCIENCE : BIG BANG ?
  29. 29. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 29 Les données analysées AVANT Périmètre Univers de données Format et stockage Historique Plusieurs mois
  30. 30. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 30 Les analyses AVANT Segmentation Valeur, RFM, comportementale, style de consommation, marché, relationnelle,… Score De prospection, rétention, endormissement, appétence (cross sell , up sell, canaux..), cycle d’achat, valeur future … Etude d’impact De programme de fidélisation, déréférencement, lancement d’offre, dispositif de Marketing direct Prévision Prévision de vente, prévision de résiliation, prévision d’appels , durée de vie… Etude géomarketing Typologies de zone d’implantation , des études d’optimisation des réseaux de points de vente physique…. Fraude Modèles de détection des comportements atypiques
  31. 31. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 31 Les méthodologies AVANT Régression logistique Modèle ARIMA/SARIMA Analyse des correspondances multiples Analyse Factorielle Analyse en composantes principales …
  32. 32. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 32 Les outils AVANT Accès aux données Manipulation de données Analytics Restitution
  33. 33. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 33 L’organisation des projets et les charges AVANT Définition de la démarche et des indicateurs Extraction des données Construction de la matrice d’études Analyse/ Modélisation Présentation des résultats 2 jours 5 jours 10 jours 15 jours 10 jours Exemple pour la mise en place d’une segmentation : = 42 jours
  34. 34. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 34 Les compétences attendues pour un Datamininer Maitrise des outils Maitrise des méthodes Sens Business AVANT
  35. 35. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 35 Quelles évolutions/ Quels impacts avec l’arrivée du Big Data ?
  36. 36. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 36 Au démarrage du Big data • Des données brutes / non structurées • Accès/manipulation de données via Impala, Hive
  37. 37. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 37 Big data 2014 Démocratisation Big data 2015 Démocratisation
  38. 38. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 38 Les données analysées 2015 Périmètre clients Univers de données Format et stockage Historique Plusieurs années
  39. 39. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 39 Les nouvelles analyses 2015 Analyse de parcours web Analyse de sentiments Segmentation multicanal Segmentation Style de consommation Scores à la volée Moteur de recommandations
  40. 40. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 40 Les nouvelles méthodologies utilisées 2015 Random Forest Boosting Gradient Machine Textmining Réseau Bayesien ACP avec rotation Sequential Pattern Analysis
  41. 41. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 41 Les outils 2015 Accès aux données Manipulation de données Analytics Restitution
  42. 42. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 42 L’organisation des projets et les charges 2015 Exemple pour la mise en place d’une segmentation : Définition de la démarche et des indicateurs Extraction des données Construction de la matrice d’études Analyse/ Modélisation Présentation des résultats 2 jours 3 jours 6 jours 8 jours 3 jours = 22 jours
  43. 43. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 43 Les compétences attendues pour un Data Scientist Maitrise des outils Maitrise des nouvelles méthodes Sens Business Maintenant GESTION DE PROJET
  44. 44. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 44 SOMMAIRESOMMAIRE 1. A propos de Soft Computing 2. La donnée et son exploitation : quels enjeux pour les entreprises ? 3. Data Miner vs Data Scientist : quelles compétences, quelles différences ? 4. Les nouvelles possibilités d’analyses et les méthodologies associées : quels cas d’utilisation ? 5. Les retours d’expériences : quelle démarche, le délai, les coûts ?
  45. 45. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 45 Un nouvel environnement Données Web/ SC Données exogènes Données non structurées Importante volumétrie de données Plus de contrainte de stockage Temps réel Nouvelles méthodes
  46. 46. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 46 Les nouveaux besoins d’analyse Améliorer la performance de détection avec des données exogènes Proposer des produits de substitution Améliorer la performance de détection et les temps de traitement avec de nouvelles méthodes Analyser les sentiments Identifier les influenceurs Appréhender les styles de consommation Identifier et optimiser les parcours Web … …
  47. 47. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 47 SOMMAIRESOMMAIRE 1. A propos de Soft Computing 2. La donnée et son exploitation : quels enjeux pour les entreprises ? 3. Data Miner vs Data Scientist : quelles compétences, quelles différences ? 4. Les nouvelles possibilités d’analyses et les méthodologies associées : quels cas d’utilisation ? 5. Les retours d’expériences : quelle démarche, le délai, les coûts ?
  48. 48. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 48 Données : DigitalesCRM Penser applications opérationnelles et débuter simple R.O.I. Connaissance Productivité opérationnelle Analyses ad’hoc Vision produit Vision clients Technologies 1 2 3 4 DataminingRéconciliation Externes
  49. 49. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 49 Une démarche itérative et cocréative • Une approche pour : – Identifier vos enjeux et vos besoins et les décliner en plan d’expérimentation, – Benchmarker, tester et valoriser la création de valeur – Préparer une éventuelle industrialisation Mettre en œuvre la plateforme2 Présentation, ajustement , validation de l’apport de valeur, plans test 3 Représentants métiers Définition des cas d’usages Réaliser les cas d’usage métiers et benchmark avt - après 4 1 Représentants métiers / SI Recueil de l’existant et des besoins métier et SI Représentants métiers Recommandation et plans d’actions en vu de l’industrialisation 5 2 Décile Lift
  50. 50. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 50 Architecture de travail Lab data Large Data Fast Data Prototyper l’algorithme Produire les résultats Suivre et optimiser la performance de l’algorithme Proposer les résultats Intégrer l’algorithme Développer l’algorithme
  51. 51. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 51 Planning et contributeurs Run Initialisation du centre de services Conception et réalisation « large » Maintenance Monitoring applications Administration Gestion des projets de setup Gestion du centre de servicesProgram Management Gestion des projets d’évolutions BusinessIT Gestiondeprojet etdeservices Setup Sprints algorithme sur le « lab » Mise en place architecture Définition du SLA Conception et réalisation « fast » Tests Sprints d’amélioration algorithme sur le « lab » Surveillance de la santé de l’algorithme « lab » Infra Hard & soft Hébergement et monitoring Data exploration M1 M2 M3 M4 M5
  52. 52. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 52 Surement pas seul Marketing DatascienceProgrammation
  53. 53. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 53 Combien ça coûte ? X*100 K€ / an Batch As a service X* 1 M€ / an Industrialisation Temps réel Datawahouse+big data
  54. 54. www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 54 Offre de services S ensibilisation tratégie andbox R oadmap ollout un

×