SlideShare une entreprise Scribd logo
1  sur  22
Télécharger pour lire hors ligne
Thomas ANGLADE - Data Scientist
Thomas.anglade@data2b.net
06 60 30 00 14
data2b.net
Vers une meilleure connaissance client
grâce au big data
Data2Breakfast – 07/02/2017
1. La révolution big data : utiliser les données comme
matière première
2. Cas concret : mieux connaître ses clients pour détecter la
fraude
3. Comment améliorer la segmentation client grâce au big
data
3
Utiliser la donnée comme matière
première
(Big) data
010011001100
000110011100
110110011011
000111001101
Explosion des données
01 La révolution technologique qui ne pourra être remplacée que
par l’ordinateur quantique
Les 3V : Volume, Variety, Velocity
Il est estimé que 90% des données récoltées depuis le début de
l’humanité ont été générées durant les 2 dernières années
Le développement de la data science à été permis par le big data et
notamment l’invention du paradigme hadoop (2003)
Passage de l’ère de la causalité à celle de la corrélation : le big data
permet de faire mieux mais on ne sait pas forcément pourquoi…
Que vaut la donnée ?
La donnée a pris de la valeur car elle est passée de luxe a commodité
La donnée est désormais produite de manière différente, pas forcément de
manière consciente et intentionnelle.
Valeur de ré-utilisation énorme
Matière 1ère (circulation – blé)
Outil de levier / décision
Actif stratégique
Avantage compétitif grâce aux data
Marketing
Finance &
assurances
E-commerce
Santé
RH
Transports
Logistique
Maintenance
Agro-alimentaire
Environnement
Le data scientist peut-il faire mieux que l’expert ?
La data est un « business » de volume
« Un algorithme moins performant couplé à un plus gros volume de
données donne de meilleurs résultats qu’un algorithme performant sur
un échantillon plus restreint »
valeur de la data personnelle / an / personne selon OCDE
Collecter des données avant de savoir comment les exploiter ??
Comment produire la donnée ?
Utiliser le « digital labour » ?
9
Utiliser les données clients pour la
détection de fraude
Détection de fraude – le problème
25%demandes de remboursement frauduleuses
Fraude à l’assurance en 2014 2,5Md€
Achat d'une police après la
survenance
« Crash for cash »
Inventer un sinistre de
toutes pièces
« Gonfler » les montants
des sinistres
Déclaration pour une
blessure antérieure
Dupliquer un sinistre
1 2
3 4
65
Détection de fraude – les méthodes
Lot of
Data
Variety of
Data
Machine
learning
Less
Fraud
x x =
DEMO !
12
Automatiser la recherche de bons clients et
V360
Sujet tous métiers de
service et de vente
Type de segmentation
Étapes de la vie Public cible Segmentation discrète
TOUS les clients Sous-groupe de clients
ayant un comportement /
attribut
Décrire un ensemble
spécifique de personnes
a travers le temps
(cohortes)
Chaque client est
seulement dans un
segment
Aucune relation
naturelle a travers les
segments
Statique - les gens ne
bougent pas du segment
Suivi de la progression
de segments
Suivi de l'adhésion
(entrée ou sortie) du
segment et suivi des
membres du segment
Suivre le comportement
au fil du temps
Utilisation en
combinaison avec
segments cibles
Utilisé pour des
campagnes et offres
spécifiques
Utilisé pour l'analyse de
rétention et l'analyse
saisonnière
+ interactions clients = + données
• Données internes
Association données marketing avec des données d'autres
divisions de la société (ventes, opérations, service client, etc.)
• Données externes
Réseaux sociaux, logs, géolocalisation, open data, etc.
Meilleure technologie = données mieux
utilisées
• Exploiter de nombreux formats d'information - le
contenu d'une image ou d'une vidéo et la signification des
données textuelles
• Nouveaux algorithmes de segmentation tels que l'analyse
de réseaux (network science) et le regroupement par densité
(density-based clustering).
• Amélioration des performances matérielles et logicielles
sur de grandes quantités de données.
• Capacité à calculer des segmentations dynamiques en
temps réel, grâce à Spark Streaming et Flink.
Network science
Clustering coefficient
Les amis de mes amis
sont mes amis.
Ce coefficient mesure à quel
point le voisinage d'un
sommet est connecté.
- Segmentation dynamique
Density-based clustering
Trouver une structure de formes non linéaires basée sur la densité.
Density-based clustering
Paramètres
ɛ Le rayon autour d'un point de données p.
minPts Le nombre minimum de points que nous voulons dans un cluster.
Points
Points de noyeau Un point p est point de noyau si | Nbhd (p, ɛ) | > = MinPts.
Points de frontière Un point q est point de frontière si Nbhd (q, ɛ) contient
moins minPts, mais q est accessible à partir d'un point de noyau p.
Outlier Un point o est un outlier si ce n'est ni un point de noyau ni un point de
frontière.
Density-based clustering
Algorithme
• Choisissez un point au hasard qui n'a pas été affecté à un cluster ou
qui a été désigné comme outlier.
• Déterminer si c'est un point de noyau. Si oui, démarrez un cluster
autour de ce point. Si non, étiquettez le point comme outlier.
• Répétez ces deux étapes jusqu'à ce que tous les points soient soit
assignés à un cluster ou désignés comme outlier.
Density-based clustering vs k-means
Big Data + segmentation on action
Possibilité d'avoir autant
de segmentations que de
questions à répondre.
Industrialisation des segmentations
dynamiques mises à jour
automatiquement en temps réel.
data2b.net

Contenu connexe

Tendances

Baina bigdata introduction 2016
Baina bigdata introduction 2016Baina bigdata introduction 2016
Baina bigdata introduction 2016Karim Baïna
 
Introduction au big data
Introduction au big dataIntroduction au big data
Introduction au big dataAbdelghani Azri
 
Valtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entrepriseValtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entrepriseValtech
 
BIG DATA - Les données au service de la business intelligence
BIG DATA - Les données au service de la business intelligenceBIG DATA - Les données au service de la business intelligence
BIG DATA - Les données au service de la business intelligenceJulien DEMAUGÉ-BOST
 
La Big Data et ses applications
La Big Data et ses applicationsLa Big Data et ses applications
La Big Data et ses applicationsAffinity Engine
 
Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture Lilia Sfaxi
 
Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...
Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...
Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...Jean-Pierre Riehl
 
Big data démystifié td2014
Big data démystifié td2014Big data démystifié td2014
Big data démystifié td2014Romain Casteres
 
Introduction au projet Datapride
Introduction au projet DataprideIntroduction au projet Datapride
Introduction au projet Datapridedatapride
 
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDI
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDIPrésentation pfe Big Data Hachem SELMI et Ahmed DRIDI
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDIHaShem Selmi
 
Data Science & Big Data, réalités et perspectives.
Data Science & Big Data, réalités et perspectives.Data Science & Big Data, réalités et perspectives.
Data Science & Big Data, réalités et perspectives.Aleph Technologies
 
Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Philippe METAYER
 
Introduction à la big data V2
Introduction à la big data V2Introduction à la big data V2
Introduction à la big data V2Mehdi TAZI
 
2014 Présentation pour la soutenance du probatoire "Big Data"de galsungen
2014 Présentation pour la soutenance du probatoire "Big Data"de galsungen2014 Présentation pour la soutenance du probatoire "Big Data"de galsungen
2014 Présentation pour la soutenance du probatoire "Big Data"de galsungenGalsungen
 
La visualisation de données comme outil pour découvrir et partager des idées ...
La visualisation de données comme outil pour découvrir et partager des idées ...La visualisation de données comme outil pour découvrir et partager des idées ...
La visualisation de données comme outil pour découvrir et partager des idées ...philogb
 
Meetup intro techno big data
Meetup intro techno big dataMeetup intro techno big data
Meetup intro techno big dataRomain Jouin
 
Présentation Big Data DFCG
Présentation Big Data DFCGPrésentation Big Data DFCG
Présentation Big Data DFCGMicropole Group
 

Tendances (20)

Baina bigdata introduction 2016
Baina bigdata introduction 2016Baina bigdata introduction 2016
Baina bigdata introduction 2016
 
Introduction au big data
Introduction au big dataIntroduction au big data
Introduction au big data
 
Valtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entrepriseValtech - Du BI au Big Data, une révolution dans l’entreprise
Valtech - Du BI au Big Data, une révolution dans l’entreprise
 
BIG DATA - Les données au service de la business intelligence
BIG DATA - Les données au service de la business intelligenceBIG DATA - Les données au service de la business intelligence
BIG DATA - Les données au service de la business intelligence
 
La Big Data et ses applications
La Big Data et ses applicationsLa Big Data et ses applications
La Big Data et ses applications
 
Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture
 
Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...
Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...
Data Science : Méthodologie, Outillage et Application - MS Cloud Summit Paris...
 
Big data démystifié td2014
Big data démystifié td2014Big data démystifié td2014
Big data démystifié td2014
 
Introduction au projet Datapride
Introduction au projet DataprideIntroduction au projet Datapride
Introduction au projet Datapride
 
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDI
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDIPrésentation pfe Big Data Hachem SELMI et Ahmed DRIDI
Présentation pfe Big Data Hachem SELMI et Ahmed DRIDI
 
Big data
Big dataBig data
Big data
 
Big data
Big dataBig data
Big data
 
Data Science & Big Data, réalités et perspectives.
Data Science & Big Data, réalités et perspectives.Data Science & Big Data, réalités et perspectives.
Data Science & Big Data, réalités et perspectives.
 
Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"
 
Introduction à la big data V2
Introduction à la big data V2Introduction à la big data V2
Introduction à la big data V2
 
2014 Présentation pour la soutenance du probatoire "Big Data"de galsungen
2014 Présentation pour la soutenance du probatoire "Big Data"de galsungen2014 Présentation pour la soutenance du probatoire "Big Data"de galsungen
2014 Présentation pour la soutenance du probatoire "Big Data"de galsungen
 
La visualisation de données comme outil pour découvrir et partager des idées ...
La visualisation de données comme outil pour découvrir et partager des idées ...La visualisation de données comme outil pour découvrir et partager des idées ...
La visualisation de données comme outil pour découvrir et partager des idées ...
 
Etude sur le Big Data
Etude sur le Big DataEtude sur le Big Data
Etude sur le Big Data
 
Meetup intro techno big data
Meetup intro techno big dataMeetup intro techno big data
Meetup intro techno big data
 
Présentation Big Data DFCG
Présentation Big Data DFCGPrésentation Big Data DFCG
Présentation Big Data DFCG
 

En vedette

Optimisation des vélos en libre service
Optimisation des vélos en libre serviceOptimisation des vélos en libre service
Optimisation des vélos en libre serviceData2B
 
Welcome to criteo factory: 72k jobs per day
Welcome to criteo factory:   72k jobs per dayWelcome to criteo factory:   72k jobs per day
Welcome to criteo factory: 72k jobs per dayData2B
 
Criteo Infraestructure: Hadoop Datacenter
Criteo Infraestructure: Hadoop DatacenterCriteo Infraestructure: Hadoop Datacenter
Criteo Infraestructure: Hadoop DatacenterData2B
 
What ad networks need to know when choosing a cdn
What ad networks need to know when choosing a cdnWhat ad networks need to know when choosing a cdn
What ad networks need to know when choosing a cdnHighwinds
 
Apache SPARK ML : principes, concepts et mise en œuvre
Apache SPARK  ML : principes, concepts et  mise en œuvre Apache SPARK  ML : principes, concepts et  mise en œuvre
Apache SPARK ML : principes, concepts et mise en œuvre MICHRAFY MUSTAFA
 
Demain tous dans le cloud - journée web innovation lorient 2011
Demain tous dans le cloud -  journée web innovation lorient 2011Demain tous dans le cloud -  journée web innovation lorient 2011
Demain tous dans le cloud - journée web innovation lorient 2011dgerges
 

En vedette (8)

Optimisation des vélos en libre service
Optimisation des vélos en libre serviceOptimisation des vélos en libre service
Optimisation des vélos en libre service
 
Welcome to criteo factory: 72k jobs per day
Welcome to criteo factory:   72k jobs per dayWelcome to criteo factory:   72k jobs per day
Welcome to criteo factory: 72k jobs per day
 
Criteo Infraestructure: Hadoop Datacenter
Criteo Infraestructure: Hadoop DatacenterCriteo Infraestructure: Hadoop Datacenter
Criteo Infraestructure: Hadoop Datacenter
 
Plateforme deepwaterhorizon[1].md
Plateforme deepwaterhorizon[1].mdPlateforme deepwaterhorizon[1].md
Plateforme deepwaterhorizon[1].md
 
What ad networks need to know when choosing a cdn
What ad networks need to know when choosing a cdnWhat ad networks need to know when choosing a cdn
What ad networks need to know when choosing a cdn
 
Réforme de la directive MIF: quelles conséquences sur les marchés financiers ?
Réforme de la directive MIF:  quelles conséquences sur les marchés financiers  ?Réforme de la directive MIF:  quelles conséquences sur les marchés financiers  ?
Réforme de la directive MIF: quelles conséquences sur les marchés financiers ?
 
Apache SPARK ML : principes, concepts et mise en œuvre
Apache SPARK  ML : principes, concepts et  mise en œuvre Apache SPARK  ML : principes, concepts et  mise en œuvre
Apache SPARK ML : principes, concepts et mise en œuvre
 
Demain tous dans le cloud - journée web innovation lorient 2011
Demain tous dans le cloud -  journée web innovation lorient 2011Demain tous dans le cloud -  journée web innovation lorient 2011
Demain tous dans le cloud - journée web innovation lorient 2011
 

Similaire à Vers une meilleure connaissance client grâce au big data

La Banque de demain : Chapitre 4
La Banque de demain : Chapitre 4 La Banque de demain : Chapitre 4
La Banque de demain : Chapitre 4 OCTO Technology
 
Softshake 2015 - Des small data aux big data - Méthodes et Technologies
Softshake 2015 - Des small data aux big data - Méthodes et TechnologiesSoftshake 2015 - Des small data aux big data - Méthodes et Technologies
Softshake 2015 - Des small data aux big data - Méthodes et TechnologiesOCTO Technology Suisse
 
Bigdata, small decision and smart organisation
Bigdata, small decision and smart organisationBigdata, small decision and smart organisation
Bigdata, small decision and smart organisationChristophe Benavent
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel businessMouhsine LAKHDISSI
 
Séminaire BIG DATA, SYNTHÈSE - ORSYS Formation
Séminaire BIG DATA, SYNTHÈSE - ORSYS FormationSéminaire BIG DATA, SYNTHÈSE - ORSYS Formation
Séminaire BIG DATA, SYNTHÈSE - ORSYS FormationORSYS
 
Big Data: quelle valeur pour l'entreprise
Big Data: quelle valeur pour l'entrepriseBig Data: quelle valeur pour l'entreprise
Big Data: quelle valeur pour l'entrepriseGenève Lab
 
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeSeminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeJean Roger Mably
 
Big Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendancesBig Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendancesJean-Michel Franco
 
Tracer la voie vers le big data avec Talend et AWS
Tracer la voie vers le big data avec Talend et AWSTracer la voie vers le big data avec Talend et AWS
Tracer la voie vers le big data avec Talend et AWSJean-Michel Franco
 
Comment le Data et Deep Learning révolutionnent la science
Comment le Data et Deep Learning révolutionnent la scienceComment le Data et Deep Learning révolutionnent la science
Comment le Data et Deep Learning révolutionnent la sciencehabib200
 
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015IBM France Lab
 
uyéyefygjhqjhgjhgequtCours-Data-Mining.pdf
uyéyefygjhqjhgjhgequtCours-Data-Mining.pdfuyéyefygjhqjhgjhgequtCours-Data-Mining.pdf
uyéyefygjhqjhgjhgequtCours-Data-Mining.pdfNajlaAllouche
 
Données critiques et blockchain - sajida zouarhi - juillet 2016
Données critiques et blockchain  - sajida zouarhi - juillet 2016Données critiques et blockchain  - sajida zouarhi - juillet 2016
Données critiques et blockchain - sajida zouarhi - juillet 2016Sajida ZOUARHI
 
Valorisez votre business grâce au Big Data - Mois du numérique 2017
Valorisez votre business grâce au Big Data - Mois du numérique 2017Valorisez votre business grâce au Big Data - Mois du numérique 2017
Valorisez votre business grâce au Big Data - Mois du numérique 2017Cyril Marsaud
 
Big data et marketing digital
Big data et marketing digital Big data et marketing digital
Big data et marketing digital Hamza Sossey
 
Data Mining (Partie 1).pdf
Data Mining (Partie 1).pdfData Mining (Partie 1).pdf
Data Mining (Partie 1).pdfOuailChoukhairi
 
#NSD14 - La sécurité autour du Big Data
#NSD14 - La sécurité autour du Big Data#NSD14 - La sécurité autour du Big Data
#NSD14 - La sécurité autour du Big DataNetSecure Day
 
Livre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligenceLivre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligenceHélène Etienne
 
Introduction au datamining partiel 1.pdf
Introduction au datamining partiel 1.pdfIntroduction au datamining partiel 1.pdf
Introduction au datamining partiel 1.pdfamarasidibeavm
 

Similaire à Vers une meilleure connaissance client grâce au big data (20)

La Banque de demain : Chapitre 4
La Banque de demain : Chapitre 4 La Banque de demain : Chapitre 4
La Banque de demain : Chapitre 4
 
Softshake 2015 - Des small data aux big data - Méthodes et Technologies
Softshake 2015 - Des small data aux big data - Méthodes et TechnologiesSoftshake 2015 - Des small data aux big data - Méthodes et Technologies
Softshake 2015 - Des small data aux big data - Méthodes et Technologies
 
Bigdata, small decision and smart organisation
Bigdata, small decision and smart organisationBigdata, small decision and smart organisation
Bigdata, small decision and smart organisation
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel business
 
Séminaire BIG DATA, SYNTHÈSE - ORSYS Formation
Séminaire BIG DATA, SYNTHÈSE - ORSYS FormationSéminaire BIG DATA, SYNTHÈSE - ORSYS Formation
Séminaire BIG DATA, SYNTHÈSE - ORSYS Formation
 
Big Data: quelle valeur pour l'entreprise
Big Data: quelle valeur pour l'entrepriseBig Data: quelle valeur pour l'entreprise
Big Data: quelle valeur pour l'entreprise
 
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie AppliquéeSeminaire datamining Ecole de Statistique et d'Economie Appliquée
Seminaire datamining Ecole de Statistique et d'Economie Appliquée
 
Big Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendancesBig Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendances
 
Tracer la voie vers le big data avec Talend et AWS
Tracer la voie vers le big data avec Talend et AWSTracer la voie vers le big data avec Talend et AWS
Tracer la voie vers le big data avec Talend et AWS
 
Comment le Data et Deep Learning révolutionnent la science
Comment le Data et Deep Learning révolutionnent la scienceComment le Data et Deep Learning révolutionnent la science
Comment le Data et Deep Learning révolutionnent la science
 
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
 
uyéyefygjhqjhgjhgequtCours-Data-Mining.pdf
uyéyefygjhqjhgjhgequtCours-Data-Mining.pdfuyéyefygjhqjhgjhgequtCours-Data-Mining.pdf
uyéyefygjhqjhgjhgequtCours-Data-Mining.pdf
 
Données critiques et blockchain - sajida zouarhi - juillet 2016
Données critiques et blockchain  - sajida zouarhi - juillet 2016Données critiques et blockchain  - sajida zouarhi - juillet 2016
Données critiques et blockchain - sajida zouarhi - juillet 2016
 
Valorisez votre business grâce au Big Data - Mois du numérique 2017
Valorisez votre business grâce au Big Data - Mois du numérique 2017Valorisez votre business grâce au Big Data - Mois du numérique 2017
Valorisez votre business grâce au Big Data - Mois du numérique 2017
 
Conférence big data
Conférence big dataConférence big data
Conférence big data
 
Big data et marketing digital
Big data et marketing digital Big data et marketing digital
Big data et marketing digital
 
Data Mining (Partie 1).pdf
Data Mining (Partie 1).pdfData Mining (Partie 1).pdf
Data Mining (Partie 1).pdf
 
#NSD14 - La sécurité autour du Big Data
#NSD14 - La sécurité autour du Big Data#NSD14 - La sécurité autour du Big Data
#NSD14 - La sécurité autour du Big Data
 
Livre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligenceLivre blanc big data et data lake le duo gagnant extrait_itelligence
Livre blanc big data et data lake le duo gagnant extrait_itelligence
 
Introduction au datamining partiel 1.pdf
Introduction au datamining partiel 1.pdfIntroduction au datamining partiel 1.pdf
Introduction au datamining partiel 1.pdf
 

Vers une meilleure connaissance client grâce au big data

  • 1. Thomas ANGLADE - Data Scientist Thomas.anglade@data2b.net 06 60 30 00 14 data2b.net
  • 2. Vers une meilleure connaissance client grâce au big data Data2Breakfast – 07/02/2017 1. La révolution big data : utiliser les données comme matière première 2. Cas concret : mieux connaître ses clients pour détecter la fraude 3. Comment améliorer la segmentation client grâce au big data
  • 3. 3 Utiliser la donnée comme matière première (Big) data 010011001100 000110011100 110110011011 000111001101
  • 4. Explosion des données 01 La révolution technologique qui ne pourra être remplacée que par l’ordinateur quantique Les 3V : Volume, Variety, Velocity Il est estimé que 90% des données récoltées depuis le début de l’humanité ont été générées durant les 2 dernières années Le développement de la data science à été permis par le big data et notamment l’invention du paradigme hadoop (2003) Passage de l’ère de la causalité à celle de la corrélation : le big data permet de faire mieux mais on ne sait pas forcément pourquoi…
  • 5. Que vaut la donnée ? La donnée a pris de la valeur car elle est passée de luxe a commodité La donnée est désormais produite de manière différente, pas forcément de manière consciente et intentionnelle. Valeur de ré-utilisation énorme Matière 1ère (circulation – blé) Outil de levier / décision Actif stratégique
  • 6. Avantage compétitif grâce aux data Marketing Finance & assurances E-commerce Santé RH Transports Logistique Maintenance Agro-alimentaire Environnement Le data scientist peut-il faire mieux que l’expert ?
  • 7. La data est un « business » de volume « Un algorithme moins performant couplé à un plus gros volume de données donne de meilleurs résultats qu’un algorithme performant sur un échantillon plus restreint » valeur de la data personnelle / an / personne selon OCDE Collecter des données avant de savoir comment les exploiter ??
  • 8. Comment produire la donnée ? Utiliser le « digital labour » ?
  • 9. 9 Utiliser les données clients pour la détection de fraude
  • 10. Détection de fraude – le problème 25%demandes de remboursement frauduleuses Fraude à l’assurance en 2014 2,5Md€ Achat d'une police après la survenance « Crash for cash » Inventer un sinistre de toutes pièces « Gonfler » les montants des sinistres Déclaration pour une blessure antérieure Dupliquer un sinistre 1 2 3 4 65
  • 11. Détection de fraude – les méthodes Lot of Data Variety of Data Machine learning Less Fraud x x = DEMO !
  • 12. 12 Automatiser la recherche de bons clients et V360 Sujet tous métiers de service et de vente
  • 13. Type de segmentation Étapes de la vie Public cible Segmentation discrète TOUS les clients Sous-groupe de clients ayant un comportement / attribut Décrire un ensemble spécifique de personnes a travers le temps (cohortes) Chaque client est seulement dans un segment Aucune relation naturelle a travers les segments Statique - les gens ne bougent pas du segment Suivi de la progression de segments Suivi de l'adhésion (entrée ou sortie) du segment et suivi des membres du segment Suivre le comportement au fil du temps Utilisation en combinaison avec segments cibles Utilisé pour des campagnes et offres spécifiques Utilisé pour l'analyse de rétention et l'analyse saisonnière
  • 14. + interactions clients = + données • Données internes Association données marketing avec des données d'autres divisions de la société (ventes, opérations, service client, etc.) • Données externes Réseaux sociaux, logs, géolocalisation, open data, etc.
  • 15. Meilleure technologie = données mieux utilisées • Exploiter de nombreux formats d'information - le contenu d'une image ou d'une vidéo et la signification des données textuelles • Nouveaux algorithmes de segmentation tels que l'analyse de réseaux (network science) et le regroupement par densité (density-based clustering). • Amélioration des performances matérielles et logicielles sur de grandes quantités de données. • Capacité à calculer des segmentations dynamiques en temps réel, grâce à Spark Streaming et Flink.
  • 16. Network science Clustering coefficient Les amis de mes amis sont mes amis. Ce coefficient mesure à quel point le voisinage d'un sommet est connecté. - Segmentation dynamique
  • 17. Density-based clustering Trouver une structure de formes non linéaires basée sur la densité.
  • 18. Density-based clustering Paramètres ɛ Le rayon autour d'un point de données p. minPts Le nombre minimum de points que nous voulons dans un cluster. Points Points de noyeau Un point p est point de noyau si | Nbhd (p, ɛ) | > = MinPts. Points de frontière Un point q est point de frontière si Nbhd (q, ɛ) contient moins minPts, mais q est accessible à partir d'un point de noyau p. Outlier Un point o est un outlier si ce n'est ni un point de noyau ni un point de frontière.
  • 19. Density-based clustering Algorithme • Choisissez un point au hasard qui n'a pas été affecté à un cluster ou qui a été désigné comme outlier. • Déterminer si c'est un point de noyau. Si oui, démarrez un cluster autour de ce point. Si non, étiquettez le point comme outlier. • Répétez ces deux étapes jusqu'à ce que tous les points soient soit assignés à un cluster ou désignés comme outlier.
  • 21. Big Data + segmentation on action Possibilité d'avoir autant de segmentations que de questions à répondre. Industrialisation des segmentations dynamiques mises à jour automatiquement en temps réel.