4. un score, à quoi ça sert ?
à prédire l’occurrence d’événements, tels que la
souscription d’une offre par un client ou son degré de
fragilité.
à estimer des informations manquantes dans le SI pour
le client, comme l’âge, la composition familiale, la CSP, la
détention d’équipements concurrents ou les centres
d’intérêt… notamment pour adresser des messages
personnalisés aux clients.
afin d’augmenter l’efficacité des actions
tout en réduisant les coûts
5. un score, comment ça fonctionne ?
détection et combinaison des variables statistiquement
explicatives du phénomène étudié (modélisation de la
formule de score).
attribution de notes individuelles de score selon la
probabilité d’occurrence du phénomène (calcul des notes
mensuelles de scores des clients par application des
données clients récentes à la formule de score)
le score sert à classer le fichier par probabilité
décroissante d’occurrence du phénomène
client score A score B score C score D score E
00001 00002 00013 00066 00085 00056
00002 00008 00056 00013 00066 00085
00003 00007 00034 00009 00024 00057
00004 00021 00056 00013 00066 00085
00005 00038 00001 00004 00015 00036
00006 00020 00056 00013 00066 00085
00007 00038 00002 00039 00035 00028
00008 00020 00056 00013 00066 00085
00009 00038 00010 00003 00003 00007
00010 00024 00056 00013 00066 00085
00011 00040 00010 00004 00013 00013
00012 00025 00056 00013 00066 00085
00013 00040 00010 00010 00006 00004
00014 00025 00056 00013 00066 00085
00015 00040 00011 00010 00007 00009
00016 00026 00056 00013 00066 00085
00017 00041 00011 00011 00010 00008
00018 00026 00056 00013 00066 00085
00019 00041 00011 00011 00011 00008
00020 00026 00056 00013 00066 00085
00021 00041 00011 00011 00011 00010
7. les scores au marketing Orange France
413 séries de notes de scores sont produites mensuellement
(environ 1,6 milliard de notes).
Ces scores couvrent 7 univers (internet, fibre, 4-play, mobile, fixe,
foyers, prospects)
exemples : . score d’appétence à une offre concurrente
. score de fragilité des clients fibre
500 autres séries de notes de scores de qualification ou d’intérêt
sont également calculées semestriellement.
exemples : . estimation de la détention d’équipement concurrent
. intérêt estimé pour la chaîne TV Eurosport
8. les usages
ciblage proactif sur les canaux phoning, print, emailing, SMS
marquage pour réactif
reroutage direct des appels entrants des clients scorés fragiles aux services
clients vers le front prevenance
exemples de scores Broad Band utilisés lors des campagnes 2014 :
fragilité, appétence aux bouquets TV, appétence aux videos on demand,
appétence au parrainage, appétence à la montée en gamme 4-play
70 scores ont été utilisés en proactif (10% des campagnes appuyées sur des scores)
9. les usages
push pour clients mobile en services clients, en point de vente,
sur l’espace client, aux USSD et SVI (serveur vocal interactif)
push pour clients 4-play sur device mobile
push pour clients Broad Band en service client, en point de vente, sur la TV,
sur le portail et la boutique online
marquage pour réactif
push d’offres
connaissance client
qualification des bases
détention de mobile concurrent, descriptif foyer, intérêts thématiques
scores exploratoires (sans autre vocation qu’analytique)
clients injoignables, utilisateurs du service Cineday
inputs pour les autres scores
les notes des scores du mois m-1 sont candidates aux modèles du mois m
intérêt estimé pour le sport appétence à une chaîne Sport
11. 1 On s’appuie sur les données d’avant-hier pour construire une formule
de score qui aurait prédit au mieux le churn d’hier
données d’apprentissage
churn observé
modélisation
notes de fragilité
formule
1
un score, ça vit comment ?
exemple d’un score prédictif du churn
12. données d’apprentissage
churn observé
modélisation
notes de fragilité
données de recalcul des notes
application
formule
formule prévision du churn
2
2 On applique les données d’aujourd’hui pour prédire demain
un score, ça vit comment ?
exemple d’un score prédictif du churn
13. données d’apprentissage
churn observé
modélisation
notes de fragilité
données de recalcul des notes
application
formule prévision du churn
churn observé
suivi
3
3 On rapproche la prévision faite avant–hier pour la période d’hier avec le
churn effectif d’hier
formule
un score, ça vit comment ?
exemple d’un score prédictif du churn
application
14. données de recalcul des notes
application
formule prévision du churn
churn observé
suivi
données de recalcul des notes
application
formule prévision du churn
churn observé
suivi
4
5
données d’apprentissage
churn observé
modélisation
notes de fragilité
formule
4
Chaque mois,
on recalcule les notes
et on suit les performances5
un score, ça vit comment ?
exemple d’un score prédictif du churn
15. pour aller un peu plus loin…
sous-profils des top scores
Dans la très grande majorité des cas, les clients top scorés ne présentent pas le
profil moyen du modèle, mais sont regroupés en trois ou quatre sous-profils
différenciés. Par clusterisation des top scores, on met en évidence ces familles et
on peut ainsi adopter une posture commerciale différenciée.
scoring de l’uplift
Les clients ciblés par un score d’appétence souscrivent plus que les autres lors
d’une campagne, mais le groupe témoin (les appétents non adressés) a souvent
également un taux de prise significatif. Pour concentrer les moyens sur les clients
appétents qui ne prendraient pas sans la campagne on construit un modèle uplift
qui combine un modèle d’apprentissage de la campagne (qui a pris lors de la
campagne?) et un modèle d’apprentissage de l’appétence naturelle (qui a pris
hors campagne?)
fast learning
Actuellement, nos datamarts sont alimentés mensuellement. Nous modélisons
donc sur des données froides et recalculons les notes de scores mensuellement.
Les évolutions de notre CRM pourront nous permettre d’utiliser des données
chaudes (données de contexte) et de recalculer de façon dynamique les
messages adressés aux clients.
17. perspectives… Big Data
Généralement quelques dizaines de variables sont candidates en standard
pour un modèle (small data)
Actuellement nous testons 20 000 agrégats lors d’une modélisation
(serveur en mono-cœur) : du Big Data en architecture Small Data
Big Data phase 2 (avec PredicSis) :
320 000 agrégats testés (modèle en mode distribué serveur 32 cœurs).
tuning en cours avec objectif de réduire la durée de modélisation
Big Data phase 3 (avec PredicSis) : plusieurs millions d’agrégats multi-
tables de type [1 | n] seront testés à la volée pour chaque score.
un environnement parallélisé permet d’augmenter efficacement
l’espace de recherche : le Big data, consiste à aller
dénicher la valeur prédictive des nouveaux gisements de données.