Nos formations : www.jedha.co
Analyser des comportements d'achats, d'utilisateurs Web, de retombées de campagnes, la Data Science est maintenant un outil important pour l'aide à la décision pour mieux connaître son audience et proposer les solutions les plus adaptés. Vous pourrez aussi découvrir toutes les possibilités qu'offre la Data Science dans l'élaboration d'une stratégie marketing.
4. Pour quoi la data science est appliqué dans le marketing?
Nouvelles
technologies
génèrent un volume
important de
données
Ce volume de
données pourrait
être utilisé pour
affiner les stratégies
marketing
Extraire de la
connaissance des
données de toute
forme et structure
n’est pas évident
La data science peut aider
à répondre à ces besoins
5. Les avantages de faire appel à la data science
Amélioration de la connaissance client
Bien connaitre son client aide à prédire ses prochaines actions et mieux répondre à ses
attentes
Prédiction d'attrition
un prospect potentiel de se diriger vers les concurrents si votre service ne lui convient
plus. Par le biais de la prédiction d'attrition, l'équipe de marketing peut mettre en place
des stratégies pour assurer la fidélité continue du client.
Amélioration de la productivité et de l'efficacité au sein même de l'entreprise
L'utilisation du Machine Learning permet d'analyser les données de façon purement
mathématique, et ainsi fournir un résultat objectif des attentes et des désirs du
consommateur.
7. Exemples d’utilisation de la data-science dans le marketing
Typologie des clients Ciblage des clients
Personnalisation
prédictive
Cette technique adoptée
depuis plusieurs années par
les grands groupes, permet
notamment l’étude des
habitudes d’achat des
clients et d’effectuer leur
classement selon ces
critères. On peut également
citer dans un contexte BtoC
des critères de segmentation
client plus démographiques.
- Objectif : orienter les
investissement sur
l’audience ayant le plus
forte probabilité de
transformer
- La modélisation des
intentions clients repose sur
des algorithmes de scores
qui identifient et calculent le
degré d'appétence des
individus à l’offre, d’une
entreprise
Pour booster leurs ventes
en ligne, les e-marchands
utilisent de plus en plus des
solutions de personnalisation
prédictive.
La personnalisation
prédictive permet par
exemple établir des
recommandations de
produits, poussées à chaque
client sur le site e-commerce
ou off-site.
9. typologie des clients : méthodologie (1)
OBJECTIF
Méthodes classique :
- PMG
- RFM
Ces méthodes utilisent la connaissance
métier et sont plutôt simples à mettre en
place.
Méthodes modernes : On laisse les
modèles de Machine-Learning trouver les
groupes qui composent les clients.
Comprendre qui sont nos clients
10. typologie des clients : méthodologie (2)
DEMARCHE
On récupère le plus de données possibles sur les clients
Pour chaque client on aura une ligne de données avec m
attributs :
On cherche à attribuer chaque client à une classe.
on parle d’une classification non-supervisée, mais aussi de
clustering
âge genre diplôme …
Client 1 24 M Bac+2 …
Client 2 37 F Bac+3 …
…
Clustering
Classification non-supervisée
11. typologie des clients : méthodologie (3)
ALGORITHME
L’algorithme le plus connu et le plus utilisé de classification
non-supervisée s’appelle « K-means ». Cet algorithme se base
sur la similarité entre les individus.
Les étapes de l’algorithme de K-means:
1. On choisit le nombre de classes K
2. On sélectionne K clients au hasard comme les centres
3. On calcule la distance euclidienne entre chaque client et les
centres
4. On attribue chaque client au centre qui lui est le plus
proche
5. On calcule le centre de gravité de chaque classe
6. On répète les étapes 3,4 et 5 jusqu’à ce que les centres ne
bougent plus
K-Means
12. typologie des clients : méthodologie (4)
ALGORITHME
Nombre de classes optimal :
Dans un bon clustering
• grande inertie inter-classe
• petite inertie intra-classe
Pour trouver le nombre de classes
optimal la règle de coude : la courbe
commence à aplatir
K-Means
14. Ciblage de nouveaux clients : méthodologie (1)
OBJECTIF
Le ciblage de clients est habituellement
réalisé à l’aide des méthodes de scoring.
Le scoring est généralement produit par
des modèles de Machine Learning afin
de prédire l’appétence, l’attrition ou le
canal marketing privilégié, d’un client/
prospect.
Savoir quel client cibler
15. Ciblage de nouveaux clients : méthodologie (2)
DEMARCHE
On dispose de différentes données sur chaque client (les variables
explicatives, désignées avec ), plus une nouvelle information :
le client a-t-il acheté le produit/ cliqué sur le lien/ accepté
l’offre /etc. ?
Cette information constitue la variable à expliquer ou la variable
cible. Elle est binaire et vaut 1 si le client s’est montré intéressé, et
0 sinon. On le désigne avec .
L’objectif de la classification supervisée est de prédire la variables
cible à l’aide des variables explicatives.
𝑋𝑖
𝑌
Classification supervisée
âge genre diplôme … cible
Client 1 24 M Bac+2 … 1
Client 2 37 F Bac+3 … 0
…
Les données labelisées
Algorithme machine learning
Un modèle qui distingue les données
16. Ciblage de nouveaux clients : méthodologie (3)
ALGORITHME
La régression logistique rend une valeur entre 0 et 1.
Généralement on définit un seuil, par exemple au-delàs
duquel on estime que l’individu appartient au groupe avec
.
Evaluation de la régression logistique :
Il est souhaité que les indicateurs suivants soient les plus
élevés possibles.
0,5
𝑌 = 1
Accurac𝑦 =
𝑉 𝑃 + 𝑉 𝑁
𝑉 𝑃 + 𝐹𝑃 + 𝐹𝑁 + 𝑉 𝑁
Rappel =
𝑉 𝑃
𝑉 𝑃 + 𝐹𝑁
Précision =
𝑉 𝑃
𝑉 𝑃 + 𝐹𝑃
Régression logistique
Régression linéaire
Régression linéaire et régression logistique
appliquées au problème binaireValeur prédite
Y = 1 Y = 0
Y = 1
Y = 0
Valeur
réelle
Vrai
positif
Faux
positif
Faux
négatif
Vrai
négatif
18. Personnalisation prédictive : méthodologie (1)
OBJECTIF
Données récupérées:
- temps passé sur les différents sites web
- articles ajoutés au panier
- les achats precedents
- Formulaires remplies
- Les recherches effectuées
- Les interactions sur les reseaux sociaux
On utilize ces données pour proposer au client
les articles qui vont lui plaire.
On parle de « système de recommendation ».
Proposer le bon produit au bon client
Vous avez acheté un
portable, vous aurez très
probablement besoin d’un
étui
Vous aimez les films du
genre action ayant pour
vedette clint Eastwood,
vous aimerez le film « Le
Bon, la Brute et le Truand »
Les gens qui vous
ressemblent et qui ont
acheté du lait, ont aussi
acheté du pain
Vous aimez « Spiderman »,
vous allez aimer
« Superman »
Votre ami aime les voitures
de marque « Ford », vous
allez aussi les aimer
19. Personnalisation prédictive : méthodologie (2)
DEMARCHE
HYPOTHESE : les clients similaires aiment les
mêmes produits.
On peut :
- proposer à un client les articles similaires ou
liés à un article qu’il a déjà acheté.
Exemple : le client a loué le film « Titanic », ce
film est similaire au « The great Gatsby », on
propose au client de louer « The great Gatsby ».
- Proposer à un client les articles qu’un autre
client similaire a acheté.
Exemple : Le client a loué le film « Titanic », les
clients qui ont loué ce film, ont aussi loué « Harry
Potter ». Donc au propose au client de louer
« Harry Potter ».
Filtrage collaboratif
User-based collaborative filtering Item-based collaborative filtering
20. Personnalisation prédictive : méthodologie (3)
ALGORITHME
On construit une matrice avec les notes de
clients aux produits.
Parfois l’information est manquante. On
cherche à la trouver.
On décompose la matrice avec n clients et
m articles en deux matrices et .
Pour connaitre le note que peut donner le
premier client au quatrième article, il suffit de
multiplier la première ligne de par la
quatrième colonne de .
𝑋𝑛∗𝑚
𝑈𝑛∗𝑘 𝑉 𝑘∗𝑚
𝑈
𝑉
Factorisation matricielle
21. Message à retenir (take-home message)
La pratique de data-science apporte une solution plus précise aux problématiques
courantes de marketing
La connaissance client, la prédiction d’attrition et la personnalisation de l’offre sont des
sujets souvent traités à l’aide de machine-learning
Les méthodes les plus utilisées pour répondre à ces problématiques incluent le K-
mean (la classification non-supervisée), la régression logistique (la classification
supervisée) et la factorisation matricielle