Evaluer la pertinence des moteurs de suggestion marchande dans un environnement big data
1. 1. INTRODUCTION : DEFINIR LA PERTINENCE
Dans le cadre d’un partenariat réalisé avec la société Pig Data, nous développons une méthode on-line permettant
d’évaluer la pertinence des suggestions effectuées par son moteur de recommandation marchande. D’un point de vue
sociolinguistique, la pertinence d’une communication P dépend de son utilité U, du coût de son traitement C et de son
caractère acceptable A. Une communication est donc d’autant plus pertinente P+ que le coût de sont traitement est faible
C-, que son utilité est forte U+ et que son acceptabilité est forte A+. Soit, plus formellement P+ = C- / U+ / A+ ---> 0.
2. MESURER LA PERTINENCE : EXEMPLES D’INDICATEURS
Il existe plusieurs indicateurs permettant de mesurer on-line le coût, l’utilité et l’acceptabilité d’un dispositif de
communication du point de vue du parcours informationnel de l’utilisateur. Compte tenu du fait que les outils de
publicisation de l’offre ont pour finalité de favoriser la sérendipité* des consommateurs (cf. le modèle AIDA) sans pour
autant les désorienter, voici quelques exemples de ceux que nous mobilisons :
Pour C : une mesure de désorientation L tel que L = (D / T - 1)² + (R / D - 1)² pour D = le nombre de pages différentes
ouvertes, T = le nombre total de pages ouvertes, et R = le nombre de pages ouvertes durant plus de 30 sec. et moins
de 1 min. (nb : le temps moyen d’ouverture d’une page pour une valeur maximum de 60 sec. est de 16.37 sec.).
Pour U : une mesure de performance de profondeur H et de largeur M tel que H = la profondeur moyenne du parcours
d’information et M = t / T pour t = le nombre de thèmes différents consultés durant le parcours d’information ; et,
une mesure d’accès à l’information intéressante A tel que A = R / (R + V) pour V = le nombre de pages ouvertes durant
moins de 10 sec. (nb : le temps moyen de chargement d’une page est de 3.25 sec.).
Pour A : une mesure d’utilisation W tel que W = (k * K) / 10 pour k = le nombre moyen de clics effectués sur le dispositif
de communication et K = le pourcentage du nombre de parcours informationnels composés d’au moins un clic effectué
sur le dispositif de communication ; et, une mesure d’intérêt économique I tel que I = l’activation ou non du panier.
3. EVALUER LA PERTINENCE : GRILLE DE LECTURE
Dans le cas de C : plus L ---> 2, plus l’utilisateur tend à « tourner en rond » sans ouvrir aucun lien pertinent (soit, L+ est
le groupe médian des utilisateurs dont les scores L sont les plus élevés ; cf. Tableau 1).
Dans le cas de U : plus H est élevé, plus l’utilisateur a observé des pages produits différentes ; plus M est élevé, plus
l’utilisateur a consulté des catégories de produits différentes ; et, plus A ---> 1, plus l’utilisateur tend à avoir réalisé
un parcours informationnel intéressant en termes de focalisation attentionnelle (soit, H+, M+ et A+ sont
respectivement les groupes médians des utilisateurs dont les scores H, M et A sont les plus élevés ; cf. Tableau 1).
Dans le cas de A : plus W est élevé, plus le dispositif de communication est mobilisé par les utilisateurs (d’un point de vue
général, mais aussi du point de vue de leurs parcours informationnels) ; et, I+ correspond au groupe des utilisateurs
qui ont consulté une ou plusieurs fois leur panier pour y déposer un ou plusieurs produits ou encore pour réaliser un
ou plusieurs achats.
4. EXEMPLES DE RESULTATS : CAMPAGNE (p) VS RECOMMANDATION (r)
Cf. Tableau 1.Technique de traitement statistique : régression logistique binaire.
Indice de pertinence du dispositif campagne : Pp = 4.359 / 4.367 / 6.0915 = 0.1638.
Indice de pertinence du dispositif recommandation : Pr = 1.056 / 8.18 / 3.117 = 0.0414.
Interprétation : bien que les campagnes élaborées manuellement par les e-commerçants apparaissent plus
acceptables du point de vue des utilisateurs, elles constituent néanmoins un dispositif de documentation moins pertinent
que le moteur de suggestion développé par Pig Data. En effet, comme nous l’avons vu, les outils de publicisation de l’offre
ont généralement pour finalité de favoriser la sérendipité des consommateurs. Aussi, bien que les recommandations
réalisées par Pig Data renvoient à un indice d’intérêt économique I plus faible que celui des campagnes effectuées par les
e-commerçants (respectivement 1.832 contre 2.891), elle permettent néanmoins de limiter les effets de désorientation L
tout en favorisant l’exploration de l’utilisateur en termes de profondeur H (contrairement aux campagnes) et de largeur
M. De plus, l’indice d’accès à l’information intéressante A est légèrement plus élevé dans le cas des recommandations que
dans celui des campagnes. Soulignons toutefois que ces résultats sont exploratoires et doivent être complétés par une
méthode d’évaluation off-line permettant de mesurer les niveaux de compréhension des utilisateurs.
Evaluer la pertinence des moteurs de
suggestion marchande dans un environnement
Big Data
Auteur :
Jean-Sébastien VAYRE
Doctorant en sociologie, université de
Toulouse II-Le Mirail, CERTOP - UMR
5044, jsvayre@univ-tlse2.fr
http://www.certop.cnrs.fr/VAYRE-Jean-Sebastien
Partenaire :
Nicolas BAHOUT
Fondateur de la société Pig Data
http://www.pigdata.net/
Tableau 1 : Résultats
Chance
de
faire
partie
du
groupe
des L+
(C1)
Chance
de
faire
partie
du
groupe
des H+
(C2)
Chance
de
faire
partie
du
groupe
des M+
(C3)
Chance
de
faire
partie
du
groupe
des A+
(C4)
Chance
de
faire
partie
du
groupe
des I+
(C5)
W(C6)
Pour au
moins
un clic
p
1.453
(B =
0.373
p =
0.000)
0.823
(B = -
0.195
p =
0.000)
2.275
(B =
0.822
p =
0.000)
1.269
(B =
0.238
p =
0.000)
2.891
(B =
1.062
p =
0.000)
1.170
(k =
0.56
K =
20.9)
Pour au
moins
un clic r
0.352
(B = -
1.045
p =
0.000)
3.946
(B =
1.373
p =
0.000)
2.670
(B =
0.982
p =
0.000)
1.564
(B =
0.447
p =
0.000)
1.832
(B =
0.605
p =
0.000)
0.246
(k =
0.23
K =
10.7)
R2 0.033 0.043 0.075 0.013 0.065
P = (C1 * 3) / (C2 + C3 + C4) / [(C5 + C6 ) * 1.5]
Etude exploratoire réalisée sur 17 163 parcours d’information
de e-consommateurs.
En conclusion, le moteur de suggestion marchande Pig Data est un
dispositif de communication qui tend à favoriser une certaine disposition à la
sérendipité. Autrement dit, comparativement aux campagnes élaborées par les
e-commerçants, ce dispositif contribue à instaurer sur les marchés des formes
relationnelles plus exploratoires qui doivent être mieux maîtrisées afin
d’améliorer, notamment, leur niveau d’acceptabilité.
* La notion de sérendipité réfère à cette faculté
humaine qui consiste à faire des trouvailles par
sagacité accidentelle. Elle renvoie à un processus de
découverte compris comme une séquence de trois
états : 1- celui de l’observation surprenante, 2- celui
de l’évaluation curieuse et 3- celui de l’intérêt
stratégique. Précisons alors que les différents
indicateurs de pertinence que nous exposons, à
travers les trois dimensions que sont le coût, l’utilité
et l’acceptabilité, font directement référence à
cette notion .