SlideShare une entreprise Scribd logo
1  sur  29
Télécharger pour lire hors ligne
Erreurs courantes
A/B Testing
Antoine Tissier – @antoine_tissier
Antoine Tissier
Data Analyst expérimentation pour
Decathlon depuis Mars 2020
Anciennement Digital Analyst pour
l’agence altima° pendant 6 ans (L’Oréal
Luxe, Groupe Seb, Petit Bateau, Engie…)
Antoine Tissier
Intéressé par des retours (surtout si
négatifs :-) )
Aimerait organiser des événements en
France dédié à l’expérimentation
digitale en 2022.
L’opinion des personnes
expérimentées
est dévalorisée
par notre secteur
« Without data, you’re
just another person
with an opinion. »
W. Edwards Deming
Data Scientist
métier le plus sexy
du 21ème
siècle
Un grand pouvoir implique
de grandes
responsabilités
Et les sources
d’erreurs
sont nombreuses
Ne pas calculer l’audience
nécessaire
Pas toujours si simple :
Si vous tester la visibilité d’un élément qui n’est
pas au niveau de la ligne de flottaison il va
falloir obtenir une estimation de l’audience
exposée et de leur performance associée.
Ne pas calculer l’audience nécessaire
Ne pas suivre / trop suivre
l’évolution des
performances avant la fin
du test
Les méthodes de calcul fréquentistes sont
adaptées uniquement à une taille d’échantillon
fixe. Vous n’êtes pas censé suivre
quotidiennement la significativité => faux
positifs / négatifs
Significativité n’est pas un critère d’arrêt
Il serait suicidaire de laisser tourner un test A/B
plusieurs semaines sur un site sans étudier les
performances.
Pour ma part : si les performances sont faibles j’étudie
Session Recording / Heatmaps ; je refais de la recette.
+ Méthode séquentielle alpha spending comme critère
d’arrêt
On ne peut pas non plus rien suivre
Analyser l’évolution du
Revenu Par utilisateur
avec du trafic à peine
suffisant pour
analyser le taux de
conversion
Il faut plus de temps pour suivre une métrique
continue. Cela dépend notamment de la
distribution de cette valeur (variance…).
Si vous vous basez sur le taux de conversion,
vous n’aurez probablement pas assez de trafic
pour le chiffre d’affaire ou le panier moyen.
Taille d’audience est associée à une métrique
Suivre de nombreuses
variantes
sans effectuer la
moindre correction
sur la significativité
Avec une seuil de valeur P à 5%, on accepte qu’il
n’y ait qu’une chance sur 20 d’obtenir un
résultat aussi extrême.
En multipliant, sans correction les variantes,
vous augmentez le risque d’avoir un mauvais
enseignement.
Différentes variantes sans correction
Confondre non validation
d’une hypothèse
avec non validation
d’une réalisation
En cas d’échec, est-ce parce que votre
hypothèse était mauvaise ou parce que la
concrétisation de l’hypothèse était mauvaise ?
Non validation d’une hypothèse
Ne pas prêter attention
à l’asymétrie de la
distribution des
variables continues
En théorie les métriques continues suivent une
loi normale (thèorème central limite).
Dans la réalité, il faut contrôler le coefficient
d’asymétrie et capper si nécessaire avec la
valeur maximale.
Asymétrie
Selon Ronny Kohavi, (AirBnb, Microsoft…) on peut faire de
l’optimisation sur les métriques continues mais on doit suivre
cette règle:
la taille d’échantillon pour chaque variante doit être supérieure à
355*s2
Où s est le coefficient d’asymétrie de la distribution de la
métrique
(peut facilement être calculé avec Python et Big Query)
Asymétrie
Ne pas suivre la répartition
du trafic
Le calcul SRM classique est adapté
pour vérifier la bonne répartition du
trafic à la fin d’une expérimentation.
SSRM est plus adapté pour détecter
dès le départ une anomalie dans la
répartition du trafic.
SRM vs SSRM
Considérer un test gagnant
si une métrique
inattendue est
augmentée
sans la moindre
explication
Ne prêter attention qu’aux
moyennes
Sur la partie statistique
Livres que je recommande
Par des leaders d'expérimentations qui
travaillent chez Microsoft, Linkedin, Google.
Livres que je recommande
Merci
Antoine Tissier
Suivez-moi sur :
@antoine_tissier
antoine@dinatam.com

Contenu connexe

Similaire à Erreurs courantes en ab tests

Web Analytics : Générer de la valeur en allant au-delà du reporting
Web Analytics : Générer de la valeur en allant au-delà du reportingWeb Analytics : Générer de la valeur en allant au-delà du reporting
Web Analytics : Générer de la valeur en allant au-delà du reportingaltima°
 
Présentation sur l'e-commerce à E-DAY / EXPORT DAY
Présentation sur l'e-commerce à E-DAY / EXPORT DAYPrésentation sur l'e-commerce à E-DAY / EXPORT DAY
Présentation sur l'e-commerce à E-DAY / EXPORT DAYJ.P. Robert Vandenbegine
 
14 Conseils d'experts pour optimiser vos conversions
14 Conseils d'experts pour optimiser vos conversions14 Conseils d'experts pour optimiser vos conversions
14 Conseils d'experts pour optimiser vos conversionsScandola SA
 
Pour une métrologie efficace et économique
Pour une métrologie efficace et économiquePour une métrologie efficace et économique
Pour une métrologie efficace et économiqueJean-Michel POU
 
Lean analytics from Web A Quebec mars 2014
Lean analytics from Web A Quebec mars 2014Lean analytics from Web A Quebec mars 2014
Lean analytics from Web A Quebec mars 2014Lean Analytics
 
Lean Analytics, version française—from Web A Québec 2014
Lean Analytics, version française—from Web A Québec 2014Lean Analytics, version française—from Web A Québec 2014
Lean Analytics, version française—from Web A Québec 2014Alistair Croll
 
L’analytique et l’avenir
L’analytique et l’avenirL’analytique et l’avenir
L’analytique et l’avenirDeloitte Canada
 
Savoir si votre idée de business va fonctionner et les gains possibles
Savoir si votre idée de business va fonctionner et les gains possiblesSavoir si votre idée de business va fonctionner et les gains possibles
Savoir si votre idée de business va fonctionner et les gains possiblesEmmanuel BEB à NGON
 
Customer Dev + Prototyping (Bizspark day mai 2011)
Customer Dev + Prototyping (Bizspark day mai 2011)Customer Dev + Prototyping (Bizspark day mai 2011)
Customer Dev + Prototyping (Bizspark day mai 2011)People in action
 
De l’usage des Options Réelles dans le secteur des Biotechs
De l’usage des Options Réelles dans le secteur des BiotechsDe l’usage des Options Réelles dans le secteur des Biotechs
De l’usage des Options Réelles dans le secteur des BiotechsCBM Audit & Conseil
 
[Webinar] Optimisez votre site en alliant Digital Analytics & A/B Testing
[Webinar] Optimisez votre site en alliant Digital Analytics & A/B Testing[Webinar] Optimisez votre site en alliant Digital Analytics & A/B Testing
[Webinar] Optimisez votre site en alliant Digital Analytics & A/B TestingAT Internet
 
Formation etudes de marché starters abe 2011
Formation etudes de marché starters abe 2011Formation etudes de marché starters abe 2011
Formation etudes de marché starters abe 2011pnschwab
 
Le Big Data et les analytics : quels enjeux pour le marketing BtoB
Le Big Data et les analytics : quels enjeux pour le marketing BtoBLe Big Data et les analytics : quels enjeux pour le marketing BtoB
Le Big Data et les analytics : quels enjeux pour le marketing BtoBSparklane
 
Marketing et Big Data
Marketing et Big DataMarketing et Big Data
Marketing et Big DataJeremy Greze
 
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...AQT-presentations
 
La grande consultation des entrepreneurs - Vague 2 - CCI France - Par Opinion...
La grande consultation des entrepreneurs - Vague 2 - CCI France - Par Opinion...La grande consultation des entrepreneurs - Vague 2 - CCI France - Par Opinion...
La grande consultation des entrepreneurs - Vague 2 - CCI France - Par Opinion...OpinionWay
 
Grande Consultation des Entrepreneurs - Avril 2015 - Vague n°2
Grande Consultation des Entrepreneurs - Avril 2015 - Vague n°2Grande Consultation des Entrepreneurs - Avril 2015 - Vague n°2
Grande Consultation des Entrepreneurs - Avril 2015 - Vague n°2CCI France
 
Opinionway pour cci grande consultation des entrepreneurs vague 2
Opinionway pour cci grande consultation des entrepreneurs vague 2Opinionway pour cci grande consultation des entrepreneurs vague 2
Opinionway pour cci grande consultation des entrepreneurs vague 2CCI Entreprendre
 
Opinionway pour CCI / La Tribune / Europe 1 : Grande consultation des entrepr...
Opinionway pour CCI / La Tribune / Europe 1 : Grande consultation des entrepr...Opinionway pour CCI / La Tribune / Europe 1 : Grande consultation des entrepr...
Opinionway pour CCI / La Tribune / Europe 1 : Grande consultation des entrepr...contactOpinionWay
 
Opinionway / CCI France Grande consultation des entrepreneurs vague 2 - avril...
Opinionway / CCI France Grande consultation des entrepreneurs vague 2 - avril...Opinionway / CCI France Grande consultation des entrepreneurs vague 2 - avril...
Opinionway / CCI France Grande consultation des entrepreneurs vague 2 - avril...polenumerique33
 

Similaire à Erreurs courantes en ab tests (20)

Web Analytics : Générer de la valeur en allant au-delà du reporting
Web Analytics : Générer de la valeur en allant au-delà du reportingWeb Analytics : Générer de la valeur en allant au-delà du reporting
Web Analytics : Générer de la valeur en allant au-delà du reporting
 
Présentation sur l'e-commerce à E-DAY / EXPORT DAY
Présentation sur l'e-commerce à E-DAY / EXPORT DAYPrésentation sur l'e-commerce à E-DAY / EXPORT DAY
Présentation sur l'e-commerce à E-DAY / EXPORT DAY
 
14 Conseils d'experts pour optimiser vos conversions
14 Conseils d'experts pour optimiser vos conversions14 Conseils d'experts pour optimiser vos conversions
14 Conseils d'experts pour optimiser vos conversions
 
Pour une métrologie efficace et économique
Pour une métrologie efficace et économiquePour une métrologie efficace et économique
Pour une métrologie efficace et économique
 
Lean analytics from Web A Quebec mars 2014
Lean analytics from Web A Quebec mars 2014Lean analytics from Web A Quebec mars 2014
Lean analytics from Web A Quebec mars 2014
 
Lean Analytics, version française—from Web A Québec 2014
Lean Analytics, version française—from Web A Québec 2014Lean Analytics, version française—from Web A Québec 2014
Lean Analytics, version française—from Web A Québec 2014
 
L’analytique et l’avenir
L’analytique et l’avenirL’analytique et l’avenir
L’analytique et l’avenir
 
Savoir si votre idée de business va fonctionner et les gains possibles
Savoir si votre idée de business va fonctionner et les gains possiblesSavoir si votre idée de business va fonctionner et les gains possibles
Savoir si votre idée de business va fonctionner et les gains possibles
 
Customer Dev + Prototyping (Bizspark day mai 2011)
Customer Dev + Prototyping (Bizspark day mai 2011)Customer Dev + Prototyping (Bizspark day mai 2011)
Customer Dev + Prototyping (Bizspark day mai 2011)
 
De l’usage des Options Réelles dans le secteur des Biotechs
De l’usage des Options Réelles dans le secteur des BiotechsDe l’usage des Options Réelles dans le secteur des Biotechs
De l’usage des Options Réelles dans le secteur des Biotechs
 
[Webinar] Optimisez votre site en alliant Digital Analytics & A/B Testing
[Webinar] Optimisez votre site en alliant Digital Analytics & A/B Testing[Webinar] Optimisez votre site en alliant Digital Analytics & A/B Testing
[Webinar] Optimisez votre site en alliant Digital Analytics & A/B Testing
 
Formation etudes de marché starters abe 2011
Formation etudes de marché starters abe 2011Formation etudes de marché starters abe 2011
Formation etudes de marché starters abe 2011
 
Le Big Data et les analytics : quels enjeux pour le marketing BtoB
Le Big Data et les analytics : quels enjeux pour le marketing BtoBLe Big Data et les analytics : quels enjeux pour le marketing BtoB
Le Big Data et les analytics : quels enjeux pour le marketing BtoB
 
Marketing et Big Data
Marketing et Big DataMarketing et Big Data
Marketing et Big Data
 
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
Web Analytics : L’importance de la collecte et de l’analyse de données pour v...
 
La grande consultation des entrepreneurs - Vague 2 - CCI France - Par Opinion...
La grande consultation des entrepreneurs - Vague 2 - CCI France - Par Opinion...La grande consultation des entrepreneurs - Vague 2 - CCI France - Par Opinion...
La grande consultation des entrepreneurs - Vague 2 - CCI France - Par Opinion...
 
Grande Consultation des Entrepreneurs - Avril 2015 - Vague n°2
Grande Consultation des Entrepreneurs - Avril 2015 - Vague n°2Grande Consultation des Entrepreneurs - Avril 2015 - Vague n°2
Grande Consultation des Entrepreneurs - Avril 2015 - Vague n°2
 
Opinionway pour cci grande consultation des entrepreneurs vague 2
Opinionway pour cci grande consultation des entrepreneurs vague 2Opinionway pour cci grande consultation des entrepreneurs vague 2
Opinionway pour cci grande consultation des entrepreneurs vague 2
 
Opinionway pour CCI / La Tribune / Europe 1 : Grande consultation des entrepr...
Opinionway pour CCI / La Tribune / Europe 1 : Grande consultation des entrepr...Opinionway pour CCI / La Tribune / Europe 1 : Grande consultation des entrepr...
Opinionway pour CCI / La Tribune / Europe 1 : Grande consultation des entrepr...
 
Opinionway / CCI France Grande consultation des entrepreneurs vague 2 - avril...
Opinionway / CCI France Grande consultation des entrepreneurs vague 2 - avril...Opinionway / CCI France Grande consultation des entrepreneurs vague 2 - avril...
Opinionway / CCI France Grande consultation des entrepreneurs vague 2 - avril...
 

Erreurs courantes en ab tests

  • 1. Erreurs courantes A/B Testing Antoine Tissier – @antoine_tissier
  • 2. Antoine Tissier Data Analyst expérimentation pour Decathlon depuis Mars 2020 Anciennement Digital Analyst pour l’agence altima° pendant 6 ans (L’Oréal Luxe, Groupe Seb, Petit Bateau, Engie…)
  • 3. Antoine Tissier Intéressé par des retours (surtout si négatifs :-) ) Aimerait organiser des événements en France dédié à l’expérimentation digitale en 2022.
  • 4. L’opinion des personnes expérimentées est dévalorisée par notre secteur
  • 5. « Without data, you’re just another person with an opinion. » W. Edwards Deming
  • 6. Data Scientist métier le plus sexy du 21ème siècle
  • 7. Un grand pouvoir implique de grandes responsabilités
  • 9. Ne pas calculer l’audience nécessaire
  • 10. Pas toujours si simple : Si vous tester la visibilité d’un élément qui n’est pas au niveau de la ligne de flottaison il va falloir obtenir une estimation de l’audience exposée et de leur performance associée. Ne pas calculer l’audience nécessaire
  • 11. Ne pas suivre / trop suivre l’évolution des performances avant la fin du test
  • 12. Les méthodes de calcul fréquentistes sont adaptées uniquement à une taille d’échantillon fixe. Vous n’êtes pas censé suivre quotidiennement la significativité => faux positifs / négatifs Significativité n’est pas un critère d’arrêt
  • 13. Il serait suicidaire de laisser tourner un test A/B plusieurs semaines sur un site sans étudier les performances. Pour ma part : si les performances sont faibles j’étudie Session Recording / Heatmaps ; je refais de la recette. + Méthode séquentielle alpha spending comme critère d’arrêt On ne peut pas non plus rien suivre
  • 14. Analyser l’évolution du Revenu Par utilisateur avec du trafic à peine suffisant pour analyser le taux de conversion
  • 15. Il faut plus de temps pour suivre une métrique continue. Cela dépend notamment de la distribution de cette valeur (variance…). Si vous vous basez sur le taux de conversion, vous n’aurez probablement pas assez de trafic pour le chiffre d’affaire ou le panier moyen. Taille d’audience est associée à une métrique
  • 16. Suivre de nombreuses variantes sans effectuer la moindre correction sur la significativité
  • 17. Avec une seuil de valeur P à 5%, on accepte qu’il n’y ait qu’une chance sur 20 d’obtenir un résultat aussi extrême. En multipliant, sans correction les variantes, vous augmentez le risque d’avoir un mauvais enseignement. Différentes variantes sans correction
  • 18. Confondre non validation d’une hypothèse avec non validation d’une réalisation
  • 19. En cas d’échec, est-ce parce que votre hypothèse était mauvaise ou parce que la concrétisation de l’hypothèse était mauvaise ? Non validation d’une hypothèse
  • 20. Ne pas prêter attention à l’asymétrie de la distribution des variables continues
  • 21. En théorie les métriques continues suivent une loi normale (thèorème central limite). Dans la réalité, il faut contrôler le coefficient d’asymétrie et capper si nécessaire avec la valeur maximale. Asymétrie
  • 22. Selon Ronny Kohavi, (AirBnb, Microsoft…) on peut faire de l’optimisation sur les métriques continues mais on doit suivre cette règle: la taille d’échantillon pour chaque variante doit être supérieure à 355*s2 Où s est le coefficient d’asymétrie de la distribution de la métrique (peut facilement être calculé avec Python et Big Query) Asymétrie
  • 23. Ne pas suivre la répartition du trafic
  • 24. Le calcul SRM classique est adapté pour vérifier la bonne répartition du trafic à la fin d’une expérimentation. SSRM est plus adapté pour détecter dès le départ une anomalie dans la répartition du trafic. SRM vs SSRM
  • 25. Considérer un test gagnant si une métrique inattendue est augmentée sans la moindre explication
  • 26. Ne prêter attention qu’aux moyennes
  • 27. Sur la partie statistique Livres que je recommande
  • 28. Par des leaders d'expérimentations qui travaillent chez Microsoft, Linkedin, Google. Livres que je recommande
  • 29. Merci Antoine Tissier Suivez-moi sur : @antoine_tissier antoine@dinatam.com