Paul Sjoberg - Pourquoi y a-t-il youporn dans mes referrals-données fantômes sur analytics
1. Pourquoi ai-je 3 nouvelles homes pages ?
Qui a défini un objectif qui n’a aucun sens ?
Pourquoi j’ai des visiteurs du monde entier sur mon site FR ?
POURQUOI Y A-T-IL “YOUPORN” DANS MES REFERRAL ???
27/06/2015
Paul Sjoberg
paul.sjoberg@tamento.com
3. Le thème de l’atelier
27 JUIN
2015POURQUOI Y A-T-IL YOUPORN DANS
MES REFERRALS ?
3
Bugs Analytics
Données fantômes
Visiteurs non qualifiés
Spam crawlers
4. Pourtant on a un parefeu
On a bien configuré le Htaccess ?
On n’avait pas quelque chose contre les SPAMS crawlers fous déjà ?
SITUATION : des choses étranges surviennent sur GA
5. J’ai Youporn dans mes referral, que se passe-t-il ?
27 JUIN
2015POURQUOI Y A-T-IL YOUPORN DANS
MES REFERRALS ?
5
6. Les syndromes sont multiples
des visites du monde entier (tiens on a lancé la version multilingue ? On a eu beaucoup
de chinois hier)
27 JUIN
2015POURQUOI Y A-T-IL YOUPORN DANS
MES REFERRALS ?
6
7. Des syndromes multiples :
des pages intrigantes sont consultées alors qu’elles n’existent pas (un
coup du stagiaire ?)
27 JUIN
2015POURQUOI Y A-T-IL YOUPORN DANS
MES REFERRALS ?
7
8. Des syndromes multiples :
de nouveaux événements apparaissent
(je ne me souviens pas l’avoir configuré celui là !)
27 JUIN
2015POURQUOI Y A-T-IL YOUPORN DANS
MES REFERRALS ?
8
9. Il y a du spam là dessous
27 JUIN
2015POURQUOI Y A-T-IL YOUPORN DANS
MES REFERRALS ?
9
Pourtant …
Le site utilise par un pare-feu
j’ai soigné aux petits oignons mon fichier HTAccess
j’ai filtré les referral spams.
Que se passe-t-il ?
10. Je te l’avais bien dit !
Explication : il n’y a jamais eu de visites !
11. Petit rappel :
Google Analytics Measurement Protocol
27 JUIN
2015POURQUOI Y A-T-IL YOUPORN DANS
MES REFERRALS ?
11
Le Google Analytics Measurement Protocol permet aux
développeurs d’effectuer des requètes HTTP afin d’envoyer des
données brutes d’intéractions utilisateurs aux serveurs Google
Analytics.
Cela permet d’enrichir les données GA d’un compte :
- en rajoutant des données d’environnements différents
- en complétant le compte avec des informations obtenues offline
- en envoyant des données depuis le serveur et le terminal
utilisateur
12. Petit rappel :
Google Analytics Measurement Protocol
27 JUIN
2015POURQUOI Y A-T-IL YOUPORN DANS
MES REFERRALS ?
12
Ce protocole permet seulement de collecter des données
concernant les intéractions utilisateurs telles que les clics ou
événements.
Les données aggrégées, comme des tableaux par exemple, ne
peuvent être uploadées.
13. 27 JUIN
2015POURQUOI Y A-T-IL YOUPORN DANS
MES REFERRALS ?
13
Un utilisateur
visite le site
Le serveur envoie
le contenu
SERVEUR
SITE INTERNET
TERMINAL UTILISATEUR
SERVEUR
GOOGLE ANALYTICS
Données de consultation
transmises via javascript
Vrai
données
Via le GA
Measurement protocol
15. 27 JUIN
2015POURQUOI Y A-T-IL YOUPORN DANS
MES REFERRALS ?
15
L’utilisateur
visite
le site
Le serveur
envoie
le contenu
SERVEUR
SITE INTERNET
TERMINAL UTILISATEUR
SERVEUR
GOOGLE ANALYTICS
Données de consultation
transmises via javascript
Via le GA
Measurement protocol
Fausses données Vrai données
Via le GA
Measurement protocol
SERVEUR
DU SPAMMER
16. Des visites sans visiteurs ? Kezako ?
27 JUIN
2015POURQUOI Y A-T-IL YOUPORN DANS
MES REFERRALS ?
16
En créant de faux rapports, des petits malins envoient de fausses
visites de pages internet au service de tracking Google en associant
des ID GA générées en grand nombre.
Quand cela tombe sur l’ID GA de votre compte, les données «
pourries » tombent dans vos rapports analytics !
Ces données pourries sont de natures variées ; comme ces malins
rédigent ce qu’ils veulent, dans les rapports Analytics, ces données «
pourries » peuvent être de toutes sortes d’origine (géographique,
canal d’acquisition, support…)
17. Des visites sans visiteurs ? Kezako ?
27 JUIN
2015POURQUOI Y A-T-IL YOUPORN DANS
MES REFERRALS ?
17
Des spammeurs créent des faux rapports. Ils y associent des ID GA
qu’ils génèrent automatiquement par millions. Puis ils envoient ces
rapports au serveur de Google Analytics.
Dès que l’ID GA correspond à votre compte, les données « pourries »
tombent dans vos rapports analytics !
Ces données pourries sont de natures variées ; comme ces malins
rédigent ce qu’ils veulent, dans les rapports Analytics, ces données «
pourries » peuvent être de toutes sortes d’origine (géographique,
canal d’acquisition, support…)
18. Quel intérêt pour les spammeurs ?
27 JUIN
2015POURQUOI Y A-T-IL YOUPORN DANS
MES REFERRALS ?
18
Obtenir de la notoriété :
Tout le monde parle d’eux sur le net !
Générer des visites sur leurs sites :
Nombre de webmasters ont le réflexe d’aller voir ces sites référents
étranges, ces noms qui apparaissent sur des pages fictives de site…
N’ALLEZ JAMAIS VOIR CES SITES
NE CLIQUEZ PAS SUR LEURS LIENS
19. T’es sûr que tu veux faire le ménage ?
On a quand même multiplié l’audience du site par 4
Comment fait-on le ménage ?
20. La méthode de filtrage sur les noms de domaine
27 JUIN
2015POURQUOI Y A-T-IL YOUPORN DANS
MES REFERRALS ?
20
Au préalable : bien créer des vues non filtrées, voire même une vue pour
tester les filtres en plus de la bonne vue avec les filtres effectifs.
La méthode = enregistrer tout le trafic correct en incluant seulement dans
les filtres les noms de domaines correct et on ignore le reste.
Attention à ne pas oublier des noms de domaine liés à des applications
tierces (panier, statistiques…) et d’autres communs tel que google translate,
youtube (si vous l’avez configuré avec votre code GA) et
webcache.googlerusercontent.com (la version cache de votre site).
21. La méthode de filtrage sur les noms de domaine
27 JUIN
2015POURQUOI Y A-T-IL YOUPORN DANS
MES REFERRALS ?
21
22. La méthode cookie UA + GTM
27 JUIN
2015POURQUOI Y A-T-IL YOUPORN DANS
MES REFERRALS ?
22
Comme les méthodes de spams évoluent en permanence, les filtres ne peuvent être une solution à
toutes les nouveautés, surtout celles qui ciblent correctement notre site.
Un visiteur réel possède un navigateur alors qu’un bot non.
Si l’on place un cookie sur le navigateur du visiteur, qu’on le lit sur Google Tag Manager et qu’il est
transmis à Google Analytics, on peut verrouiller l’accès aux visiteurs possédant les bonnes valeurs
associées à leurs cookies.
Limite : cela ne fonctionne ni pour les premières visites, ni pour les utilisateurs supprimant
régulièrement leur cookies…
23. La méthode cookie UA + GTM
27 JUIN
2015POURQUOI Y A-T-IL YOUPORN DANS
MES REFERRALS ?
23
Pour cette méthode il faut
:
Créer un cookie manuellement, à date d’expiration très
lointaine, y ajouter un code snippet avec une valeur
particulière.
Par exemple :
<script type=”text/javascript”>
document.cookie = “dev-status=valeur_cookie;
expires=Fri, 31 Dec 9999 23:59:59 GMT; path=/”;
</script>
Le nouveau visiteur se verra affecter ce cookie lors de sa
première visite qui ne sera donc pas enregistrée.
Admin>Propriété>Ajouter une dimension personnalisée
24. La méthode cookie UA + GTM
27 JUIN
2015POURQUOI Y A-T-IL YOUPORN DANS
MES REFERRALS ?
24
Dans Google Tag Manager, nous créons une
nouvelle variable associée à un numéro d’index
qui nous resservira.
Puis dans GTM, allez dans la gestion des tags,
paramètres, et dimensions personnalisées, y
insérer l’index et la variable valeur_cookie créée.
L’étape finale est de reconnaitre dans Analytics les
visiteurs possédant ce cookie à l’aide d’un filtre :
25. Mon compte est débarrassé des données fantômes !
27 JUIN
2015POURQUOI Y A-T-IL YOUPORN DANS
MES REFERRALS ?
Aller plus loin
25
Luna Metrics
http://www.lunametrics.com/blog/2015/03/19/eli
minating-dumb-ghost-referral-traffic/
Thrive Marketing
http://thrivenetmarketing.com/analytics/how-to-
block-ghost-referrer-spam-in-google-analytics/
Google Developpers
https://developers.google.com/analytics/devguides
/collection/protocol/v1/?hl=FR
SEMRush Blog
http://www.semrush.com/blog/how-to-get-rid-of-
the-ghost-referrals-in-google-analytics/
26. Des questions ?
Des remarques ?
27 JUIN
2015POURQUOI Y A-T-IL YOUPORN DANS
MES REFERRALS ?
26