3. LA plateforme dédiée à l’optimisation
technique du référencement naturel
OnCrawl SEO Crawler
Analysez votre site
à la manière de Google
OnCrawl Log Analyzer
Suivez le comportement des bots
et des visiteurs
OnCrawl Data³
Comprenez l’influence des
facteurs de positionnement
sur l’indexabilité
5. Source : Gartner 2018 + Harvard Business Review
G
A
F
A
OOGLE +
ACEBOOK DEALS
MAZON
RESTAURANTS
PPLE PING
6. 3 100 000 000 000 000 000 $ par an
3,1 TRILLION $ par an
=
LA DETTE DATA COÛTE BEAUCOUP PLUS CHER QUE LA DETTE TECHNIQUE
7. DATA DIFFERENTE
Google Analytics et AT Internet
Pas les mêmes définitions
Google Search et Google Adword
Pas les mêmes objectifs
SEMrush et Yooda
Pas les mêmes périmètres
SOLUTIONS : VALIDER LES DEFINITIONS
8. DATA CORROMPUE
VOLONTAIRE
> Achat de clics > Achat de trafic > Achat de Likes
INVOLONTAIRE
> Les bots > Passage TV > DDOS
UN PEU LES DEUX
Réduire le temps de session !
Changer le modèle d’attribution
9. SOLUTION
1. Créer une vue
« Raw Data » qui
tous les bots
2. Monitorer les
changements
de trafic à la hausse
la baisse
10. DATA MANQUANTE
Google Analytics vs Search Console vs Logs
Site
1 TAG JS manquant
1 TAG JS posé plusieurs fois
Serveur
1 SOUCI TECHNIQUE
Client :
Adblocker
DO NOT TRACK
SOLUTIONS : CRAWLER - ANTI-ADBLOCK
11. DATA A SUPPRIMER
Nouvelles lois ( RGPD )
Durée de conservation
SOLUTIONS : ANONYMISER LES DATA, DECLARER TOUS LES PROCESS
13. DATA PÉRIMÉE
Changement d’adresse
Fusion / Acquisition de société
Changement de téléphone
SOLUTIONS : METTRE DES DATES de MISE A JOUR A LA MINUTE PRES
14. DATA MAL CONVERTIE
Timezone
Currencies ( €, $, … )
SOLUTIONS : RECUPERER CHAQUE JOUR LES TAUX DE CONVERSION
15. CLIENT DUPLIQUE
Level 1
> sur plusieurs bases de données différentes
Level 2
> sous différentes identifications
Level 3
> sur plusieurs bases de données différentes et sous
différentes identifications
Solution : Référentiel client unique
17. DATA TROP AGGREGEE
> Temporel : Filtrer à l’heure sur des
jour
> Catégoriel : Catégorie qui regroupe trop
catégories
> Lieu : Filtrer par ville sur des données
SOLUTIONS : TRAVAILLER SUR LES DONNES BRUTES
18. CHAMPS DE FORMULAIRE MANQUANT ou PRIS EN OTAGE
> Ajout du SIRET
> Ajout du DUNS
> Séparer le code postal de l’adresse
19. MACHINE LEARNING : SUR-OPTIMISATION
Avec les BAD DATA, les biais sont amplifiés par les machines
Word2Vec
GENRE : Machine à coudre
AGE : Docteur
20. SOLUTION
1. Identifier la direction du biais
2. Neutraliser ces mots
3. Egaliser les pairs ( la seul différence entre fille et garçon
doit être le genre )
4. Si la pair de mots est peu défini, nous pouvons la
passer
21. Les BAD DATA peuvent être très utile
VOIX
IMAGE
TEXTE
VIDEO
NEWS
DEVELOPPER L’ESPRIT CRITIQUE
22. PLAN
ANTI
BAD
DATA
Savoir à quoi ressemble les BAD DATA
(Champ vide, Champ dupliqué, Donnée de
mauvaise qualité)
Surveiller chaque jour tous les changements
impactants de façon automatique
Collecter seulement les données dont vous avez
besoin, partager et documenter des définitions
communes
Nettoyer, enrichir et auditer régulièrement vos
données
Développer l’esprit critique de vos équipes