SlideShare une entreprise Scribd logo
1  sur  39
Télécharger pour lire hors ligne
LA DATA SCIENCE
AU SERVICE DU
CONSULTANT SEO
Paris 2023 #SEOCAMPus 2
PRÉSENTATION
Rémi Nestasio Grégory Florin
On recrute
Consultant SEO
remi.nestasio@performics.com
Ex : Conforama, Freelance
Directeur Expertise et Innovation
gregory.florin@performics.com
Ex : Marmiton, La redoute, Doctissimo,...
Paris 2023 #SEOCAMPus 3
LA DATA SCIENCE EN SEO :
POUR QUOI FAIRE ?
1. Mieux comprendre ce qui est important
pour Google sur sa thématique
2. Justifier ses choix par la data auprès de
son manager / client
3. Prioriser les actions et aller plus vite
Pour assister le consultant
Paris 2023 #SEOCAMPus
NOTRE MÉTHODOLOGIE
Stocker les
données SEO
1
Nettoyer / enrichir
les données
2
Fournir des
outils pour
analyser les
données
3
AUTOMATISER
Paris 2023 #SEOCAMPus 5
DISCLAIMER
ATTENTION AU CONTEXTE
Nous menons des analyses dans un
contexte précis et avec un jeu de données
propre à ce contexte.
Si on change le contexte, les
recommandations vont également
changer
Paris 2023 #SEOCAMPus 6
DISCLAIMER
CORRÉLATION ET CAUSALITÉ
“Souvent les gens qui mangent une glace
portent un maillot de bain.”
→ Il y a une corrélation entre manger une
glace et porter un maillot de bain.
“On mange une glace parce qu’il fait
chaud”
→ Il y a donc une causalité entre la
chaleur et le fait de manger une glace
● Les statistiques montrent les
corrélations
● Seul le consultant peut identifier la
causalité
Paris 2023 #SEOCAMPus
C’EST PARTI
7
Paris 2023 #SEOCAMPus
4 CLUSTERS ANALYSÉS
1.
ACHAT DE
MONTRES
2.
RECETTES DE
CUISINE
3.
REQUÊTES
MÉTÉO + VILLE
4.
ARTICLES
MALADIES
500
mots clés
300
mots clés
300
mots clés
97
mots clés
Paris 2023 #SEOCAMPus
On doit comparer des mots clés comparables
→ Construire un set de mots clés “proches” :
que Google va considérer de manière similaire
dans l’algo
Ne pas mélanger :
● Les requêtes marque et hors marque
● Les intentions de recherche
● La top tail et longue traine
Ne pas hésiter à créer plusieurs clusters
9
Pourquoi pas + de 500 mots clés ?
Paris 2023 #SEOCAMPus 10
Exemple d’un mauvais cluster car trop d’écart : Entre les volumes de recherche
Pourquoi pas plus de 500 mots clés ?
Le bon et le mauvais cluster
Paris 2023 #SEOCAMPus 11
Trouver l’intention de recherche
Comment faire ?
Détection de l’intention par GPT4
Il est conseillé de vérifier les données générées
CHATGPT + API
Paris 2023 #SEOCAMPus
Bien valider que les données sont exploitables
On ne peut pas toujours analyser tous les critères
Paris 2023 #SEOCAMPus
5 CAS
CONCRETS
Paris 2023 #SEOCAMPus
1 - Saisonnalité : scoring mots clés
Pourquoi ?
Pour être positionné au bon moment, il faut
optimiser les pages en amont :
● Prioriser son travail selon la saisonnalité
● Construire sa roadmap éditoriale
● Anticiper et adapter son maillage interne
● …
1 - Saisonnalité : scoring de mots clés
Cluster recette - La version classique
La version classique : Données source :
● Volumes de recherches mensuels sur 12
mois
● On connaît les tops mots clés pour
chaque mois
→ On peut prioriser les mots clés
importants
Paris 2023 #SEOCAMPus
1 - Saisonnalité : scoring de mots clés
Cluster recette - La version prédictive
On améliore notre capacité à évaluer l’importance des mots clés
On prédit les prochains
mois
Données source :
Historique des volumes de
recherches mensuels sur 4
ans
Algo utilisé :
Facebook Prophet
Volume de recherche sur la requête quiche lorraine
Paris 2023 #SEOCAMPus
2 - Contenu : l’importance de la sémantique
Le protocole :
1. On score les pages du top 10
2. Pour chaque mot clé, on définit un
objectif
3. On évalue chaque page par rapport à
l’objectif
4. On calcul le score moyen par position sur
Google
Objectif : Déterminer si les meilleures positions ont un score plus élevé que les autres
Source : Yourtext.guru
Paris 2023 #SEOCAMPus
2 - Contenu : l’importance de la sémantique
Cluster recette
Les scores élevés sont bien corrélés au ranking
Taux d’atteinte de l’objectif de score sémantique par position :
Paris 2023 #SEOCAMPus
2 - Contenu : l’importance de la sémantique
Cluster météo
Les sites qui rankent le mieux sont les moins bien scorés : pas logique…
Taux d’atteinte de l’objectif par position :
Paris 2023 #SEOCAMPus
3 - Netlinking : Quel ticket d’entrée pour le top 10 ?
Cluster maladie
Il faut se positionner dans la bonne fenêtre
● On calcule les métriques de Netlinking pour chaque site et chaque page
● On détermine visuellement les limites minimales
Quelles métriques minimales pour se positionner ?
Paris 2023 #SEOCAMPus
3 - Netlinking : sur quelles pages dois-je améliorer le netlinking ?
Cluster maladie
Le protocole :
1. On score les pages du top 10
2. On définit un objectif de score
3. On évalue chaque page par rapport à l’objectif
4. On filtre sur :
● Nos urls mal positionnées
● Les urls avec un taux d’atteinte de l’objectif faible
Paris 2023 #SEOCAMPus
3 - Netlinking : sur quelles pages dois-je améliorer le netlinking ?
Cluster maladie
On filtre sur :
● Les urls hors top 10
● Les urls avec un taux d’atteinte de l’objectif faible : moins de 70%
Paris 2023 #SEOCAMPus
4 - Les données structurées : nécessaires pour ranker ?
Cluster maladie
EEAT (Experience Expertise Authority Trust) est important sur les requêtes santé
Hypothèse :
Les données structurées aident Google à facilement découvrir des infos autour des articles et
des auteurs :
- Nom de l’auteur (et liens vers une page descriptive)
- Date de création / modification de l’article
- …
Cela semble donc être un must have
Paris 2023 #SEOCAMPus
4 - Les données structurées : nécessaires pour ranker ?
Cluster maladie
Présence des données structurées schema.org Article
Fiche maladie sur Ameli.fr :
L’exception Ameli.fr
Positions sur Google
5 - Comment faire prioriser l’optimisation du TTFB ?
Cluster Montre
1. On calcule le TTFB médian sur toutes les
pages analysées
2. On se compare aux concurrents
3. On priorise si on est en dehors des
normes
host feature median
www.louispion.fr ttfb 2207,5
ocarat.com ttfb 1069
magmontres.fr ttfb 1025
www.montresandco.com ttfb 1022
m.darty.com ttfb 936
www.decathlon.fr ttfb 764,5
www.histoiredor.com ttfb 705
www.maty.com ttfb 631,5
www.bijourama.com ttfb 630
www.chrono24.fr ttfb 532
www.cdiscount.com ttfb 525
m.boulanger.com ttfb 510
www.cleor.com ttfb 340
A ce stade :
On peut :
- Prédire le potentiel d’un mot clé
- Déterminer le niveau de difficulté
- Détecter des corrélations entre un
facteur et le ranking
MAIS :
On ne sait pas déterminer les critères
les plus importants
ET SI ON ALLAIT PLUS LOIN ?
Paris 2023 #SEOCAMPus
Utiliser le machine learning pour prédire les critères les plus importants
Comment faire ?
ÉTAPE 1 : Collecter les données
LES MÉTRIQUES DES PAGES
Technique
- Canonical
- Données structurées
- Core Web Vitals
- TTFB
- ….
Contenu
- Titre
- Hn
- Textes
- …
Popularité
- Trust Flow / Citation Flow
- Nombre de backlinks
- Nombre de liens internes
- …
LES RANKINGS
● Les positions
● Les urls positionnées
Paris 2023 #SEOCAMPus 28
Utiliser le machine learning pour prédire les critères les plus importants
Comment faire ?
Répartition des valeurs de CLS nulles
Cluster Maladies
ÉTAPE 2 : Nettoyer les données Les valeurs nulles
Certaines valeurs ne peuvent être collectées
→ Retirer les données
ou
→ Remplacer par la valeur moyenne pour
“neutraliser les valeurs nulles”
Paris 2023 #SEOCAMPus 29
Utiliser le machine learning pour prédire les critères les plus importants
Comment faire ?
Répartition des liens internes par url
Cluster Maladie
ÉTAPE 2 : Nettoyer les données Les valeurs extrêmes
On peut leur fixer une valeur maximum :
→ Considérer que le nombre maximum de
liens internes est de 10k.
Paris 2023 #SEOCAMPus
Utiliser le machine learning
pour prédire les critères les plus
importants
Comment faire ?
ÉTAPE 3 : Lancer l’algo
On demande à l’algo de “reproduire les résultats de
Google” : présence ou non dans le top 3
L’algo teste toutes les combinaisons pour
arriver au résultat le plus proche de la
réalité
Paris 2023 #SEOCAMPus
Utiliser le machine learning pour prédire les critères les plus importants
Comment faire ?
ÉTAPE 4 : Confirmer les prédictions
Le consultant confirme les hypothèses émises par l’algo : en analysant les données
● Graphique de corrélation
● Forces en présences
Paris 2023 #SEOCAMPus
Utiliser le machine learning pour prédire les critères les plus importants
Les limites
On ne vise pas le résultat parfait mais plutôt dégager une tendance
Des données pas exactement
identiques à celles dont
Google dispose
03
● Données de netlinking simulées
● …
Des données que Google
possède mais pas nous
02
● Les critères d’usage : Taux de rebond,...
● Le trafic ? (utilisé pour Discover)
La collecte parfaite des
données nécessite
01
● de crawler tous les sites qui rankent
● d’utiliser le modèle du surfeur
raisonnable
Paris 2023 #SEOCAMPus
Utiliser le machine learning pour prédire les critères les plus importants
Les résultats
Des poids très différents en fonction des métriques
Paris 2023 #SEOCAMPus
Utiliser le machine learning pour prédire les critères les plus importants
Les résultats
2 3
1
Cluster météo
Host Trust
Nombre de backlinks Host semantic Value*
*prend en compte l’adéquation sémantique entre les pages
sources des backlinks qui pointent vers la page
2 3
1
Cluster Recettes
Semantic Score
Nombre de backlinks Nombre d’urls connues
● Les critères importants diffèrent d’un cluster à l’autre
● Pas étonnant que la sémantique ne soit pas prépondérante sur la météo
Paris 2023 #SEOCAMPus
CLUSTER 2 : Recettes de cuisine
Quand l’IA se trompe sur le CLS ?
La corrélation existe mais pas la causalité : toujours vérifier les recos d’un algo !
L’IA est bonne en math mais pas en SEO….
Paris 2023 #SEOCAMPus
Conclusion
● La data nous aide à prendre
des décisions plus fines
(prédiction de recherche,
priorisation des actions)
● Pour chaque thématique, on
sait déterminer les critères
les plus importants
Paris 2023 #SEOCAMPus
MERCI
37
Question Mug
Paris 2023 #SEOCAMPus
Citez 2 exemples
d’application de la
data science au
SEO
38
MERCI AUX SPONSORS
Paris 2023 #SEOCAMPus

Contenu connexe

Tendances

El SEO en medios: En busca del engranaje perfecto en una redacción
El SEO en medios: En busca del engranaje perfecto en una redacciónEl SEO en medios: En busca del engranaje perfecto en una redacción
El SEO en medios: En busca del engranaje perfecto en una redacciónClara Soteras
 
Probabilistic Thinking in SEO - BrightonSEO October 2022
Probabilistic Thinking in SEO - BrightonSEO October 2022Probabilistic Thinking in SEO - BrightonSEO October 2022
Probabilistic Thinking in SEO - BrightonSEO October 2022Andrew Charlton
 
eCommerce Internal Linking - Into the Spider-Verse (BrightonSEO edition)
eCommerce Internal Linking - Into the Spider-Verse (BrightonSEO edition)eCommerce Internal Linking - Into the Spider-Verse (BrightonSEO edition)
eCommerce Internal Linking - Into the Spider-Verse (BrightonSEO edition)Kristina Azarenko
 
SEO In 2022: Google Discover and Microsite SERPs - (SEMrush Webinar)
SEO In 2022: Google Discover and Microsite SERPs - (SEMrush Webinar)SEO In 2022: Google Discover and Microsite SERPs - (SEMrush Webinar)
SEO In 2022: Google Discover and Microsite SERPs - (SEMrush Webinar)Evolving SEO
 
How We Built 1,000+ Links Per Month With This 6-Month Sprint.
How We Built 1,000+ Links Per Month With This 6-Month Sprint.How We Built 1,000+ Links Per Month With This 6-Month Sprint.
How We Built 1,000+ Links Per Month With This 6-Month Sprint.Search Engine Journal
 
BrightonSEO April 2023 Similar AI: Automation recipes for SEO success
BrightonSEO April 2023 Similar AI: Automation recipes for SEO successBrightonSEO April 2023 Similar AI: Automation recipes for SEO success
BrightonSEO April 2023 Similar AI: Automation recipes for SEO successDylan Fuler
 
SEO Camp'us 2022 - Stratégie de contenu : ces erreurs qui sabordent votre ROI.
SEO Camp'us 2022 - Stratégie de contenu : ces erreurs qui sabordent votre ROI.SEO Camp'us 2022 - Stratégie de contenu : ces erreurs qui sabordent votre ROI.
SEO Camp'us 2022 - Stratégie de contenu : ces erreurs qui sabordent votre ROI.Ecribouille
 
Pubcon 2023 - A deep dive into the latest Google updates, from Lily Ray
Pubcon 2023 - A deep dive into the latest Google updates, from Lily RayPubcon 2023 - A deep dive into the latest Google updates, from Lily Ray
Pubcon 2023 - A deep dive into the latest Google updates, from Lily RayAmsive
 
Machine Learning use cases for Technical SEO Automation Brighton SEO Patrick ...
Machine Learning use cases for Technical SEO Automation Brighton SEO Patrick ...Machine Learning use cases for Technical SEO Automation Brighton SEO Patrick ...
Machine Learning use cases for Technical SEO Automation Brighton SEO Patrick ...Ahrefs
 
Product, service and category page links (and how to get them) - Rebecca Moss...
Product, service and category page links (and how to get them) - Rebecca Moss...Product, service and category page links (and how to get them) - Rebecca Moss...
Product, service and category page links (and how to get them) - Rebecca Moss...Rebecca Moss
 
How to unlock the secrets of effortless keyword research with ChatGPT.pptx
How to unlock the secrets of effortless keyword research with ChatGPT.pptxHow to unlock the secrets of effortless keyword research with ChatGPT.pptx
How to unlock the secrets of effortless keyword research with ChatGPT.pptxDaniel Smullen
 
Beyond the Basics – 5 Google Business Profile elements you might not know abo...
Beyond the Basics – 5 Google Business Profile elements you might not know abo...Beyond the Basics – 5 Google Business Profile elements you might not know abo...
Beyond the Basics – 5 Google Business Profile elements you might not know abo...Claire Carlile Marketing
 
Think Beyond Search: Top Channels & Emerging Trends to Grow Your Brand
Think Beyond Search: Top Channels & Emerging Trends to Grow Your BrandThink Beyond Search: Top Channels & Emerging Trends to Grow Your Brand
Think Beyond Search: Top Channels & Emerging Trends to Grow Your BrandSearch Engine Journal
 
Core Web Vitals Audit - Sophie Gibson - PDF - BrightonSEO.pdf
Core Web Vitals Audit - Sophie Gibson - PDF - BrightonSEO.pdfCore Web Vitals Audit - Sophie Gibson - PDF - BrightonSEO.pdf
Core Web Vitals Audit - Sophie Gibson - PDF - BrightonSEO.pdfSophie Gibson
 
Maximize Your Local Visibility: Mastering Google, Social & Reputation
Maximize Your Local Visibility: Mastering Google, Social & ReputationMaximize Your Local Visibility: Mastering Google, Social & Reputation
Maximize Your Local Visibility: Mastering Google, Social & ReputationSearch Engine Journal
 
Discover, pa’ tipos como tú: Los 13 factores para disparar tu tráfico
Discover, pa’ tipos como tú: Los 13 factores para disparar tu tráficoDiscover, pa’ tipos como tú: Los 13 factores para disparar tu tráfico
Discover, pa’ tipos como tú: Los 13 factores para disparar tu tráficoClara Soteras
 
Optimising Organisation Movement: speeding up professional growth backed by data
Optimising Organisation Movement: speeding up professional growth backed by dataOptimising Organisation Movement: speeding up professional growth backed by data
Optimising Organisation Movement: speeding up professional growth backed by dataReza Moaiandin
 
Keyword Research for SEO: Best Practices & Top Tips
Keyword Research for SEO: Best Practices & Top TipsKeyword Research for SEO: Best Practices & Top Tips
Keyword Research for SEO: Best Practices & Top TipsSearch Engine Journal
 
Brighton SEO April 2022 - Automate the technical SEO stuff
Brighton SEO April 2022 - Automate the technical SEO stuffBrighton SEO April 2022 - Automate the technical SEO stuff
Brighton SEO April 2022 - Automate the technical SEO stuffMichael Van Den Reym
 
BrightonSEO - Master Crawl Budget Optimization for Enterprise Websites
BrightonSEO - Master Crawl Budget Optimization for Enterprise WebsitesBrightonSEO - Master Crawl Budget Optimization for Enterprise Websites
BrightonSEO - Master Crawl Budget Optimization for Enterprise WebsitesManick Bhan
 

Tendances (20)

El SEO en medios: En busca del engranaje perfecto en una redacción
El SEO en medios: En busca del engranaje perfecto en una redacciónEl SEO en medios: En busca del engranaje perfecto en una redacción
El SEO en medios: En busca del engranaje perfecto en una redacción
 
Probabilistic Thinking in SEO - BrightonSEO October 2022
Probabilistic Thinking in SEO - BrightonSEO October 2022Probabilistic Thinking in SEO - BrightonSEO October 2022
Probabilistic Thinking in SEO - BrightonSEO October 2022
 
eCommerce Internal Linking - Into the Spider-Verse (BrightonSEO edition)
eCommerce Internal Linking - Into the Spider-Verse (BrightonSEO edition)eCommerce Internal Linking - Into the Spider-Verse (BrightonSEO edition)
eCommerce Internal Linking - Into the Spider-Verse (BrightonSEO edition)
 
SEO In 2022: Google Discover and Microsite SERPs - (SEMrush Webinar)
SEO In 2022: Google Discover and Microsite SERPs - (SEMrush Webinar)SEO In 2022: Google Discover and Microsite SERPs - (SEMrush Webinar)
SEO In 2022: Google Discover and Microsite SERPs - (SEMrush Webinar)
 
How We Built 1,000+ Links Per Month With This 6-Month Sprint.
How We Built 1,000+ Links Per Month With This 6-Month Sprint.How We Built 1,000+ Links Per Month With This 6-Month Sprint.
How We Built 1,000+ Links Per Month With This 6-Month Sprint.
 
BrightonSEO April 2023 Similar AI: Automation recipes for SEO success
BrightonSEO April 2023 Similar AI: Automation recipes for SEO successBrightonSEO April 2023 Similar AI: Automation recipes for SEO success
BrightonSEO April 2023 Similar AI: Automation recipes for SEO success
 
SEO Camp'us 2022 - Stratégie de contenu : ces erreurs qui sabordent votre ROI.
SEO Camp'us 2022 - Stratégie de contenu : ces erreurs qui sabordent votre ROI.SEO Camp'us 2022 - Stratégie de contenu : ces erreurs qui sabordent votre ROI.
SEO Camp'us 2022 - Stratégie de contenu : ces erreurs qui sabordent votre ROI.
 
Pubcon 2023 - A deep dive into the latest Google updates, from Lily Ray
Pubcon 2023 - A deep dive into the latest Google updates, from Lily RayPubcon 2023 - A deep dive into the latest Google updates, from Lily Ray
Pubcon 2023 - A deep dive into the latest Google updates, from Lily Ray
 
Machine Learning use cases for Technical SEO Automation Brighton SEO Patrick ...
Machine Learning use cases for Technical SEO Automation Brighton SEO Patrick ...Machine Learning use cases for Technical SEO Automation Brighton SEO Patrick ...
Machine Learning use cases for Technical SEO Automation Brighton SEO Patrick ...
 
Product, service and category page links (and how to get them) - Rebecca Moss...
Product, service and category page links (and how to get them) - Rebecca Moss...Product, service and category page links (and how to get them) - Rebecca Moss...
Product, service and category page links (and how to get them) - Rebecca Moss...
 
How to unlock the secrets of effortless keyword research with ChatGPT.pptx
How to unlock the secrets of effortless keyword research with ChatGPT.pptxHow to unlock the secrets of effortless keyword research with ChatGPT.pptx
How to unlock the secrets of effortless keyword research with ChatGPT.pptx
 
Beyond the Basics – 5 Google Business Profile elements you might not know abo...
Beyond the Basics – 5 Google Business Profile elements you might not know abo...Beyond the Basics – 5 Google Business Profile elements you might not know abo...
Beyond the Basics – 5 Google Business Profile elements you might not know abo...
 
Think Beyond Search: Top Channels & Emerging Trends to Grow Your Brand
Think Beyond Search: Top Channels & Emerging Trends to Grow Your BrandThink Beyond Search: Top Channels & Emerging Trends to Grow Your Brand
Think Beyond Search: Top Channels & Emerging Trends to Grow Your Brand
 
Core Web Vitals Audit - Sophie Gibson - PDF - BrightonSEO.pdf
Core Web Vitals Audit - Sophie Gibson - PDF - BrightonSEO.pdfCore Web Vitals Audit - Sophie Gibson - PDF - BrightonSEO.pdf
Core Web Vitals Audit - Sophie Gibson - PDF - BrightonSEO.pdf
 
Maximize Your Local Visibility: Mastering Google, Social & Reputation
Maximize Your Local Visibility: Mastering Google, Social & ReputationMaximize Your Local Visibility: Mastering Google, Social & Reputation
Maximize Your Local Visibility: Mastering Google, Social & Reputation
 
Discover, pa’ tipos como tú: Los 13 factores para disparar tu tráfico
Discover, pa’ tipos como tú: Los 13 factores para disparar tu tráficoDiscover, pa’ tipos como tú: Los 13 factores para disparar tu tráfico
Discover, pa’ tipos como tú: Los 13 factores para disparar tu tráfico
 
Optimising Organisation Movement: speeding up professional growth backed by data
Optimising Organisation Movement: speeding up professional growth backed by dataOptimising Organisation Movement: speeding up professional growth backed by data
Optimising Organisation Movement: speeding up professional growth backed by data
 
Keyword Research for SEO: Best Practices & Top Tips
Keyword Research for SEO: Best Practices & Top TipsKeyword Research for SEO: Best Practices & Top Tips
Keyword Research for SEO: Best Practices & Top Tips
 
Brighton SEO April 2022 - Automate the technical SEO stuff
Brighton SEO April 2022 - Automate the technical SEO stuffBrighton SEO April 2022 - Automate the technical SEO stuff
Brighton SEO April 2022 - Automate the technical SEO stuff
 
BrightonSEO - Master Crawl Budget Optimization for Enterprise Websites
BrightonSEO - Master Crawl Budget Optimization for Enterprise WebsitesBrightonSEO - Master Crawl Budget Optimization for Enterprise Websites
BrightonSEO - Master Crawl Budget Optimization for Enterprise Websites
 

Similaire à La data science au service du consultant SEO | SEO Campus 2023

Gestion de projet SEO : comment s'organiser ? - Yannick Bouvard - SEO CAMP'us...
Gestion de projet SEO : comment s'organiser ? - Yannick Bouvard - SEO CAMP'us...Gestion de projet SEO : comment s'organiser ? - Yannick Bouvard - SEO CAMP'us...
Gestion de projet SEO : comment s'organiser ? - Yannick Bouvard - SEO CAMP'us...SEO CAMP
 
tests, investigations et études SEO - Alexis Rylko - SEO CAMP'us Paris 2021
tests, investigations et études SEO - Alexis Rylko - SEO CAMP'us Paris 2021tests, investigations et études SEO - Alexis Rylko - SEO CAMP'us Paris 2021
tests, investigations et études SEO - Alexis Rylko - SEO CAMP'us Paris 2021SEO CAMP
 
Seo 10 clés pour plaire à Google
Seo   10 clés pour plaire à GoogleSeo   10 clés pour plaire à Google
Seo 10 clés pour plaire à GoogleKeyweo
 
Webinaire du 25 janvier 2024 : "Comment évoluera l’algorithme de Google en 20...
Webinaire du 25 janvier 2024 : "Comment évoluera l’algorithme de Google en 20...Webinaire du 25 janvier 2024 : "Comment évoluera l’algorithme de Google en 20...
Webinaire du 25 janvier 2024 : "Comment évoluera l’algorithme de Google en 20...Dan Bernier
 
Booster son SEO on-site avec les entités - Frédéric LAURENT - SEO CAMP'us Par...
Booster son SEO on-site avec les entités - Frédéric LAURENT - SEO CAMP'us Par...Booster son SEO on-site avec les entités - Frédéric LAURENT - SEO CAMP'us Par...
Booster son SEO on-site avec les entités - Frédéric LAURENT - SEO CAMP'us Par...SEO CAMP
 
Les bases du seo : comment réussir votre référencement naturel
Les bases du seo : comment réussir votre référencement naturelLes bases du seo : comment réussir votre référencement naturel
Les bases du seo : comment réussir votre référencement naturelClaire WIBAILLE
 
SEO CAMP'us Paris 2022 - 6 Tips E-Commerce - Mathieu Chapon.pptx
SEO CAMP'us Paris 2022 - 6 Tips E-Commerce - Mathieu Chapon.pptxSEO CAMP'us Paris 2022 - 6 Tips E-Commerce - Mathieu Chapon.pptx
SEO CAMP'us Paris 2022 - 6 Tips E-Commerce - Mathieu Chapon.pptxPeak Ace
 
Les nouveaux moteurs de recherche - Search Foresight
Les nouveaux moteurs de recherche - Search ForesightLes nouveaux moteurs de recherche - Search Foresight
Les nouveaux moteurs de recherche - Search ForesightPeak Ace
 
Chirurgie SEO / Solution répulsive contre les pandas #SEOCamp
Chirurgie SEO / Solution répulsive contre les pandas #SEOCampChirurgie SEO / Solution répulsive contre les pandas #SEOCamp
Chirurgie SEO / Solution répulsive contre les pandas #SEOCampHtitipi
 
CCC-CONNECTION - etablir une strategie ecommerce efficace: abandon de panier,...
CCC-CONNECTION - etablir une strategie ecommerce efficace: abandon de panier,...CCC-CONNECTION - etablir une strategie ecommerce efficace: abandon de panier,...
CCC-CONNECTION - etablir une strategie ecommerce efficace: abandon de panier,...Eric Culnaert
 
Referencement 1ere Position Forum Src Montbeliard
Referencement 1ere Position Forum Src MontbeliardReferencement 1ere Position Forum Src Montbeliard
Referencement 1ere Position Forum Src MontbeliardJCD srcmontbeliard
 
Référencements naturel et payant, 13 juin 2014
Référencements naturel et payant, 13 juin 2014Référencements naturel et payant, 13 juin 2014
Référencements naturel et payant, 13 juin 2014webassoc .fr
 
Le visiteur Utile - De la data à la connaissance
Le visiteur Utile - De la data à la connaissance Le visiteur Utile - De la data à la connaissance
Le visiteur Utile - De la data à la connaissance Thomas LEONETTI
 
Critères et outils pour sélectionner des domaines expires de qualité
Critères et outils pour sélectionner des domaines expires de qualitéCritères et outils pour sélectionner des domaines expires de qualité
Critères et outils pour sélectionner des domaines expires de qualitépasquelin Jérôme
 
Le mix de données Data Studio : un must pour les SEO
Le mix de données Data Studio : un must pour les SEOLe mix de données Data Studio : un must pour les SEO
Le mix de données Data Studio : un must pour les SEOSEO CAMP
 
Séminaire Boostez votre référencement sur Google
Séminaire Boostez votre référencement sur GoogleSéminaire Boostez votre référencement sur Google
Séminaire Boostez votre référencement sur GoogleDigital Link Sàrl
 
OnCrawl @ Digital Analytics Forum 2018 : le référencement naturel augmenté
OnCrawl @ Digital Analytics Forum 2018 : le référencement naturel augmentéOnCrawl @ Digital Analytics Forum 2018 : le référencement naturel augmenté
OnCrawl @ Digital Analytics Forum 2018 : le référencement naturel augmentéAT Internet
 
SEO inclusive : vos visiteurs ne sont pas (que) des robots - Mathile Touchebo...
SEO inclusive : vos visiteurs ne sont pas (que) des robots - Mathile Touchebo...SEO inclusive : vos visiteurs ne sont pas (que) des robots - Mathile Touchebo...
SEO inclusive : vos visiteurs ne sont pas (que) des robots - Mathile Touchebo...SEO CAMP
 

Similaire à La data science au service du consultant SEO | SEO Campus 2023 (20)

Gestion de projet SEO : comment s'organiser ? - Yannick Bouvard - SEO CAMP'us...
Gestion de projet SEO : comment s'organiser ? - Yannick Bouvard - SEO CAMP'us...Gestion de projet SEO : comment s'organiser ? - Yannick Bouvard - SEO CAMP'us...
Gestion de projet SEO : comment s'organiser ? - Yannick Bouvard - SEO CAMP'us...
 
tests, investigations et études SEO - Alexis Rylko - SEO CAMP'us Paris 2021
tests, investigations et études SEO - Alexis Rylko - SEO CAMP'us Paris 2021tests, investigations et études SEO - Alexis Rylko - SEO CAMP'us Paris 2021
tests, investigations et études SEO - Alexis Rylko - SEO CAMP'us Paris 2021
 
Seo 10 clés pour plaire à Google
Seo   10 clés pour plaire à GoogleSeo   10 clés pour plaire à Google
Seo 10 clés pour plaire à Google
 
Webinaire du 25 janvier 2024 : "Comment évoluera l’algorithme de Google en 20...
Webinaire du 25 janvier 2024 : "Comment évoluera l’algorithme de Google en 20...Webinaire du 25 janvier 2024 : "Comment évoluera l’algorithme de Google en 20...
Webinaire du 25 janvier 2024 : "Comment évoluera l’algorithme de Google en 20...
 
Booster son SEO on-site avec les entités - Frédéric LAURENT - SEO CAMP'us Par...
Booster son SEO on-site avec les entités - Frédéric LAURENT - SEO CAMP'us Par...Booster son SEO on-site avec les entités - Frédéric LAURENT - SEO CAMP'us Par...
Booster son SEO on-site avec les entités - Frédéric LAURENT - SEO CAMP'us Par...
 
Les bases du seo : comment réussir votre référencement naturel
Les bases du seo : comment réussir votre référencement naturelLes bases du seo : comment réussir votre référencement naturel
Les bases du seo : comment réussir votre référencement naturel
 
SEO CAMP'us Paris 2022 - 6 Tips E-Commerce - Mathieu Chapon.pptx
SEO CAMP'us Paris 2022 - 6 Tips E-Commerce - Mathieu Chapon.pptxSEO CAMP'us Paris 2022 - 6 Tips E-Commerce - Mathieu Chapon.pptx
SEO CAMP'us Paris 2022 - 6 Tips E-Commerce - Mathieu Chapon.pptx
 
Réussir son référencement Google actualites
Réussir son référencement Google actualitesRéussir son référencement Google actualites
Réussir son référencement Google actualites
 
Les nouveaux moteurs de recherche - Search Foresight
Les nouveaux moteurs de recherche - Search ForesightLes nouveaux moteurs de recherche - Search Foresight
Les nouveaux moteurs de recherche - Search Foresight
 
We Love SEO 2018 : Peut-on encore détrôner les gros sites leaders en SEO ?
We Love SEO 2018 : Peut-on encore détrôner les gros sites leaders en SEO ?We Love SEO 2018 : Peut-on encore détrôner les gros sites leaders en SEO ?
We Love SEO 2018 : Peut-on encore détrôner les gros sites leaders en SEO ?
 
Chirurgie SEO / Solution répulsive contre les pandas #SEOCamp
Chirurgie SEO / Solution répulsive contre les pandas #SEOCampChirurgie SEO / Solution répulsive contre les pandas #SEOCamp
Chirurgie SEO / Solution répulsive contre les pandas #SEOCamp
 
CCC-CONNECTION - etablir une strategie ecommerce efficace: abandon de panier,...
CCC-CONNECTION - etablir une strategie ecommerce efficace: abandon de panier,...CCC-CONNECTION - etablir une strategie ecommerce efficace: abandon de panier,...
CCC-CONNECTION - etablir une strategie ecommerce efficace: abandon de panier,...
 
Referencement 1ere Position Forum Src Montbeliard
Referencement 1ere Position Forum Src MontbeliardReferencement 1ere Position Forum Src Montbeliard
Referencement 1ere Position Forum Src Montbeliard
 
Référencements naturel et payant, 13 juin 2014
Référencements naturel et payant, 13 juin 2014Référencements naturel et payant, 13 juin 2014
Référencements naturel et payant, 13 juin 2014
 
Le visiteur Utile - De la data à la connaissance
Le visiteur Utile - De la data à la connaissance Le visiteur Utile - De la data à la connaissance
Le visiteur Utile - De la data à la connaissance
 
Critères et outils pour sélectionner des domaines expires de qualité
Critères et outils pour sélectionner des domaines expires de qualitéCritères et outils pour sélectionner des domaines expires de qualité
Critères et outils pour sélectionner des domaines expires de qualité
 
Le mix de données Data Studio : un must pour les SEO
Le mix de données Data Studio : un must pour les SEOLe mix de données Data Studio : un must pour les SEO
Le mix de données Data Studio : un must pour les SEO
 
Séminaire Boostez votre référencement sur Google
Séminaire Boostez votre référencement sur GoogleSéminaire Boostez votre référencement sur Google
Séminaire Boostez votre référencement sur Google
 
OnCrawl @ Digital Analytics Forum 2018 : le référencement naturel augmenté
OnCrawl @ Digital Analytics Forum 2018 : le référencement naturel augmentéOnCrawl @ Digital Analytics Forum 2018 : le référencement naturel augmenté
OnCrawl @ Digital Analytics Forum 2018 : le référencement naturel augmenté
 
SEO inclusive : vos visiteurs ne sont pas (que) des robots - Mathile Touchebo...
SEO inclusive : vos visiteurs ne sont pas (que) des robots - Mathile Touchebo...SEO inclusive : vos visiteurs ne sont pas (que) des robots - Mathile Touchebo...
SEO inclusive : vos visiteurs ne sont pas (que) des robots - Mathile Touchebo...
 

La data science au service du consultant SEO | SEO Campus 2023

  • 1. LA DATA SCIENCE AU SERVICE DU CONSULTANT SEO
  • 2. Paris 2023 #SEOCAMPus 2 PRÉSENTATION Rémi Nestasio Grégory Florin On recrute Consultant SEO remi.nestasio@performics.com Ex : Conforama, Freelance Directeur Expertise et Innovation gregory.florin@performics.com Ex : Marmiton, La redoute, Doctissimo,...
  • 3. Paris 2023 #SEOCAMPus 3 LA DATA SCIENCE EN SEO : POUR QUOI FAIRE ? 1. Mieux comprendre ce qui est important pour Google sur sa thématique 2. Justifier ses choix par la data auprès de son manager / client 3. Prioriser les actions et aller plus vite Pour assister le consultant
  • 4. Paris 2023 #SEOCAMPus NOTRE MÉTHODOLOGIE Stocker les données SEO 1 Nettoyer / enrichir les données 2 Fournir des outils pour analyser les données 3 AUTOMATISER
  • 5. Paris 2023 #SEOCAMPus 5 DISCLAIMER ATTENTION AU CONTEXTE Nous menons des analyses dans un contexte précis et avec un jeu de données propre à ce contexte. Si on change le contexte, les recommandations vont également changer
  • 6. Paris 2023 #SEOCAMPus 6 DISCLAIMER CORRÉLATION ET CAUSALITÉ “Souvent les gens qui mangent une glace portent un maillot de bain.” → Il y a une corrélation entre manger une glace et porter un maillot de bain. “On mange une glace parce qu’il fait chaud” → Il y a donc une causalité entre la chaleur et le fait de manger une glace ● Les statistiques montrent les corrélations ● Seul le consultant peut identifier la causalité
  • 8. Paris 2023 #SEOCAMPus 4 CLUSTERS ANALYSÉS 1. ACHAT DE MONTRES 2. RECETTES DE CUISINE 3. REQUÊTES MÉTÉO + VILLE 4. ARTICLES MALADIES 500 mots clés 300 mots clés 300 mots clés 97 mots clés
  • 9. Paris 2023 #SEOCAMPus On doit comparer des mots clés comparables → Construire un set de mots clés “proches” : que Google va considérer de manière similaire dans l’algo Ne pas mélanger : ● Les requêtes marque et hors marque ● Les intentions de recherche ● La top tail et longue traine Ne pas hésiter à créer plusieurs clusters 9 Pourquoi pas + de 500 mots clés ?
  • 10. Paris 2023 #SEOCAMPus 10 Exemple d’un mauvais cluster car trop d’écart : Entre les volumes de recherche Pourquoi pas plus de 500 mots clés ? Le bon et le mauvais cluster
  • 11. Paris 2023 #SEOCAMPus 11 Trouver l’intention de recherche Comment faire ? Détection de l’intention par GPT4 Il est conseillé de vérifier les données générées CHATGPT + API
  • 12. Paris 2023 #SEOCAMPus Bien valider que les données sont exploitables On ne peut pas toujours analyser tous les critères
  • 13. Paris 2023 #SEOCAMPus 5 CAS CONCRETS
  • 14. Paris 2023 #SEOCAMPus 1 - Saisonnalité : scoring mots clés Pourquoi ? Pour être positionné au bon moment, il faut optimiser les pages en amont : ● Prioriser son travail selon la saisonnalité ● Construire sa roadmap éditoriale ● Anticiper et adapter son maillage interne ● …
  • 15. 1 - Saisonnalité : scoring de mots clés Cluster recette - La version classique La version classique : Données source : ● Volumes de recherches mensuels sur 12 mois ● On connaît les tops mots clés pour chaque mois → On peut prioriser les mots clés importants
  • 16. Paris 2023 #SEOCAMPus 1 - Saisonnalité : scoring de mots clés Cluster recette - La version prédictive On améliore notre capacité à évaluer l’importance des mots clés On prédit les prochains mois Données source : Historique des volumes de recherches mensuels sur 4 ans Algo utilisé : Facebook Prophet Volume de recherche sur la requête quiche lorraine
  • 17. Paris 2023 #SEOCAMPus 2 - Contenu : l’importance de la sémantique Le protocole : 1. On score les pages du top 10 2. Pour chaque mot clé, on définit un objectif 3. On évalue chaque page par rapport à l’objectif 4. On calcul le score moyen par position sur Google Objectif : Déterminer si les meilleures positions ont un score plus élevé que les autres Source : Yourtext.guru
  • 18. Paris 2023 #SEOCAMPus 2 - Contenu : l’importance de la sémantique Cluster recette Les scores élevés sont bien corrélés au ranking Taux d’atteinte de l’objectif de score sémantique par position :
  • 19. Paris 2023 #SEOCAMPus 2 - Contenu : l’importance de la sémantique Cluster météo Les sites qui rankent le mieux sont les moins bien scorés : pas logique… Taux d’atteinte de l’objectif par position :
  • 20. Paris 2023 #SEOCAMPus 3 - Netlinking : Quel ticket d’entrée pour le top 10 ? Cluster maladie Il faut se positionner dans la bonne fenêtre ● On calcule les métriques de Netlinking pour chaque site et chaque page ● On détermine visuellement les limites minimales Quelles métriques minimales pour se positionner ?
  • 21. Paris 2023 #SEOCAMPus 3 - Netlinking : sur quelles pages dois-je améliorer le netlinking ? Cluster maladie Le protocole : 1. On score les pages du top 10 2. On définit un objectif de score 3. On évalue chaque page par rapport à l’objectif 4. On filtre sur : ● Nos urls mal positionnées ● Les urls avec un taux d’atteinte de l’objectif faible
  • 22. Paris 2023 #SEOCAMPus 3 - Netlinking : sur quelles pages dois-je améliorer le netlinking ? Cluster maladie On filtre sur : ● Les urls hors top 10 ● Les urls avec un taux d’atteinte de l’objectif faible : moins de 70%
  • 23. Paris 2023 #SEOCAMPus 4 - Les données structurées : nécessaires pour ranker ? Cluster maladie EEAT (Experience Expertise Authority Trust) est important sur les requêtes santé Hypothèse : Les données structurées aident Google à facilement découvrir des infos autour des articles et des auteurs : - Nom de l’auteur (et liens vers une page descriptive) - Date de création / modification de l’article - … Cela semble donc être un must have
  • 24. Paris 2023 #SEOCAMPus 4 - Les données structurées : nécessaires pour ranker ? Cluster maladie Présence des données structurées schema.org Article Fiche maladie sur Ameli.fr : L’exception Ameli.fr Positions sur Google
  • 25. 5 - Comment faire prioriser l’optimisation du TTFB ? Cluster Montre 1. On calcule le TTFB médian sur toutes les pages analysées 2. On se compare aux concurrents 3. On priorise si on est en dehors des normes host feature median www.louispion.fr ttfb 2207,5 ocarat.com ttfb 1069 magmontres.fr ttfb 1025 www.montresandco.com ttfb 1022 m.darty.com ttfb 936 www.decathlon.fr ttfb 764,5 www.histoiredor.com ttfb 705 www.maty.com ttfb 631,5 www.bijourama.com ttfb 630 www.chrono24.fr ttfb 532 www.cdiscount.com ttfb 525 m.boulanger.com ttfb 510 www.cleor.com ttfb 340
  • 26. A ce stade : On peut : - Prédire le potentiel d’un mot clé - Déterminer le niveau de difficulté - Détecter des corrélations entre un facteur et le ranking MAIS : On ne sait pas déterminer les critères les plus importants ET SI ON ALLAIT PLUS LOIN ?
  • 27. Paris 2023 #SEOCAMPus Utiliser le machine learning pour prédire les critères les plus importants Comment faire ? ÉTAPE 1 : Collecter les données LES MÉTRIQUES DES PAGES Technique - Canonical - Données structurées - Core Web Vitals - TTFB - …. Contenu - Titre - Hn - Textes - … Popularité - Trust Flow / Citation Flow - Nombre de backlinks - Nombre de liens internes - … LES RANKINGS ● Les positions ● Les urls positionnées
  • 28. Paris 2023 #SEOCAMPus 28 Utiliser le machine learning pour prédire les critères les plus importants Comment faire ? Répartition des valeurs de CLS nulles Cluster Maladies ÉTAPE 2 : Nettoyer les données Les valeurs nulles Certaines valeurs ne peuvent être collectées → Retirer les données ou → Remplacer par la valeur moyenne pour “neutraliser les valeurs nulles”
  • 29. Paris 2023 #SEOCAMPus 29 Utiliser le machine learning pour prédire les critères les plus importants Comment faire ? Répartition des liens internes par url Cluster Maladie ÉTAPE 2 : Nettoyer les données Les valeurs extrêmes On peut leur fixer une valeur maximum : → Considérer que le nombre maximum de liens internes est de 10k.
  • 30. Paris 2023 #SEOCAMPus Utiliser le machine learning pour prédire les critères les plus importants Comment faire ? ÉTAPE 3 : Lancer l’algo On demande à l’algo de “reproduire les résultats de Google” : présence ou non dans le top 3 L’algo teste toutes les combinaisons pour arriver au résultat le plus proche de la réalité
  • 31. Paris 2023 #SEOCAMPus Utiliser le machine learning pour prédire les critères les plus importants Comment faire ? ÉTAPE 4 : Confirmer les prédictions Le consultant confirme les hypothèses émises par l’algo : en analysant les données ● Graphique de corrélation ● Forces en présences
  • 32. Paris 2023 #SEOCAMPus Utiliser le machine learning pour prédire les critères les plus importants Les limites On ne vise pas le résultat parfait mais plutôt dégager une tendance Des données pas exactement identiques à celles dont Google dispose 03 ● Données de netlinking simulées ● … Des données que Google possède mais pas nous 02 ● Les critères d’usage : Taux de rebond,... ● Le trafic ? (utilisé pour Discover) La collecte parfaite des données nécessite 01 ● de crawler tous les sites qui rankent ● d’utiliser le modèle du surfeur raisonnable
  • 33. Paris 2023 #SEOCAMPus Utiliser le machine learning pour prédire les critères les plus importants Les résultats Des poids très différents en fonction des métriques
  • 34. Paris 2023 #SEOCAMPus Utiliser le machine learning pour prédire les critères les plus importants Les résultats 2 3 1 Cluster météo Host Trust Nombre de backlinks Host semantic Value* *prend en compte l’adéquation sémantique entre les pages sources des backlinks qui pointent vers la page 2 3 1 Cluster Recettes Semantic Score Nombre de backlinks Nombre d’urls connues ● Les critères importants diffèrent d’un cluster à l’autre ● Pas étonnant que la sémantique ne soit pas prépondérante sur la météo
  • 35. Paris 2023 #SEOCAMPus CLUSTER 2 : Recettes de cuisine Quand l’IA se trompe sur le CLS ? La corrélation existe mais pas la causalité : toujours vérifier les recos d’un algo ! L’IA est bonne en math mais pas en SEO….
  • 36. Paris 2023 #SEOCAMPus Conclusion ● La data nous aide à prendre des décisions plus fines (prédiction de recherche, priorisation des actions) ● Pour chaque thématique, on sait déterminer les critères les plus importants
  • 38. Question Mug Paris 2023 #SEOCAMPus Citez 2 exemples d’application de la data science au SEO 38
  • 39. MERCI AUX SPONSORS Paris 2023 #SEOCAMPus