SlideShare une entreprise Scribd logo

Screaming frog - l'outil ne fait pas l'artisan

Aymeric Bouillat
Aymeric Bouillat
Aymeric BouillatConsultant SEO senior chez Novalem [Havas Media] à SEO Hackers

Conférence sur l'outil Screaming Frog lors du SEOCampus Paris 2020. Screaming Frog Seo Spider est un crawler qui est utilisé par de nombreux référenceurs. C'est un outil puissant pour effectuer des analyses SEO, mais il est parfois sous-exploité. En effet, cet outil est en constante évolution, et certaines nouveautés sont discrètes ert bien cachées dans le smultiples menus! L'outil ne fait pas l'artisan : avoir des données c'est bien mais savoir les interpréter correctement c'est mieux ;)

Screaming frog - l'outil ne fait pas l'artisan

1  sur  49
Screaming Frog
L’outil ne fait pas
l’artisan
Cycle technique
#seocampParis 2020 2
Aymeric Bouillat
Consultant SEO technique dans l’agence SEO (groupe )
• Des affinités avec le SEO technique
• Spécialiste des migrations de site
• Et un blog plus trop à jour…. https://www.yapasdequoi.com
Pour me suivre sur Twitter :
@aymerictwit
#seocampParis 2020 3
A quoi ça sert?
Analyse des balises
SEO
Extraction de données
précises dans les pages
Découverte des
problématiques de duplication
Examen des directives
pour les robots
Analyse des redirections
Crawl avec un
rendu JS, comme
Google
Détection des liens
cassés
Visualisation de l’architecture
d’un site et de son maillage
Connexions à des API (Search
Console, GA, Ahrefs, etc)
Génération de sitemaps
XML
#seocampParis 2020 4
3 choses à savoir
#seocampParis 2020
Quel mode de crawl?
5
#seocampParis 2020 6
Préférez le mode Base de données
• Un crawl, c’est gourmand ! (Configuration > Storage mode)
• Memory = 3Go min.  crawls de moins de 100.000 URL : plus rapide, moins souple
• Database storage = avoir un disque SSD : plus souple, permet le crawl de gros sites

Recommandé

SEO Lanta : gagnez l'aventure des SERP
SEO Lanta : gagnez l'aventure des SERPSEO Lanta : gagnez l'aventure des SERP
SEO Lanta : gagnez l'aventure des SERPAymeric Bouillat
 
Les mythes et légendes du SEO - WebIsland Nantes 2022.pdf
Les mythes et légendes du SEO - WebIsland Nantes 2022.pdfLes mythes et légendes du SEO - WebIsland Nantes 2022.pdf
Les mythes et légendes du SEO - WebIsland Nantes 2022.pdfNicolas AUDEMAR
 
Entity Seo Mastery
Entity Seo MasteryEntity Seo Mastery
Entity Seo MasteryDixon Jones
 
Quality Content at Scale Through Automated Text Summarization of UGC
Quality Content at Scale Through Automated Text Summarization of UGCQuality Content at Scale Through Automated Text Summarization of UGC
Quality Content at Scale Through Automated Text Summarization of UGCHamlet Batista
 
Crawl Budget: Everything you Need to Know
Crawl Budget: Everything you Need to KnowCrawl Budget: Everything you Need to Know
Crawl Budget: Everything you Need to KnowSallyR7
 
BrightonSEO Oct 2022_ Topical Authority Audits.pptx
BrightonSEO Oct 2022_ Topical Authority Audits.pptxBrightonSEO Oct 2022_ Topical Authority Audits.pptx
BrightonSEO Oct 2022_ Topical Authority Audits.pptxRobotZebraAgency
 
Seo y big data, rastreando lo que google rastrea - clinic seo - eshow
Seo y big data, rastreando lo que google rastrea - clinic seo - eshowSeo y big data, rastreando lo que google rastrea - clinic seo - eshow
Seo y big data, rastreando lo que google rastrea - clinic seo - eshowIñaki Huerta (ikhuerta)
 

Contenu connexe

Tendances

SEO 101 - Search Engine Optimization Basics - HubSpot
SEO 101 - Search Engine Optimization Basics - HubSpotSEO 101 - Search Engine Optimization Basics - HubSpot
SEO 101 - Search Engine Optimization Basics - HubSpotHubSpot
 
Coronavirus and Future of SEO: Digital Marketing and Remote Culture
Coronavirus and Future of SEO: Digital Marketing and Remote CultureCoronavirus and Future of SEO: Digital Marketing and Remote Culture
Coronavirus and Future of SEO: Digital Marketing and Remote CultureKoray Tugberk GUBUR
 
Entity-based SEO - Wordlift webinar - Studio Makoto Agenzia di Marketing.pptx
Entity-based SEO - Wordlift webinar - Studio Makoto Agenzia di Marketing.pptxEntity-based SEO - Wordlift webinar - Studio Makoto Agenzia di Marketing.pptx
Entity-based SEO - Wordlift webinar - Studio Makoto Agenzia di Marketing.pptxMassimiliano Geraci
 
SEO Migrations for International Web Setups
SEO Migrations for International Web SetupsSEO Migrations for International Web Setups
SEO Migrations for International Web SetupsNitin Manchanda
 
¡Que lo haga otro! Automatizaciones SEO para vivir mejor
¡Que lo haga otro! Automatizaciones SEO para vivir mejor¡Que lo haga otro! Automatizaciones SEO para vivir mejor
¡Que lo haga otro! Automatizaciones SEO para vivir mejorIñaki Huerta (ikhuerta)
 
Web Server SEO: Make your TTFB faster!
Web Server SEO: Make your TTFB faster!Web Server SEO: Make your TTFB faster!
Web Server SEO: Make your TTFB faster!Ash New
 
데이터는 차트가 아니라 돈이 되어야 한다.
데이터는 차트가 아니라 돈이 되어야 한다.데이터는 차트가 아니라 돈이 되어야 한다.
데이터는 차트가 아니라 돈이 되어야 한다.Yongho Ha
 
Technical SEO on the Jamstack by Zahid Mahmood @ BrightonSEO 2022
Technical SEO on the Jamstack by Zahid Mahmood @ BrightonSEO 2022Technical SEO on the Jamstack by Zahid Mahmood @ BrightonSEO 2022
Technical SEO on the Jamstack by Zahid Mahmood @ BrightonSEO 2022Zahid106217
 
Contenter tout le monde, Google et les internautes, grâce à un maillage inter...
Contenter tout le monde, Google et les internautes, grâce à un maillage inter...Contenter tout le monde, Google et les internautes, grâce à un maillage inter...
Contenter tout le monde, Google et les internautes, grâce à un maillage inter...Dan Bernier
 
How to Automatically Subcategorise Your Website Automatically With Python
How to Automatically Subcategorise Your Website Automatically With PythonHow to Automatically Subcategorise Your Website Automatically With Python
How to Automatically Subcategorise Your Website Automatically With Pythonsearchsolved
 
어떻게 하면 데이터 사이언티스트가 될 수 있나요?
어떻게 하면 데이터 사이언티스트가 될 수 있나요?어떻게 하면 데이터 사이언티스트가 될 수 있나요?
어떻게 하면 데이터 사이언티스트가 될 수 있나요?Yongho Ha
 
On a les CRO : 7 astuces conversion applicables dès demain
On a les CRO : 7 astuces conversion applicables dès demainOn a les CRO : 7 astuces conversion applicables dès demain
On a les CRO : 7 astuces conversion applicables dès demainAlexandraBornot
 
#SEOCamp - People Also Ask : Comment les exploiter au mieux ? par Alexis Rylko
#SEOCamp - People Also Ask : Comment les exploiter au mieux ? par Alexis Rylko#SEOCamp - People Also Ask : Comment les exploiter au mieux ? par Alexis Rylko
#SEOCamp - People Also Ask : Comment les exploiter au mieux ? par Alexis RylkoiProspect France
 
The Python Cheat Sheet for the Busy Marketer
The Python Cheat Sheet for the Busy MarketerThe Python Cheat Sheet for the Busy Marketer
The Python Cheat Sheet for the Busy MarketerHamlet Batista
 
오늘 밤부터 쓰는 google analytics (구글 애널리틱스, GA)
오늘 밤부터 쓰는 google analytics (구글 애널리틱스, GA) 오늘 밤부터 쓰는 google analytics (구글 애널리틱스, GA)
오늘 밤부터 쓰는 google analytics (구글 애널리틱스, GA) Yongho Ha
 
Befriend JavaScript- Your New Pal in Winning the Search Game -September 2023 ...
Befriend JavaScript- Your New Pal in Winning the Search Game -September 2023 ...Befriend JavaScript- Your New Pal in Winning the Search Game -September 2023 ...
Befriend JavaScript- Your New Pal in Winning the Search Game -September 2023 ...Izabela Wisniewska
 
Javascript, SEO and Dollhouses by - #5HoursofTechnicalSEO @SEMrush
Javascript, SEO and Dollhouses by - #5HoursofTechnicalSEO @SEMrushJavascript, SEO and Dollhouses by - #5HoursofTechnicalSEO @SEMrush
Javascript, SEO and Dollhouses by - #5HoursofTechnicalSEO @SEMrushKristina Azarenko
 
Google Sheets For SEO - Tom Pool - London SEO Meetup XL
Google Sheets For SEO - Tom Pool - London SEO Meetup XLGoogle Sheets For SEO - Tom Pool - London SEO Meetup XL
Google Sheets For SEO - Tom Pool - London SEO Meetup XLTom Pool
 

Tendances (20)

SEO 101 - Search Engine Optimization Basics - HubSpot
SEO 101 - Search Engine Optimization Basics - HubSpotSEO 101 - Search Engine Optimization Basics - HubSpot
SEO 101 - Search Engine Optimization Basics - HubSpot
 
Coronavirus and Future of SEO: Digital Marketing and Remote Culture
Coronavirus and Future of SEO: Digital Marketing and Remote CultureCoronavirus and Future of SEO: Digital Marketing and Remote Culture
Coronavirus and Future of SEO: Digital Marketing and Remote Culture
 
Entity-based SEO - Wordlift webinar - Studio Makoto Agenzia di Marketing.pptx
Entity-based SEO - Wordlift webinar - Studio Makoto Agenzia di Marketing.pptxEntity-based SEO - Wordlift webinar - Studio Makoto Agenzia di Marketing.pptx
Entity-based SEO - Wordlift webinar - Studio Makoto Agenzia di Marketing.pptx
 
SEO Migrations for International Web Setups
SEO Migrations for International Web SetupsSEO Migrations for International Web Setups
SEO Migrations for International Web Setups
 
¡Que lo haga otro! Automatizaciones SEO para vivir mejor
¡Que lo haga otro! Automatizaciones SEO para vivir mejor¡Que lo haga otro! Automatizaciones SEO para vivir mejor
¡Que lo haga otro! Automatizaciones SEO para vivir mejor
 
Web Server SEO: Make your TTFB faster!
Web Server SEO: Make your TTFB faster!Web Server SEO: Make your TTFB faster!
Web Server SEO: Make your TTFB faster!
 
데이터는 차트가 아니라 돈이 되어야 한다.
데이터는 차트가 아니라 돈이 되어야 한다.데이터는 차트가 아니라 돈이 되어야 한다.
데이터는 차트가 아니라 돈이 되어야 한다.
 
Technical SEO on the Jamstack by Zahid Mahmood @ BrightonSEO 2022
Technical SEO on the Jamstack by Zahid Mahmood @ BrightonSEO 2022Technical SEO on the Jamstack by Zahid Mahmood @ BrightonSEO 2022
Technical SEO on the Jamstack by Zahid Mahmood @ BrightonSEO 2022
 
Contenter tout le monde, Google et les internautes, grâce à un maillage inter...
Contenter tout le monde, Google et les internautes, grâce à un maillage inter...Contenter tout le monde, Google et les internautes, grâce à un maillage inter...
Contenter tout le monde, Google et les internautes, grâce à un maillage inter...
 
How to Automatically Subcategorise Your Website Automatically With Python
How to Automatically Subcategorise Your Website Automatically With PythonHow to Automatically Subcategorise Your Website Automatically With Python
How to Automatically Subcategorise Your Website Automatically With Python
 
어떻게 하면 데이터 사이언티스트가 될 수 있나요?
어떻게 하면 데이터 사이언티스트가 될 수 있나요?어떻게 하면 데이터 사이언티스트가 될 수 있나요?
어떻게 하면 데이터 사이언티스트가 될 수 있나요?
 
On a les CRO : 7 astuces conversion applicables dès demain
On a les CRO : 7 astuces conversion applicables dès demainOn a les CRO : 7 astuces conversion applicables dès demain
On a les CRO : 7 astuces conversion applicables dès demain
 
Schema Markup
Schema MarkupSchema Markup
Schema Markup
 
Entity seo
Entity seoEntity seo
Entity seo
 
#SEOCamp - People Also Ask : Comment les exploiter au mieux ? par Alexis Rylko
#SEOCamp - People Also Ask : Comment les exploiter au mieux ? par Alexis Rylko#SEOCamp - People Also Ask : Comment les exploiter au mieux ? par Alexis Rylko
#SEOCamp - People Also Ask : Comment les exploiter au mieux ? par Alexis Rylko
 
The Python Cheat Sheet for the Busy Marketer
The Python Cheat Sheet for the Busy MarketerThe Python Cheat Sheet for the Busy Marketer
The Python Cheat Sheet for the Busy Marketer
 
오늘 밤부터 쓰는 google analytics (구글 애널리틱스, GA)
오늘 밤부터 쓰는 google analytics (구글 애널리틱스, GA) 오늘 밤부터 쓰는 google analytics (구글 애널리틱스, GA)
오늘 밤부터 쓰는 google analytics (구글 애널리틱스, GA)
 
Befriend JavaScript- Your New Pal in Winning the Search Game -September 2023 ...
Befriend JavaScript- Your New Pal in Winning the Search Game -September 2023 ...Befriend JavaScript- Your New Pal in Winning the Search Game -September 2023 ...
Befriend JavaScript- Your New Pal in Winning the Search Game -September 2023 ...
 
Javascript, SEO and Dollhouses by - #5HoursofTechnicalSEO @SEMrush
Javascript, SEO and Dollhouses by - #5HoursofTechnicalSEO @SEMrushJavascript, SEO and Dollhouses by - #5HoursofTechnicalSEO @SEMrush
Javascript, SEO and Dollhouses by - #5HoursofTechnicalSEO @SEMrush
 
Google Sheets For SEO - Tom Pool - London SEO Meetup XL
Google Sheets For SEO - Tom Pool - London SEO Meetup XLGoogle Sheets For SEO - Tom Pool - London SEO Meetup XL
Google Sheets For SEO - Tom Pool - London SEO Meetup XL
 

Similaire à Screaming frog - l'outil ne fait pas l'artisan

Utilisation avancée d'un crawler - SEO Camp'us 2015
Utilisation avancée d'un crawler - SEO Camp'us 2015Utilisation avancée d'un crawler - SEO Camp'us 2015
Utilisation avancée d'un crawler - SEO Camp'us 2015Philippe YONNET
 
Drupal SEO - Optimiser son site
Drupal SEO - Optimiser son siteDrupal SEO - Optimiser son site
Drupal SEO - Optimiser son siteStéphane ARRAMI
 
Cours referencement optimisation
Cours referencement optimisationCours referencement optimisation
Cours referencement optimisationRémi Bachelet
 
Cours SEO / Référencement Naturel - août 2013
Cours SEO / Référencement Naturel - août 2013Cours SEO / Référencement Naturel - août 2013
Cours SEO / Référencement Naturel - août 2013Pierre Ammeloot
 
La casa de SEO : les questions à se poser pour le casse SEO parfait
La casa de SEO : les questions à se poser pour le casse SEO parfaitLa casa de SEO : les questions à se poser pour le casse SEO parfait
La casa de SEO : les questions à se poser pour le casse SEO parfaitAymeric Bouillat
 
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017Peak Ace
 
Choisir une solution e commerce compatible seo : quelle plateforme vous perme...
Choisir une solution e commerce compatible seo : quelle plateforme vous perme...Choisir une solution e commerce compatible seo : quelle plateforme vous perme...
Choisir une solution e commerce compatible seo : quelle plateforme vous perme...Philippe YONNET
 
Seocamp2016 : javascript et indexation, où en est-on ?
Seocamp2016 : javascript et indexation, où en est-on ?Seocamp2016 : javascript et indexation, où en est-on ?
Seocamp2016 : javascript et indexation, où en est-on ?Madeline Pinthon
 
Cours SEO débutant Polycom Lausanne
Cours SEO débutant Polycom LausanneCours SEO débutant Polycom Lausanne
Cours SEO débutant Polycom LausannePierre Ammeloot
 
Being Googlebot - de nouvelles clés pour optimiser le SEO
Being Googlebot - de nouvelles clés pour optimiser le SEOBeing Googlebot - de nouvelles clés pour optimiser le SEO
Being Googlebot - de nouvelles clés pour optimiser le SEODigimood - Agence SEO / SEA
 
Le SEO expliqué aux développeurs - Jean-Baptiste Marchand-Arvier
Le SEO expliqué aux développeurs - Jean-Baptiste Marchand-ArvierLe SEO expliqué aux développeurs - Jean-Baptiste Marchand-Arvier
Le SEO expliqué aux développeurs - Jean-Baptiste Marchand-ArvierLa Cuisine du Web
 
Comment un e-commerçant a multiplié son trafic SEO par 9,8 en 12 mois !
Comment un e-commerçant a multiplié son trafic SEO par 9,8 en 12 mois !Comment un e-commerçant a multiplié son trafic SEO par 9,8 en 12 mois !
Comment un e-commerçant a multiplié son trafic SEO par 9,8 en 12 mois !David Dragesco
 
Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016
Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016
Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016iProspect France
 
Livre blanc de sensibilisation au SEO
Livre blanc de sensibilisation au SEOLivre blanc de sensibilisation au SEO
Livre blanc de sensibilisation au SEOKseo Conseil
 
Les bonnes pratiques SEO avec PrestaShop et WordPress - CCI Montpellier
Les bonnes pratiques SEO avec PrestaShop et WordPress - CCI MontpellierLes bonnes pratiques SEO avec PrestaShop et WordPress - CCI Montpellier
Les bonnes pratiques SEO avec PrestaShop et WordPress - CCI MontpellierNicolas Mercatili
 
Moteurs de recherche et optimisation de classement
Moteurs de recherche et optimisation de classementMoteurs de recherche et optimisation de classement
Moteurs de recherche et optimisation de classementGuillaume Kulakowski
 
Le référencement naturel ou SEO
Le référencement naturel ou SEOLe référencement naturel ou SEO
Le référencement naturel ou SEOForestier Mégane
 
Webconférence SEO le 22 Novembre : Comment optimiser un site Demandware pour ...
Webconférence SEO le 22 Novembre : Comment optimiser un site Demandware pour ...Webconférence SEO le 22 Novembre : Comment optimiser un site Demandware pour ...
Webconférence SEO le 22 Novembre : Comment optimiser un site Demandware pour ...Peak Ace
 
Evolutions et nouveaux outils SEO
Evolutions et nouveaux outils SEOEvolutions et nouveaux outils SEO
Evolutions et nouveaux outils SEODimitri Brunel
 
Tripler son CA grâce au seo - Emmanuel De Vauxmoret - SEO Camp'us Paris 2020
Tripler son CA grâce au seo - Emmanuel De Vauxmoret - SEO Camp'us Paris 2020Tripler son CA grâce au seo - Emmanuel De Vauxmoret - SEO Camp'us Paris 2020
Tripler son CA grâce au seo - Emmanuel De Vauxmoret - SEO Camp'us Paris 2020SEO CAMP
 

Similaire à Screaming frog - l'outil ne fait pas l'artisan (20)

Utilisation avancée d'un crawler - SEO Camp'us 2015
Utilisation avancée d'un crawler - SEO Camp'us 2015Utilisation avancée d'un crawler - SEO Camp'us 2015
Utilisation avancée d'un crawler - SEO Camp'us 2015
 
Drupal SEO - Optimiser son site
Drupal SEO - Optimiser son siteDrupal SEO - Optimiser son site
Drupal SEO - Optimiser son site
 
Cours referencement optimisation
Cours referencement optimisationCours referencement optimisation
Cours referencement optimisation
 
Cours SEO / Référencement Naturel - août 2013
Cours SEO / Référencement Naturel - août 2013Cours SEO / Référencement Naturel - août 2013
Cours SEO / Référencement Naturel - août 2013
 
La casa de SEO : les questions à se poser pour le casse SEO parfait
La casa de SEO : les questions à se poser pour le casse SEO parfaitLa casa de SEO : les questions à se poser pour le casse SEO parfait
La casa de SEO : les questions à se poser pour le casse SEO parfait
 
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017
 
Choisir une solution e commerce compatible seo : quelle plateforme vous perme...
Choisir une solution e commerce compatible seo : quelle plateforme vous perme...Choisir une solution e commerce compatible seo : quelle plateforme vous perme...
Choisir une solution e commerce compatible seo : quelle plateforme vous perme...
 
Seocamp2016 : javascript et indexation, où en est-on ?
Seocamp2016 : javascript et indexation, où en est-on ?Seocamp2016 : javascript et indexation, où en est-on ?
Seocamp2016 : javascript et indexation, où en est-on ?
 
Cours SEO débutant Polycom Lausanne
Cours SEO débutant Polycom LausanneCours SEO débutant Polycom Lausanne
Cours SEO débutant Polycom Lausanne
 
Being Googlebot - de nouvelles clés pour optimiser le SEO
Being Googlebot - de nouvelles clés pour optimiser le SEOBeing Googlebot - de nouvelles clés pour optimiser le SEO
Being Googlebot - de nouvelles clés pour optimiser le SEO
 
Le SEO expliqué aux développeurs - Jean-Baptiste Marchand-Arvier
Le SEO expliqué aux développeurs - Jean-Baptiste Marchand-ArvierLe SEO expliqué aux développeurs - Jean-Baptiste Marchand-Arvier
Le SEO expliqué aux développeurs - Jean-Baptiste Marchand-Arvier
 
Comment un e-commerçant a multiplié son trafic SEO par 9,8 en 12 mois !
Comment un e-commerçant a multiplié son trafic SEO par 9,8 en 12 mois !Comment un e-commerçant a multiplié son trafic SEO par 9,8 en 12 mois !
Comment un e-commerçant a multiplié son trafic SEO par 9,8 en 12 mois !
 
Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016
Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016
Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016
 
Livre blanc de sensibilisation au SEO
Livre blanc de sensibilisation au SEOLivre blanc de sensibilisation au SEO
Livre blanc de sensibilisation au SEO
 
Les bonnes pratiques SEO avec PrestaShop et WordPress - CCI Montpellier
Les bonnes pratiques SEO avec PrestaShop et WordPress - CCI MontpellierLes bonnes pratiques SEO avec PrestaShop et WordPress - CCI Montpellier
Les bonnes pratiques SEO avec PrestaShop et WordPress - CCI Montpellier
 
Moteurs de recherche et optimisation de classement
Moteurs de recherche et optimisation de classementMoteurs de recherche et optimisation de classement
Moteurs de recherche et optimisation de classement
 
Le référencement naturel ou SEO
Le référencement naturel ou SEOLe référencement naturel ou SEO
Le référencement naturel ou SEO
 
Webconférence SEO le 22 Novembre : Comment optimiser un site Demandware pour ...
Webconférence SEO le 22 Novembre : Comment optimiser un site Demandware pour ...Webconférence SEO le 22 Novembre : Comment optimiser un site Demandware pour ...
Webconférence SEO le 22 Novembre : Comment optimiser un site Demandware pour ...
 
Evolutions et nouveaux outils SEO
Evolutions et nouveaux outils SEOEvolutions et nouveaux outils SEO
Evolutions et nouveaux outils SEO
 
Tripler son CA grâce au seo - Emmanuel De Vauxmoret - SEO Camp'us Paris 2020
Tripler son CA grâce au seo - Emmanuel De Vauxmoret - SEO Camp'us Paris 2020Tripler son CA grâce au seo - Emmanuel De Vauxmoret - SEO Camp'us Paris 2020
Tripler son CA grâce au seo - Emmanuel De Vauxmoret - SEO Camp'us Paris 2020
 

Plus de Aymeric Bouillat

Dans la jungle des sites mobiles - comment les rendre (vraiment) SEO-friendly ?
Dans la jungle des sites mobiles  - comment les rendre (vraiment) SEO-friendly ?Dans la jungle des sites mobiles  - comment les rendre (vraiment) SEO-friendly ?
Dans la jungle des sites mobiles - comment les rendre (vraiment) SEO-friendly ?Aymeric Bouillat
 
Mystères et associés dans les résultats de Google
Mystères et associés dans les résultats de GoogleMystères et associés dans les résultats de Google
Mystères et associés dans les résultats de GoogleAymeric Bouillat
 
La mise en cache et ses secrets
La mise en cache et ses secretsLa mise en cache et ses secrets
La mise en cache et ses secretsAymeric Bouillat
 
Migration seo - astuces techniques pour améliorer votre trafic
Migration seo - astuces techniques pour améliorer votre traficMigration seo - astuces techniques pour améliorer votre trafic
Migration seo - astuces techniques pour améliorer votre traficAymeric Bouillat
 
Seo mobile - bonnes pratiques
Seo mobile -  bonnes pratiquesSeo mobile -  bonnes pratiques
Seo mobile - bonnes pratiquesAymeric Bouillat
 
Site mobile et SEO - les erreurs à ne pas commettre
Site mobile et SEO - les erreurs à ne pas commettreSite mobile et SEO - les erreurs à ne pas commettre
Site mobile et SEO - les erreurs à ne pas commettreAymeric Bouillat
 

Plus de Aymeric Bouillat (7)

Dans la jungle des sites mobiles - comment les rendre (vraiment) SEO-friendly ?
Dans la jungle des sites mobiles  - comment les rendre (vraiment) SEO-friendly ?Dans la jungle des sites mobiles  - comment les rendre (vraiment) SEO-friendly ?
Dans la jungle des sites mobiles - comment les rendre (vraiment) SEO-friendly ?
 
Mystères et associés dans les résultats de Google
Mystères et associés dans les résultats de GoogleMystères et associés dans les résultats de Google
Mystères et associés dans les résultats de Google
 
La mise en cache et ses secrets
La mise en cache et ses secretsLa mise en cache et ses secrets
La mise en cache et ses secrets
 
Migration seo - astuces techniques pour améliorer votre trafic
Migration seo - astuces techniques pour améliorer votre traficMigration seo - astuces techniques pour améliorer votre trafic
Migration seo - astuces techniques pour améliorer votre trafic
 
Netlinking en 2015
Netlinking en 2015Netlinking en 2015
Netlinking en 2015
 
Seo mobile - bonnes pratiques
Seo mobile -  bonnes pratiquesSeo mobile -  bonnes pratiques
Seo mobile - bonnes pratiques
 
Site mobile et SEO - les erreurs à ne pas commettre
Site mobile et SEO - les erreurs à ne pas commettreSite mobile et SEO - les erreurs à ne pas commettre
Site mobile et SEO - les erreurs à ne pas commettre
 

Screaming frog - l'outil ne fait pas l'artisan

  • 1. Screaming Frog L’outil ne fait pas l’artisan Cycle technique
  • 2. #seocampParis 2020 2 Aymeric Bouillat Consultant SEO technique dans l’agence SEO (groupe ) • Des affinités avec le SEO technique • Spécialiste des migrations de site • Et un blog plus trop à jour…. https://www.yapasdequoi.com Pour me suivre sur Twitter : @aymerictwit
  • 3. #seocampParis 2020 3 A quoi ça sert? Analyse des balises SEO Extraction de données précises dans les pages Découverte des problématiques de duplication Examen des directives pour les robots Analyse des redirections Crawl avec un rendu JS, comme Google Détection des liens cassés Visualisation de l’architecture d’un site et de son maillage Connexions à des API (Search Console, GA, Ahrefs, etc) Génération de sitemaps XML
  • 4. #seocampParis 2020 4 3 choses à savoir
  • 6. #seocampParis 2020 6 Préférez le mode Base de données • Un crawl, c’est gourmand ! (Configuration > Storage mode) • Memory = 3Go min.  crawls de moins de 100.000 URL : plus rapide, moins souple • Database storage = avoir un disque SSD : plus souple, permet le crawl de gros sites
  • 7. #seocampParis 2020 7 Database storage : mode « projet » • Gérer ses crawls par client (File > Crawls ) Penser à faire le ménage de temps en temps
  • 8. #seocampParis 2020 Préparer son crawl avant de se lancer 8
  • 9. #seocampParis 2020 9 Ne pas oublier ! • Utiliser la commande « site: » • Faire un « précrawl » avant le crawl complet • Prévenir le client ou l’hébergeur (éviter la blacklist) • Sauvegarder sa configuration
  • 10. #seocampParis 2020 10 Database storage : mode « projet » • Définir ce que l’on souhaite crawler, et stocker •  Store permet de conserver toutes les relations (liens entrants et sortants) • Objectif : Limiter le poids des fichiers dans la base de données
  • 11. #seocampParis 2020 11 Comportement du crawler Si il ne fallait en retenir que 6 : • Configuration « User-agent » : dynamic serving /site mobile dédié • Craw Linked Xml Sitemaps(onglet « Crawl ») • Extraction JSON-LD +microdata (onglet « Extraction ») • Store HTML/rendered HTML (onglet « Extraction ») • Effectuer un rendu JS (onglet « Rendering ») • Respect « canonical » & « noindex » en fonction des besoins…(Onglet « Advanced ») Aucun crawl ne se ressemble…
  • 12. #seocampParis 2020 12 Modifier des URL à la volée Case study  HTTP vers HTTPS  Suppression du #, ex: /faq#question1 /faq#question2 (avec le rendu JS, les URL avec # sont explorées, on va regrouper les signaux)
  • 13. #seocampParis 2020 13 Site en développement Menu Configuration > Authentification 2 méthodes : Authentification serveur standard ou Formulaire de login • Adapter le robots.txt si nécessaire • Informer client/hébergeur de l’IP et de l’UA utilisé Penser à l’exclusion des URL « touchy »
  • 14. #seocampParis 2020 • « Let’s crawl by night » ! • Crawl régulier (utile pour faire des comparaisons) • Possibilité de générer des exports auto (csv, xlsx,..) • Génération automatisée de sitemaps 14 Et le crawl programmable?
  • 15. #seocampParis 2020 15 Crawl sans interface ! • Pas d’interface graphique = Idéal pour un serveur Préparer un fichier de configuration et générer ses exports automatiquement ! --config "C:UsersAymeric.BouillatCrawlsconfig-mobile.seospidercon
  • 16. #seocampParis 2020 Il manquerait pas quelque chose? 16
  • 17. #seocampParis 2020 17 A la pêche aux données : scrappons! Extraire des données des pages Web, pour qualifier, analyser et optimiser! Fil d’Ariane Nombre d’avis Stock Descriptif Code de tracking GA Le type de page (ex: listing, produit, édito, etc.) Nombre de commentaires
  • 18. #seocampParis 2020 18 Exemples d’utilisations SEO Récupérer des éléments précis sur une page Web: Fil d’Ariane (ex: qualifier/organiser ses URL) Détecter des typologies de pages Sur un site e-commerce l’état en stock d’un produit (disponibilité / liens vers des produits épuisés) le nombre d’avis sur un produit (pages produits avec peu d’avis) le nombre de commentaires Sur un site de contenu le nom de l’auteur d’un article la date de publication d’un article Et en général: le nombre de blocs catégories le contenu principal (contenu d’un paragraphe précis) les données Opengraph/TwitterCards les URL des vidéos Youtube etc. Cf. « Annexe scraping » en fin de présentation
  • 19. #seocampParis 2020 Analyse & interprétation 19
  • 20. #seocampParis 2020 20 Attention aux erreurs d’interprétation Profondeur des URL Près d’un tiers de vos URL sont accessibles en 4 clics depuis la page d’accueil. C’est très grave d’un point de vue maillage. La majeure partie des URL en profondeur 4 sont des URL d’ images (liens vers des images), ça va…
  • 21. #seocampParis 2020 21 Problématiques d’URL Focus sur les paramètres d’URL (ex: tri, filtre, pagination etc.)  Pertinence des URL (si indexables)  C’est pas parce qu’il y a écrit « canonical » que c’est bien ! (ex: pagination vers la 1ere page…)
  • 22. #seocampParis 2020 22 Codes réponse : par typologie de page/URL Beaucoup de redirections? - similarité entre les redirections (pages de destination) - source des redirections (lien ? Canonical ? hreflang ? AMP ? ) - erreur de lien? La page de destination existe peut être !
  • 23. #seocampParis 2020 23 Redirections 301 Un poisson peut en cacher un autre Une redirection aussi peut en cacher une autre...
  • 24. #seocampParis 2020 24 Regrouper les redirections par type
  • 25. #seocampParis 2020 25 Pas d’erreurs 404 ? Ça n’est pas forcément bon signe…!
  • 26. #seocampParis 2020 26 Attention aux softs 404  Tester des URL inexistantes et regarder le code réponse. Ex: /url-qui-n-existe-pas Statut HTTP de l’URL en 200 ? (et non 404)
  • 27. #seocampParis 2020 27 Retrouver le chemin Ex: Retrouver l’origine d’un lien cassé  Clic-droit puis « Crawl Path Report »
  • 28. #seocampParis 2020 28 Et les balises <title>…</title>? Beaucoup de duplicate au premier abord? mais il peut être « logique » (ex: pagination)
  • 29. #seocampParis 2020 29 Faire des exclusions pour y voir + clair Pour voir toutes les URL qui ne contiennent pas « page=… » ^((?!page=).)*$  Afficher les URL ne contenant pas « page= » via une regexp.
  • 30. #seocampParis 2020 30 Contenu dupliqué Un nouvel onglet dans Screaming Frog ! Comparer les différences entre 2 pages très similaires
  • 31. #seocampParis 2020 31 Trop de similarité à cause d’un mega-menu ? Ne pas tenir compte de certains éléments HTML, c’est possible 
  • 33. #seocampParis 2020 33 Maillage Maillage interne : bien ou pas? Ça dépend de ce qu’on regarde Attention : ne représente pas l’intégralité des liens, mais juste le chemin le + court pour accéder à chaque URL
  • 34. #seocampParis 2020 34 Visualisation Mettre en avant des défauts de maillage, ou identifier des pages en fonctions de certains KPI • Voir si des URL fortement maillées ne sont pas indexables (Canonical, redirection, noindex)  perte de PageRank interne • Voir où se situent dans le maillage les URL qui génèrent le plus de trafic • Link score : page rank interne de screaming Frog
  • 35. #seocampParis 2020 35 Perte de jus Dilution de la popularité vers des pages en noindex (en rouge) :
  • 36. #seocampParis 2020 36 Mieux comprendre le maillage d’une page Ancres de liens : renforcer les variations sémantiques
  • 37. #seocampParis 2020 37 Principales occurrences d’un contenu Avoir préalablement coché la case « Store HTML » de l’onglet « Extraction » lors de la config du crawl
  • 39. #seocampParis 2020 39 + de données avec une analyse de crawl Menu « Crawl analysis »  « Start » Voir les URL non maillées détectées par ailleurs (hreflang, canonical, sitemap, AMP, API, etc.)
  • 40. #seocampParis 2020 40 URL non maillées URL introuvables lors du crawl mais existantes par ailleurs URL n’ayant jamais reçu de liens URL ne recevant plus de liens  Renforcer le maillage
  • 41. #seocampParis 2020 41 Orphan URL via les API Permet de mettre en avant les URL présentes dans le sitemap, mais aussi la Search Console, Google Analytics, et qui n’ont pas été trouvées lors du crawl. (cf. les onglets correspondants)
  • 42. #seocampParis 2020 42 Question Mug Quel est le dernier onglet qui a vu le jour en Juillet 2020 dans Screaming Frog ?
  • 43. #seocampParis 2020 43 Réponse Mug L’onglet « Content » ! On peut même faire de la détection de fautes de grammaire et d’orthographe :
  • 44. #seocampParis 2020 Merci! Des questions? 44 Pour me suivre sur Twitter : @aymerictwit
  • 47. #seocampParis 2020 47 Paramétrage de l’extraction Rechercher un élément via: - Texte - Expression régulière Rechercher via - Xpath (<3) - Un sélecteur CSS
  • 48. #seocampParis 2020 48 Type d’éléments à extraire <div class="bloc-content-title"> <div class="bloc-title-readmore"> <a href="/news" class="read-more-title"><i class="fa fa-arrow-circle-o-right"></i> Voir plus</a> </div> <h2 class="ellipsis ellipsis-1l">News</h2> </div> <div class="bloc-content-title"> <div class="bloc-title-readmore"> <a href="/news" class="read-more-title"><i class="fa fa-arrow-circle-o-right"></i> Voir plus</a> </div> <h2 class="ellipsis ellipsis-1l">News</h2> </div> <div class="bloc-title-readmore"> <a href="/news" class="read-more-title"><i class="fa fa-arrow-circle-o-right"></i> Voir plus</a> </div> <h2 class="ellipsis ellipsis-1l">News</h2> Voir plus News //div[@class=“bloc-content-title“]
  • 49. #seocampParis 2020 49 Exemples Xpath vs HTML //div[@id="wayfinding-breadcrumbs_feature_div"]/li[not(@class)] //ul[@class="a-unordered-list a-vertical a-spacing-mini"]/li/span //span[@id="acrCustomerReviewText"] (//span[@class="a-icon-alt"])[1]  la première balise de ce type //div[@id="availability"]/span Descriptif Nbe commentaires Nbe avis Stock Fil d’Ariane https://devhints.io/xpathAntisèche :

Notes de l'éditeur

  1. List, serp, crawl