Conférence sur l'outil Screaming Frog lors du SEOCampus Paris 2020.
Screaming Frog Seo Spider est un crawler qui est utilisé par de nombreux référenceurs. C'est un outil puissant pour effectuer des analyses SEO, mais il est parfois sous-exploité. En effet, cet outil est en constante évolution, et certaines nouveautés sont discrètes ert bien cachées dans le smultiples menus!
L'outil ne fait pas l'artisan : avoir des données c'est bien mais savoir les interpréter correctement c'est mieux ;)
Ranker n’est pas toujours simple. Avant de s’attaquer aux top positions, il est nécessaire de faire une bonne reconnaissance du terrain pour savoir où l’on met les pieds. Avec des exemples concrets, nous verrons comment sortir des sentiers des battus pour renforcer la pertinence de ses pages, tout en étant mobile. Les optimisations qui vous permettront de faire la différence pour espérer rejoindre le Top 3 seront passées en revue, avec plusieurs astuces et des stratégies qui sortent de l’ordinaire.
White hat SEO refers to ethical techniques like optimizing content for users by using relevant keywords. Black hat SEO focuses only on search engines through manipulative methods like keyword stuffing that break guidelines. Grey hat SEO uses a mix of both white and black hat techniques, such as domain grabbing which purchases expired domains to build existing authority. Common black hat techniques include link schemes, paid links, hidden text, and automated article spinning.
Google Lighthouse is super valuable but it only checks one page at a time.
Hamlet will show you how to get it to check all pages of a site, and how to run automated Lighthouse checks on-demand at scheduled intervals and from automated tests.
He'll also cover how to set performance budgets, how to get alerts when budgets are exceeded, and how to aggregate page reports using BigQuery and Google Data Studio.
This document provides an introduction to Google Search Console, formerly known as Google Webmaster Tools. Search Console is a free Google platform that informs website owners about the health of their site and how it appears in Google search results. It allows users to set a preferred domain, submit sitemaps, check crawl errors and links, and be notified of any Google penalties. Search Console ensures a site is accessible to Google bots and provides analytics, recommendations, and notifications to improve search performance.
Mike King examines the state of the SEO industry and talks through knowing information retrieval will help improve our understanding of Google. This talk debuted at MozCon
principes du référencement SEO, histoire du référencement, principaux critères SEO, pratiques de recherche, évolution de la recherche, guides SEO, liens SEO
En esta charla se explican casos de uso concretos para agilizar análisis SEO utilizando programación, en este caso, R y Rstudio, como por ejemplo:
- Sustituir tareas tediosas y repetitivas de excel
- Fusionar datos entre distintas herramientas SEO, que por defecto, no nos dan y crear visualizaciones automáticamente
- Trabajar series temporales para entender mejor tendencias, ciclos y eventos externos que afecten
- Atacar APIs de distintos servicios, útiles para SEO, como SISTRIX, Google Analytics, Google Search Console, Google Trends, Twitter, etc.
Próximamente compartiré una guía paso a paso para iniciarse en R y agilizar los análisis SEO.
BrightonSEO October 2022 - Log File Analysis - Steven van Vessum.pdfSteven van Vessum
This document discusses how log file insights can help companies improve their crawling, indexing and organic marketing performance. It outlines some of the common issues companies face like not understanding search engine behavior and not reflecting on their past work. With log file insights accessible in real-time and automatically distilled, companies can answer critical questions to speed up their crawl times, see how search engines are handling their updated content and troubleshoot issues. The presenter promotes their solution, ContentKing, which provides real-time log file analysis from CDN logs to help companies learn what search engines know and keep sharpening their SEO strategies.
Ranker n’est pas toujours simple. Avant de s’attaquer aux top positions, il est nécessaire de faire une bonne reconnaissance du terrain pour savoir où l’on met les pieds. Avec des exemples concrets, nous verrons comment sortir des sentiers des battus pour renforcer la pertinence de ses pages, tout en étant mobile. Les optimisations qui vous permettront de faire la différence pour espérer rejoindre le Top 3 seront passées en revue, avec plusieurs astuces et des stratégies qui sortent de l’ordinaire.
White hat SEO refers to ethical techniques like optimizing content for users by using relevant keywords. Black hat SEO focuses only on search engines through manipulative methods like keyword stuffing that break guidelines. Grey hat SEO uses a mix of both white and black hat techniques, such as domain grabbing which purchases expired domains to build existing authority. Common black hat techniques include link schemes, paid links, hidden text, and automated article spinning.
Google Lighthouse is super valuable but it only checks one page at a time.
Hamlet will show you how to get it to check all pages of a site, and how to run automated Lighthouse checks on-demand at scheduled intervals and from automated tests.
He'll also cover how to set performance budgets, how to get alerts when budgets are exceeded, and how to aggregate page reports using BigQuery and Google Data Studio.
This document provides an introduction to Google Search Console, formerly known as Google Webmaster Tools. Search Console is a free Google platform that informs website owners about the health of their site and how it appears in Google search results. It allows users to set a preferred domain, submit sitemaps, check crawl errors and links, and be notified of any Google penalties. Search Console ensures a site is accessible to Google bots and provides analytics, recommendations, and notifications to improve search performance.
Mike King examines the state of the SEO industry and talks through knowing information retrieval will help improve our understanding of Google. This talk debuted at MozCon
principes du référencement SEO, histoire du référencement, principaux critères SEO, pratiques de recherche, évolution de la recherche, guides SEO, liens SEO
En esta charla se explican casos de uso concretos para agilizar análisis SEO utilizando programación, en este caso, R y Rstudio, como por ejemplo:
- Sustituir tareas tediosas y repetitivas de excel
- Fusionar datos entre distintas herramientas SEO, que por defecto, no nos dan y crear visualizaciones automáticamente
- Trabajar series temporales para entender mejor tendencias, ciclos y eventos externos que afecten
- Atacar APIs de distintos servicios, útiles para SEO, como SISTRIX, Google Analytics, Google Search Console, Google Trends, Twitter, etc.
Próximamente compartiré una guía paso a paso para iniciarse en R y agilizar los análisis SEO.
BrightonSEO October 2022 - Log File Analysis - Steven van Vessum.pdfSteven van Vessum
This document discusses how log file insights can help companies improve their crawling, indexing and organic marketing performance. It outlines some of the common issues companies face like not understanding search engine behavior and not reflecting on their past work. With log file insights accessible in real-time and automatically distilled, companies can answer critical questions to speed up their crawl times, see how search engines are handling their updated content and troubleshoot issues. The presenter promotes their solution, ContentKing, which provides real-time log file analysis from CDN logs to help companies learn what search engines know and keep sharpening their SEO strategies.
The Ultimate Guide to Scrapebox - The Only Scrapebox Tutorial You Needfrankmo920
This resource is going to teach you how to become a Scrapebox master, so brace yourself. For many years the SEO neighborhood has been needing one real supreme Scrapebox tutorial, however, no SEO has actually been brave enough to see it all the way through. Initially, I believed it would be difficult to finish. However then five weeks and 9,000 words later it was lastly here, take pleasure in everybody.
Commerce Platforms PDP Content Strategy: Amazon and Beyond - BrightonSEO Oct ...MargoHowie
My presentation for the Ecommerce SEO track for BrightonSEO on approaching PDP content strategy, maximising listings, and avoiding common mistakes. For more information, please contact the MediaCom eCom Practice.
This document discusses how to control Googlebot's crawling of a website. It notes that Googlebot often does not crawl all pages of large websites due to limited crawl budgets. It recommends analyzing website logs and other metrics like pages crawled, indexed, ranked, impressions, clicks and conversions to understand Googlebot's behavior. The key factors that influence Googlebot are described as the "magic triangle" of links, content, and technical aspects. All three need attention to help Googlebot fully crawl and index a website.
Brighton SEO Sept 2023 - How & Why the history of SEO will help us plan for t...Varn
Here is the slides to my talk from Brighton SEO, Sept 2023.
The talk was about how & why the history of SEO will help us plan for the future of search.
This document introduces methods and tools for planning and creating optimized content using natural language processing techniques. It discusses using Distilled NLP to study top-ranking pages in a vertical, identify common topics and how they are combined, and then analyze and optimize one's own content. Specific tools mentioned include SEO Moonshine for implementing Distilled NLP, Majestic for backlink analysis and identifying topical trust flow, and TechSEO360 for keyword analysis. The overall goal is to identify recurring concepts across related pages and use those common topics to target user intent and improve content and search performance.
SEO In 2022: Google Discover and Microsite SERPs - (SEMrush Webinar)Evolving SEO
My presentation for the SEMrush webinar with Aleyda Solis and Mordy Oberstein on the Biggest Developments in SEO in 2021 and what to do about them in 2022. I focused on Google Discover and Google's SERP 'Microsites'.
BrightonSEO March 2021 | Dan Taylor, Image Entity TagsDan Taylor
My talk from BrightonSEO 2021; focusing on using Google's image category labels (glancing into the Knowledge Graph and Google's image annotation processes) for better topic research and content optimization.
Les mythes et légendes du SEO - WebIsland Nantes 2022.pdfNicolas AUDEMAR
Afin de cerner et comprendre ce qui a de l’importance en SEO (et surtout ce qui n’en a pas !) nous démonterons certains mythes grâce à des données illustrées par des exemples.
Entity SEO is an advanced approach to SEO concerning both on-page and off-page optimization activities. This approach considers not only the keywords, but also the entities or subtopics that constitute the page‘s topic. It allows for better targeting of content creation, keyword research, backlinks and social media outreach.
Google Search Console is a free tool that allows website owners to monitor and optimize their site's performance in Google search results. It provides insights into how Google sees the site through data on indexing, errors, and search queries. To get started, users simply enter their website URL which links their site to the Search Console dashboard for ongoing access and reporting.
BrightonSEO - Master Crawl Budget Optimization for Enterprise WebsitesManick Bhan
For every website on the internet, Google has a fixed budget for how many pages their bots can and are willing to crawl. The internet is a big place, so Googlebot can only spend so much time crawling and indexing our websites. Crawl budget optimization is the process of ensuring that the right pages of our websites end up in Google’s index and are ultimately shown to searchers.
Google’s recommendations for optimizing crawl budget are rather limited, because Googlebot crawls through most websites without reaching its limit. But enterprise-level and ecommerce sites with thousands of landing pages are at risk of maxing out their budget. A 2018 study even found that Google’s crawlers failed to crawl over half of the webpages of larger sites in the experiment.
Influencing how crawl budget is spent can be a more difficult technical optimization for strategists to implement. But for enterprise-level and ecommerce sites, it’s worth the effort to maximize crawl budget where you can. With a few tweaks, site owners and SEO strategists can guide Googlebot to regularly crawl and index their best-performing pages.
This document provides an overview of key trends in ecommerce SEO. It discusses moving from chasing keywords and links to focusing on creating quality experiences and content for users. Technical SEO is becoming more important, including optimizing for mobile where 25% of organic traffic comes from. The document also covers challenges like "hidden" search data from platforms like iOS 6 and loss of clickshare to product listing ads. It emphasizes understanding your audience and data trends to effectively implement SEO strategies.
"En SEO, améliorer son maillage interne grâce au test & learn : étude de cas ...Dan Bernier
Dans le cadre du SDDAY, le samedi 9 décembre 2023, j'ai présenté la conférence avec le titre suivant "En SEO, améliorer son maillage interne grâce au test & learn : étude de cas et méthodologie" basée sur un projet réalisé en 2023 qui a permis de mettre en oeuvre un projet de test & learn.
La conférence a donné aux participants et participantes les clés pour faire appliquer leurs recommandations de maillage interne dans un environnement impliquant des personnes aux profils différents (marketing, client, technique…) avec réussite tout en limitant l'impact des problèmes impondérables liés au projet SEO
3 HACKS PARA CONSEGUIR MÁS LEADS Y MEJORAR TU SEO, UX y CROIñaki Tovar
Implantación de un sistema de reserva de citas priorizando la captación de leads de Whatsapps sobre emails y la importancia de esto.
Automatización de la recolección de opiniones en tu web y sus beneficios a nivel SEO y CRO.
Análisis del comportamiento de los usuarios para mejorar UX y CRO
How to leverage indexation tracking to monitor issues and improve performanceSimon Lesser
Understanding and diagnosing indexation issues is vital to SEO success, but until very recently, getting good data was nearly impossible. Google’s newly-introduced URL Inspection API opens a new world of possibilities for tracking indexation. In this talk, Simon explores how to leverage this data to monitor status, spot changes, and catch issues in realtime — no coding required!
Este documento presenta una introducción a los comandos básicos de línea de comandos como cat, grep y sed, y cómo se pueden combinar para extraer y filtrar información de archivos de texto. También discute comandos más avanzados como wget y curl que son útiles para acceder y navegar sitios web, y cómo se pueden encadenar estos comandos para realizar tareas como extraer enlaces de sitemaps.
Patrick Stox gives a presentation on how search works. He discusses how Google crawls and indexes websites, processes content, handles queries, and ranks results. Some key points include: Google's crawler downloads pages and files from websites; processing includes duplicate detection, link parsing, and content analysis; queries are understood through techniques like spelling correction and query expansion; and search results are ranked based on numerous freshness, popularity, and relevancy signals.
Using Tags & Taxonomies to super charge your eCommerce SEOMichael King
Using tags and taxonomies can supercharge ecommerce SEO. Properly labeling products and categorizing them allows for (1) better targeting of long-tail keywords, (2) improved internal linking to distribute PageRank, and (3) helping Google's crawlers discover content more efficiently. Key recommendations include designing three-level categorization for products and using tags to link diverse products. Automating recommendations and dynamic linking based on tags and attributes can further boost performance.
The Ultimate Guide to Scrapebox - The Only Scrapebox Tutorial You Needfrankmo920
This resource is going to teach you how to become a Scrapebox master, so brace yourself. For many years the SEO neighborhood has been needing one real supreme Scrapebox tutorial, however, no SEO has actually been brave enough to see it all the way through. Initially, I believed it would be difficult to finish. However then five weeks and 9,000 words later it was lastly here, take pleasure in everybody.
Commerce Platforms PDP Content Strategy: Amazon and Beyond - BrightonSEO Oct ...MargoHowie
My presentation for the Ecommerce SEO track for BrightonSEO on approaching PDP content strategy, maximising listings, and avoiding common mistakes. For more information, please contact the MediaCom eCom Practice.
This document discusses how to control Googlebot's crawling of a website. It notes that Googlebot often does not crawl all pages of large websites due to limited crawl budgets. It recommends analyzing website logs and other metrics like pages crawled, indexed, ranked, impressions, clicks and conversions to understand Googlebot's behavior. The key factors that influence Googlebot are described as the "magic triangle" of links, content, and technical aspects. All three need attention to help Googlebot fully crawl and index a website.
Brighton SEO Sept 2023 - How & Why the history of SEO will help us plan for t...Varn
Here is the slides to my talk from Brighton SEO, Sept 2023.
The talk was about how & why the history of SEO will help us plan for the future of search.
This document introduces methods and tools for planning and creating optimized content using natural language processing techniques. It discusses using Distilled NLP to study top-ranking pages in a vertical, identify common topics and how they are combined, and then analyze and optimize one's own content. Specific tools mentioned include SEO Moonshine for implementing Distilled NLP, Majestic for backlink analysis and identifying topical trust flow, and TechSEO360 for keyword analysis. The overall goal is to identify recurring concepts across related pages and use those common topics to target user intent and improve content and search performance.
SEO In 2022: Google Discover and Microsite SERPs - (SEMrush Webinar)Evolving SEO
My presentation for the SEMrush webinar with Aleyda Solis and Mordy Oberstein on the Biggest Developments in SEO in 2021 and what to do about them in 2022. I focused on Google Discover and Google's SERP 'Microsites'.
BrightonSEO March 2021 | Dan Taylor, Image Entity TagsDan Taylor
My talk from BrightonSEO 2021; focusing on using Google's image category labels (glancing into the Knowledge Graph and Google's image annotation processes) for better topic research and content optimization.
Les mythes et légendes du SEO - WebIsland Nantes 2022.pdfNicolas AUDEMAR
Afin de cerner et comprendre ce qui a de l’importance en SEO (et surtout ce qui n’en a pas !) nous démonterons certains mythes grâce à des données illustrées par des exemples.
Entity SEO is an advanced approach to SEO concerning both on-page and off-page optimization activities. This approach considers not only the keywords, but also the entities or subtopics that constitute the page‘s topic. It allows for better targeting of content creation, keyword research, backlinks and social media outreach.
Google Search Console is a free tool that allows website owners to monitor and optimize their site's performance in Google search results. It provides insights into how Google sees the site through data on indexing, errors, and search queries. To get started, users simply enter their website URL which links their site to the Search Console dashboard for ongoing access and reporting.
BrightonSEO - Master Crawl Budget Optimization for Enterprise WebsitesManick Bhan
For every website on the internet, Google has a fixed budget for how many pages their bots can and are willing to crawl. The internet is a big place, so Googlebot can only spend so much time crawling and indexing our websites. Crawl budget optimization is the process of ensuring that the right pages of our websites end up in Google’s index and are ultimately shown to searchers.
Google’s recommendations for optimizing crawl budget are rather limited, because Googlebot crawls through most websites without reaching its limit. But enterprise-level and ecommerce sites with thousands of landing pages are at risk of maxing out their budget. A 2018 study even found that Google’s crawlers failed to crawl over half of the webpages of larger sites in the experiment.
Influencing how crawl budget is spent can be a more difficult technical optimization for strategists to implement. But for enterprise-level and ecommerce sites, it’s worth the effort to maximize crawl budget where you can. With a few tweaks, site owners and SEO strategists can guide Googlebot to regularly crawl and index their best-performing pages.
This document provides an overview of key trends in ecommerce SEO. It discusses moving from chasing keywords and links to focusing on creating quality experiences and content for users. Technical SEO is becoming more important, including optimizing for mobile where 25% of organic traffic comes from. The document also covers challenges like "hidden" search data from platforms like iOS 6 and loss of clickshare to product listing ads. It emphasizes understanding your audience and data trends to effectively implement SEO strategies.
"En SEO, améliorer son maillage interne grâce au test & learn : étude de cas ...Dan Bernier
Dans le cadre du SDDAY, le samedi 9 décembre 2023, j'ai présenté la conférence avec le titre suivant "En SEO, améliorer son maillage interne grâce au test & learn : étude de cas et méthodologie" basée sur un projet réalisé en 2023 qui a permis de mettre en oeuvre un projet de test & learn.
La conférence a donné aux participants et participantes les clés pour faire appliquer leurs recommandations de maillage interne dans un environnement impliquant des personnes aux profils différents (marketing, client, technique…) avec réussite tout en limitant l'impact des problèmes impondérables liés au projet SEO
3 HACKS PARA CONSEGUIR MÁS LEADS Y MEJORAR TU SEO, UX y CROIñaki Tovar
Implantación de un sistema de reserva de citas priorizando la captación de leads de Whatsapps sobre emails y la importancia de esto.
Automatización de la recolección de opiniones en tu web y sus beneficios a nivel SEO y CRO.
Análisis del comportamiento de los usuarios para mejorar UX y CRO
How to leverage indexation tracking to monitor issues and improve performanceSimon Lesser
Understanding and diagnosing indexation issues is vital to SEO success, but until very recently, getting good data was nearly impossible. Google’s newly-introduced URL Inspection API opens a new world of possibilities for tracking indexation. In this talk, Simon explores how to leverage this data to monitor status, spot changes, and catch issues in realtime — no coding required!
Este documento presenta una introducción a los comandos básicos de línea de comandos como cat, grep y sed, y cómo se pueden combinar para extraer y filtrar información de archivos de texto. También discute comandos más avanzados como wget y curl que son útiles para acceder y navegar sitios web, y cómo se pueden encadenar estos comandos para realizar tareas como extraer enlaces de sitemaps.
Patrick Stox gives a presentation on how search works. He discusses how Google crawls and indexes websites, processes content, handles queries, and ranks results. Some key points include: Google's crawler downloads pages and files from websites; processing includes duplicate detection, link parsing, and content analysis; queries are understood through techniques like spelling correction and query expansion; and search results are ranked based on numerous freshness, popularity, and relevancy signals.
Using Tags & Taxonomies to super charge your eCommerce SEOMichael King
Using tags and taxonomies can supercharge ecommerce SEO. Properly labeling products and categorizing them allows for (1) better targeting of long-tail keywords, (2) improved internal linking to distribute PageRank, and (3) helping Google's crawlers discover content more efficiently. Key recommendations include designing three-level categorization for products and using tags to link diverse products. Automating recommendations and dynamic linking based on tags and attributes can further boost performance.
Cours SEO / Référencement Naturel - août 2013Pierre Ammeloot
Cours sur le SEO pour l'équipe web de Knowledge Expert.
Ce cours présente les fondamentaux du référencement (SEO & SEA).
Il présente le vocabulaire du référencement et permet d'assurer la formation continue de nos équipes techniques travaillant au développement des sites internet de nos clients grands comptes.
La casa de SEO : les questions à se poser pour le casse SEO parfaitAymeric Bouillat
Slide 7 accessible ici: https://imgur.com/a/Vmqjl2C
"Les questions à se poser en prévision du braquage de l'algo de Google". Indexation, Crawl, Pagination, Webperf: différents axes du SEO abordés sous la forme de questions réponses afin de parfaire sa stratégie SEO.
C'est toujours mieux avec les commentaires, il fallait être au #webcampday ;)
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017Peak Ace
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017
Intervenants : Philippe Yonnet - Directeur Général et Cédric Rambaud, Consultant SEO, Search Foresight
Choisir une solution e commerce compatible seo : quelle plateforme vous perme...Philippe YONNET
Un tour d'horizon des principaux soucis gênants ou bloquants pour le SEO que l'on retrouve sur les principales solutions ecommerce du marché.
Comment choisir sa plateforme ? Quels sont les points d'attention ?
Seocamp2016 : javascript et indexation, où en est-on ?Madeline Pinthon
Google annonce comprendre le JavaScript mais qu'en est-il exactement ?
Plus d'information : http://www.iprospect.com/fr/fr/le-blog/indexation-javascript/
Présentation lors de la conférence e-commerce #Shake14 le 24/06/2014 à Marseille. On a parlé optimisation du SEO en particulier au travers de l'analyse du crawl et des logs d'un site. Des questions sur cette présentation ? Contactez-nous : info@digimood.com ou +33 4 91 65 63
Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016iProspect France
Le jeudi 7 avril à 11h45, Madeline Pinthon a donné une conférence sur les bonnes pratiques du Javascript pour indexer les pages sur les moteurs de recherche.
Les bonnes pratiques SEO avec PrestaShop et WordPress - CCI MontpellierNicolas Mercatili
Présentation des 3 piliers du référencement naturel et mes conseils pour les optimiser dans le but d’obtenir plus de trafic et de visibilité sur Google. Conférence donnée à la CCI de Montpellier le 22 novembre 2016.
Retrouvez l'article complet et mes prestations sur mon site www.creanico.fr
Formation rapide au SEO et au webmarketing ! Ce power point vous offre quelques outils intéressants, mais aussi un guide, pas à pas, pour optimiser son référencement naturel !
Webconférence SEO le 22 Novembre : Comment optimiser un site Demandware pour ...Peak Ace
Demandware (Salesforce Commerce Cloud) est une plateforme e-commerce de plus en plus populaire. Bien que cette solution se présente comme "SEO friendly", l'analyse des implémentations en situation réelle montre que la plateforme n'est pas exempte de défauts de conception dans ce domaine, et nous verrons lesquels et comment les corriger. En outre, de sérieux problèmes peuvent être causés par un mauvais travail d'intégration, et nous listerons aussi pendant la conférence les points d'attention à surveiller...
Durant ce webinar, nous vous proposons en 30 à 45 mn de faire le point sur ce sujet.
Intervenant : Philippe Yonnet, Directeur Général, Search Foresight
Dans la jungle des sites mobiles - comment les rendre (vraiment) SEO-friendly ?Aymeric Bouillat
L'index mobile first étant complètement déployé chez Google, les sites mobiles respectent-ils tous les best practices SEO? Cette conférence passera en revue les erreurs structurelles les plus fréquentes pouvant toucher les sites mobiles. Des astuces seront partagées sur les façons de mieux exploiter cet espace réduit sur smartphone, tout en proposant de nombreuses informations aux internautes, (et aux moteurs) sur des petits écrans. D'autres aspects seront également évoqués comme le crawl de Googlebot vs Mobile, ou encore l'intérêt des pages de résultats géolocalisés et les stratégies SEO associées.
Mystères et associés dans les résultats de GoogleAymeric Bouillat
Conférence à l'occasion de la première édition du SearchY 2019
Des phénomènes parfois étranges se produisent dans les pages de résultats de Google : disparition de la page d’accueil d’un site, perte progressive de positions, chute brutale du trafic SEO, positions en dents de scie, etc. Voici quelques bons réflexes à acquérir pour comprendre l’origine d’une problématique SEO, via différentes astuces et l’utilisation d’outils variés. Pour éviter des interventions « SEO pompier », vous verrez comment prévenir certaines problématiques liées au quotidien de tout site Web : mieux vaut prévenir que guérir.
Le cache côté client, le cache côté serveurs et leur impact sur le SEO et l'expérience utilisateur. Conférence effectuée lors du SEOCamp'us Paris 2017 avec Benoit Chevillot de Divioseo
Migration seo - astuces techniques pour améliorer votre traficAymeric Bouillat
Support d'un Webinar (18/05/2016) en partenariat avec SEMRush. Astuces techniques pour améliorer votre trafic lors d'une migration SEO (par Aymeric Bouillat, Consultant SEO chez Résonéo
Site mobile et SEO - les erreurs à ne pas commettreAymeric Bouillat
Référencement de site mobile: les erreurs à ne pas commettre. Conférence sur le SEO mobile lors du SMXParis 2014 avec :
- Aymeric Bouillat, Consultant SEO, Resoneo (partie présentée ci dessus) @aymerictwit
- Zineb Ait Bahajji, Webmaster Trends Analyst, Google
- Rebecca Birnbaum, Responsable des partenariats produit, google
Modérateur :
- Virgile Juhan, Journaliste, Journal du Net
2. #seocampParis 2020 2
Aymeric Bouillat
Consultant SEO technique dans l’agence SEO (groupe )
• Des affinités avec le SEO technique
• Spécialiste des migrations de site
• Et un blog plus trop à jour…. https://www.yapasdequoi.com
Pour me suivre sur Twitter :
@aymerictwit
3. #seocampParis 2020 3
A quoi ça sert?
Analyse des balises
SEO
Extraction de données
précises dans les pages
Découverte des
problématiques de duplication
Examen des directives
pour les robots
Analyse des redirections
Crawl avec un
rendu JS, comme
Google
Détection des liens
cassés
Visualisation de l’architecture
d’un site et de son maillage
Connexions à des API (Search
Console, GA, Ahrefs, etc)
Génération de sitemaps
XML
6. #seocampParis 2020 6
Préférez le mode Base de données
• Un crawl, c’est gourmand ! (Configuration > Storage mode)
• Memory = 3Go min. crawls de moins de 100.000 URL : plus rapide, moins souple
• Database storage = avoir un disque SSD : plus souple, permet le crawl de gros sites
7. #seocampParis 2020 7
Database storage : mode « projet »
• Gérer ses crawls par client (File > Crawls )
Penser à faire le ménage
de temps en temps
9. #seocampParis 2020 9
Ne pas oublier !
• Utiliser la commande « site: »
• Faire un « précrawl » avant le crawl complet
• Prévenir le client ou l’hébergeur (éviter la blacklist)
• Sauvegarder sa configuration
10. #seocampParis 2020 10
Database storage : mode « projet »
• Définir ce que l’on souhaite crawler, et stocker
• Store permet de conserver toutes les relations (liens entrants et sortants)
• Objectif : Limiter le poids des fichiers dans la base de données
11. #seocampParis 2020 11
Comportement du crawler
Si il ne fallait en retenir que 6 :
• Configuration « User-agent » : dynamic serving /site mobile dédié
• Craw Linked Xml Sitemaps(onglet « Crawl »)
• Extraction JSON-LD +microdata (onglet « Extraction »)
• Store HTML/rendered HTML (onglet « Extraction »)
• Effectuer un rendu JS (onglet « Rendering »)
• Respect « canonical » & « noindex » en fonction des besoins…(Onglet
« Advanced »)
Aucun crawl ne se ressemble…
12. #seocampParis 2020 12
Modifier des URL à la volée
Case study
HTTP vers HTTPS
Suppression du #, ex:
/faq#question1
/faq#question2
(avec le rendu JS, les URL avec # sont
explorées, on va regrouper les signaux)
13. #seocampParis 2020 13
Site en développement
Menu Configuration > Authentification
2 méthodes :
Authentification serveur standard
ou
Formulaire de login
• Adapter le robots.txt si nécessaire
• Informer client/hébergeur de l’IP et de l’UA utilisé
Penser à
l’exclusion des
URL « touchy »
14. #seocampParis 2020
• « Let’s crawl by night » !
• Crawl régulier (utile pour faire des comparaisons)
• Possibilité de générer des exports auto (csv, xlsx,..)
• Génération automatisée de sitemaps
14
Et le crawl programmable?
15. #seocampParis 2020 15
Crawl sans interface !
• Pas d’interface graphique =
Idéal pour un serveur
Préparer un fichier de configuration et générer
ses exports automatiquement !
--config "C:UsersAymeric.BouillatCrawlsconfig-mobile.seospidercon
17. #seocampParis 2020 17
A la pêche aux données : scrappons!
Extraire des données des pages Web, pour qualifier, analyser et optimiser!
Fil d’Ariane
Nombre
d’avis
Stock
Descriptif
Code de
tracking GA
Le type de page (ex:
listing, produit, édito, etc.)
Nombre de
commentaires
18. #seocampParis 2020 18
Exemples d’utilisations SEO
Récupérer des éléments précis sur une page Web:
Fil d’Ariane (ex: qualifier/organiser ses URL)
Détecter des typologies de pages
Sur un site e-commerce
l’état en stock d’un produit (disponibilité / liens vers des produits épuisés)
le nombre d’avis sur un produit (pages produits avec peu d’avis)
le nombre de commentaires
Sur un site de contenu
le nom de l’auteur d’un article
la date de publication d’un article
Et en général:
le nombre de blocs catégories
le contenu principal (contenu d’un paragraphe précis)
les données Opengraph/TwitterCards
les URL des vidéos Youtube
etc.
Cf. « Annexe scraping » en fin de
présentation
20. #seocampParis 2020 20
Attention aux erreurs d’interprétation
Profondeur des URL
Près d’un tiers de vos URL sont accessibles en 4
clics depuis la page d’accueil.
C’est très grave d’un point de vue maillage.
La majeure partie des URL en profondeur 4 sont
des URL d’ images (liens vers des images), ça va…
21. #seocampParis 2020 21
Problématiques d’URL
Focus sur les paramètres d’URL (ex: tri, filtre, pagination etc.)
Pertinence des URL (si indexables)
C’est pas parce qu’il y a écrit « canonical » que c’est bien ! (ex: pagination vers la 1ere page…)
22. #seocampParis 2020 22
Codes réponse : par typologie de page/URL
Beaucoup de redirections?
- similarité entre les redirections (pages de
destination)
- source des redirections (lien ? Canonical ?
hreflang ? AMP ? )
- erreur de lien? La page de destination
existe peut être !
26. #seocampParis 2020 26
Attention aux softs 404
Tester des URL inexistantes et regarder le code réponse. Ex: /url-qui-n-existe-pas
Statut HTTP de l’URL en 200 ?
(et non 404)
28. #seocampParis 2020 28
Et les balises <title>…</title>?
Beaucoup de duplicate au premier abord? mais il peut être « logique » (ex: pagination)
29. #seocampParis 2020 29
Faire des exclusions pour y voir + clair
Pour voir toutes les URL qui ne contiennent pas « page=… »
^((?!page=).)*$ Afficher les URL ne contenant pas « page= » via une regexp.
30. #seocampParis 2020 30
Contenu dupliqué
Un nouvel onglet dans Screaming Frog !
Comparer les différences
entre 2 pages très
similaires
31. #seocampParis 2020 31
Trop de similarité à cause d’un mega-menu ?
Ne pas tenir compte de certains éléments HTML, c’est possible
33. #seocampParis 2020 33
Maillage
Maillage interne : bien ou pas? Ça dépend de ce qu’on regarde
Attention : ne représente pas l’intégralité
des liens, mais juste le chemin le + court
pour accéder à chaque URL
34. #seocampParis 2020 34
Visualisation
Mettre en avant des défauts de maillage, ou identifier des pages en fonctions de certains KPI
• Voir si des URL fortement maillées ne sont pas indexables
(Canonical, redirection, noindex) perte de PageRank
interne
• Voir où se situent dans le maillage les URL qui
génèrent le plus de trafic
• Link score : page rank interne de
screaming Frog
36. #seocampParis 2020 36
Mieux comprendre le maillage d’une page
Ancres de liens : renforcer les variations sémantiques
37. #seocampParis 2020 37
Principales occurrences d’un contenu
Avoir préalablement coché la case
« Store HTML » de l’onglet « Extraction »
lors de la config du crawl
39. #seocampParis 2020 39
+ de données avec une analyse de crawl
Menu « Crawl analysis » « Start »
Voir les URL non maillées détectées
par ailleurs (hreflang, canonical,
sitemap, AMP, API, etc.)
40. #seocampParis 2020 40
URL non maillées
URL introuvables lors du crawl mais existantes par ailleurs
URL n’ayant jamais reçu de liens
URL ne recevant plus de liens
Renforcer le maillage
41. #seocampParis 2020 41
Orphan URL via les API
Permet de mettre en avant les URL présentes dans le sitemap, mais aussi la Search Console,
Google Analytics, et qui n’ont pas été trouvées lors du crawl. (cf. les onglets correspondants)
49. #seocampParis 2020 49
Exemples Xpath vs HTML
//div[@id="wayfinding-breadcrumbs_feature_div"]/li[not(@class)]
//ul[@class="a-unordered-list a-vertical a-spacing-mini"]/li/span
//span[@id="acrCustomerReviewText"]
(//span[@class="a-icon-alt"])[1] la première balise de ce type
//div[@id="availability"]/span
Descriptif
Nbe
commentaires
Nbe avis
Stock
Fil d’Ariane
https://devhints.io/xpathAntisèche :