Agence Conseil en stratégie digitale
SEO, CRO, Inbound Marketing, Analytics
PETIT DEJEUNER SEO
SEARCH FORESIGHT
LE 9 AVRIL 2014
9h-12h
PILOTER LES COMPORTEMENTS DES
MOTEURS DE RECHERCHE
/ SEO
/ SOMMAIRE
1. ROBOTS.TXT
2. NO INDEX, NO
FOLLOW
3. REL CANONICAL
4. REL PREV NEXT
5. HREFLANG
- 2 -
AGIR SUR LE COMPORTEMENT DU MOTEUR DE RECHERCHE
1
ROBOTS.TXT
Agence Conseil en stratégie digitale
SEO, CRO, Inbound Marketing, Analytics
/ ROBOTS.TXT EMPÊCHE LE CRAWL DE GOOGLE
RAPPEL SUR DEUX NOTIONS:
CRAWL : C’est lorsque Googlebot explore les pages de votre site pour aspirer votre contenu, il s’agit
là d’exploration
INDEXER : L’indexation est une autre étape au processus de collecte de Google, l’indexation
signifie que Google a retenu l’url de votre site web dans son index.
- 4 -
AGIR SUR LE COMPORTEMENT DU BOT – ROBOTS.TXT
/ ROBOTS.TXT EMPÊCHE LE CRAWL DE GOOGLE
COMMENT INTERDIRE LE ROBOT D’EXPLORER UNE PARTIE DE
SON SITE?
Il s’agit d’un fichier basique sous format txt uploadé à la racine du site
http://www.mydomain.com/robots.txt
Dans cet exemple Google n’explorera pas le contenu du répertoire wp-admin et
l’URL suivante http://www.mydomain.com/test/abc.html
- 5 -
AGIR SUR LE COMPORTEMENT DU BOT – ROBOTS.TXT
Attention les instructions de ce fichier sont sensibles à la casse
Disallow: /mapage.html ne bloquera pas l’accès à Mapage.html
2
NO INDEX, NO FOLLOW
Agence Conseil en stratégie digitale
SEO, CRO, Inbound Marketing, Analytics
/ LES INSTRUCTIONS MÉTA ROBOTS QUI
EMPÊCHENT L’INDEXATION
Vous pouvez ordonner à Google de ne pas indexer vos pages web et/ou de ne pas
scanner les liens qui s’y trouvent grâce à ces différentes instructions:
Ces instructions sont à placer dans la partie <HEAD></HEAD> de votre code HTML
Ces instructions méta robots ne sont pas sensibles à la casse.
- 7 -
AGIR SUR LE COMPORTEMENT DU BOT – NO INDEX, NO FOLLOW
<META NAME="robots" CONTENT="noindex,follow">
<META NAME="robots" CONTENT="index,nofollow">
<META NAME="robots" CONTENT="noindex,nofollow">
/ LES INSTRUCTIONS MÉTA ROBOTS QUI
EMPÊCHENT L’INDEXATION
Vous pouvez ordonner à Google de ne pas indexer vos pages web et/ou de ne pas
scanner les liens qui s’y trouvent grâce à ces différentes instructions, vous pouvez
aussi empêcher l’exploration de Google via le fichier robots.txt
- 8 -
POUR RÉSUMER :
3
CANONICAL TAGS
Agence Conseil en stratégie digitale
SEO, CRO, Inbound Marketing, Analytics
/ LES TAGS CANONIQUES ONT PLUSIEURS
UTILISATIONS MAIS RESTENT UN MOYEN
EFFICACE POUR GÉRER LE DC
Pour mieux contrôler la manière dont vos URL s'affichent dans les résultats de
recherche, et pour regrouper des propriétés telles que la popularité des liens, nous
vous recommandons de choisir une URL canonique (favorite) comme version de
préférence de la page.
- 10 -
TAGS CANONIQUES:
AJOUT DU TAG CANONIQUE
<link rel="canonical" href="http://www.example.com/robes/robeverte.html">
(Sur la page référente)
/ QUE PEUT ON FAIRE DE PLUS ?
Gérer les paramètres dynamiques via Webmaster Tools pour limiter le Duplicate
Content
Par exemple, si vous spécifiez que le paramètre PHPSESSID doit être ignoré, Google considère que
http://www.example.com/robes/vertes.htm?PHPSESSID=273749 est identique à
http://www.example.com/robes/vertes.htm
- 11 -
TAGS CANONIQUES:
/ QUE PEUT ON FAIRE DE PLUS ?
Indiquer les URL canoniques d’un site web dans un sitemap (ex d’un site e-
Commerce)
- 12 -
TAGS CANONIQUES:
Sélectionnez une URL canonique préférée pour chacune de vos fiches produits, et
indiquez-nous vos préférences en soumettant ces URL dans un sitemap
4
REL PREV, REL NEXT
Agence Conseil en stratégie digitale
SEO, CRO, Inbound Marketing, Analytics
/ INDIQUER LE CONTENU PAGINÉ
Google renvoyant en général les personnes effectuant une recherche vers la
première page..
- 14 -
REL PREV NEXT:
AJOUT DE REL NEXT
<link rel = "next" href= "/article-partie3.html "
(Sur la page 2)
Utiliser les liens rel="next" et rel="prev" pour signaler la relation entre les différentes URL.
Ce balisage envoie à Google un signal fort que vous souhaitez utiliser ces pages comme
une séquence logique
AJOUT DE REL PREV
<link rel = « prev" href= "/article-partie1.html "
(Sur la page 2)
5
HREF LANG
Agence Conseil en stratégie digitale
SEO, CRO, Inbound Marketing, Analytics
/ PERMETTRE À GOOGLE D’AFFICHER LA LANGUE
DE VOS INTERNAUTES
- 16 -
HREF LANG:
Imaginer un site anglophone qui s’adresse aux anglophone et que vous
disposez d’un contenu équivalent en allemand qui s’adresse aux
germanophones…
Les annotations rel="alternate" hreflang="x vont nous permettent d'afficher
l'URL correspondant à la langue ou à la région de l'internaute !
/ DÉCLARER L’ÉQUIVALENT DE VOS URL
ANGLAISES DANS UN SITEMAP SPÉCIFIQUE
- 17 -
HREF LANG:
CONCLUSION
CE QU’IL FAUT RETENIR!
1. Essayer de bien comprendre la stratégie à adopter
afin de choisir les bon attributs qui serviront à contrôler
le crawl ou l’indexation par le moteur.
2. Chaque balise a un usage précis, certaines ne se
combinent pas..
3. Il est préférable de bien nettoyer votre site en
interne afin de ne pas utiliser à outrance les balises
canoniques si votre site est trop dupliqué.
4. Vérifier l’indexation de votre site et le
comportement de Google vis-à-vis de vos URL sur les
outils Webmaster Tools de Google

SEO: Piloter les comportement des moteurs de recherche

  • 1.
    Agence Conseil enstratégie digitale SEO, CRO, Inbound Marketing, Analytics PETIT DEJEUNER SEO SEARCH FORESIGHT LE 9 AVRIL 2014 9h-12h PILOTER LES COMPORTEMENTS DES MOTEURS DE RECHERCHE / SEO
  • 2.
    / SOMMAIRE 1. ROBOTS.TXT 2.NO INDEX, NO FOLLOW 3. REL CANONICAL 4. REL PREV NEXT 5. HREFLANG - 2 - AGIR SUR LE COMPORTEMENT DU MOTEUR DE RECHERCHE
  • 3.
    1 ROBOTS.TXT Agence Conseil enstratégie digitale SEO, CRO, Inbound Marketing, Analytics
  • 4.
    / ROBOTS.TXT EMPÊCHELE CRAWL DE GOOGLE RAPPEL SUR DEUX NOTIONS: CRAWL : C’est lorsque Googlebot explore les pages de votre site pour aspirer votre contenu, il s’agit là d’exploration INDEXER : L’indexation est une autre étape au processus de collecte de Google, l’indexation signifie que Google a retenu l’url de votre site web dans son index. - 4 - AGIR SUR LE COMPORTEMENT DU BOT – ROBOTS.TXT
  • 5.
    / ROBOTS.TXT EMPÊCHELE CRAWL DE GOOGLE COMMENT INTERDIRE LE ROBOT D’EXPLORER UNE PARTIE DE SON SITE? Il s’agit d’un fichier basique sous format txt uploadé à la racine du site http://www.mydomain.com/robots.txt Dans cet exemple Google n’explorera pas le contenu du répertoire wp-admin et l’URL suivante http://www.mydomain.com/test/abc.html - 5 - AGIR SUR LE COMPORTEMENT DU BOT – ROBOTS.TXT Attention les instructions de ce fichier sont sensibles à la casse Disallow: /mapage.html ne bloquera pas l’accès à Mapage.html
  • 6.
    2 NO INDEX, NOFOLLOW Agence Conseil en stratégie digitale SEO, CRO, Inbound Marketing, Analytics
  • 7.
    / LES INSTRUCTIONSMÉTA ROBOTS QUI EMPÊCHENT L’INDEXATION Vous pouvez ordonner à Google de ne pas indexer vos pages web et/ou de ne pas scanner les liens qui s’y trouvent grâce à ces différentes instructions: Ces instructions sont à placer dans la partie <HEAD></HEAD> de votre code HTML Ces instructions méta robots ne sont pas sensibles à la casse. - 7 - AGIR SUR LE COMPORTEMENT DU BOT – NO INDEX, NO FOLLOW <META NAME="robots" CONTENT="noindex,follow"> <META NAME="robots" CONTENT="index,nofollow"> <META NAME="robots" CONTENT="noindex,nofollow">
  • 8.
    / LES INSTRUCTIONSMÉTA ROBOTS QUI EMPÊCHENT L’INDEXATION Vous pouvez ordonner à Google de ne pas indexer vos pages web et/ou de ne pas scanner les liens qui s’y trouvent grâce à ces différentes instructions, vous pouvez aussi empêcher l’exploration de Google via le fichier robots.txt - 8 - POUR RÉSUMER :
  • 9.
    3 CANONICAL TAGS Agence Conseilen stratégie digitale SEO, CRO, Inbound Marketing, Analytics
  • 10.
    / LES TAGSCANONIQUES ONT PLUSIEURS UTILISATIONS MAIS RESTENT UN MOYEN EFFICACE POUR GÉRER LE DC Pour mieux contrôler la manière dont vos URL s'affichent dans les résultats de recherche, et pour regrouper des propriétés telles que la popularité des liens, nous vous recommandons de choisir une URL canonique (favorite) comme version de préférence de la page. - 10 - TAGS CANONIQUES: AJOUT DU TAG CANONIQUE <link rel="canonical" href="http://www.example.com/robes/robeverte.html"> (Sur la page référente)
  • 11.
    / QUE PEUTON FAIRE DE PLUS ? Gérer les paramètres dynamiques via Webmaster Tools pour limiter le Duplicate Content Par exemple, si vous spécifiez que le paramètre PHPSESSID doit être ignoré, Google considère que http://www.example.com/robes/vertes.htm?PHPSESSID=273749 est identique à http://www.example.com/robes/vertes.htm - 11 - TAGS CANONIQUES:
  • 12.
    / QUE PEUTON FAIRE DE PLUS ? Indiquer les URL canoniques d’un site web dans un sitemap (ex d’un site e- Commerce) - 12 - TAGS CANONIQUES: Sélectionnez une URL canonique préférée pour chacune de vos fiches produits, et indiquez-nous vos préférences en soumettant ces URL dans un sitemap
  • 13.
    4 REL PREV, RELNEXT Agence Conseil en stratégie digitale SEO, CRO, Inbound Marketing, Analytics
  • 14.
    / INDIQUER LECONTENU PAGINÉ Google renvoyant en général les personnes effectuant une recherche vers la première page.. - 14 - REL PREV NEXT: AJOUT DE REL NEXT <link rel = "next" href= "/article-partie3.html " (Sur la page 2) Utiliser les liens rel="next" et rel="prev" pour signaler la relation entre les différentes URL. Ce balisage envoie à Google un signal fort que vous souhaitez utiliser ces pages comme une séquence logique AJOUT DE REL PREV <link rel = « prev" href= "/article-partie1.html " (Sur la page 2)
  • 15.
    5 HREF LANG Agence Conseilen stratégie digitale SEO, CRO, Inbound Marketing, Analytics
  • 16.
    / PERMETTRE ÀGOOGLE D’AFFICHER LA LANGUE DE VOS INTERNAUTES - 16 - HREF LANG: Imaginer un site anglophone qui s’adresse aux anglophone et que vous disposez d’un contenu équivalent en allemand qui s’adresse aux germanophones… Les annotations rel="alternate" hreflang="x vont nous permettent d'afficher l'URL correspondant à la langue ou à la région de l'internaute !
  • 17.
    / DÉCLARER L’ÉQUIVALENTDE VOS URL ANGLAISES DANS UN SITEMAP SPÉCIFIQUE - 17 - HREF LANG:
  • 18.
    CONCLUSION CE QU’IL FAUTRETENIR! 1. Essayer de bien comprendre la stratégie à adopter afin de choisir les bon attributs qui serviront à contrôler le crawl ou l’indexation par le moteur. 2. Chaque balise a un usage précis, certaines ne se combinent pas.. 3. Il est préférable de bien nettoyer votre site en interne afin de ne pas utiliser à outrance les balises canoniques si votre site est trop dupliqué. 4. Vérifier l’indexation de votre site et le comportement de Google vis-à-vis de vos URL sur les outils Webmaster Tools de Google