Synodiance > SEO - Etude désindexation de contenus - 21/01/2015

Search Foresight
Search ForesightDirecteur du Pôle Conseil @Search Foresight - ex-Associé et cofondateur @Synodiance à Search Foresight
Désindexation de contenus
Janvier 2015
Etude
Etude désindexation de contenus
Objectifs de l ’étude
› Identifier et tester les directives de désindexation et de blocage d’indexation,
› Optimiser l’exploration des bots – notion de « crawl utile »,
› Prioriser l’indexation des contenus stratégiques – pages objectifs.
Environnement de test
› Site dédié : ananas-seo.com
› Période analysée : de septembre à novembre 2014
› Moteur étudié : Googlebot
Site Test : ananas-seo.com
Informations à prendre en compte avant lecture des résultats
› ananas-seo.com a été créé spécialement pour un environnement de test,
› Le domaine et les contenus ont peu d’autorité côté moteur de recherche,
› Des sites à gros volume et forte popularité peuvent générer des résultats
sensiblement différents,
› Les directives testées ont donné lieu à des conclusions applicatives fiables et
non strictes.
Exploration VS Indexation
Directives d’exploration :
Par défaut, si aucune restriction n’est implémentée les
bots pourront accéder à l’ensemble des fichiers présents
sur le serveur web.
Exploration VS Indexation
Directives d’exploration :
Par défaut, si aucune restriction n’est implémentée les
bots pourront accéder à l’ensemble des fichiers présents
sur le serveur web.
Exemple d’une directive d’exploration dans le fichier robots.txt
Disallow: /voyages/
Exploration VS Indexation
Directives d’indexation :
Par défaut, si aucun paramètre oriente les bots lors de
l’exploration, tout contenu est potentiellement
indexable.
Exploration VS Indexation
Directives d’indexation :
Par défaut, si aucun paramètre oriente les bots lors de
l’exploration, tout contenu est potentiellement
indexable.
Exemple d’une directive d’indexation dans le <header> html d’un document.
<Meta name=«robots» content=«noindex» />
Test SEO : liste des directives testées
Objectifs du test : bloquer l’indexation et désindexer des contenus
Liste des directives testées sur ananas-seo.com
• Déclaration d’une URL en HTTP 404 liée dans la structure
• Déclaration d’une URL en HTTP 404 non-liée dans la structure
• Déclaration d’une URL en HTTP 410 liée dans la structure
• Déclaration d’une URL en HTTP 410 non-liée dans la structure
• Balise Meta Noindex en Header Document post indexation
• Balise Meta Noindex en Header Document post indexation + liens externes vers la cible url
• Balise Meta Noindex en Header Document à la mise en production
• Bloquer l’indexation via robots.txt à la mise en production : commande Disallow
• Désindexation via directive x-robots tags implémentée dans le fichier .htaccess
• Désindexation URL via noindex dans robots.txt
• Désindexation répertoire via noindex dans robots.txt
Désindexation « naturelle » :
En soit ce n’est pas vraiment une méthode. Sur une
période relativement longue et après plusieurs
explorations, une page qui reçoit un code réponse HTTP
404 se désindexe.
Attention : un document en 404 qui reçoit des liens
externes a tendance à être maintenu dans l’index,
surtout si les pages envoyant ces liens ont de l’autorité.
Déclaration d’une URL en 404 liée dans la
structure
URL désindexée : OUI
Délai constaté : 45 jours
Désindexation « naturelle » :
Similaire à une page 404 liée dans la structure, la
désindexation est effective dans un délai constaté un
peu plus long.
Attention : un document en 404 qui reçoit des liens
externes a tendance à être maintenu dans l’index,
surtout si les pages envoyant ces liens ont de l’autorité.
Déclaration d’une URL en 404 non-liée
dans la structure
URL désindexée : OUI
Délai constaté : 60 jours
Désindexation « naturelle » :
On constate le même comportement de désindexation
qu’une URL en HTTP 404.
A noter : initialement orientée désindexation, Google
communique sur la non distinction entre 404 et 410.
Déclaration d’une URL en 410 liée dans la
structure
URL désindexée : OUI
Délai constaté : 55 jours
https://support.google.com/webmasters/answer/2409439?hl=fr
Désindexation « naturelle » :
On constate le même comportement de désindexation
qu’une URL en HTTP 404.
A noter : initialement orienté désindexation, Google
communique sur la non distinction entre 404 et 410.
Déclaration d’une URL en 410 non-liée
dans la structure
URL désindexée : OUI
Délai constaté : 45 jours
https://support.google.com/webmasters/answer/2409439?hl=fr
Désindexation rapide :
Assez efficace cette directive permet une désindexation
rapide de contenus.
<Meta name=«robots» content=«noindex» />
Important : attention de ne pas bloquer dans le
robots.txt l’exploration des pages en Noindex. Cela
aurait pour effet la non prise en compte de la directive
de désindexation.
Implémenter le balisage Meta Noindex
après indexation
URL désindexée : OUI
Délai constaté : 15 jours
Désindexation rapide :
Assez efficace cette directive permet une désindexation
rapide de contenus.
<Meta name=«robots» content=«noindex» />
Important : sur un site d’autorité à forte popularité, un
contenu en noindex peut être plus difficile à désindexer
en raison du nombre de liens qu’il reçoit.
Implémenter le balisage Meta Noindex après
indexation sur une page qui reçoit du liens.
URL désindexée : OUI
Délai constaté : 20 jours
Pas d’indexation :
Intégrée dès la mise en production d’un document, la
directive empêche l’indexation.
<Meta name=«robots» content=«noindex» />
Implémenter le balisage Meta Noindex à
la mise en prod
URL non indexée : OUI
Délai constaté : none
Fonctionne dès la mise en production :
La directive d’exploration « Disallow » empêche
l’indexation d’un document uniquement si cette
dernière est intégrée à la mise en production.
Disallow: /ananas-poulet-riz-coco.php
Important : n’a aucune fonction de désindexation. Un
« disallow » est une directive d’exploration.
Bloquer l’indexation d’un contenu via le
fichier robots.txt
URL non indexée : OUI
Délai constaté : none
Le robot d’exploration analyse l’entête HTTP:
Directive très efficace et également intéressante quand
on souhaite gérer la désindexation sans modifier le
code source d’un contenu.
X-Robots-Tag: googlebot: noindex
A noter : le mode d’implémentation dépend du site
(volume de pages, architecture,…)
Désindexation via commande x-robots tag
URL désindexée : OUI
Délai constaté : 15 jours
Directive non officielle :
Google ne l’a jamais officialisée mais il sait l’interpréter.
Noindex: /ananas-roti-vanille.php
A noter : un site qui réalise 120 000 visites par mois a
un fichier robots.txt exploré en moyenne 40 fois par
jour. La directive, dans certains cas, peut être
intéressante.
Désindexation d’un document via noindex
dans le robots.txt
URL désindexée : OUI
Délai constaté : 15 jours
Directive non officielle :
Google ne l’a jamais officialisé mais il sait l’interpréter.
Noindex: /fruit/
A noter : un site qui réalise 120 000 visites par mois a
un fichier robots.txt exploré en moyenne 40 fois par
jour! La directive, dans certains cas, peut être
intéressante.
Désindexation d’un répertoire via noindex
dans le robots.txt
URL désindexée : OUI
Délai constaté : 25 jours
Synthèse
Désindexer « naturellement » un contenu via HTTP 404/410
› Fonctionne si les contenus ne reçoivent pas trop de maillage interne/externe
Bloquer l’indexation ou désindexer un contenu avec une Meta Noindex
› Fonctionne si les contenus sont accessibles par les robots d’exploration
Bloquer l’indexation ou désindexer un contenu X-robots tag Noindex
› Très efficace, plus technique, la directive est dans l’entête HTTP du document.
Désindexer un contenu avec directive Noindex dans le robots.txt
› Non officielle mais reconnue par les principaux robots d’exploration, peut être
utile selon les cas.
1 sur 20

Recommandé

Catalogue Idwatt 2016 par
Catalogue Idwatt 2016Catalogue Idwatt 2016
Catalogue Idwatt 2016SOREA
5K vues84 diapositives
18 02-2015 atelier-pratique-xml-tei-stage-d-ecdotique-2015 par
18 02-2015 atelier-pratique-xml-tei-stage-d-ecdotique-201518 02-2015 atelier-pratique-xml-tei-stage-d-ecdotique-2015
18 02-2015 atelier-pratique-xml-tei-stage-d-ecdotique-2015Emmanuelle Morlock
1.6K vues59 diapositives
Présentation de MEODEX 2015 - Vos modules LED sur mesure par
Présentation de MEODEX 2015 - Vos modules LED sur mesurePrésentation de MEODEX 2015 - Vos modules LED sur mesure
Présentation de MEODEX 2015 - Vos modules LED sur mesureMarketing and Sales MEODEX
1.6K vues19 diapositives
Le référencement pour les developpeurs par
Le référencement pour les developpeursLe référencement pour les developpeurs
Le référencement pour les developpeursrelevant_traffic_france
2K vues25 diapositives
Lucibel Corporate presentation oct2011 par
Lucibel Corporate presentation oct2011Lucibel Corporate presentation oct2011
Lucibel Corporate presentation oct2011Giorgio Anselmetti
1.8K vues19 diapositives
Superivision Aéroportuaire par
Superivision AéroportuaireSuperivision Aéroportuaire
Superivision AéroportuaireKarim Hassaouan
790 vues8 diapositives

Contenu connexe

En vedette

Document Object Model ( DOM) par
Document Object Model ( DOM)Document Object Model ( DOM)
Document Object Model ( DOM)Abdelouahed Abdou
2.9K vues19 diapositives
HTML, CSS et Javascript par
HTML, CSS et JavascriptHTML, CSS et Javascript
HTML, CSS et JavascriptECAM Brussels Engineering School
2.4K vues67 diapositives
Html par
HtmlHtml
HtmlMohsen Kerdaoui
2.2K vues115 diapositives
Les fils RSS : l’information au bout des doigts par
Les fils RSS : l’information au bout des doigtsLes fils RSS : l’information au bout des doigts
Les fils RSS : l’information au bout des doigtsAref Jdey
1.4K vues26 diapositives
Exploration et visualisation de fichiers XML avec BaseX par
Exploration et visualisation de fichiers XML avec BaseXExploration et visualisation de fichiers XML avec BaseX
Exploration et visualisation de fichiers XML avec BaseXEmmanuelle Morlock
2.1K vues39 diapositives
2014 09 12_atelier-humanites-numerique-hisoma-seance-1-oxygen par
2014 09 12_atelier-humanites-numerique-hisoma-seance-1-oxygen2014 09 12_atelier-humanites-numerique-hisoma-seance-1-oxygen
2014 09 12_atelier-humanites-numerique-hisoma-seance-1-oxygenEmmanuelle Morlock
1.7K vues25 diapositives

En vedette(19)

Les fils RSS : l’information au bout des doigts par Aref Jdey
Les fils RSS : l’information au bout des doigtsLes fils RSS : l’information au bout des doigts
Les fils RSS : l’information au bout des doigts
Aref Jdey1.4K vues
Exploration et visualisation de fichiers XML avec BaseX par Emmanuelle Morlock
Exploration et visualisation de fichiers XML avec BaseXExploration et visualisation de fichiers XML avec BaseX
Exploration et visualisation de fichiers XML avec BaseX
Emmanuelle Morlock2.1K vues
2014 09 12_atelier-humanites-numerique-hisoma-seance-1-oxygen par Emmanuelle Morlock
2014 09 12_atelier-humanites-numerique-hisoma-seance-1-oxygen2014 09 12_atelier-humanites-numerique-hisoma-seance-1-oxygen
2014 09 12_atelier-humanites-numerique-hisoma-seance-1-oxygen
Emmanuelle Morlock1.7K vues
Intégration #2 : HTML 101 : Back to Basics par Jean Michel
Intégration #2 : HTML 101 : Back to BasicsIntégration #2 : HTML 101 : Back to Basics
Intégration #2 : HTML 101 : Back to Basics
Jean Michel1.6K vues
APARTAMENTO PRONTO PARA MORAR - Alameda Morumbi -96m2 par jicarbonelli
APARTAMENTO PRONTO PARA MORAR - Alameda Morumbi -96m2APARTAMENTO PRONTO PARA MORAR - Alameda Morumbi -96m2
APARTAMENTO PRONTO PARA MORAR - Alameda Morumbi -96m2
jicarbonelli1.8K vues
Pepsi Kick par M51
Pepsi KickPepsi Kick
Pepsi Kick
M511.2K vues
LED lighting - Iluminação LED - Dualcom par dualcom
LED lighting - Iluminação LED - DualcomLED lighting - Iluminação LED - Dualcom
LED lighting - Iluminação LED - Dualcom
dualcom2.2K vues
French www.lumin-lighting.com par led panel
French www.lumin-lighting.comFrench www.lumin-lighting.com
French www.lumin-lighting.com
led panel1.9K vues
Html de base par krymo
Html de baseHtml de base
Html de base
krymo7.7K vues
Présentation html5 par Kénium
Présentation html5Présentation html5
Présentation html5
Kénium9.1K vues

Plus de Search Foresight

Synodiance > Recherche Vocale - SEO Campus Paris - 07/04/2016 par
Synodiance > Recherche Vocale - SEO Campus Paris - 07/04/2016Synodiance > Recherche Vocale - SEO Campus Paris - 07/04/2016
Synodiance > Recherche Vocale - SEO Campus Paris - 07/04/2016Search Foresight
6.1K vues99 diapositives
Synodiance > AMP - EBG - 04/04/2016 par
Synodiance > AMP - EBG - 04/04/2016Synodiance > AMP - EBG - 04/04/2016
Synodiance > AMP - EBG - 04/04/2016Search Foresight
1.7K vues91 diapositives
Synodiance > Etude - Impact Block-4 SEA - 07/03/2016 par
Synodiance > Etude - Impact Block-4 SEA - 07/03/2016Synodiance > Etude - Impact Block-4 SEA - 07/03/2016
Synodiance > Etude - Impact Block-4 SEA - 07/03/2016Search Foresight
5K vues35 diapositives
Synodiance > 10 régles pour un site web bien référencé - Webikeo - 09/02/2016 par
Synodiance > 10 régles pour un site web bien référencé - Webikeo - 09/02/2016Synodiance > 10 régles pour un site web bien référencé - Webikeo - 09/02/2016
Synodiance > 10 régles pour un site web bien référencé - Webikeo - 09/02/2016Search Foresight
11.7K vues98 diapositives
Synodiance > Infographie - Taux de Clics SEO - 18/12/2015 par
Synodiance > Infographie - Taux de Clics SEO - 18/12/2015Synodiance > Infographie - Taux de Clics SEO - 18/12/2015
Synodiance > Infographie - Taux de Clics SEO - 18/12/2015Search Foresight
2.7K vues1 diapositive
Synodiance > Etude - Taux de Clics SEO - 18/12/2015 par
Synodiance > Etude - Taux de Clics SEO - 18/12/2015Synodiance > Etude - Taux de Clics SEO - 18/12/2015
Synodiance > Etude - Taux de Clics SEO - 18/12/2015Search Foresight
23.4K vues47 diapositives

Plus de Search Foresight(20)

Synodiance > Recherche Vocale - SEO Campus Paris - 07/04/2016 par Search Foresight
Synodiance > Recherche Vocale - SEO Campus Paris - 07/04/2016Synodiance > Recherche Vocale - SEO Campus Paris - 07/04/2016
Synodiance > Recherche Vocale - SEO Campus Paris - 07/04/2016
Search Foresight6.1K vues
Synodiance > Etude - Impact Block-4 SEA - 07/03/2016 par Search Foresight
Synodiance > Etude - Impact Block-4 SEA - 07/03/2016Synodiance > Etude - Impact Block-4 SEA - 07/03/2016
Synodiance > Etude - Impact Block-4 SEA - 07/03/2016
Synodiance > 10 régles pour un site web bien référencé - Webikeo - 09/02/2016 par Search Foresight
Synodiance > 10 régles pour un site web bien référencé - Webikeo - 09/02/2016Synodiance > 10 régles pour un site web bien référencé - Webikeo - 09/02/2016
Synodiance > 10 régles pour un site web bien référencé - Webikeo - 09/02/2016
Search Foresight11.7K vues
Synodiance > Infographie - Taux de Clics SEO - 18/12/2015 par Search Foresight
Synodiance > Infographie - Taux de Clics SEO - 18/12/2015Synodiance > Infographie - Taux de Clics SEO - 18/12/2015
Synodiance > Infographie - Taux de Clics SEO - 18/12/2015
Search Foresight2.7K vues
Synodiance > Etude - Taux de Clics SEO - 18/12/2015 par Search Foresight
Synodiance > Etude - Taux de Clics SEO - 18/12/2015Synodiance > Etude - Taux de Clics SEO - 18/12/2015
Synodiance > Etude - Taux de Clics SEO - 18/12/2015
Search Foresight23.4K vues
Synodiance > SEM Local - EBG - 04/11/2015 par Search Foresight
Synodiance > SEM Local - EBG - 04/11/2015Synodiance > SEM Local - EBG - 04/11/2015
Synodiance > SEM Local - EBG - 04/11/2015
Search Foresight3.7K vues
Synodiance > Stratégie de synchronisation SEO SEA - EBG - 23/10/2015 par Search Foresight
Synodiance > Stratégie de synchronisation SEO SEA - EBG - 23/10/2015Synodiance > Stratégie de synchronisation SEO SEA - EBG - 23/10/2015
Synodiance > Stratégie de synchronisation SEO SEA - EBG - 23/10/2015
Synodiance > Enjeux SEO Mobile & APPs - Table Ronde EBG - 28/05/2015 par Search Foresight
Synodiance > Enjeux SEO Mobile & APPs - Table Ronde EBG - 28/05/2015Synodiance > Enjeux SEO Mobile & APPs - Table Ronde EBG - 28/05/2015
Synodiance > Enjeux SEO Mobile & APPs - Table Ronde EBG - 28/05/2015
Search Foresight3.4K vues
Synodiance > SEO Mobile - L'après 21 Avril - 06/05/2015 par Search Foresight
Synodiance > SEO Mobile - L'après 21 Avril - 06/05/2015Synodiance > SEO Mobile - L'après 21 Avril - 06/05/2015
Synodiance > SEO Mobile - L'après 21 Avril - 06/05/2015
Search Foresight1.9K vues
Synodiance > Etude - Le CAC 40 est-il Mobile Friendly ? - 07/04/2015 par Search Foresight
Synodiance > Etude - Le CAC 40 est-il Mobile Friendly ? - 07/04/2015Synodiance > Etude - Le CAC 40 est-il Mobile Friendly ? - 07/04/2015
Synodiance > Etude - Le CAC 40 est-il Mobile Friendly ? - 07/04/2015
Search Foresight4.6K vues
Synodiance > Search, Mobile et Marché de l'Assurance - Conférence CCM Benchma... par Search Foresight
Synodiance > Search, Mobile et Marché de l'Assurance - Conférence CCM Benchma...Synodiance > Search, Mobile et Marché de l'Assurance - Conférence CCM Benchma...
Synodiance > Search, Mobile et Marché de l'Assurance - Conférence CCM Benchma...
Search Foresight4.2K vues
Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 -... par Search Foresight
Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 -...Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 -...
Synodiance > SEO et Speech Processing : Futur enjeu SEO ? - SEO Campus 2015 -...
Search Foresight5.4K vues
Synodiance > La nouvelle donne du SEO - 13/02/2015 par Search Foresight
Synodiance > La nouvelle donne du SEO - 13/02/2015Synodiance > La nouvelle donne du SEO - 13/02/2015
Synodiance > La nouvelle donne du SEO - 13/02/2015
Search Foresight2.7K vues
Synodiance > SEO - Tendances SEO - French Web - 01/12/2014 par Search Foresight
Synodiance > SEO - Tendances SEO - French Web - 01/12/2014Synodiance > SEO - Tendances SEO - French Web - 01/12/2014
Synodiance > SEO - Tendances SEO - French Web - 01/12/2014
Search Foresight3.2K vues
Synodiance > SEO - Le New Deal du Linking - Webikeo - 27/11/2014 par Search Foresight
Synodiance > SEO - Le New Deal du Linking - Webikeo - 27/11/2014Synodiance > SEO - Le New Deal du Linking - Webikeo - 27/11/2014
Synodiance > SEO - Le New Deal du Linking - Webikeo - 27/11/2014
Search Foresight2.3K vues
Synodiance > Google Glass, objets connectés et SEO > Optiday > 28/11/2014 par Search Foresight
Synodiance > Google Glass, objets connectés et SEO > Optiday > 28/11/2014Synodiance > Google Glass, objets connectés et SEO > Optiday > 28/11/2014
Synodiance > Google Glass, objets connectés et SEO > Optiday > 28/11/2014
Search Foresight2.5K vues
Synodiance > SEO, vocal et sémantique - Performance Digitale Expo - 06/11/2014 par Search Foresight
Synodiance > SEO, vocal et sémantique - Performance Digitale Expo - 06/11/2014Synodiance > SEO, vocal et sémantique - Performance Digitale Expo - 06/11/2014
Synodiance > SEO, vocal et sémantique - Performance Digitale Expo - 06/11/2014
Search Foresight3.8K vues
Synodiance > SEO - Réussir votre refonte avec GEMO - E-Commerce Paris 2014 - ... par Search Foresight
Synodiance > SEO - Réussir votre refonte avec GEMO - E-Commerce Paris 2014 - ...Synodiance > SEO - Réussir votre refonte avec GEMO - E-Commerce Paris 2014 - ...
Synodiance > SEO - Réussir votre refonte avec GEMO - E-Commerce Paris 2014 - ...
Search Foresight3.1K vues
Synodiance > SEO - Update sur les News de l'été - Webconférence EBG - 19/09/2... par Search Foresight
Synodiance > SEO - Update sur les News de l'été - Webconférence EBG - 19/09/2...Synodiance > SEO - Update sur les News de l'été - Webconférence EBG - 19/09/2...
Synodiance > SEO - Update sur les News de l'été - Webconférence EBG - 19/09/2...
Search Foresight2.5K vues

Synodiance > SEO - Etude désindexation de contenus - 21/01/2015

  • 2. Etude désindexation de contenus Objectifs de l ’étude › Identifier et tester les directives de désindexation et de blocage d’indexation, › Optimiser l’exploration des bots – notion de « crawl utile », › Prioriser l’indexation des contenus stratégiques – pages objectifs. Environnement de test › Site dédié : ananas-seo.com › Période analysée : de septembre à novembre 2014 › Moteur étudié : Googlebot
  • 3. Site Test : ananas-seo.com Informations à prendre en compte avant lecture des résultats › ananas-seo.com a été créé spécialement pour un environnement de test, › Le domaine et les contenus ont peu d’autorité côté moteur de recherche, › Des sites à gros volume et forte popularité peuvent générer des résultats sensiblement différents, › Les directives testées ont donné lieu à des conclusions applicatives fiables et non strictes.
  • 4. Exploration VS Indexation Directives d’exploration : Par défaut, si aucune restriction n’est implémentée les bots pourront accéder à l’ensemble des fichiers présents sur le serveur web.
  • 5. Exploration VS Indexation Directives d’exploration : Par défaut, si aucune restriction n’est implémentée les bots pourront accéder à l’ensemble des fichiers présents sur le serveur web. Exemple d’une directive d’exploration dans le fichier robots.txt Disallow: /voyages/
  • 6. Exploration VS Indexation Directives d’indexation : Par défaut, si aucun paramètre oriente les bots lors de l’exploration, tout contenu est potentiellement indexable.
  • 7. Exploration VS Indexation Directives d’indexation : Par défaut, si aucun paramètre oriente les bots lors de l’exploration, tout contenu est potentiellement indexable. Exemple d’une directive d’indexation dans le <header> html d’un document. <Meta name=«robots» content=«noindex» />
  • 8. Test SEO : liste des directives testées Objectifs du test : bloquer l’indexation et désindexer des contenus Liste des directives testées sur ananas-seo.com • Déclaration d’une URL en HTTP 404 liée dans la structure • Déclaration d’une URL en HTTP 404 non-liée dans la structure • Déclaration d’une URL en HTTP 410 liée dans la structure • Déclaration d’une URL en HTTP 410 non-liée dans la structure • Balise Meta Noindex en Header Document post indexation • Balise Meta Noindex en Header Document post indexation + liens externes vers la cible url • Balise Meta Noindex en Header Document à la mise en production • Bloquer l’indexation via robots.txt à la mise en production : commande Disallow • Désindexation via directive x-robots tags implémentée dans le fichier .htaccess • Désindexation URL via noindex dans robots.txt • Désindexation répertoire via noindex dans robots.txt
  • 9. Désindexation « naturelle » : En soit ce n’est pas vraiment une méthode. Sur une période relativement longue et après plusieurs explorations, une page qui reçoit un code réponse HTTP 404 se désindexe. Attention : un document en 404 qui reçoit des liens externes a tendance à être maintenu dans l’index, surtout si les pages envoyant ces liens ont de l’autorité. Déclaration d’une URL en 404 liée dans la structure URL désindexée : OUI Délai constaté : 45 jours
  • 10. Désindexation « naturelle » : Similaire à une page 404 liée dans la structure, la désindexation est effective dans un délai constaté un peu plus long. Attention : un document en 404 qui reçoit des liens externes a tendance à être maintenu dans l’index, surtout si les pages envoyant ces liens ont de l’autorité. Déclaration d’une URL en 404 non-liée dans la structure URL désindexée : OUI Délai constaté : 60 jours
  • 11. Désindexation « naturelle » : On constate le même comportement de désindexation qu’une URL en HTTP 404. A noter : initialement orientée désindexation, Google communique sur la non distinction entre 404 et 410. Déclaration d’une URL en 410 liée dans la structure URL désindexée : OUI Délai constaté : 55 jours https://support.google.com/webmasters/answer/2409439?hl=fr
  • 12. Désindexation « naturelle » : On constate le même comportement de désindexation qu’une URL en HTTP 404. A noter : initialement orienté désindexation, Google communique sur la non distinction entre 404 et 410. Déclaration d’une URL en 410 non-liée dans la structure URL désindexée : OUI Délai constaté : 45 jours https://support.google.com/webmasters/answer/2409439?hl=fr
  • 13. Désindexation rapide : Assez efficace cette directive permet une désindexation rapide de contenus. <Meta name=«robots» content=«noindex» /> Important : attention de ne pas bloquer dans le robots.txt l’exploration des pages en Noindex. Cela aurait pour effet la non prise en compte de la directive de désindexation. Implémenter le balisage Meta Noindex après indexation URL désindexée : OUI Délai constaté : 15 jours
  • 14. Désindexation rapide : Assez efficace cette directive permet une désindexation rapide de contenus. <Meta name=«robots» content=«noindex» /> Important : sur un site d’autorité à forte popularité, un contenu en noindex peut être plus difficile à désindexer en raison du nombre de liens qu’il reçoit. Implémenter le balisage Meta Noindex après indexation sur une page qui reçoit du liens. URL désindexée : OUI Délai constaté : 20 jours
  • 15. Pas d’indexation : Intégrée dès la mise en production d’un document, la directive empêche l’indexation. <Meta name=«robots» content=«noindex» /> Implémenter le balisage Meta Noindex à la mise en prod URL non indexée : OUI Délai constaté : none
  • 16. Fonctionne dès la mise en production : La directive d’exploration « Disallow » empêche l’indexation d’un document uniquement si cette dernière est intégrée à la mise en production. Disallow: /ananas-poulet-riz-coco.php Important : n’a aucune fonction de désindexation. Un « disallow » est une directive d’exploration. Bloquer l’indexation d’un contenu via le fichier robots.txt URL non indexée : OUI Délai constaté : none
  • 17. Le robot d’exploration analyse l’entête HTTP: Directive très efficace et également intéressante quand on souhaite gérer la désindexation sans modifier le code source d’un contenu. X-Robots-Tag: googlebot: noindex A noter : le mode d’implémentation dépend du site (volume de pages, architecture,…) Désindexation via commande x-robots tag URL désindexée : OUI Délai constaté : 15 jours
  • 18. Directive non officielle : Google ne l’a jamais officialisée mais il sait l’interpréter. Noindex: /ananas-roti-vanille.php A noter : un site qui réalise 120 000 visites par mois a un fichier robots.txt exploré en moyenne 40 fois par jour. La directive, dans certains cas, peut être intéressante. Désindexation d’un document via noindex dans le robots.txt URL désindexée : OUI Délai constaté : 15 jours
  • 19. Directive non officielle : Google ne l’a jamais officialisé mais il sait l’interpréter. Noindex: /fruit/ A noter : un site qui réalise 120 000 visites par mois a un fichier robots.txt exploré en moyenne 40 fois par jour! La directive, dans certains cas, peut être intéressante. Désindexation d’un répertoire via noindex dans le robots.txt URL désindexée : OUI Délai constaté : 25 jours
  • 20. Synthèse Désindexer « naturellement » un contenu via HTTP 404/410 › Fonctionne si les contenus ne reçoivent pas trop de maillage interne/externe Bloquer l’indexation ou désindexer un contenu avec une Meta Noindex › Fonctionne si les contenus sont accessibles par les robots d’exploration Bloquer l’indexation ou désindexer un contenu X-robots tag Noindex › Très efficace, plus technique, la directive est dans l’entête HTTP du document. Désindexer un contenu avec directive Noindex dans le robots.txt › Non officielle mais reconnue par les principaux robots d’exploration, peut être utile selon les cas.