SlideShare une entreprise Scribd logo
1  sur  31
Indexation et désindexation

SEO Campus
14 mars 2013
Olivier Andrieu
(Abondance)

olivier@abondance.com
http://www.abondance.com/
Présentation

Olivier Andrieu

Basé à Heiligenstein (67140)

- Premiers pas sur Internet en 1993

- Création de la société Abondance en 1996

- Audit, conseil, accompagnement, formations, etc.
autour du référencement naturel (SEO)
Indexation et désindexation



1. Pourquoi désindexer ?

2. Que désindexer ?

3. Comment désindexer ?

4. Suivre une désindexation




Les slides seront en ligne demain
Indexation et désindexation
Pourquoi désindexer ?
- Pour fournir aux internautes uniquement des pages
           de bonne qualité

- Pour améliorer le taux de rebond sur son site

- Pour améliorer le "pogo sticking" de Google

- Désindexer = parfois "ne pas encore indexer"

- Pour des raisons de confidentialité

- Pour "bétonner" la non-indexation d'un intranet
           ou d'une zone accessible aux abonnés/clients…

- Pour éviter d'indexer des fichiers inutiles (CSS, JS, cgi-bin, etc.)

- Pour obliger l'internaute à venir sur votre site
           chercher un document

- Pour être en conformité avec les "guidelines" de Google
           (pages de résultats du moteur interne)

- Pour des problèmes de droits

- Pour faciliter le travail de crawl de Google

- Pour cause de diffamation ou demande à finalité juridique

- Pour interdire l'accès à des robots "exotiques”

- Pour éviter les foudres de Panda
Indexation et désindexation

Les risques de la désindexation

- Moins de pages indexées = perte de confiance
         de la part de Google ?

- Moins de trafic de Longue Traîne ?

- Montrer aux autres les "zones d'ombre"
         du site

- La perte de transmission de PR
          (augmentation des "dangling pages")


Pourquoi s'embêter à désindexer ?
- On n'a pas l'habitude :-)

- Une pratique récente

- Pourquoi faire le boulot de Google à sa place ?
Indexation et désindexation
Que désindexer ?

- Les pages en "duplicate content" ?

- Les pages obsolètes ?

- Les pages avec peu de contenu textuel

- Les pages peu intéressantes (formulaires)

- Les images (copyright ?)

- Les versions de test d'un site web

- Les pages de résultats de votre moteur interne

- Des pages diffamantes

Globalement, les pages qui n'apportent pas une réponse satisfaisante aux
internautes si on les trouve dans les SERP, notamment si elles sont présentes en
grande quantité sur votre site…

- Rappel : Google demande que vous ne désindexiez pas les JS et CSS
(http://www.abondance.com/actualites/20120326-11319-matt-cutts-laissez-googlebot-
crawler-vos-css-et-javascript.html).
Indexation et désindexation


Que désindexer ?

- Les pages en "duplicate content" ?

Exemples :

-   Mêmes produits dans des couleurs différentes
-   Même article dans des rubriques différentes
-   Article repris depuis une source originale
-   DUST (Duplicate URL, Same Text)

A priori, préférer la balise canonical
qui transfère les backlinks des pages dupliquées
vers les canoniques.

La désindexation peut être obligatoire
si la source le demande (mais c'est dommage
pour tout le monde, la canonical est préférable)

Problématique des contenus disponibles sous différents formats (Doc, PDF, etc.)
Indexation et désindexation


Que désindexer ?

- Les pages obsolètes ?

A traiter au cas par cas…

Leur Contenu est-il vraiment
totalement inintéressant ?
Dans ce cas, ne vaut-il pas mieux
envisager une 301 vers une
page plus intéressante ?
Indexation et désindexation


Que désindexer ?

- Les pages de faible qualité

Oui, ça semble logique…

- Formulaires
- Pages avec très peu de texte
- Pages ne répondant pas potentiellement
         aux questions des internautes

Mais désindexer uniquement
         si leur volume est important

Faites preuve de bon sens…
Indexation et désindexation


Comment désindexer ?

- Fichier robots.txt
          (interdit le crawl)

- Balise meta "robots"
          (interdit l'indexation)

- Directive X-Robots-Tag
          (interdit l'indexation)

- Google Webmaster Tools
         (interdit l'indexation)
Indexation et désindexation


Comment désindexer ?

- Fichier robots.txt
         (interdit le crawl)                        User-agent: Googlebot
                                                    Disallow:

http://www.votresite.com/robots.txt                 User-agent: *
                                                    Disallow: /
User-agent:*
                                                         Seul Googlebot est autorisé
Disallow: /images/
Disallow: /fichiers

                                                User-Agent: *
      User-agent: *                             Disallow: /repertoire/chemin/page.html
      Disallow:                                 Disallow: /repertoire/chemin/page2.html
            Opérations portes ouvertes
                                                Disallow: /repertoire/chemin/page3.html
                                                               Désindexation d'URL précises

   User-agent: *
   Disallow: /
                                         User-Agent: *
           Fermé à double tour           Disallow: /repertoire/chemin/page

                                                   Comment autoriser /repertoire/chemin/page2 au crawl ?
Indexation et désindexation


Comment désindexer ?

- Fichier robots.txt
          (interdit le crawl)


- Les robots de Google >




- Liste des autres robots :
http://www.robotstxt.org/db.html




                   Source : http://support.google.com/webmasters/bin/answer.py?hl=fr&answer=1061943
Indexation et désindexation


Comment désindexer ?

- Fichier robots.txt
          (interdit le crawl)


- Eviter les jokers (*, $, etc.) qui ne sont compatibles qu'avec Google et Bing
         Disallow: /*price=
         Disallow: /*{{config path=$
         Disallow: /*.flv$

- Idem pour "Allow:"

- Ne pas insérer de lignes blanches
         après le User-agent:


                                                                  QuickTime™ and a
                                                               Graphics decompressor
                                                          are needed to see this picture.
Indexation et désindexation


Comment désindexer ?

- Fichier robots.txt
          (interdit le crawl)



- Le bloc le plus spécifique sera pris en compte :

User-agent: *
Disallow:
User-agent: Bingbot
Disallow: /

Attention aux directives contradictoires !
Indexation et désindexation


Comment désindexer ?

- Fichier robots.txt
          (interdit le crawl)


- Testez vos robots.txt :

* Google Webmaster Tools
         (Etat de santé > URL bloquées)


* Outils dédiés :
http://tool.motoricerca.info/robots-checker.phtml
Indexation et désindexation
Comment désindexer ?

- Fichier robots.txt
          (interdit le crawl)


- Les pages sont connues de Google,
         les URL sont donc indexées
         mais pas explorées
         (mais un titre explicite
         est parfois indiqué par Google)
Indexation et désindexation


Comment désindexer ?

- Fichier robots.txt
          (interdit le crawl)



- L'URL est indexée, pas le contenu.

- Mais elle est "présente" dans les SERP !

- Que se passe-t-il si le contenu était
         indexé avant la mise en place du robots.txt ?
         > Délai avant remise à jour des données

- Le fichier robots.txt d'un site n'est pas lu par Google à chaque visite.
          Il faut le créer bien avant la mise en ligne des contenus "interdits"
Indexation et désindexation


Comment désindexer ?

- Fichier robots.txt
          (interdit le crawl)



- Attention si vous recevez ce type de message :




- Conclusion : le robots.txt est une solution plutôt à déconseiller
Indexation et désindexation


Comment désindexer ?

- Balise meta robots
         (interdit l'indexation)


<meta name="robots" content="noindex,follow">
<meta name="robots" content="noindex,nofollow">

<meta name="googlebot" content="noindex,follow">

- Fonctionne pour les pages web

- Ne fonctionne pas pour les autres formats (PDF, Word, PPT, images, etc.)

- Bien penser à ne pas mettre les URL dans le fichier robots.txt
Indexation et désindexation


Comment désindexer ?

- Directive X-Robots-Tag
          (interdit l'indexation)


- Dans l'en-tête HTTP

- Convient pour tous les formats de documents.

- Bien penser à ne pas mettre les URL dans le fichier robots.txt

- Peut être intéressant pour ne pas indexer les pages https déjà disponibles en http
(http://www.yapasdequoi.com/apache/2983-len-tete-x-robot-tag-ou-comment-vite-desindexer-des-
pages.html)

- Plus d'infos : https://developers.google.com/webmasters/control-crawl-index/docs/robots_meta_tag
Indexation et désindexation


Comment désindexer ?

- Directive X-Robots-Tag
          (interdit l'indexation)


Quelques exemples :

HTTP/1.1 200 OK
Date: Tue, 25 May 2010 21:42:43 GMT
(…)
X-Robots-Tag: noindex                                 HTTP/1.1 200 OK
(…)                                                   Date: Tue, 25 May 2010 21:42:43 GMT
                                                      (…)
                                                      X-Robots-Tag: googlebot: nofollow
HTTP/1.1 200 OK                                       X-Robots-Tag: otherbot: noindex, nofollow
Date: Tue, 25 May 2010 21:42:43 GMT                   (…)
(…)
X-Robots-Tag: noarchive
X-Robots-Tag: unavailable_after: 25 Jun 2013 15:00:00 PST
(…)
Indexation et désindexation


Comment désindexer ?

- Directive X-Robots-Tag
          (interdit l'indexation)




  Source : https://developers.google.com/webmasters/control-crawl-index/docs/robots_meta_tag
Indexation et désindexation


Comment désindexer ?

- Directive X-Robots-Tag
          (interdit l'indexation)


Exemple PHP :

header("X-Robots-Tag: noindex", true);

header("X-Robots-Tag: noindex, nofollow", true);


Exemple via le .htaccess :

<FilesMatch ".doc$">
Header set X-Robots-Tag "noindex, noarchive"
</Files>


<FilesMatch ".(doc|pdf)$">
Header set X-Robots-Tag "noindex, noarchive"
</Files>
Indexation et désindexation

Comment désindexer ?

- Google Webmaster Tools
        (interdit l'indexation)




   Le contenu supprimé à l'aide de cet outil est exclu de l'index Google pour une période minimale de 90
   jours. Au cours de cette période, vous pouvez à tout moment utiliser l'outil de demande de
   suppression d'URL pour réintégrer votre contenu.
   Voir : https://support.google.com/webmasters/bin/answer.py?hl=fr&answer=59819
Indexation et désindexation

Comment désindexer ?

- Google Webmaster Tools
         (interdit l'indexation)




    "Gardez à l'esprit que cet outil supprime toutes les versions d'une page (http/https et www/non
    www), même la version principale."
    Autre cas ici :
    http://support.google.com/webmasters/bin/answer.py?hl=fr&answer=1269119
Indexation et désindexation

Comment suivre une désindexation ?
- Requête "site:"

- Google Webmaster Tools : Etat de santé > Etat de l'indexation




- Eventuellement, créer un Sitemap spécial
         "Désindexation" et le suivre dans les GWT
Indexation et désindexation


Quelques infos supplémentaires

- Google n'a pas de limite de nombre de pages
         crawlées / indexées par site.

- Vous ne pouvez pas désindexer les
         sites de vos concurrents :-)

- Si vous demandez à Google de désindexer un contenu pour cause de diffamation
ou autre motif, le seul moyen d'arriver à vos fins est de faire un procès…

- Mais vous pouvez faire une demande Digital Millennium Copyright Act (DMCA) (
http://www.google.fr/intl/fr/dmca.html) en cas de violation des droits d’auteur
Indexation et désindexation


Conclusion

- La désindexation, une pratique nouvelle
          mais parfois utile et nécessaire

- Séparer le bon grain de l’ivraie sur son site

- Ne donner à manger à Goole que
         ce qu’il peut bien digérer

- Préférer la balise meta “robots”
         et la directive X-Robots-Tag
Indexation et désindexation


Quelques liens :

Protocole robots.txt et standards associés :
http://www.robotstxt.org/

Page de référence de Google sur les balises meta robots et x-robots-tag :
https://developers.google.com/webmasters/control-crawl-index/docs/robots_meta_tag

Pages de référence de Google sur le fichier robots.txt et les extensions du standard propres à
ce moteur :

http://googlewebmastercentral.blogspot.fr/2008/06/improving-on-robots-exclusion-
protocol.html

http://support.google.com/webmasters/bin/answer.py?
hl=fr&answer=156449&from=40367&r d=1

https://developers.google.com/webmasters/control-crawl-index/docs/faq
Indexation et désindexation




                  MERCI !!
          Merci à Philippe Yonnet et David Degrelle


          pour la relecture et les suggestions :))
Indexation et désindexation



 CONTENT IS KING, LINK IS HIS QUEEN,
  OPTIMIZED CONTENT IS EMPEROR !!!

  Le référencement sert à donner une
bonne visibilité à un contenu de qualité !


           Support proposé par Olivier Andrieu
                 olivier@abondance.com

Contenu connexe

Tendances

SEO: Faut il migrer vos sites en https ?
SEO: Faut il migrer vos sites en https ?SEO: Faut il migrer vos sites en https ?
SEO: Faut il migrer vos sites en https ?Camille Thomas
 
Optimiser réellement le référencement naturel de WordPress
Optimiser réellement le référencement naturel de WordPressOptimiser réellement le référencement naturel de WordPress
Optimiser réellement le référencement naturel de WordPressDaniel Roch - SeoMix
 
Le Contenu Dupliqué : Comment ça marche ? (Journée Big SEO 20 janvier 2021)
Le Contenu Dupliqué : Comment ça marche ? (Journée Big SEO 20 janvier 2021)Le Contenu Dupliqué : Comment ça marche ? (Journée Big SEO 20 janvier 2021)
Le Contenu Dupliqué : Comment ça marche ? (Journée Big SEO 20 janvier 2021)Olivier Andrieu
 
Refonte de site : Des méthodes pour préserver son SEO ?
Refonte de site :  Des méthodes pour préserver son SEO ?Refonte de site :  Des méthodes pour préserver son SEO ?
Refonte de site : Des méthodes pour préserver son SEO ?Alexy Souciet
 
Answer Engine Optimization (AEO) et Recherche Vocale : le futur du SEO ?
Answer Engine Optimization (AEO) et Recherche Vocale : le futur du SEO ?Answer Engine Optimization (AEO) et Recherche Vocale : le futur du SEO ?
Answer Engine Optimization (AEO) et Recherche Vocale : le futur du SEO ?Olivier Andrieu
 
ADW #6 : Optimiser le référencement naturel
ADW #6 : Optimiser le référencement naturelADW #6 : Optimiser le référencement naturel
ADW #6 : Optimiser le référencement naturelAtlantic 2.0
 
Synodiance > SEO et Contenu - 5 points clés qui changent - Ecommerce-Live - 2...
Synodiance > SEO et Contenu - 5 points clés qui changent - Ecommerce-Live - 2...Synodiance > SEO et Contenu - 5 points clés qui changent - Ecommerce-Live - 2...
Synodiance > SEO et Contenu - 5 points clés qui changent - Ecommerce-Live - 2...Search Foresight
 
Position 0 seocampus 2017 (Featured Snippets)
Position 0 seocampus 2017 (Featured Snippets)Position 0 seocampus 2017 (Featured Snippets)
Position 0 seocampus 2017 (Featured Snippets)DOUCET Raphael
 
Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016
Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016
Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016iProspect France
 
Cours SEO / Référencement Naturel - août 2013
Cours SEO / Référencement Naturel - août 2013Cours SEO / Référencement Naturel - août 2013
Cours SEO / Référencement Naturel - août 2013Pierre Ammeloot
 
Intégrer Yandex dans sa stratégie Search Marketing - SEO Camp'us 2016
Intégrer Yandex dans sa stratégie Search Marketing - SEO Camp'us 2016Intégrer Yandex dans sa stratégie Search Marketing - SEO Camp'us 2016
Intégrer Yandex dans sa stratégie Search Marketing - SEO Camp'us 2016iProspect France
 
Optimiser son maillage interne pour booster son SEO
Optimiser son maillage interne pour booster son SEOOptimiser son maillage interne pour booster son SEO
Optimiser son maillage interne pour booster son SEOGrégory Florin
 
Une stratégie SEO propre avec WordPress (sans polluer le web)
Une stratégie SEO propre avec WordPress (sans polluer le web)Une stratégie SEO propre avec WordPress (sans polluer le web)
Une stratégie SEO propre avec WordPress (sans polluer le web)Daniel Roch - SeoMix
 
Alphorm.com Formation Référencement naturel SEO
Alphorm.com Formation Référencement naturel SEOAlphorm.com Formation Référencement naturel SEO
Alphorm.com Formation Référencement naturel SEOAlphorm
 
Le référencement naturel de cas complexes sur WordPress
Le référencement naturel de cas complexes sur WordPressLe référencement naturel de cas complexes sur WordPress
Le référencement naturel de cas complexes sur WordPressDaniel Roch - SeoMix
 
Pénalités Google : Google Penguin, Google Panda : quelle stratégie de Google?
Pénalités Google : Google Penguin, Google Panda : quelle stratégie de Google?Pénalités Google : Google Penguin, Google Panda : quelle stratégie de Google?
Pénalités Google : Google Penguin, Google Panda : quelle stratégie de Google?Woptimo
 
Seo campus 2016 : Comment faire du SEO sur Baidu, le moteur de recherche n°1...
Seo campus 2016  : Comment faire du SEO sur Baidu, le moteur de recherche n°1...Seo campus 2016  : Comment faire du SEO sur Baidu, le moteur de recherche n°1...
Seo campus 2016 : Comment faire du SEO sur Baidu, le moteur de recherche n°1...Veronique Duong
 
BLACKHAT-PBN Alan Cladx – CEO Investoweb
BLACKHAT-PBN   Alan Cladx – CEO InvestowebBLACKHAT-PBN   Alan Cladx – CEO Investoweb
BLACKHAT-PBN Alan Cladx – CEO InvestowebTuni' SEO
 

Tendances (20)

SEO: Faut il migrer vos sites en https ?
SEO: Faut il migrer vos sites en https ?SEO: Faut il migrer vos sites en https ?
SEO: Faut il migrer vos sites en https ?
 
Optimiser réellement le référencement naturel de WordPress
Optimiser réellement le référencement naturel de WordPressOptimiser réellement le référencement naturel de WordPress
Optimiser réellement le référencement naturel de WordPress
 
Le Contenu Dupliqué : Comment ça marche ? (Journée Big SEO 20 janvier 2021)
Le Contenu Dupliqué : Comment ça marche ? (Journée Big SEO 20 janvier 2021)Le Contenu Dupliqué : Comment ça marche ? (Journée Big SEO 20 janvier 2021)
Le Contenu Dupliqué : Comment ça marche ? (Journée Big SEO 20 janvier 2021)
 
Refonte de site : Des méthodes pour préserver son SEO ?
Refonte de site :  Des méthodes pour préserver son SEO ?Refonte de site :  Des méthodes pour préserver son SEO ?
Refonte de site : Des méthodes pour préserver son SEO ?
 
Answer Engine Optimization (AEO) et Recherche Vocale : le futur du SEO ?
Answer Engine Optimization (AEO) et Recherche Vocale : le futur du SEO ?Answer Engine Optimization (AEO) et Recherche Vocale : le futur du SEO ?
Answer Engine Optimization (AEO) et Recherche Vocale : le futur du SEO ?
 
Audit de site WordPress
Audit de site WordPressAudit de site WordPress
Audit de site WordPress
 
ADW #6 : Optimiser le référencement naturel
ADW #6 : Optimiser le référencement naturelADW #6 : Optimiser le référencement naturel
ADW #6 : Optimiser le référencement naturel
 
Synodiance > SEO et Contenu - 5 points clés qui changent - Ecommerce-Live - 2...
Synodiance > SEO et Contenu - 5 points clés qui changent - Ecommerce-Live - 2...Synodiance > SEO et Contenu - 5 points clés qui changent - Ecommerce-Live - 2...
Synodiance > SEO et Contenu - 5 points clés qui changent - Ecommerce-Live - 2...
 
Position 0 seocampus 2017 (Featured Snippets)
Position 0 seocampus 2017 (Featured Snippets)Position 0 seocampus 2017 (Featured Snippets)
Position 0 seocampus 2017 (Featured Snippets)
 
Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016
Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016
Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016
 
Cours SEO / Référencement Naturel - août 2013
Cours SEO / Référencement Naturel - août 2013Cours SEO / Référencement Naturel - août 2013
Cours SEO / Référencement Naturel - août 2013
 
Intégrer Yandex dans sa stratégie Search Marketing - SEO Camp'us 2016
Intégrer Yandex dans sa stratégie Search Marketing - SEO Camp'us 2016Intégrer Yandex dans sa stratégie Search Marketing - SEO Camp'us 2016
Intégrer Yandex dans sa stratégie Search Marketing - SEO Camp'us 2016
 
Optimiser son maillage interne pour booster son SEO
Optimiser son maillage interne pour booster son SEOOptimiser son maillage interne pour booster son SEO
Optimiser son maillage interne pour booster son SEO
 
Une stratégie SEO propre avec WordPress (sans polluer le web)
Une stratégie SEO propre avec WordPress (sans polluer le web)Une stratégie SEO propre avec WordPress (sans polluer le web)
Une stratégie SEO propre avec WordPress (sans polluer le web)
 
WordPress et SEO - SEOCampus 2013
WordPress et SEO - SEOCampus 2013WordPress et SEO - SEOCampus 2013
WordPress et SEO - SEOCampus 2013
 
Alphorm.com Formation Référencement naturel SEO
Alphorm.com Formation Référencement naturel SEOAlphorm.com Formation Référencement naturel SEO
Alphorm.com Formation Référencement naturel SEO
 
Le référencement naturel de cas complexes sur WordPress
Le référencement naturel de cas complexes sur WordPressLe référencement naturel de cas complexes sur WordPress
Le référencement naturel de cas complexes sur WordPress
 
Pénalités Google : Google Penguin, Google Panda : quelle stratégie de Google?
Pénalités Google : Google Penguin, Google Panda : quelle stratégie de Google?Pénalités Google : Google Penguin, Google Panda : quelle stratégie de Google?
Pénalités Google : Google Penguin, Google Panda : quelle stratégie de Google?
 
Seo campus 2016 : Comment faire du SEO sur Baidu, le moteur de recherche n°1...
Seo campus 2016  : Comment faire du SEO sur Baidu, le moteur de recherche n°1...Seo campus 2016  : Comment faire du SEO sur Baidu, le moteur de recherche n°1...
Seo campus 2016 : Comment faire du SEO sur Baidu, le moteur de recherche n°1...
 
BLACKHAT-PBN Alan Cladx – CEO Investoweb
BLACKHAT-PBN   Alan Cladx – CEO InvestowebBLACKHAT-PBN   Alan Cladx – CEO Investoweb
BLACKHAT-PBN Alan Cladx – CEO Investoweb
 

En vedette

Duplicate Content Seo campus 09-03-2012
Duplicate Content Seo campus 09-03-2012Duplicate Content Seo campus 09-03-2012
Duplicate Content Seo campus 09-03-2012Olivier Andrieu
 
Quels sont les indicateurs SEO performants ?
Quels sont les indicateurs SEO performants ?Quels sont les indicateurs SEO performants ?
Quels sont les indicateurs SEO performants ?Woptimo
 
HTTPS The Road To A More Secure Web / SEOCamp Paris
HTTPS The Road To A More Secure Web / SEOCamp ParisHTTPS The Road To A More Secure Web / SEOCamp Paris
HTTPS The Road To A More Secure Web / SEOCamp ParisAysun Akarsu
 
Drupal 8 lessons learned
Drupal 8 lessons learned Drupal 8 lessons learned
Drupal 8 lessons learned Aaron Crosman
 
Brand Content, Native Ads... le contenu est-il futur du marketing ?
Brand Content, Native Ads... le contenu est-il futur du marketing ?Brand Content, Native Ads... le contenu est-il futur du marketing ?
Brand Content, Native Ads... le contenu est-il futur du marketing ?SMX Paris
 
les clés du référencement naturel (focus 2014)
les clés du référencement naturel (focus 2014)les clés du référencement naturel (focus 2014)
les clés du référencement naturel (focus 2014)echangeurba
 
Google Hummingbird : ce que cela change pour le SEO - conférence SEO Campus 2014
Google Hummingbird : ce que cela change pour le SEO - conférence SEO Campus 2014Google Hummingbird : ce que cela change pour le SEO - conférence SEO Campus 2014
Google Hummingbird : ce que cela change pour le SEO - conférence SEO Campus 2014Woptimo
 
Marketing mobile et SEO : App Store Optimisation ASO
Marketing mobile et SEO : App Store Optimisation ASOMarketing mobile et SEO : App Store Optimisation ASO
Marketing mobile et SEO : App Store Optimisation ASOSMX Paris
 
Reportings SEO avec Google Data Studio - SEO Campus Paris 2017
Reportings SEO avec Google Data Studio - SEO Campus Paris 2017Reportings SEO avec Google Data Studio - SEO Campus Paris 2017
Reportings SEO avec Google Data Studio - SEO Campus Paris 2017Woptimo
 
Tendances Social Media 2017
Tendances Social Media 2017Tendances Social Media 2017
Tendances Social Media 2017Marie Dollé
 
SEO et ecommerce sur Magento: retour d’expérience
SEO et ecommerce sur Magento: retour d’expérienceSEO et ecommerce sur Magento: retour d’expérience
SEO et ecommerce sur Magento: retour d’expérienceAurélien Lavorel
 

En vedette (20)

Duplicate Content Seo campus 09-03-2012
Duplicate Content Seo campus 09-03-2012Duplicate Content Seo campus 09-03-2012
Duplicate Content Seo campus 09-03-2012
 
Quels sont les indicateurs SEO performants ?
Quels sont les indicateurs SEO performants ?Quels sont les indicateurs SEO performants ?
Quels sont les indicateurs SEO performants ?
 
Bureaux Google Zurich
Bureaux Google ZurichBureaux Google Zurich
Bureaux Google Zurich
 
2015 seo-campus-mobile
2015 seo-campus-mobile2015 seo-campus-mobile
2015 seo-campus-mobile
 
2015 seo-campus-mobile1
2015 seo-campus-mobile12015 seo-campus-mobile1
2015 seo-campus-mobile1
 
HTTPS The Road To A More Secure Web / SEOCamp Paris
HTTPS The Road To A More Secure Web / SEOCamp ParisHTTPS The Road To A More Secure Web / SEOCamp Paris
HTTPS The Road To A More Secure Web / SEOCamp Paris
 
Drupal 8 lessons learned
Drupal 8 lessons learned Drupal 8 lessons learned
Drupal 8 lessons learned
 
Brand Content, Native Ads... le contenu est-il futur du marketing ?
Brand Content, Native Ads... le contenu est-il futur du marketing ?Brand Content, Native Ads... le contenu est-il futur du marketing ?
Brand Content, Native Ads... le contenu est-il futur du marketing ?
 
les clés du référencement naturel (focus 2014)
les clés du référencement naturel (focus 2014)les clés du référencement naturel (focus 2014)
les clés du référencement naturel (focus 2014)
 
Seo campus 01-03-2011
Seo campus 01-03-2011Seo campus 01-03-2011
Seo campus 01-03-2011
 
Réussir son référencement Google actualites
Réussir son référencement Google actualitesRéussir son référencement Google actualites
Réussir son référencement Google actualites
 
Google Hummingbird : ce que cela change pour le SEO - conférence SEO Campus 2014
Google Hummingbird : ce que cela change pour le SEO - conférence SEO Campus 2014Google Hummingbird : ce que cela change pour le SEO - conférence SEO Campus 2014
Google Hummingbird : ce que cela change pour le SEO - conférence SEO Campus 2014
 
Marketing mobile et SEO : App Store Optimisation ASO
Marketing mobile et SEO : App Store Optimisation ASOMarketing mobile et SEO : App Store Optimisation ASO
Marketing mobile et SEO : App Store Optimisation ASO
 
SEO local : SMX Paris 2016
SEO local : SMX Paris 2016SEO local : SMX Paris 2016
SEO local : SMX Paris 2016
 
Seo camp2017 Marguerite Leenhardt
Seo camp2017 Marguerite LeenhardtSeo camp2017 Marguerite Leenhardt
Seo camp2017 Marguerite Leenhardt
 
Le site internet est-il (bientôt) mort ?
Le site internet est-il (bientôt) mort ?Le site internet est-il (bientôt) mort ?
Le site internet est-il (bientôt) mort ?
 
Reportings SEO avec Google Data Studio - SEO Campus Paris 2017
Reportings SEO avec Google Data Studio - SEO Campus Paris 2017Reportings SEO avec Google Data Studio - SEO Campus Paris 2017
Reportings SEO avec Google Data Studio - SEO Campus Paris 2017
 
Tendances Social Media 2017
Tendances Social Media 2017Tendances Social Media 2017
Tendances Social Media 2017
 
Les personas pour le SEO
Les personas pour le SEOLes personas pour le SEO
Les personas pour le SEO
 
SEO et ecommerce sur Magento: retour d’expérience
SEO et ecommerce sur Magento: retour d’expérienceSEO et ecommerce sur Magento: retour d’expérience
SEO et ecommerce sur Magento: retour d’expérience
 

Similaire à Désindexation

Utilisation avancée d'un crawler - SEO Camp'us 2015
Utilisation avancée d'un crawler - SEO Camp'us 2015Utilisation avancée d'un crawler - SEO Camp'us 2015
Utilisation avancée d'un crawler - SEO Camp'us 2015Philippe YONNET
 
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017Peak Ace
 
SEO Lanta : gagnez l'aventure des SERP
SEO Lanta : gagnez l'aventure des SERPSEO Lanta : gagnez l'aventure des SERP
SEO Lanta : gagnez l'aventure des SERPAymeric Bouillat
 
Livre blanc de sensibilisation au SEO
Livre blanc de sensibilisation au SEOLivre blanc de sensibilisation au SEO
Livre blanc de sensibilisation au SEOKseo Conseil
 
Cours referencement optimisation
Cours referencement optimisationCours referencement optimisation
Cours referencement optimisationRémi Bachelet
 
03 seo indexation et optimisation technique
03 seo    indexation et optimisation technique03 seo    indexation et optimisation technique
03 seo indexation et optimisation techniqueJCDomenget
 
Screaming frog - l'outil ne fait pas l'artisan
Screaming frog - l'outil ne fait pas l'artisanScreaming frog - l'outil ne fait pas l'artisan
Screaming frog - l'outil ne fait pas l'artisanAymeric Bouillat
 
Evolutions et nouveaux outils SEO
Evolutions et nouveaux outils SEOEvolutions et nouveaux outils SEO
Evolutions et nouveaux outils SEODimitri Brunel
 
Donner un turbo seo pour joomla. Conférence au JoomlaDay 2019
Donner un turbo seo pour joomla. Conférence au JoomlaDay 2019Donner un turbo seo pour joomla. Conférence au JoomlaDay 2019
Donner un turbo seo pour joomla. Conférence au JoomlaDay 2019Laurent Tulpan
 
Les défauts de WordPress pour le SEO
Les défauts de WordPress pour le SEOLes défauts de WordPress pour le SEO
Les défauts de WordPress pour le SEODaniel Roch - SeoMix
 
Synodiance > SEO & Technique - Conférence E-Commerce Live 19/11/13
Synodiance > SEO & Technique - Conférence E-Commerce Live 19/11/13Synodiance > SEO & Technique - Conférence E-Commerce Live 19/11/13
Synodiance > SEO & Technique - Conférence E-Commerce Live 19/11/13Search Foresight
 
Psm master 1 - indexation et optimisation technique SEO
Psm   master 1 -  indexation et optimisation technique SEOPsm   master 1 -  indexation et optimisation technique SEO
Psm master 1 - indexation et optimisation technique SEOJCD srcmontbeliard
 
Being Googlebot - de nouvelles clés pour optimiser le SEO
Being Googlebot - de nouvelles clés pour optimiser le SEOBeing Googlebot - de nouvelles clés pour optimiser le SEO
Being Googlebot - de nouvelles clés pour optimiser le SEODigimood - Agence SEO / SEA
 
Synodiance > SEO - Tendances SEO - French Web - 01/12/2014
Synodiance > SEO - Tendances SEO - French Web - 01/12/2014Synodiance > SEO - Tendances SEO - French Web - 01/12/2014
Synodiance > SEO - Tendances SEO - French Web - 01/12/2014Search Foresight
 
Indexation et optimisation technique - version 2010
Indexation et optimisation technique - version 2010Indexation et optimisation technique - version 2010
Indexation et optimisation technique - version 2010JCDomenget
 
L'impact sur le SEO de Googlebot Evergreen
L'impact sur le SEO de Googlebot EvergreenL'impact sur le SEO de Googlebot Evergreen
L'impact sur le SEO de Googlebot EvergreenPhilippe YONNET
 
SEARCH Y - Bing : Frédéric Dubut et Fabrice Canel - Crawl et Indexation, les ...
SEARCH Y - Bing : Frédéric Dubut et Fabrice Canel - Crawl et Indexation, les ...SEARCH Y - Bing : Frédéric Dubut et Fabrice Canel - Crawl et Indexation, les ...
SEARCH Y - Bing : Frédéric Dubut et Fabrice Canel - Crawl et Indexation, les ...SEARCH Y - Philippe Yonnet Evénements
 
Analyse et comparaison des principaux outils SEO disponible sur le marché
Analyse et comparaison des principaux outils SEO disponible sur le marchéAnalyse et comparaison des principaux outils SEO disponible sur le marché
Analyse et comparaison des principaux outils SEO disponible sur le marchéBarbara Czmil-Ruello
 
Référencement naturel, social et stratégie de contenu
Référencement naturel, social et stratégie de contenuRéférencement naturel, social et stratégie de contenu
Référencement naturel, social et stratégie de contenuFrédéric BARDEAU
 

Similaire à Désindexation (20)

Utilisation avancée d'un crawler - SEO Camp'us 2015
Utilisation avancée d'un crawler - SEO Camp'us 2015Utilisation avancée d'un crawler - SEO Camp'us 2015
Utilisation avancée d'un crawler - SEO Camp'us 2015
 
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017
 
SEO Lanta : gagnez l'aventure des SERP
SEO Lanta : gagnez l'aventure des SERPSEO Lanta : gagnez l'aventure des SERP
SEO Lanta : gagnez l'aventure des SERP
 
Livre blanc de sensibilisation au SEO
Livre blanc de sensibilisation au SEOLivre blanc de sensibilisation au SEO
Livre blanc de sensibilisation au SEO
 
Cours referencement optimisation
Cours referencement optimisationCours referencement optimisation
Cours referencement optimisation
 
03 seo indexation et optimisation technique
03 seo    indexation et optimisation technique03 seo    indexation et optimisation technique
03 seo indexation et optimisation technique
 
Screaming frog - l'outil ne fait pas l'artisan
Screaming frog - l'outil ne fait pas l'artisanScreaming frog - l'outil ne fait pas l'artisan
Screaming frog - l'outil ne fait pas l'artisan
 
Evolutions et nouveaux outils SEO
Evolutions et nouveaux outils SEOEvolutions et nouveaux outils SEO
Evolutions et nouveaux outils SEO
 
Donner un turbo seo pour joomla. Conférence au JoomlaDay 2019
Donner un turbo seo pour joomla. Conférence au JoomlaDay 2019Donner un turbo seo pour joomla. Conférence au JoomlaDay 2019
Donner un turbo seo pour joomla. Conférence au JoomlaDay 2019
 
Les défauts de WordPress pour le SEO
Les défauts de WordPress pour le SEOLes défauts de WordPress pour le SEO
Les défauts de WordPress pour le SEO
 
Synodiance > SEO & Technique - Conférence E-Commerce Live 19/11/13
Synodiance > SEO & Technique - Conférence E-Commerce Live 19/11/13Synodiance > SEO & Technique - Conférence E-Commerce Live 19/11/13
Synodiance > SEO & Technique - Conférence E-Commerce Live 19/11/13
 
Psm master 1 - indexation et optimisation technique SEO
Psm   master 1 -  indexation et optimisation technique SEOPsm   master 1 -  indexation et optimisation technique SEO
Psm master 1 - indexation et optimisation technique SEO
 
Being Googlebot - de nouvelles clés pour optimiser le SEO
Being Googlebot - de nouvelles clés pour optimiser le SEOBeing Googlebot - de nouvelles clés pour optimiser le SEO
Being Googlebot - de nouvelles clés pour optimiser le SEO
 
Synodiance > SEO - Tendances SEO - French Web - 01/12/2014
Synodiance > SEO - Tendances SEO - French Web - 01/12/2014Synodiance > SEO - Tendances SEO - French Web - 01/12/2014
Synodiance > SEO - Tendances SEO - French Web - 01/12/2014
 
Se faire connaitre sur le web
Se faire connaitre sur le webSe faire connaitre sur le web
Se faire connaitre sur le web
 
Indexation et optimisation technique - version 2010
Indexation et optimisation technique - version 2010Indexation et optimisation technique - version 2010
Indexation et optimisation technique - version 2010
 
L'impact sur le SEO de Googlebot Evergreen
L'impact sur le SEO de Googlebot EvergreenL'impact sur le SEO de Googlebot Evergreen
L'impact sur le SEO de Googlebot Evergreen
 
SEARCH Y - Bing : Frédéric Dubut et Fabrice Canel - Crawl et Indexation, les ...
SEARCH Y - Bing : Frédéric Dubut et Fabrice Canel - Crawl et Indexation, les ...SEARCH Y - Bing : Frédéric Dubut et Fabrice Canel - Crawl et Indexation, les ...
SEARCH Y - Bing : Frédéric Dubut et Fabrice Canel - Crawl et Indexation, les ...
 
Analyse et comparaison des principaux outils SEO disponible sur le marché
Analyse et comparaison des principaux outils SEO disponible sur le marchéAnalyse et comparaison des principaux outils SEO disponible sur le marché
Analyse et comparaison des principaux outils SEO disponible sur le marché
 
Référencement naturel, social et stratégie de contenu
Référencement naturel, social et stratégie de contenuRéférencement naturel, social et stratégie de contenu
Référencement naturel, social et stratégie de contenu
 

Plus de Olivier Andrieu

Les Bienfaits de la Désindexaton (Seo camp day Lorraine)
Les Bienfaits de la Désindexaton (Seo camp day Lorraine)Les Bienfaits de la Désindexaton (Seo camp day Lorraine)
Les Bienfaits de la Désindexaton (Seo camp day Lorraine)Olivier Andrieu
 
Comment identifier l'intention de recherche détectée par Google sur une requê...
Comment identifier l'intention de recherche détectée par Google sur une requê...Comment identifier l'intention de recherche détectée par Google sur une requê...
Comment identifier l'intention de recherche détectée par Google sur une requê...Olivier Andrieu
 
Tendances SEO 2021 : Slides et Replay du webinar BIG SEO
Tendances SEO 2021 : Slides et Replay du webinar BIG SEOTendances SEO 2021 : Slides et Replay du webinar BIG SEO
Tendances SEO 2021 : Slides et Replay du webinar BIG SEOOlivier Andrieu
 
SEO International : Comment élargir sa visibilité ? - Digital Marketing League
SEO International : Comment élargir sa visibilité ? - Digital Marketing LeagueSEO International : Comment élargir sa visibilité ? - Digital Marketing League
SEO International : Comment élargir sa visibilité ? - Digital Marketing LeagueOlivier Andrieu
 
L'intégration des balises de données structurées FAQ, Q&A et HowTo pour do...
L'intégration des balises de données structurées FAQ, Q&A et HowTo pour do...L'intégration des balises de données structurées FAQ, Q&A et HowTo pour do...
L'intégration des balises de données structurées FAQ, Q&A et HowTo pour do...Olivier Andrieu
 
10 points à savoir pour mieux utiliser la Search Console
10 points à savoir pour mieux utiliser la Search Console10 points à savoir pour mieux utiliser la Search Console
10 points à savoir pour mieux utiliser la Search ConsoleOlivier Andrieu
 
Comment intégrer les "core Updates" de Google dans sa stratégie SEO ?
Comment intégrer les "core Updates" de Google dans sa stratégie SEO ?Comment intégrer les "core Updates" de Google dans sa stratégie SEO ?
Comment intégrer les "core Updates" de Google dans sa stratégie SEO ?Olivier Andrieu
 
Etude de cas : mettre en place une migration sans perdre son SEO (Performance...
Etude de cas : mettre en place une migration sans perdre son SEO (Performance...Etude de cas : mettre en place une migration sans perdre son SEO (Performance...
Etude de cas : mettre en place une migration sans perdre son SEO (Performance...Olivier Andrieu
 
Featured Snippets, Recherche Vocale et SEO (Seo Campus 2018)
Featured Snippets, Recherche Vocale et SEO (Seo Campus 2018)Featured Snippets, Recherche Vocale et SEO (Seo Campus 2018)
Featured Snippets, Recherche Vocale et SEO (Seo Campus 2018)Olivier Andrieu
 

Plus de Olivier Andrieu (9)

Les Bienfaits de la Désindexaton (Seo camp day Lorraine)
Les Bienfaits de la Désindexaton (Seo camp day Lorraine)Les Bienfaits de la Désindexaton (Seo camp day Lorraine)
Les Bienfaits de la Désindexaton (Seo camp day Lorraine)
 
Comment identifier l'intention de recherche détectée par Google sur une requê...
Comment identifier l'intention de recherche détectée par Google sur une requê...Comment identifier l'intention de recherche détectée par Google sur une requê...
Comment identifier l'intention de recherche détectée par Google sur une requê...
 
Tendances SEO 2021 : Slides et Replay du webinar BIG SEO
Tendances SEO 2021 : Slides et Replay du webinar BIG SEOTendances SEO 2021 : Slides et Replay du webinar BIG SEO
Tendances SEO 2021 : Slides et Replay du webinar BIG SEO
 
SEO International : Comment élargir sa visibilité ? - Digital Marketing League
SEO International : Comment élargir sa visibilité ? - Digital Marketing LeagueSEO International : Comment élargir sa visibilité ? - Digital Marketing League
SEO International : Comment élargir sa visibilité ? - Digital Marketing League
 
L'intégration des balises de données structurées FAQ, Q&A et HowTo pour do...
L'intégration des balises de données structurées FAQ, Q&A et HowTo pour do...L'intégration des balises de données structurées FAQ, Q&A et HowTo pour do...
L'intégration des balises de données structurées FAQ, Q&A et HowTo pour do...
 
10 points à savoir pour mieux utiliser la Search Console
10 points à savoir pour mieux utiliser la Search Console10 points à savoir pour mieux utiliser la Search Console
10 points à savoir pour mieux utiliser la Search Console
 
Comment intégrer les "core Updates" de Google dans sa stratégie SEO ?
Comment intégrer les "core Updates" de Google dans sa stratégie SEO ?Comment intégrer les "core Updates" de Google dans sa stratégie SEO ?
Comment intégrer les "core Updates" de Google dans sa stratégie SEO ?
 
Etude de cas : mettre en place une migration sans perdre son SEO (Performance...
Etude de cas : mettre en place une migration sans perdre son SEO (Performance...Etude de cas : mettre en place une migration sans perdre son SEO (Performance...
Etude de cas : mettre en place une migration sans perdre son SEO (Performance...
 
Featured Snippets, Recherche Vocale et SEO (Seo Campus 2018)
Featured Snippets, Recherche Vocale et SEO (Seo Campus 2018)Featured Snippets, Recherche Vocale et SEO (Seo Campus 2018)
Featured Snippets, Recherche Vocale et SEO (Seo Campus 2018)
 

Désindexation

  • 1. Indexation et désindexation SEO Campus 14 mars 2013 Olivier Andrieu (Abondance) olivier@abondance.com http://www.abondance.com/
  • 2. Présentation Olivier Andrieu Basé à Heiligenstein (67140) - Premiers pas sur Internet en 1993 - Création de la société Abondance en 1996 - Audit, conseil, accompagnement, formations, etc. autour du référencement naturel (SEO)
  • 3. Indexation et désindexation 1. Pourquoi désindexer ? 2. Que désindexer ? 3. Comment désindexer ? 4. Suivre une désindexation Les slides seront en ligne demain
  • 4. Indexation et désindexation Pourquoi désindexer ? - Pour fournir aux internautes uniquement des pages de bonne qualité - Pour améliorer le taux de rebond sur son site - Pour améliorer le "pogo sticking" de Google - Désindexer = parfois "ne pas encore indexer" - Pour des raisons de confidentialité - Pour "bétonner" la non-indexation d'un intranet ou d'une zone accessible aux abonnés/clients… - Pour éviter d'indexer des fichiers inutiles (CSS, JS, cgi-bin, etc.) - Pour obliger l'internaute à venir sur votre site chercher un document - Pour être en conformité avec les "guidelines" de Google (pages de résultats du moteur interne) - Pour des problèmes de droits - Pour faciliter le travail de crawl de Google - Pour cause de diffamation ou demande à finalité juridique - Pour interdire l'accès à des robots "exotiques” - Pour éviter les foudres de Panda
  • 5. Indexation et désindexation Les risques de la désindexation - Moins de pages indexées = perte de confiance de la part de Google ? - Moins de trafic de Longue Traîne ? - Montrer aux autres les "zones d'ombre" du site - La perte de transmission de PR (augmentation des "dangling pages") Pourquoi s'embêter à désindexer ? - On n'a pas l'habitude :-) - Une pratique récente - Pourquoi faire le boulot de Google à sa place ?
  • 6. Indexation et désindexation Que désindexer ? - Les pages en "duplicate content" ? - Les pages obsolètes ? - Les pages avec peu de contenu textuel - Les pages peu intéressantes (formulaires) - Les images (copyright ?) - Les versions de test d'un site web - Les pages de résultats de votre moteur interne - Des pages diffamantes Globalement, les pages qui n'apportent pas une réponse satisfaisante aux internautes si on les trouve dans les SERP, notamment si elles sont présentes en grande quantité sur votre site… - Rappel : Google demande que vous ne désindexiez pas les JS et CSS (http://www.abondance.com/actualites/20120326-11319-matt-cutts-laissez-googlebot- crawler-vos-css-et-javascript.html).
  • 7. Indexation et désindexation Que désindexer ? - Les pages en "duplicate content" ? Exemples : - Mêmes produits dans des couleurs différentes - Même article dans des rubriques différentes - Article repris depuis une source originale - DUST (Duplicate URL, Same Text) A priori, préférer la balise canonical qui transfère les backlinks des pages dupliquées vers les canoniques. La désindexation peut être obligatoire si la source le demande (mais c'est dommage pour tout le monde, la canonical est préférable) Problématique des contenus disponibles sous différents formats (Doc, PDF, etc.)
  • 8. Indexation et désindexation Que désindexer ? - Les pages obsolètes ? A traiter au cas par cas… Leur Contenu est-il vraiment totalement inintéressant ? Dans ce cas, ne vaut-il pas mieux envisager une 301 vers une page plus intéressante ?
  • 9. Indexation et désindexation Que désindexer ? - Les pages de faible qualité Oui, ça semble logique… - Formulaires - Pages avec très peu de texte - Pages ne répondant pas potentiellement aux questions des internautes Mais désindexer uniquement si leur volume est important Faites preuve de bon sens…
  • 10. Indexation et désindexation Comment désindexer ? - Fichier robots.txt (interdit le crawl) - Balise meta "robots" (interdit l'indexation) - Directive X-Robots-Tag (interdit l'indexation) - Google Webmaster Tools (interdit l'indexation)
  • 11. Indexation et désindexation Comment désindexer ? - Fichier robots.txt (interdit le crawl) User-agent: Googlebot Disallow: http://www.votresite.com/robots.txt User-agent: * Disallow: / User-agent:* Seul Googlebot est autorisé Disallow: /images/ Disallow: /fichiers User-Agent: * User-agent: * Disallow: /repertoire/chemin/page.html Disallow: Disallow: /repertoire/chemin/page2.html Opérations portes ouvertes Disallow: /repertoire/chemin/page3.html Désindexation d'URL précises User-agent: * Disallow: / User-Agent: * Fermé à double tour Disallow: /repertoire/chemin/page Comment autoriser /repertoire/chemin/page2 au crawl ?
  • 12. Indexation et désindexation Comment désindexer ? - Fichier robots.txt (interdit le crawl) - Les robots de Google > - Liste des autres robots : http://www.robotstxt.org/db.html Source : http://support.google.com/webmasters/bin/answer.py?hl=fr&answer=1061943
  • 13. Indexation et désindexation Comment désindexer ? - Fichier robots.txt (interdit le crawl) - Eviter les jokers (*, $, etc.) qui ne sont compatibles qu'avec Google et Bing Disallow: /*price= Disallow: /*{{config path=$ Disallow: /*.flv$ - Idem pour "Allow:" - Ne pas insérer de lignes blanches après le User-agent: QuickTime™ and a Graphics decompressor are needed to see this picture.
  • 14. Indexation et désindexation Comment désindexer ? - Fichier robots.txt (interdit le crawl) - Le bloc le plus spécifique sera pris en compte : User-agent: * Disallow: User-agent: Bingbot Disallow: / Attention aux directives contradictoires !
  • 15. Indexation et désindexation Comment désindexer ? - Fichier robots.txt (interdit le crawl) - Testez vos robots.txt : * Google Webmaster Tools (Etat de santé > URL bloquées) * Outils dédiés : http://tool.motoricerca.info/robots-checker.phtml
  • 16. Indexation et désindexation Comment désindexer ? - Fichier robots.txt (interdit le crawl) - Les pages sont connues de Google, les URL sont donc indexées mais pas explorées (mais un titre explicite est parfois indiqué par Google)
  • 17. Indexation et désindexation Comment désindexer ? - Fichier robots.txt (interdit le crawl) - L'URL est indexée, pas le contenu. - Mais elle est "présente" dans les SERP ! - Que se passe-t-il si le contenu était indexé avant la mise en place du robots.txt ? > Délai avant remise à jour des données - Le fichier robots.txt d'un site n'est pas lu par Google à chaque visite. Il faut le créer bien avant la mise en ligne des contenus "interdits"
  • 18. Indexation et désindexation Comment désindexer ? - Fichier robots.txt (interdit le crawl) - Attention si vous recevez ce type de message : - Conclusion : le robots.txt est une solution plutôt à déconseiller
  • 19. Indexation et désindexation Comment désindexer ? - Balise meta robots (interdit l'indexation) <meta name="robots" content="noindex,follow"> <meta name="robots" content="noindex,nofollow"> <meta name="googlebot" content="noindex,follow"> - Fonctionne pour les pages web - Ne fonctionne pas pour les autres formats (PDF, Word, PPT, images, etc.) - Bien penser à ne pas mettre les URL dans le fichier robots.txt
  • 20. Indexation et désindexation Comment désindexer ? - Directive X-Robots-Tag (interdit l'indexation) - Dans l'en-tête HTTP - Convient pour tous les formats de documents. - Bien penser à ne pas mettre les URL dans le fichier robots.txt - Peut être intéressant pour ne pas indexer les pages https déjà disponibles en http (http://www.yapasdequoi.com/apache/2983-len-tete-x-robot-tag-ou-comment-vite-desindexer-des- pages.html) - Plus d'infos : https://developers.google.com/webmasters/control-crawl-index/docs/robots_meta_tag
  • 21. Indexation et désindexation Comment désindexer ? - Directive X-Robots-Tag (interdit l'indexation) Quelques exemples : HTTP/1.1 200 OK Date: Tue, 25 May 2010 21:42:43 GMT (…) X-Robots-Tag: noindex HTTP/1.1 200 OK (…) Date: Tue, 25 May 2010 21:42:43 GMT (…) X-Robots-Tag: googlebot: nofollow HTTP/1.1 200 OK X-Robots-Tag: otherbot: noindex, nofollow Date: Tue, 25 May 2010 21:42:43 GMT (…) (…) X-Robots-Tag: noarchive X-Robots-Tag: unavailable_after: 25 Jun 2013 15:00:00 PST (…)
  • 22. Indexation et désindexation Comment désindexer ? - Directive X-Robots-Tag (interdit l'indexation) Source : https://developers.google.com/webmasters/control-crawl-index/docs/robots_meta_tag
  • 23. Indexation et désindexation Comment désindexer ? - Directive X-Robots-Tag (interdit l'indexation) Exemple PHP : header("X-Robots-Tag: noindex", true); header("X-Robots-Tag: noindex, nofollow", true); Exemple via le .htaccess : <FilesMatch ".doc$"> Header set X-Robots-Tag "noindex, noarchive" </Files> <FilesMatch ".(doc|pdf)$"> Header set X-Robots-Tag "noindex, noarchive" </Files>
  • 24. Indexation et désindexation Comment désindexer ? - Google Webmaster Tools (interdit l'indexation) Le contenu supprimé à l'aide de cet outil est exclu de l'index Google pour une période minimale de 90 jours. Au cours de cette période, vous pouvez à tout moment utiliser l'outil de demande de suppression d'URL pour réintégrer votre contenu. Voir : https://support.google.com/webmasters/bin/answer.py?hl=fr&answer=59819
  • 25. Indexation et désindexation Comment désindexer ? - Google Webmaster Tools (interdit l'indexation) "Gardez à l'esprit que cet outil supprime toutes les versions d'une page (http/https et www/non www), même la version principale." Autre cas ici : http://support.google.com/webmasters/bin/answer.py?hl=fr&answer=1269119
  • 26. Indexation et désindexation Comment suivre une désindexation ? - Requête "site:" - Google Webmaster Tools : Etat de santé > Etat de l'indexation - Eventuellement, créer un Sitemap spécial "Désindexation" et le suivre dans les GWT
  • 27. Indexation et désindexation Quelques infos supplémentaires - Google n'a pas de limite de nombre de pages crawlées / indexées par site. - Vous ne pouvez pas désindexer les sites de vos concurrents :-) - Si vous demandez à Google de désindexer un contenu pour cause de diffamation ou autre motif, le seul moyen d'arriver à vos fins est de faire un procès… - Mais vous pouvez faire une demande Digital Millennium Copyright Act (DMCA) ( http://www.google.fr/intl/fr/dmca.html) en cas de violation des droits d’auteur
  • 28. Indexation et désindexation Conclusion - La désindexation, une pratique nouvelle mais parfois utile et nécessaire - Séparer le bon grain de l’ivraie sur son site - Ne donner à manger à Goole que ce qu’il peut bien digérer - Préférer la balise meta “robots” et la directive X-Robots-Tag
  • 29. Indexation et désindexation Quelques liens : Protocole robots.txt et standards associés : http://www.robotstxt.org/ Page de référence de Google sur les balises meta robots et x-robots-tag : https://developers.google.com/webmasters/control-crawl-index/docs/robots_meta_tag Pages de référence de Google sur le fichier robots.txt et les extensions du standard propres à ce moteur : http://googlewebmastercentral.blogspot.fr/2008/06/improving-on-robots-exclusion- protocol.html http://support.google.com/webmasters/bin/answer.py? hl=fr&answer=156449&from=40367&r d=1 https://developers.google.com/webmasters/control-crawl-index/docs/faq
  • 30. Indexation et désindexation MERCI !! Merci à Philippe Yonnet et David Degrelle pour la relecture et les suggestions :))
  • 31. Indexation et désindexation CONTENT IS KING, LINK IS HIS QUEEN, OPTIMIZED CONTENT IS EMPEROR !!! Le référencement sert à donner une bonne visibilité à un contenu de qualité ! Support proposé par Olivier Andrieu olivier@abondance.com