Audit d’un site web
Erwan Tanguy
Réaliser un audit de site web
L’audit d’un site ne se limite pas à l’analyse du potentiel « référencement » de
celui-ci et nécessite un accès à différentes données :
 Statistiques (Google Analytics par exemple) ;
 Sitemap ;
 Contenus et hiérarchie des textes ;
 Code HTML ;
 Architecture des plateformes liées (réseaux et médias sociaux, blogs…) ;
 … (j’en oublie beaucoup)
Il n’est pas toujours évident d’obtenir les informations qui ne sont pas déjà
accessibles en ligne mais il faut réussir à faire comprendre que les données
statistiques sont un élément essentiel pour l’audit et les préconisations sur le
moyen et le long terme.
Côté moteurs de recherche
Analyse du trafic du site

Attention aux redirections

Vous devez estimer la qualité et la
quantité du trafic.
Établissez les types d’internautes qui
viennent sur le site, d’où ils viennent
et quels sont les contenus les plus
visités et partagés/commentés.
Regardez aussi le nombre et la
qualité de vos « backlinks » (sont-ils
suffisants, pertinents ?), le nombre
de pages indexées par rapport au
nombre de pages réelles…
Vous pouvez aussi vérifier le Page
Rank du site même si ce critère
n’est plus mis à jour et perd de son
intérêt.

Souvent encore, le nom de domaine
avec ou sans « www » existe. Le site
est visible sur 2 urls différentes. Ça
ne semble pas important à pemière
vue mais les moteurs de recherche
voient 2 sites avec les mêmes
contenus !
Pensez à faire rediriger l’un vers
l’autre. Il n’y a pas de préférence a
priori entre avec ou sans « www ».
Nous pouvons constater cependant
que de plus en plus de site préfère
sans pour des urls plus courtes et
plus faciles à retenir, sans doute.
Côté moteurs de recherche
Les urls

Sitemap et robots.txt

Vérifiez que les urls du site web sont
bien propres (sans requêtes par
exemple) et opter pour une
réécriture, si cela est possible.
Attention, pour les réécritures d’url, il
faut que l’hébergement propose cette
option. Si votre site est hébergé chez
Free, par exemple, ce ne sera pas
possible.

Vérifier que le site propose un
sitemap et que celui-ci soit déclaré
sur le fichier robots.txt et/ou sur
GWT (Google Webmaster Tools).
Il est toujours plus intéressant de
proposer directement les urls d’un
site web aux moteurs de recherche
plutôt que de le laisser découvrir à
l’aveugle toutes les pages.
Cela n’empêche pas de bien vérifier
dans l’arborescence du site que la
majorité des pages s’y trouvent
accessible.
Côté moteurs de recherche
L’âge du nom de domaine

Le ratio texte/code

Même si ce n’est pas le critère le plus
important, l’âge d’un nom de
domaine joue sur sa notoriété et
donc sur la confiance accordée par
les moteurs de recherche.
Un nom de domaine qui a déjà fait
ses preuves ne sera pas déclassé au
profit d’un nouveau nom de domaine
du jour au lendemain. Il bénéficie
d’un antériorité qui prouve, aux yeux
des moteurs, qu’il sera encore là
demain alors que le nouveau, rien ne
le garantit.

Dans l’idéal, le texte doit représenté
proportionnellement environ 25% de
la page.

Vitesse de chargement
Comme c’est un indicateur pris en
compte par les moteurs de recherche
(Google en tête), il est important de
le noter et éventuellement de voir
comment le réduire.

Validité W3C
Sans forcément viser la validité
totale, vérifiez qu’il n’y a pas de
problèmes majeurs qui pourraient
être pris comme critère négatif par
les moteurs de recherche.
Côté site web
Responsive ?

Fidéliser

Le trafic via les mobiles dépasse les
15%, il ne faut pas le sous-estimer.
Et rien n’est plus énervant sur un
smartphone qu’un site inadapté !
Un site « responsive » devrait
améliorer sensiblement ses
statistiques et son référencement
naturel.

Le site web propose-t-il clairement
des outils pour fidéliser les visiteurs :
 Newsletter ;
 Flux RSS ;
 Concours/jeux ;
 Espaces participatifs ;
 …
Côté site web
Design et ergonomie

Accessibilité

Le site est-il lisible (couleurs des
fonds et couleurs des textes), visible
(respect d’une charte graphique) ?
De la même manière, la navigation
est-elle simple à comprendre,
intuitive. Existent-ils des liens et des
contenus contextuels en fonction des
pages ?
Combien de clics sont nécessaires
pour atteindre une page importante
(produits, services) pour faciliter le
taux de conversion ?

Le site web est-il optimiser pour les
différents navigateurs en fonction
des cibles (exemple : encore
beaucoup de IE6 et IE7 en Afrique et
en Asie).
Le ou les auteurs (personnes ou
structure) du site sont-ils bien
identifiables. Y a-t-il des mentions
légales.
Texte lisible sans CSS et sans
Javascript pour faciliter la lecture des
déficients visuels.
Pour les vidéos et les sons, y a-t-il
des sous-titrages prévus ou les
textes écrits pour les sourds et les
malentendants ?
Le contenu « alt » des images est-il
bien renseigné ?
Côté site web
Code HTML

Les balises Hn et title

HTML4, xHTML ou HTML5 ?
Vérifiez la cohérence et la hiérarchie
des contenus dans la page. Si
possible privilégiez le HTML5 et sa
structure plus sémantique.
Les micro-données du type
schema.org peuvent aider les
moteurs à cerner à quoi
correspondent vos contenus.

La balise title est un des éléments les
plus important de votre page tant
pour le visiteur que pour les moteurs
de recherche. C’est le premier
contact.
Ensuite, la structuration des Hn
permettra des donner un sens et une
importance plus précise aux moteurs
de recherche pour les aider à indexer
correctement vos pages.

CSS et Javascript
Vérifiez aussi que les fichiers CSS et
Javascript soient compressés, vous
gagnerez en temps de chargement
de vos page.

Ne pas oublier aussi la meta
description qui est le second point de
contact avec une page dans les
moteurs de recherche.
Côté contenu
Cohérence sémantique

Contenu dupliqué

Vos contenus contiennent des mots
et des expressions qui ont plus
d’importance que le reste. N’oubliez
pas que les moteurs de recherche
analyse leur fréquence (accointance).
Il faudra vérifier qu’ils sont bien
valoriser, sans excès non plus car la
sur-optimisation est risquée.
L’utilisation raisonnée et cohérente
des Hn, gras, italique, listes, citation,
souligné (en changeant son aspect
en CSS pour qu’il ne se confonde pas
avec un lien), améliorera sa visibilité
ET sa lisibilité.

Vérifiez qu’il n’y ait pas de contenus
dupliqués et que les liens
« cannonical » sont bien présents sur
les différentes pages.
Il est encore trop courant de voir sur
des sites des pages dont le contenu
est intégralement dupliqué sur la
page d’accueil ou sur une autre
page.
C’est un critère négatif très
important pour Google donc
attention !
Côté social media
Blog(s)
Au-delà des frontières du site, y a-t-il
des blogs mis en place et sont-ils mis
à jour régulièrement ?
Facilitent-ils le partage sur les
réseaux sociaux avec :
 Des boutons ;
 Du code dans le <head>
proposant le titre, le texte et
l’image à afficher

Réseaux et médias
sociaux
Vérifiez que les différentes
plateformes sont bien reliées au site
web principal.
Pour Google+, l’autorship
(rel=author ou rel=publisher) est-il
mis en place : n’oubliez pas de
vérifier avec l’outil de Google pour
les rich snippets.
Quelques outils
Title et méta description :
 Xenu http://www.01net.com/telecharger/windows/Internet/gestion_site/fiches/26103.html
 Screaming Frog http://www.screamingfrog.co.uk/seo-spider/
 Headings Map (extension Firefox) https://addons.mozilla.org/fr/firefox/addon/headingsmap/
Mots clés :
 Kgen (extension Firefox) https://addons.mozilla.org/fr/firefox/addon/kgen/
 OpenSiteExplorer http://www.opensiteexplorer.org/
Compteurs de caractères : http://www.javascriptkit.com/script/script2/charcount.shtml
Générer sitemap : http://www.xml-sitemaps.com/
Vitesse de chargement du site :
 GT Metrix http://gtmetrix.com/
 Google Page Speed https://developers.google.com/speed/pagespeed/insights/
Analyse des requêtes avec Google Trend http://www.google.com/trends/
Majestic SEO http://fr.majesticseo.com/
Analyse de classements sur les moteurs :
 Rank Checker http://tools.seobook.com/firefox/rank-checker/ (attention à ne pas générer trop de
requêtes auprès de Google sur un temps court au risque de se voir bloqué)
(…)

Audit de site web

  • 1.
    Audit d’un siteweb Erwan Tanguy
  • 2.
    Réaliser un auditde site web L’audit d’un site ne se limite pas à l’analyse du potentiel « référencement » de celui-ci et nécessite un accès à différentes données :  Statistiques (Google Analytics par exemple) ;  Sitemap ;  Contenus et hiérarchie des textes ;  Code HTML ;  Architecture des plateformes liées (réseaux et médias sociaux, blogs…) ;  … (j’en oublie beaucoup) Il n’est pas toujours évident d’obtenir les informations qui ne sont pas déjà accessibles en ligne mais il faut réussir à faire comprendre que les données statistiques sont un élément essentiel pour l’audit et les préconisations sur le moyen et le long terme.
  • 3.
    Côté moteurs derecherche Analyse du trafic du site Attention aux redirections Vous devez estimer la qualité et la quantité du trafic. Établissez les types d’internautes qui viennent sur le site, d’où ils viennent et quels sont les contenus les plus visités et partagés/commentés. Regardez aussi le nombre et la qualité de vos « backlinks » (sont-ils suffisants, pertinents ?), le nombre de pages indexées par rapport au nombre de pages réelles… Vous pouvez aussi vérifier le Page Rank du site même si ce critère n’est plus mis à jour et perd de son intérêt. Souvent encore, le nom de domaine avec ou sans « www » existe. Le site est visible sur 2 urls différentes. Ça ne semble pas important à pemière vue mais les moteurs de recherche voient 2 sites avec les mêmes contenus ! Pensez à faire rediriger l’un vers l’autre. Il n’y a pas de préférence a priori entre avec ou sans « www ». Nous pouvons constater cependant que de plus en plus de site préfère sans pour des urls plus courtes et plus faciles à retenir, sans doute.
  • 4.
    Côté moteurs derecherche Les urls Sitemap et robots.txt Vérifiez que les urls du site web sont bien propres (sans requêtes par exemple) et opter pour une réécriture, si cela est possible. Attention, pour les réécritures d’url, il faut que l’hébergement propose cette option. Si votre site est hébergé chez Free, par exemple, ce ne sera pas possible. Vérifier que le site propose un sitemap et que celui-ci soit déclaré sur le fichier robots.txt et/ou sur GWT (Google Webmaster Tools). Il est toujours plus intéressant de proposer directement les urls d’un site web aux moteurs de recherche plutôt que de le laisser découvrir à l’aveugle toutes les pages. Cela n’empêche pas de bien vérifier dans l’arborescence du site que la majorité des pages s’y trouvent accessible.
  • 5.
    Côté moteurs derecherche L’âge du nom de domaine Le ratio texte/code Même si ce n’est pas le critère le plus important, l’âge d’un nom de domaine joue sur sa notoriété et donc sur la confiance accordée par les moteurs de recherche. Un nom de domaine qui a déjà fait ses preuves ne sera pas déclassé au profit d’un nouveau nom de domaine du jour au lendemain. Il bénéficie d’un antériorité qui prouve, aux yeux des moteurs, qu’il sera encore là demain alors que le nouveau, rien ne le garantit. Dans l’idéal, le texte doit représenté proportionnellement environ 25% de la page. Vitesse de chargement Comme c’est un indicateur pris en compte par les moteurs de recherche (Google en tête), il est important de le noter et éventuellement de voir comment le réduire. Validité W3C Sans forcément viser la validité totale, vérifiez qu’il n’y a pas de problèmes majeurs qui pourraient être pris comme critère négatif par les moteurs de recherche.
  • 6.
    Côté site web Responsive? Fidéliser Le trafic via les mobiles dépasse les 15%, il ne faut pas le sous-estimer. Et rien n’est plus énervant sur un smartphone qu’un site inadapté ! Un site « responsive » devrait améliorer sensiblement ses statistiques et son référencement naturel. Le site web propose-t-il clairement des outils pour fidéliser les visiteurs :  Newsletter ;  Flux RSS ;  Concours/jeux ;  Espaces participatifs ;  …
  • 7.
    Côté site web Designet ergonomie Accessibilité Le site est-il lisible (couleurs des fonds et couleurs des textes), visible (respect d’une charte graphique) ? De la même manière, la navigation est-elle simple à comprendre, intuitive. Existent-ils des liens et des contenus contextuels en fonction des pages ? Combien de clics sont nécessaires pour atteindre une page importante (produits, services) pour faciliter le taux de conversion ? Le site web est-il optimiser pour les différents navigateurs en fonction des cibles (exemple : encore beaucoup de IE6 et IE7 en Afrique et en Asie). Le ou les auteurs (personnes ou structure) du site sont-ils bien identifiables. Y a-t-il des mentions légales. Texte lisible sans CSS et sans Javascript pour faciliter la lecture des déficients visuels. Pour les vidéos et les sons, y a-t-il des sous-titrages prévus ou les textes écrits pour les sourds et les malentendants ? Le contenu « alt » des images est-il bien renseigné ?
  • 8.
    Côté site web CodeHTML Les balises Hn et title HTML4, xHTML ou HTML5 ? Vérifiez la cohérence et la hiérarchie des contenus dans la page. Si possible privilégiez le HTML5 et sa structure plus sémantique. Les micro-données du type schema.org peuvent aider les moteurs à cerner à quoi correspondent vos contenus. La balise title est un des éléments les plus important de votre page tant pour le visiteur que pour les moteurs de recherche. C’est le premier contact. Ensuite, la structuration des Hn permettra des donner un sens et une importance plus précise aux moteurs de recherche pour les aider à indexer correctement vos pages. CSS et Javascript Vérifiez aussi que les fichiers CSS et Javascript soient compressés, vous gagnerez en temps de chargement de vos page. Ne pas oublier aussi la meta description qui est le second point de contact avec une page dans les moteurs de recherche.
  • 9.
    Côté contenu Cohérence sémantique Contenudupliqué Vos contenus contiennent des mots et des expressions qui ont plus d’importance que le reste. N’oubliez pas que les moteurs de recherche analyse leur fréquence (accointance). Il faudra vérifier qu’ils sont bien valoriser, sans excès non plus car la sur-optimisation est risquée. L’utilisation raisonnée et cohérente des Hn, gras, italique, listes, citation, souligné (en changeant son aspect en CSS pour qu’il ne se confonde pas avec un lien), améliorera sa visibilité ET sa lisibilité. Vérifiez qu’il n’y ait pas de contenus dupliqués et que les liens « cannonical » sont bien présents sur les différentes pages. Il est encore trop courant de voir sur des sites des pages dont le contenu est intégralement dupliqué sur la page d’accueil ou sur une autre page. C’est un critère négatif très important pour Google donc attention !
  • 10.
    Côté social media Blog(s) Au-delàdes frontières du site, y a-t-il des blogs mis en place et sont-ils mis à jour régulièrement ? Facilitent-ils le partage sur les réseaux sociaux avec :  Des boutons ;  Du code dans le <head> proposant le titre, le texte et l’image à afficher Réseaux et médias sociaux Vérifiez que les différentes plateformes sont bien reliées au site web principal. Pour Google+, l’autorship (rel=author ou rel=publisher) est-il mis en place : n’oubliez pas de vérifier avec l’outil de Google pour les rich snippets.
  • 11.
    Quelques outils Title etméta description :  Xenu http://www.01net.com/telecharger/windows/Internet/gestion_site/fiches/26103.html  Screaming Frog http://www.screamingfrog.co.uk/seo-spider/  Headings Map (extension Firefox) https://addons.mozilla.org/fr/firefox/addon/headingsmap/ Mots clés :  Kgen (extension Firefox) https://addons.mozilla.org/fr/firefox/addon/kgen/  OpenSiteExplorer http://www.opensiteexplorer.org/ Compteurs de caractères : http://www.javascriptkit.com/script/script2/charcount.shtml Générer sitemap : http://www.xml-sitemaps.com/ Vitesse de chargement du site :  GT Metrix http://gtmetrix.com/  Google Page Speed https://developers.google.com/speed/pagespeed/insights/ Analyse des requêtes avec Google Trend http://www.google.com/trends/ Majestic SEO http://fr.majesticseo.com/ Analyse de classements sur les moteurs :  Rank Checker http://tools.seobook.com/firefox/rank-checker/ (attention à ne pas générer trop de requêtes auprès de Google sur un temps court au risque de se voir bloqué) (…)