1
Bennis Zacharie
OPTIMISER LE CONTENU
RÉDACTIONNEL POUR LE
RÉFÉRENCEMENT NATUREL
D’UN SITE WEB
Travail de Fin d’Etudes pr...
2
Table des matières
Résumé..................................................................................................
3
Tester les mots clés.......................................................................................................
4
Les titres rédactionnels...................................................................................................
5
Évolution : Les rich-snippets..............................................................................................
6
OncoDNA....................................................................................................................
7
Remerciements
Tout d'abord, je tiens à remercier Monsieur Vincent Bachely, mon promoteur de stage, qui m'a suivi tout
au...
1
RÉSUMÉ
Le travail ci-présent a pour objectif de fournir les outils et la méthodologie nécessaires au bon référencement
n...
2
INTRODUCTION GÉNÉRALE
Dans le cadre de mon stage de fin d'études chez TagExpert, j'ai choisi le référencement naturel de...
3
C'est la raison pour laquelle ce travail va se concentrer sur les techniques de référencement qui utilisent du
texte.
J'...
4
Partie théorique
CHAPITRE 1: LE RÉFÉRENCEMENT ET LES MOTS
CLÉS
Dans un travail traitant du référencement, il convient to...
5
fait partie intégrante du SEA* (Search engine Advertising ou référencement payants) et ne sera pas abordée
dans ce trava...
6
Graph"7
.8
Le but de ce travail étant l'optimisation naturelle des sites web, le SERP ne sera pas plus
approfondi.
La st...
7
CHAPITRE 2 : LES ALGORITHMES GOOGLE
Définition
Selon le site Webmarketing, "l’algorithme Google est l’ensemble des trait...
8
GoogleBoots
Dans le cadre de ce travail, Internet peut être défini comme étant une immense base de données. À la
différe...
9
Le principe est que plus un site met du contenu en ligne, plus il sera parcouru par les GoogleBoots.
En conséquence, le ...
10
snippets, URL, mots en gras, … (voir chapitres suivants). Il était facile de se dire que si l'on met un maximum
de mots...
11
CHAPITRE 3: MÉTHODOLOGIES POUR ÉTABLIR UNE
LISTE DE MOTS CLÉS
Les mots-clés constituent la clé de voute de toute straté...
12
- 20 % du trafic est issu des mots clés "stars" (ce qui constitue la tête ou encore "courte traine"). Ce
sont les mots ...
13
- Ensuite, il y a le trafic dit "opportuniste". Celui-ci est créé par exemple, par certains termes présents
dans le tex...
14
Google Suggest
En 2008, Google mettait en place un nouveau service : Google Suggest*. Au fur et à mesure que l'internau...
15
Figure 2.3 Exemple de requête à plusieurs termes.
Comme le montre la figure 2.3, en inscrivant des mots clés sur Google...
16
Google ADwords est le principal outil pour de mise en place d'une stratégie payante. Dans le cadre de ce
travail sur le...
17
En résumé
On va soumettre la liste de mots clés à cette base de données. En soumettant chaque terme, il va générer des
...
18
ou de pizzas augmentent32
. Il est donc normal que cela influence les recherches effectuées sur
Google.
- Les différent...
19
Figure 3.6 Précision dans les informations géographiques pour le terme "pizza livraison"
Les données concernant l'évolu...
20
En réusmé
Cet outil prend toute son importance dans une stratégie SEO quand il s'agit de comparer plusieurs termes
sur ...
21
CHAPITRE 4. UNIFORM RESSOURCE LOCATOR
Dans un travail traitant de l'optimisation naturel de site web en utilisant des t...
22
e) Sous-direction
f) Le nom du fichier
g) Extension de fichier
L'importance actuelle des URLs
En premier lieu, il convi...
23
Les prochains points vont ont pour objectif de donner une explication des différents éléments qui composent
un nom de d...
24
Il a été énoncé précédemment que seul le domaine avait un impact dans le référencement. La question est
maintenant de d...
25
Nom-du-site/Plat/Cartes/Pizzas
Nom du fichier
Il s'agit de la largeur d'un site, la largeur fait références aux nombres...
26
La stratégie utilisateur
Il s'agit ici d'une stratégie de marque, vous voulez que vos utilisateurs se rappellent du nom...
27
D'un point de vue technique
L'Age du nom de domaine
L'ancienneté semble avoir être un critère proéminent dans l'indexat...
28
Néanmoins, dans une optique de confort de l'utilisateur je serai d'avis de conserver la forme répertoire. Car
si l'on c...
29
une bonne hiérarchisation des données, on peut optimiser le confort de visite d'un internaute sur un site et
donc favor...
30
À cette question Matt Cutts répond que même si Google est capable d'interpréter ce type de caractère il est
préférable ...
31
CHAPITRE 5: LE CONTENU EST ROI, LE CONTENU
OPTIMISÉ EST EMPEREUR
L'un des grands fondements du référencement naturel es...
32
ajouter au texte de départ pour dire au navigateur de quelle manière l'afficher64
) <body> (exemple de balise
HTML) , a...
33
L'optimisation des titres rédactionnels (zone 1)
Les titres rédactionnels
Les balises <Hn> (<H1> à <H6>) sont les titre...
34
Un ordre décroissant à respecter
Les balises ont un ordre d'importance décroissant, il faut donc respecter cet ordre hi...
35
d’y revenir ou non. Du point de vue de Google, le contenu rédactionnel fait partie des nombreux critères qui
lui permet...
36
Il est peu probable qu'un site ait choisi comme positionnement l'expression "cliquez ici". De plus, cela n'est
pas desc...
37
Des racines et des positions
Insérer des mots clés, enrichir un texte est une très bonne chose mais encore ne faut-il p...
38
C'est la raison pour laquelle bloguer est plus important que jamais. Non seulement cela rajoute du nouveau
contenu mais...
39
Figure 5.2 dans les résultats, Google affiche parfois la photo de l'auteur (exemple fictif)
Dans une vidéo publié sur Y...
40
CHAPITRE 6 : LES SNIPPETS
L'un des moyens les plus efficaces pour augmenter sa visibilité sur internet, en utilisant du...
41
La figure 6.2 montre une balise <Title> tel qu’elle est représenté dans les résultats de recherches
Google.
C’est elle ...
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie
Prochain SlideShare
Chargement dans…5
×

Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie

1 868 vues

Publié le

Travail de fin d'étude portant sur le référencement naturel d'un site Internet.
Ce travail se concentre essentiellement sur les balises Snippets, l'optimisation du texte "in page" et sur les URLs.

Publié dans : Internet
0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
1 868
Sur SlideShare
0
Issues des intégrations
0
Intégrations
5
Actions
Partages
0
Téléchargements
23
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Optimisation du contenu redactionnel pour le referencement naturel d’un site web-bennis zacharie

  1. 1. 1 Bennis Zacharie OPTIMISER LE CONTENU RÉDACTIONNEL POUR LE RÉFÉRENCEMENT NATUREL D’UN SITE WEB Travail de Fin d’Etudes présenté pour l’obtention du titre De Bachelier en e-Business Année académique 2013-2014 Promoteur de stage : Monsieur Vincent Bachely
  2. 2. 2 Table des matières Résumé.......................................................................................................................................................... 1 Introduction générale..................................................................................................................................... 2 Chapitre 1: le référencement et les mots clés ................................................................................................ 4 Chapitre 2 : les algorithmes Google .............................................................................................................. 7 Définition........................................................................................................................................... 7 GoogleBoots...................................................................................................................................... 8 Google Caffeine ................................................................................................................................ 8 Google panda..................................................................................................................................... 9 Google Penguin................................................................................................................................. 9 Spam de contenu........................................................................................................................ 9 Spam de lien............................................................................................................................ 10 Google Hummingbird...................................................................................................................... 10 Chapitre 3: Méthodologies pour établir une liste de mots clés.................................................................... 11 La loi de la longue traine................................................................................................................. 11 Historique................................................................................................................................ 11 Principe de la longue traine pour le référencement ................................................................. 11 Utilisation de cette loi pour une stratégie SEO........................................................................ 12 Évolution ................................................................................................................................. 13 Établissement d'une première liste .................................................................................................. 13 Utilisation des Outils Google .......................................................................................................... 13 Google Suggest........................................................................................................................ 14 La correction automatique des fautes d'orthographe et de frappe ........................................... 14 Les requêtes en plusieurs termes ............................................................................................. 14 Le paradoxe ADwords*........................................................................................................... 15 Google ADwords..................................................................................................................... 15 Google Trends* ....................................................................................................................... 17
  3. 3. 3 Tester les mots clés.................................................................................................................. 20 Chapitre 4. Uniform Ressource Locator...................................................................................................... 21 Composition d'une URL.................................................................................................................. 21 L'importance actuelle des URLs...................................................................................................... 22 Nom de domaine...................................................................................................................... 22 Le slug..................................................................................................................................... 24 Critères d'optimisation du domaine................................................................................................. 25 Le choix du nom..................................................................................................................... 25 Conclusion............................................................................................................................... 26 D'un point de vue technique ............................................................................................................ 27 L'Age du nom de domaine....................................................................................................... 27 La longueur du domaine.......................................................................................................... 27 Sous domaine ou sous répertoire? ........................................................................................... 27 Critères d'optimisation du slug........................................................................................................ 28 L'importance de l'arborescence pour le slug............................................................................ 28 Privilégiez les tirets ................................................................................................................. 29 Qu'en est-il des caractères complexes?.................................................................................... 29 Critères d'optmisation des URL....................................................................................................... 29 Les caractères accentués et spéciaux....................................................................................... 29 La problématique des URLs multiples.................................................................................... 30 Un mot sur les redirections.............................................................................................................. 30 Chapitre 5: le contenu est roi, le contenu optimisé est empereur ................................................................ 31 L'optimisation du texte.................................................................................................................... 31 Une meilleure position HTML pour un meilleur référencement?........................................... 31 Une page, un thème................................................................................................................. 32 Un contenu à trois zones.......................................................................................................... 32 L'optimisation des titres rédactionnels (zone 1) .............................................................................. 33
  4. 4. 4 Les titres rédactionnels............................................................................................................ 33 L'importance des titres............................................................................................................. 33 Le choix des mots clés contenus dans les titres....................................................................... 33 La longueur des balises H1 à H6............................................................................................. 33 Un ordre décroissant à respecter.............................................................................................. 34 Le <H1> et le slug................................................................................................................... 34 Optimisation du contenu rédactionnel (zone 2)............................................................................... 34 Le contenu rédactionnel .......................................................................................................... 34 Une balise forte pour mettre en évidence................................................................................ 35 Les liens................................................................................................................................... 35 L'occurrence et l'IDM.............................................................................................................. 36 Des racines et des positions..................................................................................................... 37 L'importance des blogs.................................................................................................................... 37 google authorship ............................................................................................................................ 38 Chapitre 6 : Les snippets ............................................................................................................................. 40 La balise <Title> ............................................................................................................................. 40 Nombres de caractères............................................................................................................. 41 Libellés du titre........................................................................................................................ 41 La géolocalisation.................................................................................................................... 42 Lisibilité et efficacité : trouver le bon équilibre ...................................................................... 42 Une page, un titre. ................................................................................................................... 43 Point de réflexion .................................................................................................................... 43 Méta description.............................................................................................................................. 44 Vers une renaissance de la Méta description ?........................................................................ 44 Optimisation de la description................................................................................................. 45 Affichage de la balise.............................................................................................................. 45 Un mot sur la balise méta Keywords............................................................................................... 46
  5. 5. 5 Évolution : Les rich-snippets........................................................................................................... 46 Le web 3.0 : Le web sémantique............................................................................................. 47 Introduction ................................................................................................................................................. 48 Présentation de TagExpert........................................................................................................................... 50 Organigramme de l'entreprise.......................................................................................................... 50 Les trois secteurs d'activités ........................................................................................................ 50 Le développement d'applications personnalisées ................................................................ 50 Les conseils ......................................................................................................................... 50 La production de contenu vidéo .......................................................................................... 51 Objectif poursuivis durant le stage.............................................................................................................. 52 La refonte du site web de TagExpert............................................................................................... 52 L'équipe ................................................................................................................................... 52 Recherche de mots clés ........................................................................................................... 52 Arborescence du site................................................................................................................ 52 Optimisation des textes............................................................................................................ 53 Optimisation des snippets........................................................................................................ 53 Un mot sur Drupal........................................................................................................................... 53 Autres projets .............................................................................................................................................. 54 Optimisation de site de TagExpert.tv .............................................................................................. 54 Création d'une chaine YouTube ...................................................................................................... 54 Optimisation de la visibilité de la chaine................................................................................. 55 Optimisation des vidéos .......................................................................................................... 56 Optimisation des Playlists ....................................................................................................... 56 CLFA............................................................................................................................................... 56 Rapport ONCODNA ....................................................................................................................... 57 Assistant réalisation......................................................................................................................... 57 Louvain-la-Neuve.................................................................................................................... 57
  6. 6. 6 OncoDNA................................................................................................................................ 58 TagExpert Party............................................................................................................................... 58 Enseignement .............................................................................................................................................. 59 Rédaction de cours .......................................................................................................................... 59 Lazaron............................................................................................................................................ 59 St Ferdinand .................................................................................................................................... 59 Technocité ....................................................................................................................................... 60 Mise en pratique de la théorie ..................................................................................................................... 61 La recherche de mots clés............................................................................................................ 61 Utilisation de Google Suggest............................................................................................. 61 Google Trends ..................................................................................................................... 61 Google ADwords................................................................................................................. 61 Optimisation de l'arborescence............................................................................................ 61 Optimisation des balises "méta description", "Title", "Hn" ................................................ 62 Optimisation du contenu éditorial ....................................................................................... 63 Blog ..................................................................................................................................... 63 L'URL.................................................................................................................................. 63 Conclusion de la partie pratique.................................................................................................................. 64 Conclusion générale .................................................................................................................................... 66 Glossaire...................................................................................................................................................... 69 Journalier..................................................................................................................................................... 70 Bibliographies ............................................................................................................................................. 87 webographies............................................................................................................................................... 88
  7. 7. 7 Remerciements Tout d'abord, je tiens à remercier Monsieur Vincent Bachely, mon promoteur de stage, qui m'a suivi tout au long de ma démarche et donné de judicieux conseils. Je souhaite également remercier Harmony et Viky qui ont consacré une énergie non négligeable à corriger tous mes désaccords avec les subtilités de la langue française. Ensuite, Axel Soyez, qui m'a donné les conseils nécessaires pour la bonne tenue et la finition de ce travail. Egalement, je remercie Monsieur David Blampain et toute l'équipe de TagExpert pour m'avoir donné l'occasion d'effectuer mon stage de fin d'études au sein de leur société. Et enfin, last but not least, mes parents sans qui je n'aurai pu finir mes études.
  8. 8. 1 RÉSUMÉ Le travail ci-présent a pour objectif de fournir les outils et la méthodologie nécessaires au bon référencement naturel d'un site Internet. Le référencement étant une matière très vaste, j'ai axé ce travail de fin d'études sur les mots clés. Autrement dit, comment utiliser de manière optimale les techniques impliquant des mots clés afin d'augmenter la visibilité de son site Internet? Dans la partie théorique, des explications sur le référencement ainsi que son importance sont fournies. Le chapitre suivant dresse un bref explicatif des algorithmes de Google. Le troisième chapitre, quant à lui, fournit une méthodologie pour obtenir une liste de mots clés la plus pertinente possible. Par la suite, j'aborde l'optimisation des textes d'un site web, son URL, et enfin, les snippets de Google. La partie pratique décrit le déroulement de mon stage ainsi que l'ensemble des tâches que j'ai dû mener à bien pour l'entreprise TagExpert. En bref: en amont de mon stage, je me suis renseigné et instruit en lisant des monographies traitant du référencement naturel. Ceci était la première étape dans ma méthode de travail. Par la suite, j'ai continué à m'informer sur cette matière en visitant des sites Internet spécialisés dans ce domaine. Regroupant ces données et celles présentes dans les monographies, j'ai ainsi pu obtenir des explications claires et complètes. J'avais alors les bases suffisantes pour commencer un vrai travail de réflexion sur la thématique choisie.
  9. 9. 2 INTRODUCTION GÉNÉRALE Dans le cadre de mon stage de fin d'études chez TagExpert, j'ai choisi le référencement naturel de sites internet comme sujet de travail de fin d'études. A mon sens, il s'agit là d'une matière réellement passionnante, qui a pour caractéristique la visibilité d'un site web sur les moteurs de recherche. Plusieurs raisons ont motivé mon choix de faire ce travail sur le référencement. Nous avons souvent tendance à l'oublier, mais Internet est, d'une certaine manière, une immense base de données, surement et de très loin la plus importante jamais créée. Il existe approximativement 1000 milliards de pages web dans le monde1 et on ne dénombre pas moins de 186,9 millions de site actifs2 . Dans une base de données classique, l'utilisateur va introduire des requêtes. Le but de ces requêtes est d'interroger la base afin de pouvoir retirer le résultat le plus recherché. Par exemple, le fait d'introduire le nom d'un article va générer un certain nombre de résultats en rapport avec cet article. Avec Internet, le principe est similaire: l'internaute va ouvrir son navigateur (interface qui lui permet d'accéder à la base de données), va ensuite ouvrir un moteur de recherche (application qui permet de générer des résultats en fonction d'une requête) et va l'interroger. Par la suite, la qualité des réponses trouvées vont dépendre de la qualité l'algorithme utilisé par le moteur à trouver un résultat pertinent parmi ces milliards de pages. Les algorithmes, justement, ont également motivé ma décision de traiter ce sujet. Effectivement, depuis sa création en 19983 , le principal objectif de Google est resté le même: donner le résultat le plus cohérent, le plus logique, en fonction des requêtes qu'introduit l'internaute dans la barre de recherche. Matière passionnante car si l'objectif est resté le même, les moyens, eux, ont connu de multiples évolutions, incarnées par les algorithmes. Il est important de comprendre l'évolution des algorithmes afin de mieux appréhender le référencement. Le référencement naturel est l'ensemble des techniques qui augmentent la visibilité d'un site web sur un moteur de recherche. L’optimisation des pages d’un site web, n’est pas le résultat d’une seule technique mais d’un ensemble de techniques dont la somme favorise le positionnement sur le moteur de recherche. Selon l’expression: "content is king, link the queen and optimized content the emperor" (le contenu est roi et le contenu optimisé est empereur) on peut en déduire que l’une des techniques les plus efficaces dans le domaine du SEO* (Search Engine optmisation ou référencement) l’optimisation de contenu, c’est-à-dire penser le contenu d'un site pour optimiser sa visibilité face aux algorithmes, entre autres via des mots clés. 1 http://www.journaldunet.com (consulté le 24/05/2014) 2 http://blog.lesannuaires.com (consulté le 25/04/2014) 3 http://www.google.com/intl/fr (consulté le 29/05/2014)
  10. 10. 3 C'est la raison pour laquelle ce travail va se concentrer sur les techniques de référencement qui utilisent du texte. J'ai choisi Google comme pilier central.de mes travaux Ce choix est justifié par son importance sur le marché des moteurs de recherche. A ce jour, il détient une part de marché de 90% en Europe4 . De plus, une grande partie des autres moteurs de recherche adaptent leurs algorithmes en fonction de ceux de Google. Tout au long de ce travail, j'ai essayé de démontrer qu'il a deux éléments essentiels pour assurer le bon positionnement d'un site dans les résultats de recherche. Il y a, d'une part, le respect des codes de Google pour la création d'un site et, d'autre part, l'utilisateur. Si un site est optimisé pour les moteurs de recherche, mais qu'il génère très peu de visites avec un retour des internautes faible, Google va considérer que le contenu de ce site n'est pas pertinent et qu'il n'est pas utile de bien le positionner dans les résultats de recherche. Ce qui m'amène aux deux démonstrations sous-jacentes de ce travail : 1. Quelles sont les techniques rédactionnelles qui permettent à un site de mieux se positionner qu'un autre? 2. Et comment favoriser le confort de l'utilisateur? Enfin, l'ordre des chapitres est déterminé par le processus de création, de réflexion d'un site web d'un point de vue rédactionnel. Ce travail va se concentrer sur les techniques de référencement précises qui se rapportent au texte. Le premier chapitre aborde le référencement: le but est de donner une explication sur cette matière, de fixer le référencement dans l'esprit du lecteur. Le chapitre suivant a pour sujet les algorithmes: l'idée est de déterminer l'impact des ceux-ci sur le référencement. Le chapitre 3 donnera une méthodologie pour trouver les mots clés. Ensuite le chapitre 4 traite des URL (Uniform Ressource Locator), Le chapitre 5 parle de l'optimisation du texte contenu sur une page web. Le chapitre 6 relate des "snippets" (terme défini plus tard) et de leurs optimisations. Pour terminer, les termes qui sont définis par le glossaire est suivi du signe*. 4 http://www.lemonde.fr/ (consulté le 21/05/2014)
  11. 11. 4 Partie théorique CHAPITRE 1: LE RÉFÉRENCEMENT ET LES MOTS CLÉS Dans un travail traitant du référencement, il convient tout d'abord d'établir son utilité, sa fonction. Pour justement déterminer cette fonction, je vais faire une analogie en utilisant la question existentielle: « un arbre qui tombe ne fait-il de bruit que s'il y a quelqu’un pour l’entendre ? ». Internet est une immense base de données composée d’approximativement un billion5 de pages. Dans ce contexte, la question devient : « si un site n’est trouvé par aucun internaute, existe-t-il ? » C’est ici que le référencement trouve tout son utilité : il permet à un site web d’être visible, d’être perçu par les internautes et, d’une certaine façon, d’exister. Le référencement est aux sites web ce que la publicité classique est aux produits. Il existe un amalgame dans le monde du SEO entre les termes de "référencement" et de "positionnement". Le référencement permet à un site web d’être indexé dans les moteurs de recherche, d’y être présent. Tandis que le positionnement permet à un site d’être mis en valeur, d’être plus visible6 . Afin d’illustrer mes propos, je vais prendre l’exemple d’un supermarché. Quand un produit est présent dans les rayons du magasin, il est référencé dans l’index de ce supermarché. Donc, si une personne demande ce produit, le vendeur pourra le retrouver dans la base de données. Il est trouvable et donc, il est référencé. Dans ce magasin, il est possible que des responsables commerciaux veuillent mettre en valeur certains produits, les placer en « tête de gondole ». Ces produits seront donc mis en évidence à des endroits stratégiques du magasin. Ces produits sont positionnés. Le terme "référencement" s’est imposé à cause d’un abus de langage qui considère que le référencement et le positionnement ne sont qu’une seule et même expression. Afin de respecter le langage courant, le terme "référencement" sera utilisé tout au long de ce travail de fin d’études pour qualifier le positionnement d'un site web avec la présupposition que le site est déjà indexé sur Google. La deuxième nuance à déterminer est la distinction entre le référencement naturel (lien organique) et payant (lien sponsorisé). Les liens sponsorisés, également appelé liens commerciaux, sont des zones publicitaires. Ces encarts fonctionnent souvent au coût par clic (CPC) et sont payés par les annonceurs. Cette stratégie 5 http://www.pcinpact.com/news/65785-combien-pages-web-foundation-tim-berners-lee.htm 6 KEBBANI Nassim, "Qu'est que le référencement?" In Améliorez la visibilité de votre site grâce au référencement : le référencement, pages 5, condé-sur-noireau, Site du Zéro, 2013
  12. 12. 5 fait partie intégrante du SEA* (Search engine Advertising ou référencement payants) et ne sera pas abordée dans ce travail. Les liens organiques sont les résultats dits naturels. Ce sont les résultats qui sont les plus pertinents selon l’algorithme employé par le moteur de recherche. De cette différentiation, il résulte que le search Engine Result page (SERP*) n’est pas une page uniforme comportant un seul type de recherche. En réalité, une SERP est composé de plusieurs zones. Figure 1.1 SERP pour le mot clé "Pizza". Cette figure est un exemple de résultats de recherche de Google. Dans le cas présent, l'écran est divisé en 4 parties. La partie rouge correspond aux résultats payants, les liens sponsorisés. La partie verte correspond aux résultats naturels. Quand on emploie une stratégie de référencement « naturelle », c’est cette zone qui est visée. La partie en bleu concerne l'actualité de ce terme et la partie en orange est le "Knowledge
  13. 13. 6 Graph"7 .8 Le but de ce travail étant l'optimisation naturelle des sites web, le SERP ne sera pas plus approfondi. La stratégie SEO a donc pour but d’employer les différentes techniques de référencement afin que les pages d’un site soit présentes sur le SERP selon les mots-clés employés par l’internaute. Pour terminer cette introduction, il convient de donner une définition de l'autre terme central de ce travail qui est le mot clé. Selon le Larousse, un mot clé* est un « mot associé à un contenu qui, une fois indexé, permet d'identifier un article dans un fichier9 ». Dans le cas d’une recherche internet, il s’agit d’un mot ou d’une expression qui est tapée dans la barre d’un moteur de recherche par l'utilisateur afin d’obtenir le résultat souhaité. Ce travail fait état de l'optimisation des techniques qui, à partir de mots clés insérés dans le site web, permettent d'optimiser la visibilité d'un site web. 7 Pour plus d'informations à ce sujet veuillez consulté cette référence : PRAT, Marie "référencement de votre site web Googlere 3 et les autres moteurs de recherches" in chapitre 3 : fonctionnement de moteurs, pages 48, St Herblain, ENI, 2013 9 http://www.larousse.fr/dictionnaires (consulté le 29/05/2014)
  14. 14. 7 CHAPITRE 2 : LES ALGORITHMES GOOGLE Définition Selon le site Webmarketing, "l’algorithme Google est l’ensemble des traitements mathématiques appliqués aux pages web présentes dans l’index du moteur pour déterminer leur classement dans les pages de résultats pour une requête donnée".10 Le but de ce chapitre est de consacrer l'importance des algorithmes pour le référencement, et l'impact des internautes et des webmasters* (Personne dont le métier est de concevoir des sites Internet) dans l'évolution de ces traitements mathématiques. L'entreprise Google existe depuis 199811 et ses fondateurs Larry Page et Sergueï Brin ont créé un premier algorithme en 199712 . Un peu moins de 20 ans plus tard, l'usage que les internautes font d'internet n'est plus le même qu'au début de la mise en ligne de la première version de Google. Par exemple, des études ont attesté que la moyenne des requêtes soumises à un moteur de recherche oscille entre 4.07 et 4.87 mots. De plus, les requêtes de 1 ou 2 mots ont respectivement perdu 3 et 5% de fréquences de recherches durant l'année 2009, tandis que les requêtes de plus de 8 mots ont connu une augmentation de 22% la même année13 . Donc, la tendance actuelle est de poser une question à Google. Pour illustrer avant il était plus courant de "s'adresser" à Google avec les termes suivants "Pizza Mons livraison". À l'heure actuelle, les termes utilisés seraient " Où puis-je trouver une pizza qui livre à domicile près de chez moi?" Dans un souci de toujours fournir l'information la plus cohérente à ses utilisateurs, Google a donc fait évoluer ses algorithmes, ce qui a eu des conséquences sur les techniques de référencement. Lesquelles doivent évoluer en parallèle à ces changements. Nous allons passer en revue les différents algorithmes au travers du fonctionnement de Google. Il s'agit d'une présentation brève et succincte qui n'est présente que pour étayer les chapitres qui suivent. Bien entendu, il y a beaucoup plus à dire sur chacun des algorithmes présentés ci-dessous. 10 http://www.definitions-webmarketing.com/ 14/05/2014 11 http://www.google.com/intl/fr_be/about/company/history/ (14/05/2014) 12 http://fr.wikipedia.org/wiki/PageRank (14/05/2014) 13 ANDRIEU, Olivier, "préparation du référencement" in réussir son référencement web : Extrapolation de la longue traîne dans le cadre d'une stratégie de référencement, page 73, Paris, éditions Eyrolles, 2013
  15. 15. 8 GoogleBoots Dans le cadre de ce travail, Internet peut être défini comme étant une immense base de données. À la différence que ce ne sont pas des personnes physiques qui indexent les informations mais des machines. Avant de commencer ce chapitre, je vais donc donner un bref explicatif sur le fonctionnement d'un moteur de recherche, en prenant l'exemple de Google. Son but est de répondre aux demandes de l'internaute, de lui donner les informations qu'il recherche. Pour ce faire, Google doit ajouter un maximum de sites internet et de pages web à son index*(L'index Google est l'ensemble des sites répertoriés par les Googlebots). Il utilise dont les Googleboots (robots Google), ces robots visitent inlassablement tous les sites internet du web. Ils vont "lire" les informations contenues dans le code HTML* (HyperText Markup Language: langage universelle utilisé sur les pages Web lisibles par tous les Navigateurs Web14 ) d'un site et les renvoyer permettant ainsi à Google d'améliorer son index15 . Google Caffeine En 2009, Google mettait en ligne l'algorithme Caffeine avec l'objectif de changer la manière qu'ont les GoogleBoots de crawler (parcourir) les pages web. Figure 2.1 Changement dans l'index de Google16 . L'index précédent avait une structure en couches et, pour établir une nouvelle couche, il était nécessaire de parcourir l'ensemble du web. Par conséquent, certaines couches étaient plus à jour que d'autres. Avec la mise en ligne de Google Caffeine, le web est plus facile à crawler. 14 http://www.clashinfo.com/dico/definition-h/art45-html.html (consulté le 218/05/2014) 15 KEBBANI Nassim, "Les robots sur le web?" In Améliorez la visibilité de votre site grâce au référencement : le référencement, pages 22, condé-sur-noireau, Site du Zéro, 2013 16 ANDRIEU, Olivier, "Fonctionnements des outils de recherche" in réussir son référencement web : Mayday, Caffeine et Jazz: quoi de neuf?, page 45, Paris, éditions Eyrolles, 2013
  16. 16. 9 Le principe est que plus un site met du contenu en ligne, plus il sera parcouru par les GoogleBoots. En conséquence, le principal impact est que les sites d'actualité ont été mis à l'honneur, car cet algorithme peut très rapidement indexer les sujets d'actualités "chauds". Ce qui veut dire que les sites qui publient de manière régulière sont avantagés. Ainsi, les plateformes telles que les blogs sont davantage mises en évidence17 . Google panda Caffeine a grandement augmenté le nombre de sites à indexer, et il s'en est suivi un risque accru de spam*(répétions excessive de mot clé). Google a dû mettre en place un filtre permettant de valorise les sites qui ont un contenu de qualité et de pénaliser ceux qui ont un contenu pauvre. Panda fait donc partie de ces algorithmes qui ne répondent pas à une requête d'un internaute mais qui permet de nettoyer les SERP des résultats jugés non pertinents. L'un des buts de cet algorithme est de pénaliser les sites qui ne créent pas de contenu, qui copient le contenu présent sur un autre site (duplicate content*) et le placent sur l'une ou l'autre de leurs pages. Pour différencier le bon grain du mauvais, Google va vérifier l'âge de la page (la première s'étant faite indexée sera considérer comme étant l'original) et la popularité de celle- ci. Le but de Panda est de diminuer les sites qui ont un contenu dit "faible" et, d'une certaine manière, d'augmenter les connaissances présentes sur le web. Cet algorithme sert Google dans le sens où il sert l'intérêt premier de la firme: la recherche d'informations pertinentes18 . Google Penguin Il s'agit d'un autre algorithme de nettoyage de Google. Si Panda s'occupe des contenus d'un site internet, lui s'occupe du spam de contenu et de liens hypertextes. Spam de contenu Pour que la visibilité d'un site internet soit optimale, il convient de suivre une certaine démarche. En effet, certains éléments sont indispensables et ne peuvent donc pas être négligés. Par exemple, les balises <Hn>, 17 ANDRIEU, Olivier, "Fonctionnements des outils de recherche" in réussir son référencement web : Mayday, Caffeine et Jazz: quoi de neuf?, page 45, Paris, éditions Eyrolles, 2013 18 Ibidem page 452
  17. 17. 10 snippets, URL, mots en gras, … (voir chapitres suivants). Il était facile de se dire que si l'on met un maximum de mots clés dans ces éléments, le site n'en sera que plus visible. Ce raisonnement, n'est plus valable depuis l'apparition de Penguin. Il va considérer qu'il s'agit de sur- optimisation de contenu et le site en sera pénalisé. Le principal changement est que, maintenant, il faut avant tout penser utilisateur et que les contenus aient l'air "naturels"19 . Spam de lien L'un des moyens les plus efficaces pour référencer un site Internet est d'avoir des liens qui pointent vers le site en question. Google penguin va détecter les liens qui pointent de manière artificielle (liens qui pointent vers un site uniquement dans le but d'optimiser le référencement) vers un site et les pénaliser.20 Google Hummingbird En septembre 2013, Google a mis en ligne son tout dernier algorithme. Il permet désormais d'analyser une requête supérieure à 6 termes. La principale difficulté réside dans le fait que Google doit répondre à une question et plus à une requête conventionnelle. Cet algorithme devrait impacter 90% des recherches. Pour reprendre l'exemple donné en introduction "Où puis-je trouver une pizza qui livre à domicile près de chez moi?", Google ne va pas prendre en compte les mots qui composent la requête mais son sens. Cet algorithme est une introduction dans l'ère du web 3.0 ou du web sémantique (voir chapitre 6). L'internaute ne doit plus parler le langage "moteur de recherche", ce sont eux qui comprennent et interprètent le langage humain21 . Il faut tout de même préciser que Google Hummingbird va uniquement impacter les requêtes qui utilisent un nombre important de mots clés. Les résultats des recherches dites "classiques" (entre 1 et 4 termes) ne changeront pas. 19 ANDRIEU, Olivier, "Référencement, indexation et pénalités" in réussir son référencement web: la suroptimisation des contenus, page 468, Paris, éditions Eyrolles, 2013 20 Ibidem page 470 21 http://www.pole-position-seo.com/ (14/05/2014)
  18. 18. 11 CHAPITRE 3: MÉTHODOLOGIES POUR ÉTABLIR UNE LISTE DE MOTS CLÉS Les mots-clés constituent la clé de voute de toute stratégie de référencement car il s'agit de l'un des outils les plus efficaces pour déterminer la thématique (Sujet, matière, idée développée dans un discours, un article, une œuvre, d'une page22 .)* Comme expliqué précédemment, les moteurs de recherche ont la volonté de savoir ce que contiennent les pages, de déterminer leurs thématiques. Les mots clés influencent grandement les résultats obtenus sur les SERP. Durant ce chapitre seront abordées les différentes étapes inhérentes à la création d'une liste de mots clés. Si cette liste est erronée, toutes les autres étapes du référencement vont en pâtir. La loi de la longue traine Historique En 2004, Chris Anderson, le rédacteur en chef de "Wired" a prêté attention aux statistiques de ventes des sites de vente en ligne. Le résultat était le suivant : 20 % des ventes provenaient des produits dit "stars". C’est-à-dire, les produits les plus connus. Les 80% provenaient de la somme des autres produits, moins connus. Cette constations a donné naissance à la loi de la longue traine23 . Afin, d'illustrer ceci je vais prendre l'exemple d'un restaurant. Quand les clients lisent la carte des menus, ils sont limités par ce que propose celle-ci. Tandis que sur Internet, il n'y a pas de limite de choix et donc les possibilités sont beaucoup plus importantes. Des lors, on va avoir des choix beaucoup plus précis et personnalisés. Principe de la longue traine pour le référencement L'idée reste la même, sauf que nous ne parlons pas de produits mais de mots clés. En analysant les statistiques d'un site Internet nous obtenons le même type de répartition : 22 http://www.linternaute.com/dictionnaire/fr/definition/theme/ (consulté le 21/04/2014) 23 ANDRIEU, Olivier, "préparation du référencement" in réussir son référencement web: Le concept de la longue traine, page 66, Paris, éditions Eyrolles, 2013
  19. 19. 12 - 20 % du trafic est issu des mots clés "stars" (ce qui constitue la tête ou encore "courte traine"). Ce sont les mots clés les plus souvent saisis par les internautes dans un moteur de recherche. Ces termes ne sont pas légion, il est donc important de les cibler. - Les autres 80 % constituent la "queue" (ou la "longue traine"). Les mots qui la constituent ne sont pas populaires mais leur nombre est tel qu'ils génèrent le plus de trafic. 24 Figure 3.1 Illustration de la loi de la "longue traine"25 . Utilisation de cette loi pour une stratégie SEO Il existe plusieurs étapes et une méthodologie qui permettent de choisir les mots clés les plus représentatifs de l'activité d'un site. Cette liste sera composée des mots clés "stars", ceux qui vont alimenter la tête de la longue traine de ce site. Les mots clés "stars" sont des mots choisis, qui décrivent au mieux l'activité d'un site. Ils génèrent un trafic dit "maitrisé". En effet, on peut déterminer deux catégories de trafic: - En premier lieu, le trafic "maitrisé", celui qui provient de la tête de votre longue traine. On parle d'un trafic maitrisé, car vous avez choisi les termes qui vont apparaitre votre site Internet. Ils décrivent au mieux votre activité et le trafic qu'ils vont engendrer sera donc considéré comme étant de bonne qualité. Un trafic de bonne qualité est composé d'internautes qui recherchent ce que propose votre site. 24 Ibidem page 73 25 http://www.olivier-corneloup.com consulté le 19/04/2014
  20. 20. 13 - Ensuite, il y a le trafic dit "opportuniste". Celui-ci est créé par exemple, par certains termes présents dans le texte du site. Ils n'ont pas été spécifiquement choisis pour le référencement. Votre visibilité sur ces termes va dépendre du fonctionnement des algorithmes des moteurs de recherches. 26 Illustration de la loi de la longue traine avec l'exemple "Pizza". Sur dix termes relatifs au mot "pizza", trois de ces termes, seront des mots-clés stars et vont générer 20% du trafic sur le site en question (exemple: pizza, livraison, domicile), il s'agit du trafic maitrisé. Les sept autres, moins populaires, vont générer les 80% restants (exemple: calzone, lasagne, etc.) le trafic opportuniste. Évolution Le nouvel algorithme (Hummingbird) mis en ligne par Google permet de prendre en compte plus de mots clés dans la barre de recherche. Dès lors, ne peut-on pas considérer que l'importance de la longue queue n'en sera que plus forte? Par exemple, si un utilisateur fait la recherche suivante "où puis-je trouver une bonne calzone à Mons à livrer?", il y a un nombre important de termes qui composent cette requête (9 mots clés). Ce qui pourrait changer la répartition du trafic obtenus via la tête et la queue de la longue traine. Établissement d'une première liste Cette étape consiste à définir un univers sémantique autour de l'activité de l'entreprise qu’on référence, à déterminer les mots clés qui viennent directement à l'esprit quant à la description de l'activité du site. La méthode la plus simple consiste à se mettre à la place d'un internaute souhaitant trouver les informations fournies par le site. Dans cette étape, il est important de décliner les mots en fonction de leurs racines. De plus, préciser la localisation de l'entreprise est important. En effet, la géolocalisation des services est devenue essentielle dans toute stratégie SEO. Par exemple, je suis un internaute souhaitant trouver une pizzeria qui livre à domicile dans la région de Mons, je vais donc taper les termes : pizza/livraison/Mons ou Pizza/livrer/domicile/Mons ou encore Pizzeria/Mons/livraisons, … Cette liste "intuitive" est donc composée des mots qui décrivent au mieux l'activité de l’entreprise, ainsi que ses dérivés. Une fois cette première liste établie, on va la soumettre aux outils fournis par Google, afin de l'étoffer. Utilisation des Outils Google 26 Ibidem page 73
  21. 21. 14 Google Suggest En 2008, Google mettait en place un nouveau service : Google Suggest*. Au fur et à mesure que l'internaute tape des termes sur la barre de recherche de Google, la liste se modifie en temps réel. Il s'agit de l'auto-complétion : Fonctionnalité d'un logiciel, d'une application web consistant à compléter automatiquement le mot que l'utilisateur est en train d'écrire27 . Figure 3.2 Exemple de résultats fournis par Google Suggest avec le terme "Pizza". Le principe de Google Suggest est de proposer un terme de recherche en fonction de sa popularité auprès des internautes et non en fonction de votre historique. La correction automatique des fautes d'orthographe et de frappe Dans le cas où vous recherchez un terme compliqué ou si vous êtes fâché avec les subtilités orthographiques de la langue française, alors Google Suggest est votre ami. Il convient de nuancer cette amitié en précisant que Google Suggest propose les termes les plus recherchés par les internautes, et donc il ne s'agit nullement d'un correcteur orthographique au sens strict. L'intérêt pour les référenceurs est de voir quelles sont les fautes les plus souvent tapées et de changer leur stratégie en conséquence en intégrant ces fautes. Par exemple, si le terme "Pizza 4 fromage" apparait avant "pizza 4 fromages", il est plus pertinent de se positionner sur le terme fautif28 . Les requêtes en plusieurs termes 27 http://dico.developpez.com/html/ 10/05/2014 28 ANDRIEU, Olivier, "préparation du référencement" in réussir son référencement web: Fautes de frappe et d'orthographe, page 81, Paris, éditions Eyrolles, 2013
  22. 22. 15 Figure 2.3 Exemple de requête à plusieurs termes. Comme le montre la figure 2.3, en inscrivant des mots clés sur Google, le service Suggest propose une liste composée de plusieurs mots clés. Cet outil fort pratique deux conséquences non négligeable sur la queue de la longue traine. - On peut voir qu'il n'y a que 4 choix proposés, ce qui, en un sens, est très positif pour les sites qui se sont positionnés sur ces termes. Il s'agit d'un enrichissement du trafic provoqué par la tête de la longue traine. Mais de par le nombre peu élevé de propositions, la queue, elle, en pâtit. - On constate un effet vicieux : au plus les internautes vont choisir les termes proposés par Google Suggest, au plus le nombre de requêtes vont diminuer. On assiste à un véritable appauvrissement de la longue traine.29 Le paradoxe ADwords* Google Suggest, en proposant des mots-clés généralement "stars", valorise le service de référencement payant proposé par Google ADwords. En effet, celui-ci se concentre sur les termes "stars". Google Suggest augmente donc le trafic sur ces termes, et favorise en même temps l'importance de Google ADwords En résumé Cet outil sera utile pour savoir comment les internautes associent les termes entre eux et comment ils les orthographient. Ce qui va permettre d'étoffer la liste établie précédemment. Google ADwords "ADwords (« Ad » pour Advertising, publicité et « Words » pour mots) est un service publicitaire mis en place par Google. Il commercialise les liens sponsorisés et les bannières publicitaires gérées par Google. Ces publicités sont publiées soit directement sur les services de Google (moteur de recherche, Gmail, Google Maps, YouTube…) soit sur des sites extérieurs." 30 29 Ibidem page 79 30 http://www.destination-webmarketing.fr/ 11/05/2014
  23. 23. 16 Google ADwords est le principal outil pour de mise en place d'une stratégie payante. Dans le cadre de ce travail sur le référencement naturel, cet outil se révèle pratique pour suggérer des idées de mots-clés sur lesquels on peut se placer. Mais plus encore, l’outil fournit également le nombre de fois que ce terme a été recherché durant le mois précédent, ainsi que la concurrence existant sur ces mots clés. Cette plateforme fournit donc trois informations essentielles : des mots clés en rapport avec celui qui fait l’objet de la recherche, le nombre de fois que ces mots ont été recherchés en moyenne par mois (leur popularité donc), et enfin la concurrence. Figure 3.4 Exemple de résultats sur Google Adwords pour le mot "Pizza" 1. Les mots-clés Une fois le terme "pizza" tapé dans la barre de recherche, on obtient des groupes de mots clés. Ces groupes permettent d'augmenter la liste des termes sur lesquels un site peut se placer. 2. La popularité Il s'agit du nombre de fois que les mots ou le groupe de mots ont été entrés dans la barre de recherche de Google. 3. La concurrence Il s'agit de l'importance des annonceurs payants présents sur un terme. Au plus ils sont présents, au plus la concurrence sera importante. Google classe trois types de concurrence : faible, moyenne et forte. Cette donnée détermine la "faisabilité" d'un mot clé. Au plus la concurrence est faible sur un mot, au plus celui- ci est "faisable", c'est-à-dire qu'il sera facile de se positionner dessus.
  24. 24. 17 En résumé On va soumettre la liste de mots clés à cette base de données. En soumettant chaque terme, il va générer des idées de mots sur base desquelles, on va pouvoir juger de la pertinence des mots de la première liste. Cet outil va non seulement permettre d'alimenter la tête de la longue traine (au cas où un terme essentiel aurait échappé au référenceur) mais également la queue de la longue traine. ADwords fournit aussi un certain nombre d'informations sur la popularité et la concurrence. Si un mot est très populaire et a une forte concurrence, il n'est pas très intéressant de se positionner dessus dans le cadre d'une stratégie naturelle. Par contre, un terme avec une plus faible concurrence, va générer moins de trafic, mais il sera plus facile de se placer sur ce terme. D'autant plus s'il se rapporte à une activité spécifique du site ou de l'entreprise. En résumé, il n'est pas intéressant de choisir les mots les plus populaires ou les plus généraux, mais plutôt ceux qui offrent un bon rapport entre popularité et spécificité. De manière générale, le mot clé idéal est celui « de niche », c’est-à-dire, celui sur lequel la concurrence est faible et qui décrit au mieux l'activité de l'entreprise. Par exemple, le terme "Pizza" n'est pas un bon mot clé. Certes, il décrit très bien l'activité du restaurant mais il est tellement générique qu'il a une concurrence trop importante pour être intéressant. Un bon mot clé de niche serait, par exemple, "livraison calzone Mons". Google Trends* Cet outil permet d'évaluer les tendances d'un mot clé, il permet de donner une évaluation de l'utilisation d'un mot clé et des expressions qui lui sont associées. Il est important de souligner que la base de données de Trends ne remonte qu'à 200431 . Google Trends est un outil très puissant qui propose plusieurs filtres afin de rendre les résultats les plus pertinents: - Catégorie : il y en tout 27, elles permettent de sélectionner une thématique autour du sujet et ainsi d’éliminer les résultats inutiles. - Géographique: il est possible de paramétrer Google Trends pour que seul les résultats d'un pays ou d'une région soient proposés. - Saisonnalité: en fonction des dates ou d'événements, les recherches de termes varient fortement. Par exemple, on sait qu’à l'approche d'une coupe du monde de Football les commandes de téléviseurs 31 http://www.infowebmaster.fr/ 12/05/2014
  25. 25. 18 ou de pizzas augmentent32 . Il est donc normal que cela influence les recherches effectuées sur Google. - Les différents services de Google : Ce service propose les résultats en fonction de la rubrique Google désirée : web, images, actualités, … 33 Figure 3.5 Exemple de termes soumis à Google Trends. En bleu "Pizza livraison" en rouge "livraison Pizza" et en jaune "Pizzalivraison" Figure 2.6 Résultats de l'évolution de ces termes depuis 2004 à nos jours 32 http://www.sofoot.com/blogs/ 12/05/2014 33 http://www.contenus-en-ligne.com/ 13/05/2014
  26. 26. 19 Figure 3.6 Précision dans les informations géographiques pour le terme "pizza livraison" Les données concernant l'évolution d'un mot clé en fonction de la saisonnalité sont importantes pour la planification d'une stratégie SEO. Figure 3.7 Le terme "salade italienne" voit un pic entre juillet et août. Figure 3.8 Le terme le plus intéressant au niveau de son évolution est "Pizza 4 Fromages". La combinaison des informations fournies par ces outils va permettre de déboucher sur une deuxième liste plus complète. Egalement, il est judicieux de rester attentif à l'évolution générale d'un terme sur le long terme. Il n'est pas dit qu'un terme populaire aujourd'hui le sera demain.
  27. 27. 20 En réusmé Cet outil prend toute son importance dans une stratégie SEO quand il s'agit de comparer plusieurs termes sur une période de temps déterminée. Il permet de voir l'évolution de ces termes sur une ligne du temps paramétrable. Ainsi, on peut déterminer sur quels termes il est préférable de se positionner en fonction de la saison. Dans la liste vont devoir figurer des mots de saison, qui ne feront partie de la stratégie de référencement qu'a des périodes données. Par exemple, comme le montre la figure 3.7, le terme "salade italienne" est plus recherché d'avril à octobre. Il est donc intéressent de se positionner sur ce mot clé durant cette période. , Tester les mots clés Combiner les différents mots clés entre eux afin de voir quels résultats apparaissent sur les SERP de Google est également une bonne manière de les tester, voire de trouver des opportunités de référencement, c’est-à- dire, les termes sur lesquels la concurrence ne s'est pas encore positionnée.
  28. 28. 21 CHAPITRE 4. UNIFORM RESSOURCE LOCATOR Dans un travail traitant de l'optimisation naturel de site web en utilisant des techniques impliquant du texte, il était impossible de ne pas parler de l'URL*. Voici la définition d'Uniform Ressource Locator (URL) selon le Larousse : "Adresse électronique qui permet de localiser un site ou un document sur Internet et qui indique la méthode pour y accéder, le chemin d'accès et le nom du fichier." 34 Donc L'URL est l'adresse web d'une page Internet. Elle est composée de deux éléments qui sont le nom de domaine et le slug* (c'est la deuxième partie d'une URL, il donne des informations sur le contenu d'une page )35 . Il est important de faire une distinction entre ces deux parties car elles n'ont pas le même objectif. Le nom de domaine est le nom d'un site, l'adresse via laquelle l'internaute va accéder à la page d'accueil. C'est la prochaine étape de réflexion rédactionnelle pour un site Internet : le choix du nom de domaine. La deuxième partie, de L'URL slug. Le but sera de démontrer qu'elles sont les techniques qui permettent de l'optimiser d'un point de vue utilisateur. Comment faire pour qu'une URL complète aide le navigateur dans sa navigation. Composition d'une URL http://www.compagny.com/blog/page-name.htlm a b c d e f g Le nom domaine Slug Figure 4.1 schéma d'une URL a) HyperText Transfer Protocol b) WWW c) Le domaine d) L'extension également appelé TLD (Top-Level Domain) 34 http://www.larousse.fr/ 20/04/2014 35 http://www.seomix.fr/ 19/04/2014
  29. 29. 22 e) Sous-direction f) Le nom du fichier g) Extension de fichier L'importance actuelle des URLs En premier lieu, il convient de se déterminer de l'importance des URLs dans le référencement d'aujourd'hui. Il est essentiel de replacer l'importance de l'adresse web dans le référencement d'aujourd'hui. Comme l'atteste Matt Cutts, directeur référencement chez Google, dans sa vidéo : "How important is to have keywords in a Domain Name"36 . "We have looked at the rankings and weights that we give to keyword domains and some people have complained that we’re giving a little too much weight for keywords in domains. And so we have been thinking about adjusting that mix a little bit and sort of turning the knob down within the algorithm so that given two different domains, it wouldn’t necessarily help you as much to have a domain with a bunch of keywords in it." Cette vidéo explique que l'importance des mots clés dans les noms de domaine seront revus à la baisse. Selon lui, cette mesure est justifiée de par un déséquilibre dû à une importance trop grande des mots clés dans un nom de domaine. De plus, le domaine est le seul élément qui va influencer le référencement dans une URL37 . Dans ce contexte, on pourrait penser désuet d'avoir des "belles" URL, mais il n'en n'est rien. S'il est vrai qu'elles n'ont plus la même importance. Il ne faut pas oublier l'autre partie du référencement naturel qui est l'internaute lui-même. Le fait d'avoir des URL explicites est une manière d'inciter les visiteurs d'un site à prolonger leurs navigations voire à revenir sur une page encouragés par une organisation claire dans les contenus proposés. Nom de domaine Le nom de domaine est la partie de L'URL qui est la plus visible, et de manière générale la plus communiquée. Un bon nom de domaine ce doit d'être facile à mémoriser. Il faut qu'il soit court au possible, il est préférable de privilégier l'utilisation de un mot ou deux maximums. Le nom de domaine est le premier jalon d'une stratégie de référencement. 36 https://www.youtube.com/watch?v=rAWFv43qubI 16/04/2014 37 KEBBANI Nassim, "Un site web, une arborescence des URL!?" In Améliorez la visibilité de votre site grâce au référencement : le nom de domaine, pages 55, condé-sur-noireau, Site du Zéro , 2013
  30. 30. 23 Les prochains points vont ont pour objectif de donner une explication des différents éléments qui composent un nom de domaine et de déterminer leurs importance ou non dans le référencement. L'HyperText Transfert Protocol Il s'agit d'un protocole de communication utilisé sur Internet. C'est la raison pour laquelle toutes les pages web commencent par http://. C'est via ce langage que les serveurs et les clients peuvent communiquer sur le web38 . Bien entendu, le protocole http n'a aucune incidence sur le référencement. WWW C'est l'acronyme de World Wide Web, il s'agit de l'une des options offertes par internet pour naviguer entre les documents reliés par des liens HyperText39 . Le domaine C'est le nom de votre site, il se doit d'être représentatif de celui-ci. Les domaines sont composés de maximum 63 caractères, peuvent être composés de tirets, caractères non accentuées et de chiffres. Les extensions (ou TLD) Les extensions des dites internet sont .com, .fr, .br, … L'extension .com est encore de nos jours l'extension le plus utilisée. Figure 4.2 Pourcentages des extensions utilisées dans le monde40 . 38 http://www.sebsauvage.net/comprendre/ssl/ 18/03/2014 39 http://www.commentcamarche.net 16/03/2014 40 http://webdesign.tutsplus.com/ 18/03/2014
  31. 31. 24 Il a été énoncé précédemment que seul le domaine avait un impact dans le référencement. La question est maintenant de déterminer pourquoi les extensions n'ont pas d'impacts. Car il semblerait que le choix pertinent d'une extension fournisse des informations de choix aux moteurs de recherche, comme par exemple sur la langue (extension en .fr) ou encore sur la destination du site (.gouv pour les sites officiels). C'est Matt Cutts qui fournit la réponse en la présence d'un post sur Google + : " Google has a lot of experience in returning relevant web pages, regardless of the top-level domain (TLD). Google will attempt to rank new TLDs appropriately, but I don't expect a new TLD to get any kind of initial preference over .com, and I wouldn't bet on that happening in the long-term either. If you want to register an entirely new TLD for other reasons, that's your choice, but you shouldn't register a TLD in the mistaken belief that you'll get some sort of boost in search engine rankings. "41 Autrement dit, Google est suffisamment puissant pour comprendre la langue dans laquelle sont écrits les textes du site et que le choix de l'une ou l'autre TLD ne changera pas l'indexation d'un site web. Il faut tout de même nuancer ses propos en précisant qu'il est conseillé de choisir l'extension du nom de domaine en fonction du public: - Dans le cas où le site vise un public habitant en France ou parlerait Français, il est préférable d'avoir un .fr. 42 Il faut tout de même être attentif à ne pas à ne pas utiliser une extension géographique si le site ne propose aucun contenu pour ce pays43 . Le slug Le slug a pour objectif d'identifier un contenu, c'est la deuxième partie d'une URL. Il se compose des éléments suivants44 . Sous-Direction Il s'agit de la profondeur d'un site Internet. Au plus un site à de sous-directions, a de sous-dossiers au plus il est profond45 . Par exemple un site profond de trois étages donnerait ceci: 41 https://plus.google.com/+MattCutts/posts/4VaWg4TMM5F 22/03/2014 42 ANDRIEU, Olivier, "optimisation des pages du site : les critères "in page"" in réussir son référencement web: Quelle extension choisir, page 141, Paris, éditions Eyrolles, 2013 43 https://www.youtube.com/watch?v=yJqZIH_0Ars&feature=youtu.be 44 http://www.seomix.fr/url-referencement-naturel/ 17/03/2014 45 Même site que 44
  32. 32. 25 Nom-du-site/Plat/Cartes/Pizzas Nom du fichier Il s'agit de la largeur d'un site, la largeur fait références aux nombres de pages pour une même catégorie. Pour continuer l'exemple précédent, le site web pourrait offrir des pizzas pour les femmes, les enfants, les gros mangeurs,… La largeur de la catégorie Pizza est de 3 pages. La largeur n'influence la visibilité, on peut avoir autant de pages que l'on veut. La seule condition est que chaque page soit unique. 46 L'extension Est-il utile pour le référencement de renommer les extensions de fichiers (.Php ou .HTML) afin d'y incorporer des mots clés. Tout d'abord cella est techniquement impossible et ensuite ce type de manipulation n'a absolument aucun impact dans l'indexation web47 . Critères d'optimisation du domaine Le choix du nom Quant à l'optimisation d'un nom de domaine, il y a deux manières de voir le problème. La première consiste à implémenter un ou deux mots clés dans le nom de domaine (qui sont en rapport direct avec l'activité du site) et la deuxième consiste à mettre un nom qui est facilement mémorisable (Google, Yahoo, …). Les deux stratégies présentent avantages et inconvénients, la première est pensée pour les moteurs et la deuxième pour les internautes. La partie moteurs de recherches Dans cette stratégie, vous vous adressez non pas à vos potentiels visiteurs mais aux moteurs de recherche. Dans le cas où vous livrez des Pizzas à domicile Vous opterez donc pour un nom de domaine tel que : "Livraison-pizza-domicile". Et ce car il s'agit de la requête qui a le plus de chance d'être demandée à Google. Il y a même une possibilité d'affiner en précision votre zone de chalandise : "livraison-pizza-Mons". L'avantage est bien entendu le positionnement de votre site dans le cas où ce type de requête serait introduite, au détriment du nom de l'entreprise. 46 http://webdesign.tutsplus.com/ 22/03/2014 47 https://www.youtube.com/watch?v=MRRWqwXufLs 30/03/2014
  33. 33. 26 La stratégie utilisateur Il s'agit ici d'une stratégie de marque, vous voulez que vos utilisateurs se rappellent du nom de votre entreprise. Et de facto, du nom de votre site. Pour que cette stratégie fonctionne il faut que le nom de votre entreprise soit facile à retenir. Ainsi des sites qui n'ont aucun mot clés dans leurs noms de domaine se sont faire connaitre sur Internet. Des sites très bien référencé tels que Google, Yahoo ou encore Twitter ont un page ranking48 (Le Pagerank est un système développé par les fondateurs de Google qui affecte une notation à une page web en fonction des liens externes pointant vers cette page et de la nature des sites sur lesquels ces liens sont présents.49 ) conséquent. En étant facilement mémorisable votre nom de domaine permet de favoriser le retour de vos visiteurs. Ce qui aura comme impact d'augmenter votre visibilité. Conclusion Matt Cutts conseille d'opter pour la stratégie de marque notamment par ce que les futurs internautes seront capables de s'en rappeler et de favoriser le retour sur le site50 . De plus, il à déjà été énoncé que l'importance des mots clés dans le nom de domaine sera revues à la baisse. Par ailleurs, au vu de l'évolution des algorithmes de Google de manière générale, on peut constater qu'ils tendent à s'orienter de plus en plus vers les utilisateurs. Au vu de tous ces éléments, la meilleure stratégie semble être celle qui favorise l'utilisateur. Il faut tout de même ajouter que ces deux stratégies dépendent énormément des disponibilités des mots noms de domaines. Ainsi, la première étape de toute réflexion est de se rendre sur des plateformes telles qu'OVH51 et de se renseigner sur leurs disponibilités. 48 Pour plus d'informations à ce sujet veuillez consulté cette référence : ANDRIEU, Olivier, "optimisation des pages du site : les critères "off page"" in réussir son référencement web: Liens, PageRank et indice de popularité, page 183, Paris, éditions Eyrolles, Site du Zéro , 2013 49 http://www.definitions-webmarketing.com/Definition-Pagerank (consulté le 20/02/2014) 50 https://www.youtube.com/watch?v=rAWFv43qubI 16/04/2014 51 Pour plus d'information sur cet outil veuillez-vous rendre à l'adresse suivante : http://www.ovh.com/jobs/qui_est_ovh.xml
  34. 34. 27 D'un point de vue technique L'Age du nom de domaine L'ancienneté semble avoir être un critère proéminent dans l'indexation web. Toutes choses étant égales par ailleurs, si vous possédez plusieurs noms de domaine il semblerait préférable de privilégier le plus ancien. La raison est que Google accorderait plus de confiance aux noms de domaine les plus anciens52 . De plus, le trust rank53 d'un site serait même influencé par la durée entre deux renouvellements. Selon olivier Andrieu, "Un nom de domaine qui serait renouvelé tous les 5 ans aurait une plus grande confiance qu'un nom de domaine qui serait renouvelés tous les ans. Apparemment, le moteur serait méfiant à propos des transactions à courte échéance.54 " La longueur du domaine. Enfin, il convient de toucher un mot sur la longueur du nom de domaine. En effet, un nom domaine qui serait aussi bien trop court ou trop long n'est pas bien perçu par Google. En général, un bon nom de domaine doit avoir une longueur comprise entre 10 et 15 caractères avec une limite maximale de 20 caractères55 . Sous domaine ou sous répertoire? Il existe deux manières de découper un site, les sous-domaines ou les répertoires. Sous-domaine Repertoire Membre.nomdusite/profil.html Votresite.com/membre/profil/html Avant 2007, la réponse aurait sans hésitations été le répertoire car Google avait un défaut dans son ancien algorithme. Lequel considérait qu'un sous-domaine était un nouveau site à part entière. Depuis, une mise à jour à été effectuée et il existe que des différences très minimes entres les deux méthodes. 52 KEBBANI Nassim, "Un site web, une arborescence des URL!?" In Améliorez la visibilité de votre site grâce au référencement : Age du nom de domaine, pages 57, condé-sur-noireau, Site du Zéro , 2013 53 Pour plus d'informations à ce sujet veuillez consulté cette référence : ANDRIEU, Olivier, "optimisation des pages du site : les critères "off page"" in réussir son référencement web: Trust rank ou indice de confiance, page 183, Paris, éditions Eyrolles, 2013 54 ANDRIEU, Olivier, "optimisation des pages du site : les critères "in page"" in réussir son référencement web: l'ancienneté du nom de domaine est-elle importante?, page 143, Paris, éditions Eyrolles, 2013 55 http://www.web-visibility.be/ (13/03/2014)
  35. 35. 28 Néanmoins, dans une optique de confort de l'utilisateur je serai d'avis de conserver la forme répertoire. Car si l'on considère les URL comme étant un fil d'Ariane, autrement dit le chemin que l'internaute a parcouru dans le site afin de trouver l'information désirée: il est plus logique que les sections visitées se superpose les unes aux autres, contrairement aux sous-domaines qui eux vont se placer derrière le nom de domaine. Avec la forme sous-domaine, il est plus difficile pour l'internaute de se retrouver dans le site56 . Critères d'optimisation du slug L'importance de l'arborescence pour le slug "L’arborescence d’un site web est une représentation de la structure et de l’organisation de l’information et des contenus sur un site web. L’arborescence d’un site web part de la page d’accueil et est généralement structurée en rubriques, sous rubriques et pages57 ." Figure 4.3 Exemple sommaire d'une arborescence d'un site Internet. Depuis la mise en ligne de Google caféine, au plus un site propose du contenu, au mieux c'est. La principale difficulté est que au plus on produit du contenu au plus il devient difficile de le hiérarchiser, d'avoir une division cohérente et logique. C'est donc dans cette étape qu'intervient tout le travail de réflexion au niveau de l'arborescence d'un site. Il faut utiliser des termes, mots clés qui vont décrire la section abordée. Via une bonne architecture, il devient plus facile de scinder le contenu en fonction de la thématique de la page. De plus, c'est dans cette étape que l'on va fixer "le chemin" qu'un internaute va parcourir afin d'obtenir l'information qu'il recherche. Grâce à 56 KEBBANI Nassim, "Un site web, une arborescence des URL!?" In Améliorez la visibilité de votre site grâce au référencement : Sous domaine ou répertoire?, pages 60, condé-sur-noireau, Site du Zéro ,2013 57 http://www.definitions-webmarketing.com/Definition-Arborescence-site-web 13/03/2014 Home page Menu principal Sous-menu Page Sous-menu 2 Page Plats Pizza Enfants Femmes Gros mangeur Salades Italienne Page
  36. 36. 29 une bonne hiérarchisation des données, on peut optimiser le confort de visite d'un internaute sur un site et donc favoriser son efficacité. Exemple d'URL qui découle de l'arborescence de la figure 4.1 Nom-du-site/Plat/Cartes/Pizzas On voit dans cet exemple que le slug donne le chemin parcouru par l'internaute ou le fil d'Ariane. Privilégiez les tirets Il est n'est pas courant d'utiliser un underscore (_) dans un Slug. Dès lors par un souci d'uniformisation, il est plus avisé d'avoir recours aux tirets. C'est une étape qui a pour une unique but d'augmenter le confort de l'utilisateur. Qu'en est-il des caractères complexes? Là encore tout n'est qu'une question de confort de l'utilisateur, que vous ayez recours à des caractères complexes que seuls les adeptes du PHP comprendront ou que vous réécriviez vos fichiers, le référencement n'en sera pas impacté. Seuls les utilisateurs de votre site le seront. Exemple d'une Url non optimisée pour les utilisateurs, il est effet très difficile de déterminer ce qu'elle contient : http://joomla.easyrh.fr/index.php?option=com_content&view=article&id=74&Itemid=67 Il s'agit URL qui sont générés automatiquement. La Solution pour éviter ce type d'URL est assez facile à mettre en place via des CMS*( site web disposant de fonctionnalités de publication et offrant en particulier une interface d'administration (back-office) permettant à un administrateur de site de créer ou organiser les différentes rubriques58 .) tel que Joomla ou encore Drupal, Il s'agit de L'URL Rewritting* (L'URL rewriting se traduit en français par réécriture d'URL. C'est une méthode utilisée sur les sites web dynamique permettant de présenter des adresses plus propre et plus lisible). Cette technique permet d'optimiser la compréhension des URL par les utilisateurs. Bien entendu, ce chapitre est centré sur l'URL rewriting. Critères d'optmisation des URL Les caractères accentués et spéciaux. Dans la vidéo "Do you recommend using special characters in URLs " posté le 27 mars 201259 . Il est demandé à Matt Cutts si il est recommandé d'utiliser les caractères spéciaux et accentués (ç, à, é, è) dans les URLs. 58 http://www.commentcamarche.net/contents/1316-cms-content-management-system 59 https://www.youtube.com/watch?v=K4TKJwvTu50 (28/03/2014)
  37. 37. 30 À cette question Matt Cutts répond que même si Google est capable d'interpréter ce type de caractère il est préférable garder une URL aussi simple que possible. Il s'agit d'une source de complication inutile. La problématique des URLs multiples Il peut exister le cas ou deux URL différentes mènent à la même page d'un site Internet. Il faut être particulièrement attentif à ce type d'éventualités car nous sommes dans le cas précis d'un duplicate content (duplication de contenu). En plus de pénalités aux algorithmes de panda ou pengouin (voir chapitre 2), le "jus de lien" s'appareille en plusieurs pages plutôt de se concentrer sur une seule page. De manière imagée, vous avez un gobelet rempli à 100% de café, si vous le versez dans un seul gobelet vous bénéficierez de 100% de son contenu tandis que si vous en avez 2 ou plus, il faudra diviser la quantité de liquide par le nombre de gobelets. C'est le même fonctionnement pour le référencement : au plus vous avez de gobelets au plus votre "jus de lien" sera divisé60 . Un mot sur les redirections Il s'agit ici d'une erreur qui est commises de trop nombreuse fois par les webmasters et qui ruine toute la stratégie de référencement mise au point. Dans le cas d'une refonte de site, il est normal de refaire des nouveaux dossiers qui contiendront de nouvelles pages. Ces pages ne seront pas nommées de la même manière que les précédentes (même si le contenu est identique) et donc l'URL ne sera pas la même. La problématique est que les robots de Google, les Googlebots, ne savent pas que cette URL n'est pas la même, et ils vont arriver sur une erreur 404* (Ce code est un message indiquant une erreur qui est renvoyé par un serveur HTTP. Globalement, cela veut dire que la page demandée n'existe pas.). Ce qui veut dire qu'ils n'ont pas trouvé la page qu'ils cherchaient. Cette remarque est également valable pour les internautes : si un internaute a stocké votre site dans ses favoris (qui contiendrait l'ancienne URL), il tombera également sur cette erreur. La solution est de recenser l'ensemble des pages de votre ancien site qui sont référencées sut Google et de mettre en place une redirection vers votre nouveau site, page par page.61 60 KEBBANI Nassim, "Un site web, une arborescence des URL!?" In Améliorez la visibilité de votre site grâce au référencement : Des Url générés automatiquement, pages 63, condé-sur-noireau, Site du Zéro ,2013 61 KEBBANI Nassim, "Un site web, une arborescence des URL!?" In Améliorez la visibilité de votre site grâce au référencement : Evitez les ereurs 404, pages 61, condé-sur-noireau, Site du Zéro ,2013
  38. 38. 31 CHAPITRE 5: LE CONTENU EST ROI, LE CONTENU OPTIMISÉ EST EMPEREUR L'un des grands fondements du référencement naturel est le contenu, et plus encore le contenu optimisé. Au cours de mes recherches, j'ai constaté que les moteurs de recherche sont souvent qualifiés "d'obsédés textuels"62 , et pour cause, leur intention est de connaitre la thématique d'une page au travers de son contenu. Le fait qu'il y ait du texte sur un site est forcément une bonne chose, mais il existe un panel de techniques quant à l'optimisation du texte visible. Le nombre d'occurrences d’un mot clé dans un texte, la disposition des titres,… sont autant de paramètres à optimiser pour la compréhension des moteurs de recherche de la thématique d'une page. Ce chapitre aura donc pour objet l'optimisation du texte visible sur un site Internet pour une meilleure compréhension de la thématique du site par les moteurs de recherches. (Notion abordées dans le chapitre 1, consacré aux mots clés). Les termes "texte" et "visible" vont jalonner ce chapitre. Afin de bien préciser les choses, il convient d'en donner une définition : - Texte : selon Olivier Andrieu, le contenu texte c'est "le contenu textuel de nos pages, c’est-à-dire le contenu que vous pouvez sélectionner avec votre souris, copier puis coller dans un traitement texte comme Word.63 " - Visible : dans ce chapitre, il sera uniquement question du texte qui peut être lu par l'utilisateur. Toutes formes de textes "cachés" dans le code source ne sera pas pris en compte. L'optimisation du texte Une meilleure position HTML pour un meilleur référencement? Le point à déterminer ici est de savoir si la position d'un texte dans le code HTML va influencer son poids, son importance pour les moteurs de recherche. Pendant longtemps, la réponse était inévitablement oui. Au plus un texte était haut dans le code source, près de la balise*(Une balise HTML est un élément que l'on va 62 ANDRIEU, Olivier, "optimisation des pages du site : les critères "in page"" in réussir son référencement web: Zone chaude 2: Texte visible, page 123, Paris, éditions Eyrolles, 2013 63 Ibidem page 123
  39. 39. 32 ajouter au texte de départ pour dire au navigateur de quelle manière l'afficher64 ) <body> (exemple de balise HTML) , au plus il était pris en compte65 . Avec les algorithmes actuels, il semblerait que ce ne soit plus le cas. En pratique, cela signifie qu'il n'est pas nécessaire de placer un mot au tout début du code source pour qu'il ait plus de poids. Une page, un thème Il a été établi que les moteurs de recherche veulent déterminer la thématique d'une page. Si une page traite de plusieurs sujets, leur tâche n'est pas facilitée. De plus, il est plus confortable pour l'utilisateur d'avoir un seul sujet. Le fait de favoriser le confort de l'utilisateur fait partie des facteurs qui influencent son retour sur le site. Ce raisonnement est le même pour les pages multilingues: il est clair qu'avoir des pages monolingues est plus confortable pour l'internaute et plus digeste pour le moteur de recherche66 . Un contenu à trois zones De manière très schématique, la zone textuelle d'un site internet est composée de 3 zones distinctes : - Zone 1 : cette zone présente le titre éditorial de la page, on va utiliser la balise H1 en y insérant des mots clés. L'objectif est de décrire l'objet de la page. - Zone 2 : dans cette partie sera présent le corps du texte. C'est dans cette espace que l'on va mettre évidence les mots clés en les mettant en gras ou en les insérant dans des liens. - Zone 3 : c'est dans cette partie que nous allons insérer des liens internes ou externes traitant d'autres sujets. Figure 5.1 Schématisation d'une page Internet 64 http://j-willette.developpez.com/tutoriels/html/les-bases-du-html/?page=page_1 (consulté le 09/05/2014) 65 Ibidem page 127 66 Ibidem page 134
  40. 40. 33 L'optimisation des titres rédactionnels (zone 1) Les titres rédactionnels Les balises <Hn> (<H1> à <H6>) sont les titres des pages et ont une importance non négligeable pour les moteurs de recherche. Tout comme pour l'écriture "hors ligne", les titres ont pour vocation d'introduire les sujets qui vont être développés dans les paragraphes qui suivent. Pour l'écriture web, le principe est le même. D'un point de vue SEO, les titres ont deux intérêts majeurs : dans un premier temps, ils aident le moteur de recherche à identifier le contenu thématique d'une page, et ensuite, ils facilitent la lecture des internautes. Ces balises permettent le placement des mots clés stars d'un site Internet, ce qui impacte le trafic maitrisé. L'importance des titres Techniquement parlant, les titres, de par leurs importances dans le référencement de premier ordre67 , permettent de placer des mots clés "stars" Il convient de préciser que tous les titres n'ont pas le même poids, la balise <H1> est bien plus importante que la balise <H6>. Cette importance décroissante va avoir in fine un impact sur le placement des mots clés. Au plus un terme, une expression sont pertinents pour l'activité, au plus ce terme sera placé "haut" dans les titres. Par exemple: les termes les plus importants pour notre activité sont "Pizza, livraison et Mons". Dès lors il faut placer ces termes en <H1>. Le choix des mots clés contenus dans les titres. Dans l'optique d'aider le moteur de recherche à déterminer la thématique de la page, il faut mettre en place une certaine récurrence entre les termes présents dans les paragraphes et ceux présents dans les titres. De plus, afin d'optimiser la loi de la longue traine, il est intéressant de placer les racines et les dérivés d'un mot dans les titres et paragraphes. La longueur des balises H1 à H6 Il y a ici un équilibre à trouver entre les internautes et les moteurs de recherche. S'il est tout à fait possible de mettre sous forme de balise <H1> l'entièreté des textes afin d'optimiser le référencement d'une page, ce type de raisonnement est tout à fait bancal. Google va détecter le trop grand nombre de mots et va considérer cette pratique comme une fraude. Ce qui aura comme conséquence que la page ne sera pas indexée. Dans un deuxième temps, les internautes, voyant toute une page écrite en gras, surdimensionnée, ne vont pas rester longtemps et ne vont encore moins revenir sur cette page. 67 http://www.yakaferci.com/balises-h1-h2/ (consulté le 04/05/2014)
  41. 41. 34 Un ordre décroissant à respecter Les balises ont un ordre d'importance décroissant, il faut donc respecter cet ordre hiérarchique sur la page. Par exemple, le type de structure suivante serait pénalisé68 : <body> <H1> Les pizzas livrées à domicile de Luigi à Mons</H1> <H4> les bonnes pizzas traditionnelles de Naples</H4> <H2> Mons, une pizzeria des recettes italiennes</H2> <H4> les recettes de ma mama Peach </H4> </body> Cette structure n'est absolument pas logique. Sur la page, on obtiendrait ce type de résultat: Les pizzas livrées à domicile de Luigi à Mons Les bonnes pizzas traditionnelles de Naples Mons, une pizzeria des recettes italiennes Les recettes de ma mama Peach69 Le <H1> et le slug Est-il utile de mettre le <H1> d'un site internet dans un slug? La réponse à cette question varie en fonction de la longueur du site, quand nous nous trouvons devant un site qui est constitué de plusieurs milliers pages. Il est utile de positionner le <H1> dans l'URL. Néanmoins, le titre <H1> va être présent dans les SERP de Google, et c'est une manière d'inciter les navigateurs à visiter le site web70 . Optimisation du contenu rédactionnel (zone 2) Le contenu rédactionnel Le contenu rédactionnel revêt une grande importance dans le référencement naturel d'un site internet. Aussi bien du point de vue de l’utilisateur que pour les moteurs de recherche. Pour l'utilisateur, c'est bien entendu dans ce contenu qu'il va trouver les informations qu'il cherche et, en fonction de sa pertinence, va choisir 68 http://blog.axe-net.fr/hierarchie-balises-h1-h2-hn-referencement/ (23/02/2014) 69 http://www.yakaferci.com/balises-h1-h2/ (consulté le 04/05/2014) 70 KEBBANI Nassim, "Un site web, une arborescence des URL!?" In Améliorez la visibilité de votre site grâce au référencement : le <h1> dans l'URL, pages,60, condé-sur-noireau, 2013
  42. 42. 35 d’y revenir ou non. Du point de vue de Google, le contenu rédactionnel fait partie des nombreux critères qui lui permettent de déterminer la thématique d'une page. Enfin, les textes d'un site Internet permettent d'optimiser le trafic opportuniste. Une balise forte pour mettre en évidence Il existe certaines balises dans le code HTML qui permet de faciliter le travail des moteurs de recherche. Comme par exemple, la balise <strong>71 , Cette balise aura pour effet de mettre en gras le mot ou l'expression désirée. L'idée est de mettre les mots clés qui définissent la thématique d'une page dans cette balise. Par exemple : <strong> Pizzeria Luigi </Strong>, les bonne recettes de ma mama peach. Les meilleures <strong>pizza de Mons</strong> et de ses alentours. Le navigateur lui, va lire : Pizzaria Luigi, les bonne recettes de ma mama peach. Les meilleures de pizzas de Mons et de ses alentours. Ici, le site a voulu se placer sur les termes Pizzeria Luigi et Pizza de Mons Bien entendu, mettre tout un texte entre deux balises <strong> sera totalement vain. Si tout contenu texte est mis en gras, le poids de tous les mots du texte devient égal. Les liens Une autre manière de mettre en évidence des expressions est de coder les mots clés en lien HyperText. Les effets seront multiples. D'une part, l'expression mise en lien aura plus d'importance que le reste du texte. D'autre part, la page cible et celle qui contient le lien va bénéficier d'un meilleur référencement. Par exemple : Voici des informations sur l'<a href=http://www.Restaurant-Luigi.com/Pizza-mons.htlm> assurance vie</a> Sur le navigateur, l'utilisateur verra la forme suivante: Voici des informations sur Pizza Mons (lien hypertexte) A contrario, voici un exemple de lien non optimisé : Pour avoir des informations sur l'assurance vie, cliquez ici. 71 ANDRIEU, Olivier, "optimisation des pages du site : les critères "in page"" in réussir son référencement web: Zone chaude 2: Texte visible, la mise en exergue du texte page 128, Paris, éditions Eyrolles, 2013
  43. 43. 36 Il est peu probable qu'un site ait choisi comme positionnement l'expression "cliquez ici". De plus, cela n'est pas descriptif de l'activité que vous exercez ou de la page web. Ce type d'expression est définitivement à proscrire. A noter qu’un lien placé en gras sera d’autant mieux référencé72 . L'occurrence et l'IDM L'IDM est l'indice de densité d'un mot clé, c’est-à-dire la répétition d'un terme dans un texte. Auparavant, c’était un indice d’une importance prépondérante dans le référencement. Aujourd'hui, la réalité est assez différente. Historiquement, les moteurs ont basé la pertinence des recherches en fonction de la densité d'un mot dans un texte. Le mot densité était clé. Ce n'est pas la répétition absolue qui comptait mais la densité relative d'un mot dans un texte. Le calcul est le suivant : 𝑁𝑜𝑚𝑏𝑟𝑒 𝑑′ 𝑜𝑐𝑐𝑢𝑟𝑒𝑛𝑐𝑒𝑠 𝑑′ 𝑢𝑛 𝑚𝑜𝑡 𝑁𝑜𝑚𝑏𝑟𝑒 𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑚𝑜𝑡𝑠 𝑑𝑎𝑛𝑠 𝑙𝑒 𝑡𝑒𝑥𝑡𝑒 = 𝐼𝐷𝑀 (𝐼𝑛𝑑𝑖𝑛𝑐𝑒 𝑑𝑒 𝑑𝑒𝑛𝑠𝑖𝑡é 𝑑′ 𝑢𝑛 𝑚𝑜𝑡 𝑐𝑙é. )73 Par exemple, si un texte contient 200 mots et que le mot se répète 6 fois. L'IDM sera de 3%. Pour une optimisation d'un texte, la fourchette devra être comprise entre 2 et 5%. Il est aujourd'hui plus difficile d'affirmer que ce genre de pratiques est porteur, et ce, parce que cela reviendrait à écrire pour les moteurs. Ce qui pas nécessairement quelque chose de positif. Dans son livre Réussir son référencement web en 2014 Olivier Durieux dit ceci: "on rentre ici dans un domaine où l'ont commence à écrire pour les moteurs de recherches ce qui n'est pas obligatoirement une bonne chose…Cette notion d'IDM est de moins en moins prise en compte par les référenceurs professionnels qui tiennent au courant de l'évolution des moteurs de recherches74 . De plus selon d'autres sources l'IDM serait complétement mise de côté par les les moteurs de recherches. Ils n'en tiendraient pas compte du tout75 . 72 ANDRIEU, Olivier, "optimisation des pages du site : les critères "in page"" in réussir son référencement web: Zone chaude 2: Texte visible, la mise en exergue du texte page 128, Paris, éditions Eyrolles, 2013 73 ANDRIEU, Olivier, "optimisation des pages du site : les critères "in page"" in réussir son référencement web: Zone chaude 2: Texte visible, Nombre d'occurrences des mots et indices de densité page 133, Paris, éditions Eyrolles, 2013 74 Ibidem page 123 75 http://www.webrankinfo.com/dossiers/redaction/indice-densite-ideal (consulté le 13/02/2014)
  44. 44. 37 Des racines et des positions Insérer des mots clés, enrichir un texte est une très bonne chose mais encore ne faut-il pas oublier la loi de la longue traine Il est donc important d'insérer les différents dérivés que peut comporter un mot. Son féminin, son pluriel,… Prenons en exemple le mot « développement ». C'est un mot clé sur lequel l'entreprise TagExpert s'est positionnée. On peut le décliner de plusieurs manières ; développer, développeur, développements, … Sur ces bases, l'insertion de ces différents termes dans une page web devient un critère de référencement. Notez que, la casse des lettres n'a plus aucun impact dans les critères de recherche actuels. Que ce soit TagExpert, tagexpert ou encore TAGEXPERT, cela revient au même pour Google. Pour conclure, l'ordre des mots dans un texte a t-il une importance dans un texte? La réponse est sans conteste oui. TagExpert s'est positionné sur le terme "développement d'applications". Le référencement du site sera facilité si l'expression est complète, si aucun mot n'est placé entre eux. Donc, "TagExpert est une agence web spécialisée dans le développement d'applications" sera mieux pris en compte que "TagExpert est une agence de développement web spécialisée dans la réalisation d'applications." Les deux termes sont dans les deux exemples, mais ne sont pas placés l'un à côté de l'autre76 . L'importance des blogs L'apparition des algorithmes Google Cafeine ont changé énormément d'éléments dans le monde du SEO. Notamment dans la fréquence avec laquelle les Googleboots vont parcourir les pages de votre site web. Dès lors la publication régulière de contenu est devenue un élément proéminant dans la stratégie de référencement naturel d'un site. Beaucoup de sites ont la fâcheuse tendance à être statiques. En effet, il n'est pas utile de mettre à jour les informations sur un produit toutes les semaines. Cette faible quantité en informations est, aujourd'hui, un point très négatif. 76 ANDRIEU, Olivier, "optimisation des pages du site : les critères "in page"" in réussir son référencement web: Zone chaude 2: Texte visible, les différentes formes, l'loignement et l'odre des mots 133, Paris, éditions Eyrolles, 2013
  45. 45. 38 C'est la raison pour laquelle bloguer est plus important que jamais. Non seulement cela rajoute du nouveau contenu mais en plus, cela augmente la consistance de votre site web. En outre, le fait de bloguer de manière régulière va permettre de rafraichir le page ranking de votre site internet. Les réseaux sociaux eux aussi joué un rôle important dans l'émergence des blogs. Le fait de publier de manière régulière à propos d'un sujet, de le partager, de commenter provoque des retours sur votre site. Ce qui augmente de façon non négligeable votre référencement naturel. Les entreprises qui ont une publication tous les jours ouvrable génèrent, de manière statistique 5 fois plus de trafic que celles qui ont une publication hebdomadaire77 . Si notre pizzaïolos commence à écrire une série d'articles intéressants sur "comment faire tourner la pizza en l'air et la rattraper" ou encore sur " la recette de secrète de la pizza super Mario détenue par sa grand- mère", il y a de fortes chances que ses articles soit lus et qu'ils génèrent des visites sur son site. Néanmoins, il y a certaines à respecter. Le contenu se doit d'être autour d'une seule et même thématique et qu'ils soient pertinents et relatif à la recherche de l'internaute. Dans l'exemple présent, si notre pizzaïolo décide d'écrire un billet sur "comment je m'identifie plus à Toad qu'a Mario" sur son blog ou il publie habituellement des informations concernant les pizzas, son site ne bénéficiera pas d'amélioration de référencement. En résumé, il faut que le blog soit à propos d'une seule et unique thématique et cohérent avec le site. Dans les textes il est judicieux d'utiliser un certain nombre de mots clés afin que les internautes puissent retrouver vos articles sur les résultats de recherche. google authorship Avec la multiplication de nombre de blogues mis en ligne, Google a voulu à donner un rating (une évaluation) aux auteurs. Par cette démarche, Google a voulu de donner un niveau de confiance à certains auteurs, le but est comme toujours de certifier la qualité du contenu publié. Blog pizza, cuisine italienne, recettes traditionnelle Naples – Luigi's www.luigi's.pizza.it/blog De luigi's Simpson – Dans 1547 cercles Google + Il y a 3 jours- 28 mars 2014- Et voici la nouvelle recette du jour Un subtil mélange d'épices oriental et de poulet indien, grâce à…. 77 http://www.webmarketing-com.com (vu le 03/05/2014)
  46. 46. 39 Figure 5.2 dans les résultats, Google affiche parfois la photo de l'auteur (exemple fictif) Dans une vidéo publié sur Youtube, Matt cutt déclare ceci: "We are doing a doing a better job of detecting when someone is sort of an authority in a specific space. It could be medical, it could be travel, whatever. And trying to makes sure that those rank a little more highly, if you are some sort of authority or a site that according to the algorithms we think might be a little bit more appropriate for users78 ". Il faut préciser que le système de reconnaissance des auteurs ne fonctionne pas avec des personnes morales, seuls des personnes physiques seront identifiés79 . Toutes les pages ne sont pas non plus, adaptées aux publications sous Google authorship. Les pages d'accueil, les forums, les fiches produits par exemple n'acceptent pas cette intégration. Ainsi, via la qualité d'un auteur Google donne plus ou moins de "jus de lien" (expression imagée pour définir les bénéfices que peut tirer une page web du lien qu'elle reçoit d'une autre page80 ) aux pages qui un lien hypertexte sur les articles de cet auteur. 78 https://www.youtube.com/watch?feature=player_embedded&v=xQmQeKU25zg (consulté le 04/05/2014 79 http://www.webrankinfo.com/dossiers/authorship/mettre-en-avant-auteurs (consulté le 03/04/2014) 80 http://www.nordnet.com/guide-referencement/lexique-seo/J/jus-de-lien.php (consulté le 02/04/2014)
  47. 47. 40 CHAPITRE 6 : LES SNIPPETS L'un des moyens les plus efficaces pour augmenter sa visibilité sur internet, en utilisant du texte, est l'utilisation des balises snippets ("Un snippet désigne généralement dans le domaine du référencement naturel le petit texte descriptif d’une page affichée dans la page de résultats d’un moteur de recherche"81 .). Cette étape est ultérieure dans le processus rédactionnel. Il faut en premier lieu écrire le contenu du site, établir les <Hn>, etc. C'est uniquement quand celui-ci mis déterminé que l'on peut commencer à écrire les snippets, ce car elles sont en corrélation directe avec la thématique de la page. Une balise snippets est composée de plusieurs éléments dont la <Title> et la <Méta description> Ce chapitre fera état des techniques d'optimisation des Balises <Title>, lesquelles permettent d'optimiser le trafic maitrisé en y plaçant notamment les mots clés star qui composent un site Internet. Mais également le trafic opportuniste via la balise <Méta description>. Dans la figure 6.1 sont présent tous les éléments qui composent qui composent une snippets : une balise <Title>, <Méta description>, et des rich-snippets. La balise <Title> La balise <Title> est aujourd’hui l’une des les plus importantes en matières de référencement82 . L’objectif de cette balise est double : dans un premier temps d’aider l’indexation d’un site en fonctions des mots clés présents dans cette balise et ensuite de renseigner l’internaute sur les différents sites affichés dans les résultats de recherche. C'est via cette balise que vous allez mettre en évidence vos mots clés stars. 81 http://www.definitions-webmarketing.com/Definition-Snippet (consulté le 23/03/2014) 82 http://www.webrankinfo.com/dossiers/debutants/balise-title (consulté le 13/03/2014)
  48. 48. 41 La figure 6.2 montre une balise <Title> tel qu’elle est représenté dans les résultats de recherches Google. C’est elle qui va générer le lien vers le site web. Dans le cas où cette balise est négligée, non seulement la page ne sera pas indexée dans les résultats de Google mais en plus une balise <Title> qui n’est pas utilisée ne va pas générer du trafic car elle n’est pas attrayante. Figure 6.3 exemple d’un résultat dont la balise <Title> n’a pas été optimisée. Nombres de caractères De manière général, le nombre optimal de mots dans cette balise est de 1083 . Avec une fourchette est de 3 mots donc cette balise est optimisée à partir du moment où elle contient donc entre 7 et 13 mots. Les stop- Word tel que « le », « la », « les »,… ne sont pas pris en compte. Libellés du titre Il est courant de voir des expressions telles que « Accueil » ou « Home-page ». Ce type de pratique est définitivement à proscrire car elles ne servent en rien le double objectif poursuivi. Tout d’abord, il est inutile 83 ANDRIEU, Olivier, "optimisation des pages du site : les critères "in page"" in réussir son référencement web: Zone chaude Zone chaude 1: balise <Title>, pages l13, Paris, éditions Eyrolles, 2013

×