2. Introduction Démocratisation d’Internet Plus de 100 millions de sites web dans le monde Plusieurs milliards de pages créées Quelques chiffres Google : plus de 90% du marché de la recherche en ligne en France. Seulement 1/3 des internautes va au-delà de la première page de résultats lors d'une recherche Le premier résultat est quatre fois plus cliqué que le deuxième. Un enjeu de taille pour les entreprises Etre visible, se démarquer de la concurrence Les types de référencement
6. Définitions Le référencement « On Page » Tous les éléments se rapportant au contenu et aux textes d’un site web. Il permet de mettre en place tous les moyens nécessaires pour que les moteurs de recherche, via leurs robots et leurs algorithmes, viennent indexer les pages internet. Il existe alors un certain nombre d’optimisations à mettre en place pour améliorer son référencement.
7. Définitions Le référencement « Off Page » Tous les éléments ne se rapportant pas à la base du code du site internet. Partenariats, échanges de liens, réseaux sociaux…
9. Les différentes techniques existantes Nom de domaine Explicite reflétant l’activité de l’entreprise et/ou les objectifs du site Mais aussi : Un nom de domaine avec des mots clés Un hébergement professionnel L’utilisation de la réécriture d'URL
10. Les différentes techniques existantes Sélection des mots clés Il faut choisir les mots clés selon 3 critères : la cohérence l'intérêt (nombre de requêtes) la faisabilité (concurrence) Créer une pyramide de mots-clés « prioriser » l’importance des mots clés sur lesquels on souhaite être présent. Plus le mot clé sera haut dans la pyramide, plus il sera concurrentiel et vous référencer dessus sera souvent stratégique, mais aussi bien plus compliqué
11. Un outil adapté : le générateur de mots clés Adwords Permet de rentrer l’ensemble des mots clés choisis dans une base, d’en générer de nouveaux (synonymes,…) et de connaître la concurrence
12. Les différentes techniques existantes Optimisation des balises La balise Meta DESCRIPTION Résumé du contenu textuel d’une page S’affiche dans les résultats de recherche (Google, Yahoo!,…) quand l’internaute fait une requête.
13. Les différentes techniques existantes Optimisation des balises La balise Meta KEYWORDS Placée dans l’en-tête du document HTML (header) Contient une série de mots clés et d’expressions clés permettant de qualifier le contenu d’une page
14. Les différentes techniques existantes Optimisation des balises La balise TITLE Important pour le référencement naturel Apparaît en lien bleu dans les résultats de recherche de Google Doit être descriptive, pertinente, et différente pour chaque page
15. Les différentes techniques existantes Optimisation des balises L’attribut ALT Décrit le contenu des images. Répond aux problèmes d'accessibilité (handicapés, problème de chargement de la page, …) Le contenu de la balise ALT s’affichera à la place de l’image en tant que telle Le texte alternatif doit : Présenter et le contenu et la fonction de l'image. Être court. Le texte alternatif ne doit pas : Répéter un contenu disponible immédiatement avant ou après. Contenir les mots « image de... » ou « graphisme de... ».
16. Les différentes techniques existantes Architecture du site Décrire les différents liens qui unissent les pages entre elles Référencement : une bonne arborescence permet de : Faciliter le parcours des pages par les robots Faire indexer plus rapidement les nouvelles pages Favoriser le positionnement sur certaines expressions clés Rôle de la page d’accueil devant comporter Des liens directs vers tous les principaux services du site Des liens vers les derniers documents mis en ligne Règles des 3 clics ?
17. Les différentes techniques existantes Le texte visible Vu par les internautes et les robots Il faut : Optimiser les 40-50 premiers mots (=les plus importants) Mettre des mots clés en lien Utiliser les balises <h1>, <h2> pour hiérarchiser les informations
18. Les différentes techniques existantes Tags et nuages de tags Terme associé à de l'information (image, un article, …) décrivant un objet, permettant de le classer. Influencent-ils le référencement ? Deux problèmes : Les pages pointées par des tags ressemblent trop à des résultats de recherche (exemple : sites de e-commerce, comparateurs de prix, …) Génèrent des duplications de contenu
19. Les différentes techniques existantes Liens Deux catégories les liens externes les liens internes Contribue à un bon Page Rank
20. Les différentes techniques existantes Les URLs création de répertoires spécifiques Liens internes avec le regroupement du contenu sémantiquement proche L'URL Rewriting (réécriture d'URL) : technique qui réécrit les URLs des pages dynamiques ( complexes). Les URL sont "propres" et ne contiennent plus de caractères spéciaux Exemple : article.php?id=12&page=2&rubrique=5
21. Les différentes techniques existantes Les images Difficile d’en analyser le contenu contrairement aux mots et phrases qui ont un sens. Le nom de l’image doit toujours posséder le mot clé de la page vers laquelle elle pointe. L’attribut « alt » de la balise doit toujours être renseigné.
22. Les différentes techniques existantes Les plugins Petits modules qui viennent se greffer sur un site pour y apporter des fonctionnalités complémentaires. Exemples pour les blogs WordPress All in One SEO Pack Gigya Google XML Sitemaps
24. préconisations Les éléments problématiques Le Flash Deux cas Les sites ayant des éléments en flash (carte géographique, …) Les sites entièrement réalisés en Flash (Full Flash) Le Flash a du mal à être bien référencé : difficile de traiter l'information contenue dans un fichier SWF Problème des URLs : ne changent pas lors de la navigation. A déconseiller si la stratégie de l’entreprise = visibilité sur le long terme Approprié pour des mini-sites, ou des programmes ayant une courte durée de vie. Opter pour la bonne approche : penser aux utilisateurs et à l’accessibilité
25. préconisations Les éléments problématiques L’ajax Construction de liens dynamiques L'utilisation de cet objet permet de Mettre à jour une partie d'une page web Éviter le rechargement complet d'une page Accroitre l'interactivité des sites avec les utilisateurs D'agir sans attendre la réponse du serveur (asynchrone)
26. préconisations Les éléments problématiques Les sessions Utilisation de sessions est parfois nécessaire : s’identifier, accéder à un contenu personnalisé, … Elles permettent de : Tracker (suivre) le chemin du visiteur sur le site Mémoriser certaines informations (cookie contenant le contenu d'un panier)
27. préconisations Les éléments problématiques Les formulaires Web invisible : contenu non accessible par les moteurs derecherche. La plupart des sites web utilisent des formulaires au sein de leurs pages (contact, recherche avancée, …). Problème : les robots contrairement aux internautes ne les valident pas. Le contenu placé derrière les formulaires = invisible. La solution : mettre en place des liens vers des pages de résultats.
28. préconisations Les éléments problématiques Les tags Ne pas avoir trop de tags Structurer les tags (servent à étendre le nombre de mots clés, à réaliser des liens transversaux entre catégories) Mettre en gras certains tags (afin de les faire ressortir et leur augmenter le trafic).
29. préconisations Les conseils à suivre La norme W3C Une volonté de standardiser le web grâce à des normes Organisme qui développe des standards pour le Web afin que les gens puissent communiquer efficacement. Cette norme est importante pour les sites, ils doivent la respecter afin d’être au mieux référencés. Garantit de meilleurs résultats de classement et de reconnaissance, d'où une visibilité accrue dans les moteurs de recherche.
30. préconisations Les conseils à suivre Un fichier pour guider les robots robots.txt = fichier texte contenant des informations et des commandes à destination des robots d'indexation des moteurs de recherche afin de leur préciser le mode de parcours de la page Il contient les informations suivantes : User-Agent : Préciser le robot concerné par le parcours et le crawl des pages du site internet Disallow: Indiquer les pages à exclure de l'indexation. Exemple de fichier robots.txt : User-Agent: * Disallow: /repertoire/chemin/page.html
31. préconisations Les conseils à suivre Le choix de l’hébergeur Judicieux d’opter pour un hébergement payant Il propose souvent la ré-écriture d’URL Risque de changement d'adresse si, par exemple, un hébergeur gratuit se fait racheter et change d'adresse Mauvais choix d’hébergement = possible impact négatif sur le référencement
32. préconisations Les choses à éviter La duplication et le spamdexing Exemple : Le nombre trop répété de tags, pointant toujours vers les mêmes mots peut entrainer une duplication du contenu Perte de temps, de ressources, de pertinence pour les robots Ce contenu dupliqué peut subir plusieurs traitements Etre désindexé Etre moins souvent parcouru Etre déclassé
33. préconisations Les choses à éviter Le texte caché Technique où certains mots clés stratégiques sont placés sur une page d’un site internet Ces mots ont la même couleur de police que le fond Système de fraude réprimandé par les robots
34. conclusion Référencement = somme d’optimisations sur le long terme. La notion d’optimisation « On Page » particulière : optimisations sur lesquelles nous avons un contrôle total. Un indice pour contrôler le référencement « On Page » mais aussi « Off Page »