Présentation du 16 février 2012 La médiathèque dématérialisée : les services Le référencement Christian Ducharme
La médiathèque dématérialisée : Les services Le référencement Je traite en priorité Google Google a 91 % du marché français Mais certains des principes sont valables pour tous les moteurs
La médiathèque dématérialisée : Les services Le référencement Constat premier Les règles de référencement évoluent constamment La dernière règle annoncée : le poids des pages a une influence sur la position de votre site dans les résultats (les pages qui sont longues à s’afficher sont pénalisées).
La médiathèque dématérialisée : Les services Principes de base du référencement = règles de l’accessibilité Contenu sous la forme de textes plutôt que d’images Si images, texte de remplacement (balises alt et title) Structure de la page (contenu structuré, respectant les principes de l’HTML) Rédaction soignée : en bon français Google a un moteur d’analyse linguistique. Il analyse la structure des phrases et tente de repérer le « sens » du texte afin de le classer dans une arborescente thématique voire sémantique. L’arrivée du web 3.0 va accentuer ce phénomène.
La médiathèque dématérialisée : Les services Google amorce le Web 3.0 Devant une requête imprécise, Google tente de présenter des sites sur des différents thèmes qui peuvent intéresser l’utilisateur. Par exemple, si vous tapez « Strasbourg » dans Google. Google n’affichera pas les 10 sites les plus populaires, mais fera une répartition en fonction du sens du mot Strasbourg : trois ou quatre sites sur la ville, puis l’aéroport, puis l’université, etc.
La médiathèque dématérialisée : Les services Eléments importants Cohérence entre :  le titre de la page (balise <title>) l’URL significatif (ce qui implique parfois d’utiliser les méthodes url-rewriting), la balise <H1> et les premières lignes de texte Les mots clés, significatifs du contenu de la page doivent revenir dans tous ces éléments. Des libellés précis : évitez le titre : « Bienvenue sur le site de la bibliothèque ».
La médiathèque dématérialisée : Les services url-rewriting  Principe qui transforme le libellé de l’adresse (URL), la rend lisible par l’être humain et indexable par les moteurs.  Exemple :  www.site.fr/node/23  Devient  : www.site.fr/histoire-de-la-geographie
La médiathèque dématérialisée : Les services Autres paramètres importants (typique de Google) :  le Pagerank «  PageRank  ou  PR  est l'algorithme d'analyse des liens concourant au système de classement des pages Web utilisé par le moteur de recherche Google. Il mesure quantitativement la popularité d'une page web. Le PageRank n'est qu'un indicateur parmi d'autres dans l'algorithme qui permet de classer les pages du Web dans les résultats de recherche de Google. Ce système a été inventé par Larry Page, cofondateur de Google. Ce mot est une marque déposée. » [Wikipédia]
La médiathèque dématérialisée : Les services Pagerank Plus vous avez de liens externes qui pointent sur votre page d’accueil, plus votre Pagerank est bon. Plus les Pagerank des sites qui pointent sur le vôtre sont élevés, plus votre Pagerank sera élevé.
La médiathèque dématérialisée : Les services A ne pas faire : Ne pas mettre des libellés (URL, <title>, <H1>) en plusieurs langues. Placer des mots-clés ou texte répétitif rédigé en blanc sur fond blanc. Votre site pourrait se voir retirer de l’index du moteur. Deux pages presqu’identiques : seule la page avec le plus haut Pagerank sera conservée. C’est le cas des sites qui sont en double : un normal et site accessible pour personnes handicapées. Seul le site accessible est indexé !
La médiathèque dématérialisée : Les services Pour finir, un peu de technique : robot.txt Un fichier intitulé robot.txt doit être placé à la racine de votre site. Les moteurs de recherche lisent ce fichier et suivent les instructions. Voici un contenu simple d’un fichier robot.txt :  User-agent: * Disallow: /admin Signifie : pour tous les moteurs (*), tout le site est indexable sauf le dossier /admin.

Le référencement. Christian Ducharme, chef de projet W3line/CD-Script

  • 1.
    Présentation du 16février 2012 La médiathèque dématérialisée : les services Le référencement Christian Ducharme
  • 2.
    La médiathèque dématérialisée: Les services Le référencement Je traite en priorité Google Google a 91 % du marché français Mais certains des principes sont valables pour tous les moteurs
  • 3.
    La médiathèque dématérialisée: Les services Le référencement Constat premier Les règles de référencement évoluent constamment La dernière règle annoncée : le poids des pages a une influence sur la position de votre site dans les résultats (les pages qui sont longues à s’afficher sont pénalisées).
  • 4.
    La médiathèque dématérialisée: Les services Principes de base du référencement = règles de l’accessibilité Contenu sous la forme de textes plutôt que d’images Si images, texte de remplacement (balises alt et title) Structure de la page (contenu structuré, respectant les principes de l’HTML) Rédaction soignée : en bon français Google a un moteur d’analyse linguistique. Il analyse la structure des phrases et tente de repérer le « sens » du texte afin de le classer dans une arborescente thématique voire sémantique. L’arrivée du web 3.0 va accentuer ce phénomène.
  • 5.
    La médiathèque dématérialisée: Les services Google amorce le Web 3.0 Devant une requête imprécise, Google tente de présenter des sites sur des différents thèmes qui peuvent intéresser l’utilisateur. Par exemple, si vous tapez « Strasbourg » dans Google. Google n’affichera pas les 10 sites les plus populaires, mais fera une répartition en fonction du sens du mot Strasbourg : trois ou quatre sites sur la ville, puis l’aéroport, puis l’université, etc.
  • 6.
    La médiathèque dématérialisée: Les services Eléments importants Cohérence entre : le titre de la page (balise <title>) l’URL significatif (ce qui implique parfois d’utiliser les méthodes url-rewriting), la balise <H1> et les premières lignes de texte Les mots clés, significatifs du contenu de la page doivent revenir dans tous ces éléments. Des libellés précis : évitez le titre : « Bienvenue sur le site de la bibliothèque ».
  • 7.
    La médiathèque dématérialisée: Les services url-rewriting  Principe qui transforme le libellé de l’adresse (URL), la rend lisible par l’être humain et indexable par les moteurs. Exemple : www.site.fr/node/23 Devient : www.site.fr/histoire-de-la-geographie
  • 8.
    La médiathèque dématérialisée: Les services Autres paramètres importants (typique de Google) : le Pagerank «  PageRank ou PR est l'algorithme d'analyse des liens concourant au système de classement des pages Web utilisé par le moteur de recherche Google. Il mesure quantitativement la popularité d'une page web. Le PageRank n'est qu'un indicateur parmi d'autres dans l'algorithme qui permet de classer les pages du Web dans les résultats de recherche de Google. Ce système a été inventé par Larry Page, cofondateur de Google. Ce mot est une marque déposée. » [Wikipédia]
  • 9.
    La médiathèque dématérialisée: Les services Pagerank Plus vous avez de liens externes qui pointent sur votre page d’accueil, plus votre Pagerank est bon. Plus les Pagerank des sites qui pointent sur le vôtre sont élevés, plus votre Pagerank sera élevé.
  • 10.
    La médiathèque dématérialisée: Les services A ne pas faire : Ne pas mettre des libellés (URL, <title>, <H1>) en plusieurs langues. Placer des mots-clés ou texte répétitif rédigé en blanc sur fond blanc. Votre site pourrait se voir retirer de l’index du moteur. Deux pages presqu’identiques : seule la page avec le plus haut Pagerank sera conservée. C’est le cas des sites qui sont en double : un normal et site accessible pour personnes handicapées. Seul le site accessible est indexé !
  • 11.
    La médiathèque dématérialisée: Les services Pour finir, un peu de technique : robot.txt Un fichier intitulé robot.txt doit être placé à la racine de votre site. Les moteurs de recherche lisent ce fichier et suivent les instructions. Voici un contenu simple d’un fichier robot.txt : User-agent: * Disallow: /admin Signifie : pour tous les moteurs (*), tout le site est indexable sauf le dossier /admin.