Fonctionnement des algorithmes de type PageRank, notion de linkjuice, comment travailler sur la popularité de son site web. Cours donné aux étudiants du Master IDEMM de l'université de Lille 3.
Master IDEMM - Optimisation de la popularité et référencement
1. OPTIMISATION DE LA POPULARITE
Auteur : Sébastien Billard (s.billard@free.fr)
2. RAPPEL : LA PYRAMIDE DU REFERENCEMENT
L'ensemble de ces composantes doit être optimisé pour obtenir une bonne
visibilité :
Voyons aujourd'hui en quoi il n'y a
pas de mal à se faire du lien !
POPULARITE
Ce que le web dit de votre site via les liens
Crédibilise Favorise
CONTENU
Essentiellement le contenu textuel du site
Valorise Redistribue
STRUCTURE
Le code qui contient le site et le met en forme
Auteur : Sébastien Billard (s.billard@free.fr)
3. LES LIENS : CONSIDERATIONS GENERALES
Auteur : Sébastien Billard (s.billard@free.fr)
4. EN QUOI LES LIENS SONT IMPORTANTS ?
- Les critères « on page » ne sont pas les seuls pris en compte par les moteurs de
recherche : l'environnement d'une page web en dit aussi beaucoup sur sa
pertinence.
- Le linking sert surtout à départager des pages à la pertinence proche. De fait,
plus la compétition est forte entre pages, plus la popularité est importante pour le
positionnement.
- Les liens transmettent en réalité plusieurs type de signaux : la popularité pure
(Pagerank), mais aussi des informations relatives au contenu (ancres des liens), à
la qualité (Trustrank et cie) etc. Les SEOs parlent de « linkjuice ».
- Les liens permettent également d'être trouvé par les moteurs, et indexé. Un site
populaire est indexé plus fréquemment, et plus profondément.
LINKJUICE
Popularité
Ancre
Confiance
Auteur : Sébastien Billard (s.billard@free.fr)
5. PRECISIONS SUR LE PAGERANK GOOGLE
- Le Pagerank (ou PR) est une valeur qui mesure uniquement la popularité relative
d'une page par rapport au reste du web. Le PR est calculé à l'avance. Le
Pagerank est un des élément du score final d'une page.
- Le Pagerank est toujours celui d'une page. Quand on parle du Pagerank d'un
site, on parle en général du PR de sa page d'accueil. Le PR d'un site est donc un
abus de langage.
- Le Pagerank d'une page mesure en fait la probabilité qu'a un surfeur aléatoire de
visiter cette page. Sa valeur réelle est donc comprise entre 0 et 1. La somme des
PR de l'ensemble des pages indexées par Google est égal à 1.
- Toute page indexée, même dépourvue de liens entrants a un PageRank « inné ».
Final score = IR score * Pagerank
Score déterminant le Score de pertinence Score de popularité
positionnement dans (lié au contenu, à la
la page de résultats structure)
Auteur : Sébastien Billard (s.billard@free.fr)
6. PAGERANK ET ALGORITHMES SIMILAIRES : FONCTIONNEMENT
La formule originelle, décrite par Larry Page et Sergei Brin :
Facteur PR de la page T1 divisé
d'amortissement par le nombre de liens
sortants de la page T1
Chaque lien présent sur une page transmet aux pages de destination une quantité
de Pagerank égale à son propre PR, divisée par le nombre de liens présents sur la
page, modéré par un facteur d'amortissement (0.85 dans le papier original).
Web à 1 page Web à 2 pages Web à 2 pages, Web à 2 pages,
isolées lien unidirectionnel lien réciproque
Auteur : Sébastien Billard (s.billard@free.fr)
7. PAGERANK ET ALGORITHMES SIMILAIRES : FONCTIONNEMENT
Simulateur de PageRank : http://caccio.blogdns.net/archives/71
Auteur : Sébastien Billard (s.billard@free.fr)
8. PAGERANK ET BARRE GOOGLE : CE QU'IL FAUT SAVOIR
- Le PR affiché par la barre d'outil Google est un chiffre entier, compris entre 0 et
10 (le PR réel est compris entre 0 et 1). Il n'est pas fiable à 100%.
- Le PR affiché n'est mis à jour que 3 ou 4 fois dans l'année. Mais le PR réel lui est
actualisé en permanence (les « Google dances » n'existent plus depuis
longtemps).
- L'échelle utilisée est logarithmique. Un Pagerank de 4 ne signifie donc pas le
double de la popularité d'un Pagerank de 2. Passer de PR3 à PR4 demande plus
d'énergie que de passer de PR2 à PR3.
- Il peut y avoir une différence importante de PR réel entre deux pages affichant le
même PR.
Auteur : Sébastien Billard (s.billard@free.fr)
10. QUALITE DES LIENS
Tous les liens ne présentent pas le même intérêt pour le référencement, du fait de
leur incapacité à être suivis ou à transmettre du PR :
- Les liens dans des fichiers Flash doivent encore êtres considérés comme
inexistants (même si les moteurs expérimentent).
- Les liens codés en javascript ne sont pas suivis par les moteurs (sauf
expérimentations). Les liens HTML additionnés de javascript peuvent être suivis et
transmettre du Pagerank.
- Les liens dotés d'un attribut nofollow peuvent être suivis ou non par les moteurs,
mais dans tous les cas ils ne transmettent pas de « linkjuice ».
- Les liens images transmettent du PageRank, mais aucune ancre, sauf si un
attribut alt est présent.
<a href="http://www.site.fr" rel="nofollow">Ancre du lien</a>
L'attribut nofollow
« castre » le lien
Auteur : Sébastien Billard (s.billard@free.fr)
11. PAGERANK ET NOFOLLOW
Il a pu être tentant de sculpter le Pagerank en utilisant l'attribut nofollow, dans le
but d'envoyer plus de PR vers les pages « utiles ». Ce n'est plus une technique
efficace aujourd'hui (à supposer qu'elle l'ait été) :
Sans nofollow : Avant juin 2009 : Depuis juin 2009 :
33% 50% 33%
33% 50% 33%
33%
nofollow nofollow
Le PR transmissible Le PR transmissible
était redistribué du lien nofollow
vers les pages sans s'évapore
nofollow
Auteur : Sébastien Billard (s.billard@free.fr)
12. CREER DU LIEN ENTRANT
Auteur : Sébastien Billard (s.billard@free.fr)
13. EVALUER LE LINKING D'UN SITE : YAHOO SITE EXPLORER
La commande « link: » de Google ne renvoie qu'un faible nombre de liens. Yahoo Site
Explorer est bien plus intéressant, même si beaucoup de redondance :
Sélectionner « Except from this
domain » et « Entire site »
Sélectionner « Inlinks »
Site explorer : http://siteexplorer.search.yahoo.com
Auteur : Sébastien Billard (s.billard@free.fr)
14. EVALUER LE LINKING D'UN SITE : BACKLINKS WATCH
Backlinks Watch utilise les donnes Yahoo, mais affiche aussi les ancres :
Nb de liens sur la Attributs
Liens Ancres
page émettrice nofollow
entrants des liens
Backlinks Watch : http://www.backlinkwatch.com/index.php
Auteur : Sébastien Billard (s.billard@free.fr)
15. EVALUER LE LINKING D'UN SITE : MAJESTIC SEO
Majestic SEO prend en compte la dimension temporelle. Il possède son propre index :
Evolution du
nombre de liens
Majestic SEO : http://www.majesticseo.com
Auteur : Sébastien Billard (s.billard@free.fr)
16. COMMENT CREER DU LIEN ENTRANT ?
- Exploitez votre réseau immédiat (partenaires, institutionnels, clients, fournisseurs...)
- Procédez à des échanges de liens avec des sites proches (privilégier la pertinence).
- Soumettez votre site aux annuaires généralistes et spécialisés.
- Faites parler de vous, online et offline (interviews, communiqués, relations presse...)
- Exprimez-vous dans des communautés (signatures de forums, commentaires de
blogs...)
- Proposez des contenus ou services attirant des liens spontanés (link baiting).
- Soyez actif dans les réseaux sociaux (même si beaucoup de liens sont en nofollow,
le SMO constitue une caisse de résonance de votre communication).
- Travaillez votre référencement : la visibilité attire le lien.
- Fuyez tout ce qui promet la création rapide de liens artificiels !
Auteur : Sébastien Billard (s.billard@free.fr)
17. ANNUAIRES : CONSEILS POUR DES SOUMISSIONS DE QUALITE
- Evitez les soumissions automatiques, les réseaux d'annuaires, les annuaires de
mauvaise qualité (par exemple sans contrôle éditorial).
- Evitez les annuaires exigeant un lien en retour.
- Assurez-vous que les liens proposés soient « en dur » (liens directs, sans
redirections).
- Soumettez aux annuaire spécialisés (thématiques, locaux), et généralistes.
- Ne soumettez que des sites finis (pas de sites en construction).
- Sélectionnez la catégorie la plus pertinente de l'annuaire.
- Utilisez la racine du site ou d'un sous-domaine comme lien.
- Utilisez le nom du site comme titre, sauf indication contraire de l'éditeur.
- Rédigez la description du site avec soin. Variez les descriptions si possible.
Auteur : Sébastien Billard (s.billard@free.fr)
18. TROUVER DES ANNUAIRES
- Pensez d'abord aux annuaires généralistes classiques (aujourd'hui surtout Dmoz).
- Utilisez les annuaires d'annuaires (pas forcément à jour). Maintenez une liste perso.
- Cherchez des annuaires avec des requêtes de type « annuaire + mot-clé »)
- Cherchez des annuaires en exploitant leurs signatures (ex : « mot-clé + "ajouter
votre site" »). Avantage : on tombe souvent directement sur la bonne catégorie.
- Etudiez les liens entrants des concurrents, par ex à l'aide de Yahoo Site Explorer.
Signatures
"Proposer un site" d'annuaires
typiques
"Proposer votre site"
"Ajouter un site"
"Ajoutez votre site"
"Inscrire votre site"
"Soumettre un site"
Auteur : Sébastien Billard (s.billard@free.fr)
19. LIENS EN NOFOLLOW
Beaucoup de sites utilisent l'attributs nofollow aujourd'hui. Ces liens sont inutiles pour
la popularité, ce qui ne veut pas dire qu'ils n'aient aucune utilité : il peuvent générer du
trafic et participer à la visibilité globale.
Le plugin Searchstatus
permet de mettre en évidence
les liens nofollow
Extension Searchstatus : http://www.quirk.biz/searchstatus/
Auteur : Sébastien Billard (s.billard@free.fr)
20. LINK BAITING
L'idée du link baiting est de pousser les internautes à faire des liens. Le link baiting
comporte le plus souvent une dimension virale (bouche à oreille). Quelques moyens
couramment employés :
- Contenu qualitatif (même si ce n'est pas vraiment une technique)
- Services, goodies, widgets ou logiciels gratuits.
- Publications gratuites (ebooks, livre blanc).
- Organisation de concours.
- Publication d'articles polémiques.
- Publications de vidéos ou contenus viraux.
- Traduction de documents et ressources de références.
- Etc.
Auteur : Sébastien Billard (s.billard@free.fr)