Google vient de confirmer qu’il existait une différence de prise en compte des liens internes vs liens externes dans son algorithme. Qu’est-ce que cela veut dire ? Optimiser son maillage interne a-t’il encore du sens en 2017 ? Cocon sémantique, siloing etc… quelles sont les méthodes qui marchent ?
Intervenant : Philippe Yonnet – Directeur Général – Search Foresight
Optimiser son maillage interne : les méthodes qui fonctionnent vrai par Philippe Yonnet Petit-déjeuner SF paris 14-09-2017
1. 1
SEO – Redirections, backlinks et maillage interne…
ce qui change à la rentrée !
BIENVENUE
#S4sight2017
@s4sight
Marriott Opera Hotel, ParisJeudi 14 Septembre 2017
Petit Déjeuner SEOSEA
Matinée Conférences
3. Maillage interne ?
Réseau de liens hypertextes reliant les pages
web d’un même domaine
Pages html
Word, ppt, pdf, flash…
De quoi parle-t’on ?
4. Pourquoi optimiser le maillage interne ?
Les moteurs de recherche font une utilisation
intensive des informations tirées des liens
C’est d’ailleurs le point faible de l’algo, ciblé par
les techniques black hat (PBN etc…)
Par contre, optimiser le maillage interne n’est
pas contraire aux guidelines de Google (enfin si
c’est fait de façon propre et élégante => pensez
à l’UX et au SXO)
C’est une approche ancienne, dont l’efficacité a
été beaucoup plus forte autrefois, mais qui
continue de donner des résultats
spectaculaires
4
5. Le poids des « textes d’ancre »
Le contenu des textes d’ancres est indexé avec le contenu visible de la page
Ces « mini textes descriptifs » ont un format et un contenu proche des requêtes par mots clés
C’est ce qui explique le succès des Google bombings
Cela va devenir moins vrai avec les progrès en sémantique (word embeddings)
Les « anchor text » servent à améliorer la pertinence des résultats retournés
5
6. Le pagerank interne
Initialement calculé avec la formule du
PR de 1998
Maintenant formule plus adaptée et
plus sophistiquée
Une note de popularité indispensable pour identifier les pages plus importantes que les autres
6
7. Les stratégies d’optimisation
Exploiter les textes d’ancre pour positionner les
pages sur plus d’expressions clé
ET / OU
Augmenter le pagerank interne des pages à
positionner sur des requêtes concurrentielles
On peut les déployer en parallèle
7
8. Agence conseil en stratégie digitale | SEO • SEM • CRO • Inbound Marketing • Analytics
Optimisations sémantiques
8
9. Le « siloing »
Utile sur des sites de taille
moyenne ou grande
À partir de plusieurs milliers de
pages
Pas très efficace si on se
contente de ça
OBJECTIF : Eviter qu’une page soit « bombardée » de liens émanant de pages d’univers différents
9
10. La rotation des ancres
Si une page reçoit 1000 inlinks, on
dispose de 1000 emplacements
différents pour 1000 textes d’ancre
différents
On ne fait pas varier les ancres sur
des liens de navigation
Attention : tester la prise en
compte des ancres dans les
templates
Jadis : seul le premier texte était pris
en compte en cas de liens multiples
Maintenant : les méthodes de
parsing se sont diversifiées, l’ordre
du code n’est pas toujours respecté
Utiliser les multiples ancres des backlinks internes pour enrichir vos pages
10
11. Agence conseil en stratégie digitale | SEO • SEM • CRO • Inbound Marketing • Analytics
Optimiser le pagerank
interne
11
12. Le pagerank interne dépend avant tout du
maillage interne
Une faible proportion de pages d’un site
reçoit des backlinks
Le pagerank des pages est transmis le plus
souvent par des liens internes (attention
aux exceptions : sites éditoriaux par ex)
12
13. La structure du maillage interne dépend avant
tout des éléments de navigation
Pour apporter des changements drastiques
de profondeur, de répartition du linkjuice, il
faut changer les éléments de navigation :
Menus
Breadcrumbs
Liens vers des pages parentes, soeurs, enfants,
descendants, suggérées …
13
14. Attention à la profondeur
Plus les pages sont profondes, moins elles
ont de pagerank interne
Moins elles ont de pagerank interne,
moins elles sont crawlées souvent (voire
plus du tout)
Moins elles ont de pagerank interne,
moins elles ont de chances d’être bien
positionnées
Profondeur : nombre de liens hypertextes minimum à suivre pour atteindre une page depuis la home
15. Attention, optimiser le Pri est piégeux
Faisons un test
Vos intuitions sont probablement … fausses
15
16. Agence conseil en stratégie digitale | SEO • SEM • CRO • Inbound Marketing • Analytics
Tous les liens internes ne se
valent pas
16
17. Le pagerank interne est calculé différemment…
Confirmé il y’a quelques jours par John
Mueller
Logique, jusqu’à l’update MayDay, il
n’était pas rare de voir des pages
profondes de gros sites passer devant
des sites spécialisés
Premier gros changement au
Printemps 2007 ?
… que le pagerank externe
18. Les liens dans les boilerplates
C’est probablement plus « fort » pour
les liens internes que pour les liens
internes
Mais il faut en tenir compte…
Les liens dans les zones reproduites sur de nombreuses pages transmettent moins de pagerank
19. Les liens (internes) avec un attribut nofollow
Les liens en nofollow génèrent des fuites de
PR inutiles
C’est inefficace (voire antiproductif) pour
faire du PR sculpting
Peut être utilisé pour empêcher Googlebot
de crawler certains liens => utiliser si
possible d’autres systèmes :
Autoliens + syntaxe ajax
Pas de motifs utiles de placer un nofollow sur des liens internes
19
“Nofollow is probably never the answer, especially on
your own site. I can think of corner case scenarios
where the target page would be robotted for whatever
reason, and then if it is robotted and not indexed yet, if
you don’t want to get that page indexed, then you
probably don’t want to point to it with anchors.”
Gary Illyes
2009 : changement de comportement
20. Les liens en javascript
Google parvient à trouver de plus en plus de
contenus en exécutant le javascript
Mais ne lui compliquez pas la vie : cela ne
fonctionne pas à tous les coups
Par défaut, les liens dans des contenus en
ajax ne sont pas découverts par défaut
(utiliser la méthode pushstate() pour pallier à
cela)
La transmission du linkjuice n’est pas assurée
avec ce type de liens
Pb pour la transmission du linkjuice, pas 100% fiable pour l’exploration
20
21. Agence conseil en stratégie digitale | SEO • SEM • CRO • Inbound Marketing • Analytics
Les méthodes obsolètes
21
22. Le PR sculpting
La plupart des méthodes d’obfuscation ne
marchent plus (Google exécute les
javascripts), la méthode avec des nofollow
ne marche pas
Par ailleurs, c’est une approche naive qui le
plus souvent n’augmente réellement le Pri
que de façon anecdotique
Beaucoup de travail, gains faibles : laissez
Google explorer votre structure librement
Lui préférer le PR modeling (voir plus haut)
Augmenter le pagerank des pages utiles en bloquant la découverte des liens inutiles
23. Les catastrophes dues au PR sculpting
Attention : le pagerank transmis par des liens
pointant vers des pages bloquées par un
robots.txt est annihilé (perdu)
Quand la volumétrie des liens concernés est
importante, la perte de Pri peut représenter
20%, 30%, 40% du linkjuice total
CONCLUSION : réfléchissez à deux fois avant
de bloquer avec le robots.txt l’exploration
des pages linkées depuis des pages front
Les trous noirs à Pagerank interne
23
24. Le « bot herding »
Stratégie utile à l’époque de « Big Daddy », moins pertinente depuis
Caffeine (2010)
Aujourd’hui : à réserver à de très gros sites (dizaine de millions de
pages) dans des cas très spécifiques
Attention à la notion de « budget de crawl », souvent mal comprise,
et qui conduit aujourd’hui à reproduire des stratégies de bot
herding…
Pour faire crawler toutes vos pages utiles : augmentez leur pagerank,
leur notes de qualité plutôt que de bloquer l’accès aux autres
« Pousser les bots à visiter les pages ‘utiles’ plutôt que des pages ‘inutiles’
24
25. Agence conseil en stratégie digitale | SEO • SEM • CRO • Inbound Marketing • Analytics
Et le « cocon sémantique »
alors ?
25
26. Le cocon sémantique
Postulat : une page se positionnera mieux sur une
thématique / sémantique / mots clés si elle est
entourée de pages sur la même thématique ou
partageant le même champ sémantique
L’optimisation consiste à créer des groupes de pages censées
booster un mot clé, avec des contenus partageant la même
sémantique
Pourquoi faire compliqué quand on peut faire simple ?
Approche manipulant beaucoup de concepts flous
Sémantique / champs sémantiques
Thématiques ?
Ressemble beaucoup aux méthodes employées chez
Bruce Clay Inc. (ou Aposition) mais avec d’autres
justifications
Pourquoi ?
Pas de prise en compte du Pagerank
Adapté à de petits sites
Concept promu par Laurent Bourrely
27. Les limites de l’approche
ROI insuffisant sur de gros sites
Scalabilité de l’approche ?
Se base sur des intuitions et des informations
parfois obsolètes
Approche trop empirique ?
Ecosystème d’outils qui dans la pratique renforce
le problème de qualité
Mal compris, mal réalisé : donne peu de résultats
Risque de ROI nul
Pourquoi cette approche est inconnue en dehors
de la France ?
Même syndrome que WF*IDF en allemagne
Optimiser le maillage, cela fonctionne, mais mieux vaut comprendre pourquoi !
27
28. Agence conseil en stratégie digitale | SEO • SEM • CRO • Inbound Marketing • Analytics
Le semantic booster SF
28
29. Le semantic booster
Identification des pages à booster et des pages
support
Identification des mots-clés supplémentaires sur
lesquels positionner les pages à booster
Calcul des associations mots clés / landing pages
Rotation des ancres
Calcul du maillage interne pour maximiser le Pri
des pages à booster
Optimisation sous contraintes
Résolution du problème dit « du sac à dos »
Résultat fourni sous la forme d’un fichier plat ou
d’une base de données, donnant pour chaque url
les optimisations à afficher (liens ajoutés ou
modifiés)
Maillage interne précalculé optimisé par SF (pour de gros sites)
30. Et cela fonctionne
Cas Meteocity
Actions de bot
herding et PR
sculpting
(bof)
Blocage de pages
(obfuscation) très bof !
Semantic Booster +
ouverture de pages (en
noindex follow) +
réouverture de pages
fermées
Arrêt du PR
sculpting