Webinar de l'agence Neper sur les approches recommandées pour la création de contenu optimisé pour le SEO en 2022.
Présenté et animé par Philippe Yonnet.
3. Le programme :
11h00 : Introduction & Accueil
11h05 : Présentation
Quelques cas où le Topical Clustering est plus adapté que les cocons sémantiques
Rappels et définitions
Les faiblesses du concept de cocon sémantique
Les problèmes de qualité que posent souvent les cocons sémantiques
Topic Clusters versus Topical Clustering
A quoi ressemble une rubrique fabriquée ainsi ?
Cas numéro 1 : les sites sur les thématiques YMYL
Cas numéro 2 : les pages TOFU
Conclusion
11h45 : Q&A
12h00 : Fin de l'événement
6. Le groupe Neper
Agence conseil en digital
marketing
Solutions SaaS de digital
marketing
Formations et événements
en marketing digital.
Search Y Paris
Search Y Genève
Les rendez-vous incontournables du
Search Marketing en Europe
Solutions
9. Abonnez-vous à la newsletter de Neper
Chaque semaine, les articles du
Blogarithme Népérien, notre blog
https://www.neper.fr/category/blog/
Articles de fond sur le digital marketing
Commentaires sur les événements marquants
de la semaine
Pas une simple curation : des tips, des conseils
Mais aussi
Nos prochains événements
Nos prochaines formations
L’actu du groupe Neper
10. Abonnez-vous à notre chaine Youtube
Les replays de nos événements
Des actus en videos
Des tutoriaux
https://www.youtube.com/channel/UCS3h6v2Ki4634Mgnltbz5mA
11. Search Y Paris 2022
30 conférences
Les meilleurs conférenciers
anglophones et francophones
Des conférences à la pointe
SEO Forecasting
Edge / Cloud SEO
SEO Split Testing
Retail Media
IA et SEO
Automation et SEO
Content Marketing et Topic
Clusters
…
Des conférences sur les sujets
digitaux connexes
Web Analytics
Droit : GDPR, Cookies Tiers…
1er juillet 2022 : Save the Date
13. Quelques définitions
Cocon sémantique :
Méthode d’optimisation du maillage interne, popularisée par Laurent Bourrelly, qui lui a donné son
nom
Topic Cluster
Méthode de rédaction web pour le SEO popularisée par Hubspot, présentée comme nouvelle
Topical Cluster
Méthode de rédaction web orientée optimisation SEO, populaire chez les anglo saxons, souvent
appelée aussi « topic cluster » ce qui crée la confusion.
Mais dans la pratique il y’a des différences entre la méthode de Hubspot et les « Topical Clusters/Topic
Cluster »
Les 3 notions ne sont pas synonymes !
14. Le siloing
Méthode popularisée par l’américain Bruce Clay
il y’a 20 ans
Constat :
Certains sites regroupent les pages par types de
documents, et non par proximité de sujets
D’autres traitent de sujets très éloignés, mais
utilisent des megas menus
Conséquence :
Les pages contiennent beaucoup de liens sortants
dont les textes d’ancre sont majoritairement associés
à des thématiques éloignées
Méthode : regrouper les pages par thématique
et éviter la présence de liens trop nombreux
pointant vers des univers différents
Inconvénient : cela élimine un défaut, mais cela ne
permet pas de créer du contenu adapté pour le SEO
15. Le « cœur de l’algorithme »
Des scores dépendant de la requête pour
identifier les pages les plus pertinentes
comme réponse à cette requête
Problème : en tête des résultats, de
nombreuses pages ont des scores
proches sur ces critères
Il faut retrier ces résultats sur des critères
indépendants de la requête
Popularité, Autorité, Trust
Topicalité (ah tiens…)
Le poids de ces critères est beaucoup moins
élevé que les signaux dépendants de la
requête
Mais c’est clé sur des requêtes concurrentielles !
16. L’algorithme de classement en 2022
Un « mille feuilles » avec des
couches modernes et des
couches anciennes
Mais grâce à ses couches
modernes, l’approche orientée
« mots clés » perd peu à peu de sa
pertinence
Optimisation SEO = construire la
page qui sera considérée comme la
meilleure réponse possible, la plus
pertinente
Information
retrieval
system, with
similarity
computation
Concept
indexing and
concept
based
retrieval
Artificial
intelligence
Rankbrain,
BERT
Query Intent
Recognition
Fact, Entities,
Relations
indexing and
retrieval
17. Le rôle clé des « textes d’ancre »
Les « anchor text » servent à améliorer la pertinence des résultats retournés
17
Le contenu des textes d’ancres est indexé avec le contenu visible de la page
Ces « mini textes descriptifs » ont un format et un contenu proche des requêtes par mots clés
Cela permet d’améliorer l’efficacité des calculs de similarité de type similarité Cosinus
Les mots clés des textes d’ancre ont un poids élevé dans l’algo
C’est ce qui explique le succès des Google bombings
Dès que l’on joue sur les textes d’ancre, on optimise un élément clé pour l’algo (dans un cocon sémantique, un Neper mesh, un topic
cluster ou dans une ancre exacte sur un lien acheté ou manipulé
19. Les faiblesses du concept de cocon sémantique
Un concept flou
Il existe plusieurs définitions (autant que de praticiens ?)
Celle de Laurent Bourrelly a évolué avec le temps
Cocon sémantique ou « Cocon lexical regroupé par thématique »
Quelle granularité pour les cocons ?
Dans la pratique, les cocons produits se révèlent assez différents les uns des autres
Autre exemple : le concept de meta mots
Un meta mot = une lexie ?
Lexie = unité lexicale = lexème + locutions
Un syllogisme « les moteurs de recherche donnent un meilleur score de pertinence aux pages
qui sont maillées avec des pages sur la même thématique, donc le cocon sémantique c’est bon
pour le référencement »
Cherchez l’erreur de raisonnement…
Approche qui permet de détecter des pages non légitimes, toujours en liaison avec d’autres critères, mais
pas de rôle utile dans une fonction d’évaluation de la pertinence
20. Des bases théoriques contestables
Google cherche à scorer la pertinence des pages
Un score sur un « cocon » ou une rubrique serait-il utile ?
Papiers scientifiques sur les scores par sujets
Ex :
https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.136.4911&r
ep=rep1&type=pdf
https://core.ac.uk/download/pdf/30934374.pdf
Pour l’ad hoc retrieval, les résultats sont bof, la pertinence par
sujet s’analyse au niveau page plus efficacement
Plutôt évalué au niveau du host que d’un sous groupe de pages,
et pour des analyses de type « qualité »
Non, le TSPR n’est pas l’explication du bon
fonctionnement du cocon sémantique
http://www-cs-
students.stanford.edu/~taherh/papers/topic-sensitive-
pagerank.pdf
Depuis le début, cette approche sert à personnaliser les
pages de résultats ! Elle est trop macro pour être utile pour
scorer la pertinence d’une page
http://www.webmaster-hub.com/publication/article47.html
A retrouver sur IR-relevant.com dans quelques semaines
21. Et pourtant ça marche !
Oui mais l’homéopathie cela marche
aussi, mais pas pour les raisons
invoquées par les homéopathes
Pourquoi cela marche
Importance des textes d’ancre dans
l’algorithme de Google
On peut obtenir les mêmes résultats avec
un cocon sémantique moins dense et
moins coûteux à produire
Créer des pages qui constituent des LP
pertinentes sur une requête donnée est
toujours une bonne idée
Mais attention à la qualité et aux
recouvrements et à la cannibalisation
entre articles etc.
23. Les trois défauts à éviter absolument
23
Le « fluff content »
Du contenu ajouté pour remplir une page, mais qui ne répond pas au besoin d’un
internaute dans le contexte de la page
Le « filler content »
Du « délayage » : subordonnées inutiles, ratio information / nombre de mots faible
Les contenus expert ont une forte fréquence d’entités nommées sur le nombre de mots total
Le shallow content
Contenu superficiel : un expert n’y trouve aucune information utile.
Syndrome du sujet technique traité par un pigiste de 20mn qui travaille à la chaîne
24. La trilogie E-A-T
Expertise
Le contenu d’une page de qualité montre un niveau d’expertise élevé
Un contenu rédigé par un expert peut aussi être vulgarisé, simplifié, mais on reconnait sur une page de
qualité qu’un tel contenu simplifié est rédigé par un expert
Autorité
Authority au sens d’institution : page émanant d’une institution publique ou privée
Authority au sens de faisant autorité
Trust : pages dignes de confiance
Fiabilité de l’information
Source / origine digne de confiance
La qualité des pages est aussi fortement évaluée en fonction de la présence ou non de problèmes
d’e-reputation.
Expertise – Authority - Trust
24
25. Les principaux critères de qualité d’une page
“Here are the most important factors to consider when selecting an overall Page
Quality rating:
The Purpose of the Page
Expertise, Authoritativeness, Trustworthiness: This is an important quality
characteristic. Use your research on the additional factors below to inform your
rating.
Main Content Quality and Amount: The rating should be based on the landing page of
the task URL.
Website Information/information about who is responsible for the MC: Find
information about the website as well as the creator of the MC.
Website Reputation/reputation about who is responsible for the MC : Links to help
with reputation research will be provided »
Extrait des « Page Quality Rating Guidelines »
25
26. Et les critères qui caractérisent une page de
mauvaise qualité
Low quality pages may have been intended to serve a beneficial purpose. However, Low quality pages do
not achieve their purpose well because they are lacking in an important dimension, such as having an
unsatisfying amount of MC, or because the creator of the MC lacks expertise for the purpose of the
page.
If a page has one or more of the following characteristics, the Low rating applies:
An inadequate level of Expertise, Authoritativeness, and Trustworthiness (E-A-T).
The quality of the MC is low.
There is an unsatisfying amount of MC for the purpose of the page.
The title of the MC is exaggerated or shocking.
The Ads or SC distracts from the MC.
There is an unsatisfying amount of website information or information about the creator of the MC
for the purpose of the page (no good reason for anonymity).
A mildly negative reputation for a website or creator of the MC, based on extensive reputation
research.
If a page has multiple Low quality attributes, a rating lower than Low may be appropriate.
26
27. La notion de « needs met »
La page est-elle utile, répond elle aux besoins, compte tenu de l’intention derrière la recherche ?
27
28. N’oubliez pas les autres critères
Publicité excessive, intrusive
Overlays qui empêchent le contenu d’être visible
Redirections intempestives
Videos qui se lancent automatiquement
Et d’une manière générale, tout les problèmes de qualité technique qui gênent le
processus de crawl et d’indexation
Pages lentes
Pièges à robots,
DUST
Codes 500, 40x, 30x renvoyés à l’excès
Etc.
Tout ce qui perturbe l’expérience de recherche est à bannir
28
29. Cette notion de qualité est holistique
Holistic (definition) :
dealing with or treating the whole of something or someone and not just a part
Et votre référencement doit devenir holistique
29
30. Et enfin …
fournissez la meilleure réponse possible
Une page populaire
Une page qui fait autorité
Une page émanant d’une autorité
sur la question
Des informations fiables et
vérifiées
Un contenu bien structuré pour
être bien compris par les bots
Pensez aussi aux données structurées
Et un contenu qui soit une réponse
pertinente par rapport aux
questions ou aux recherches des
internautes !
Sauf que les mots clés sont deviennent
moins importants
30
31. Le problème avec le cocon sémantique
31
Beaucoup de pages à créer sur de nombreux mots clés :
Risque fort de contenu « shallow » ou « filler » ou « fluff »
Recouvrement entre articles
Near duplicates (quasi doublons)
Concurrence entre pages répondant à des requêtes proches
Dilution du PR entre pages sur des requêtes concurrentielles
Volume de contenu important à créer
Risque de privilégier la quantité sur la qualité
Résultat : beaucoup de cocons sémantiques créés présentent des
problèmes de qualité
32. Conclusion
Si vous voulez gagner en visibilité dans les
résultats de Google :
Renforcez la qualité de vos contenus
Mais la qualité « vue par Google »
C’est-à-dire une qualité qui renforce l’expérience de
recherche sur le moteur
Relisez régulièrement les consignes aux
webmasters
Lisez le Guide des Quality Raters
Pensez SXO, traitez tous les problèmes dans
une logique holistique
Créez les meilleures réponses possible aux
questions des internautes
32
34. Topic cluster version Hubspot
Un concept recyclé et présenté comme
nouveau comme Hubspot
Même approche que pour l’Inbound
Marketing
https://blog.hubspot.com/marketing/topic-
clusters-seo
Problème : la méthode présentée est
aussi floue que le cocon sémantique, et
s’éloigne des bonnes pratiques de
rédaction web
C’est encore une méthode centrée sur les
mots clés.
Ne suivez pas la méthode de hubspot
35. Topic cluster / Topical Cluster
Méthode plus « journalistique » employée
de manière pragmatique parce qu’elle
donne de bons résultats en SEO
Le principe : créer une rubrique composée
de plusieurs articles qui traitent un sujet en
donnant des informations complémentaires
sur le sujet, afin de couvrir les principales
questions que se posent les internautes
36. La notion de page pilier et de pages support
La page pilier est la page d’entrée du
dossier éditorial
C’est la page qui répond à la question la
plus communément posée par les
internautes
Les autres pages répondent à des
questions connexes, mais secondaires
« pages support »
Sert aussi (sur les gros clusters) à accumuler du
PR sur la page pilier
https://www.reliablesoft.net/pillar-pages/
37. Exemple de questionnements
Les questions connexes sont traitées
dans d’autres articles (pages support)
Les articles support comportent des liens
vers la page pilier
Tous les articles du dossier (topical cluster)
font des liens vers d’autres articles du dossier
39. Choisir les contenus à rédiger
39
On n’optimise plus pour un mot clé précis (surtout
sur un site YMYL)
On cherche à créer la meilleure réponse possible à une
question des internautes
Et sur ces pages, on fait attention à ce que les mots clés
primaires et secondaires soient présents dans les balises
qui marquent les mots clés importants
Mots clés primaires (ceux avec le plus fort potentiel) => title
Mots clés secondaires => textes d’ancre des liens qui pointent
vers la page
Autres termes : dans le corps du texte
Sur un sujet à traiter :
On choisit comme article pilier celui qui répond à la
question que se posent les internautes le plus
fréquemment
L’article pilier introduit les articles « support » (ou pages
« cluster ») qui répondent précisément aux autres
questions connexes
L’ensemble constitue un dossier dans lesquels les articles
sont étroitement maillés entre eux
40. Quels sont les avantages de cette méthode
Elle permet une meilleure réflexion sur les contenus utiles à créer
Glissement de « traiter un mot clé » vers « traiter un sujet en créant les pages qui répondent de manière
pertinente aux questionnements des internautes
Adaptation aux couches récentes de l’algo
Indexation des concepts (Hummingbird 2013)
Topic relevance
Passage ranking
Etc.
Elle permet un travail éditorial de qualité
on crée un dossier éditorial classique
La logique parait plus naturelle pour les journalistes
Elle permet des articles/rubriques à deux niveaux de lectures (idéal pour des sujets techniques à
vulgariser)
Elle est plus efficiente
Si la page pilier suffit : une seule page est créée
Si trois pages suffisent : on crée trois pages
On ne crée pas des dizaines de pages pour rien parce que « c’est comme ça qu’on fait avec un cocon
sémantique »
41. 41
Les cas où les topical clusters
sont plus efficaces
42. Les pages et les requêtes YMYL
Pages YMYL : ces pages font l’objet d’une
attention renforcée chez Google
Les pages destinées à une transaction: achat
en ligne, paiement de factures, transfert
d’argent etc…
Pages d’information sur les transactions
financières : bourses, impôts, retraite,
investissements immobilier, études,
assurances etc…
Pages d’information sur les questions de
santé
Pages d’informations sur des questions
juridiques
Et autres pages donnant des informations
sensibles pouvant impacter les finances ou
l’intégrité physique des utilisateurs
42
44. Guidelines pour les sites YMYL
44
Faire la chasse à tout ce qui peut être interprété par Google comme un
pb de qualité
Pb techniques, fautes de frappe, d’orthographe, de syntaxe
Attention au niveau de langage : il doit être soutenu
Le lexique utilisé indique l’expertise :
employer les termes professionnels ou techniques, quitte à les définir
Si on s’adresse au grand public : il faut vulgariser, pas simplifier
Utiliser deux niveaux de lecture s’il le faut :
articles introductifs faits pour le grand public + articles techniques pour les experts
Contenu facile à lire avec des encadrés pour aborder les sujets techniques
45. Sites YMYL : guidelines (suite)
45
Utiliser des références primaires, pas secondaires
Attention au contenu généré par les utilisateurs : il tire la qualité de votre
contenu vers le bas
Attention à la présence de commentaires, d’avis, de discussions issus de forums
etc… Surtout s’ils ne sont pas modérés
46. Le content marketing : stratégie TOFU
En content marketing on cherche
À générer du contenu qualifié (toucher la bonne
cible)
Créer des conversions / des leads
Créer de la rétention, du repeat
Objectif : avoir un bon ROI pour les efforts de la
création de contenu
En matière de contenu, cela oblige à
travailler
la pertinence de pages d’atterrissage par
rapport aux questionnements des internautes
L’efficacité des pages pour générer des
conversions
Ce n’est pas compatible avec une approche
en cocon de qualité même moyenne
L’approche en topic cluster est plus adaptée
48. Conclusions
Les cocons sémantiques présentent souvent des problèmes de qualité incompatibles
avec de bons résultats sur des thématiques YMYL ou lorsque l’on souhaite avoir de
bons résultats en content marketing (stratégies TOFU BOFU)
Pour ces cas, l’approche « topical cluster » est plus efficiente
Ne pas confondre avec les « topic clusters » version Hubspot
De manière générale, il faut glisser d’une approche « traiter des groupements de mots
clés » à « créer un dossier qui traite un sujet »
Plus proche du fonctionnement actuel du moteur
Plus efficient : on ne crée que les contenus réellement utiles
Permet aussi d’optimiser les contenus sur les expressions clés
En 2022 : la qualité du contenu est un élément réellement clé pour avoir de bons
résultats en SEO
Ne vous tirez pas une balle dans le pied en faisant du SEO comme il y’a dix ans