Les deux nouvelles mises à jour de Google de mars 2024 montrent un changement d'approche de Google à propos de ce qu'ils considèrent comme du spam et des contenus de mauvaise qualité. Quelles sont les nouvelles règles ? Peut-on encore générer du contenu avec une IA générative sans être pénalisé par l'algorithme ? Quelles sont les tactiques jadis limites et qui sont maintenant fortement déconseillées ?
Nous verrons aussi pourquoi les pages de résultats sont maintenant si différentes entre la France et les Etats Unis...
Google - les nouvelles règles du jeu, Présenté par Philippe YONNET, CEO de Neper
1. Google : les Nouvelles règles du jeu
Philippe YONNET
CEO Neper
2. Google envoie un message avec les updates de Mars 2024
Et il vaut mieux écouter ce message
Deux updates
Une « spam update »
Une core update : cela ressemble à une
HCU, cela à la couleur d’une HCU, mais ce
n’est pas appelé une HCU
3. La « spam update » en bref
Elle cible différentes tactiques « spammy » mais en particulier
Le « parasite SEO »
L’abus de domaines expirés
La création abusive de contenus à grande échelle
5. Le « parasite SEO »
Parfois, les sites Web dotés de leur propre contenu de qualité peuvent également héberger du
contenu de mauvaise qualité fourni par des tiers dans le but de capitaliser sur la solide réputation
du site d'hébergement. Par exemple, un tiers peut publier des avis sur les prêts « Pay Day Loan »
sur un site Web éducatif de confiance afin de bénéficier des avantages de classement du site. Un
tel contenu bien classé dans la recherche peut dérouter ou induire en erreur les visiteurs qui
peuvent avoir des attentes très différentes concernant le contenu d'un site Web donné.
Nous considérerons désormais comme du spam le contenu tiers de très faible valeur produit
principalement à des fins de classement et sans surveillance étroite du propriétaire du site Web.
Nous publions cette politique deux mois avant son entrée en vigueur le 5 mai, afin de donner aux
propriétaires de sites le temps d'apporter les modifications nécessaires.
« Site reputation abuse » => sanctionné à partir du 5 mai
6. Le message : faites le ménage et surveillez le contenu
généré par des tiers
Jusqu’ici, ce type de spam était
surtout sanctionné côté spammeur
Mais dorénavant, les propriétaires de
site pourront être pénalisés pour ne
pas avoir fait le ménage !
https://www.neper.fr/2023/12/13/go
ogle-sattaque-au-seo-parasite/
7. Attention à ne pas être parasité « à l’insu de votre plein
gré »
8. L’abus de domaines expirés
Parfois, des domaines expirés sont achetés et réutilisés dans le but principal d'améliorer le
classement dans les recherches de contenu de mauvaise qualité ou non original. Cela peut
induire les utilisateurs en erreur en leur faisant croire que le nouveau contenu fait partie de
l’ancien site, ce qui n’est peut-être pas le cas. Les domaines expirés qui sont achetés et réutilisés
dans le but d'améliorer le classement de recherche de contenu de mauvaise qualité sont
désormais considérés comme du spam.
Ce n’est plus une tactique « ok »
9. Tant pis pour l’écosystème
On peut toujours acheter un nom de domaine expiré pour un motif légitime
Mais l’approche black hat à l’aide de nombreux domaines expirés est
dorénavant ciblée
10. La création abusive de contenus en masse
Cible la génération de contenus à base d’IA ?
Officiellement non, mais en pratique, cela cible aussi et surtout les cas de génération à base d’IA
« Nous avons depuis longtemps une politique interdisant l'utilisation de l'automatisation pour générer du contenu de
mauvaise qualité ou non original à grande échelle dans le but de manipuler les classements de recherche. Cette politique
a été conçue à l'origine pour gérer les cas de contenu généré à grande échelle où il était clair qu'une automatisation était
impliquée.
Aujourd'hui, les méthodes de création de contenu à grande échelle sont plus sophistiquées, et il n'est pas toujours aussi
clair si le contenu est créé uniquement par l'automatisation. Pour mieux gérer ces techniques, nous renforçons notre
politique visant à nous concentrer sur ce comportement abusif – produire du contenu à grande échelle pour améliorer le
classement dans les recherches – qu'il s'agisse d'automatisation, d'humains ou d'une combinaison. Cela nous permettra
d'agir sur davantage de types de contenu avec peu ou pas de valeur créée à grande échelle, comme les pages qui
prétendent avoir des réponses aux recherches populaires mais ne parviennent pas à fournir un contenu utile. »
12. Est-ce que Google sanctionne les contenus générés par
une IA ?
Non, pas parce que c’est fait par une IA
Mais si le contenu généré par une IA ne remplit pas les
critères de Google => impossible de se positionner
correctement
Rien n’indique que Google cherche à cibler
spécifiquement les contenus générés par une IA
aujourd’hui
Ils cherchent à détecter les contenus à faible valeur ajoutée
en tant que réponse
Guidelines récentes à ce sujet
https://developers.google.com/search/blog/2023/02/goo
ogle-search-and-ai-content?hl=fr
Nos commentaires :
https://www.neper.fr/2023/02/09/google-publie-des-
guidelines-a-propos-des-contenus-generes-par-une-ia/
13. Quels problèmes de qualité produits par une IA peuvent conduire à
une mauvaise évaluation chez Google ?
Manque de valeur ajoutée en tant que réponse :
Needs met ?
Duplicate :
est-ce que le contenu que l’IA vous propose n’a pas déjà été publié 10 fois sur internet ?
Pas d’effet Wow, contenu ne créant pas d’intérêt, manque d’originalité, de créativité
Effet « pogo sticking » => effet indirect sur les signaux de qualité
Erreurs factuelles
Pas détectable directement, mais influe indirectement sur des indicateurs détectés depuis la HCU
Contenu visiblement généré uniquement à des fins de SEO
Mauvais choix de prompt
IA crée du « Fluff content », du « shallow content » ou du « filler content »
14. Les contenus à faible valeur ajoutée
Shallow content :
Contenu superficiel : celui que produira typiquement un
rédacteur web stagiaire à partir d’une dépêche AFP sur un
sujet sur lequel il a zéro expertise
Le résultat contient peu d’entités nommées et d’informations
Résultat le plus courant avec une IA
Filler content :
Contenu « délayé » : du texte ajouté pour allonger le
contenu, sans forcément ajouter de l’information
Problème de ratio quantité d’information utile versus nombre de
mots !
Si vous n’alimentez pas l’IA en infos dans le prompt, c’est ce que
vous aurez
Fluff content :
Contenu « creux » : écrit parce qu’il faut produire du contenu
contenu
Contenu légèrement hors sujet
cas fréquent avec ChatGPT
Obtenir mieux avec une IA demande beaucoup d’efforts
Exemple de fluff content :
Brief/prompt : faire un texte pertinent pour la page
« vente villa avec piscine à Menton », et vous vous
retrouvez avec :
• un bout de texte paraphrasé, repris de la page de
l’office de Tourisme de Menton
• un autre inspiré d’un blog qui parle de l’intérêt
d’avoir une piscine pour louer son logement
• et un autre inspiré d’un article de magazine qui
parle de l’immobilier sur la Côte d’Azur
C’est du remplissage, aucune valeur ajoutée sur
la page web !
15. Production en masse : où s’arrêter
La limite max, c’est celle que votre équipe d’humains
pourrait produire avec une productivité normale, au
maximum de ses moyens
La limite est variable, et dépend de votre secteur et des
pratiques des concurrents
Si vous dépassez cette limite, attendez-vous un jour à
subir un filtre de Google…
16. Comment faire pour créer un contenu à forte valeur
ajoutée avec de l’IA ?
Produisez une information exclusive,
ou un contenu utile exclusif
Fournissez l’information vous-même à
l’outil d’IA dans le prompt
Vérifiez qu’il n’a pas modifié l’input
Peux-tu me résumer les bénéfices et dangers du
café pour la santé d'après cette étude :
https://hal.univ-lorraine.fr/hal-01732489/document en
n'utilisant que les infos figurant dans le pdf ?
17. TL;DR
La qualité des contenus que vous produisez à une importance croissante aux yeux de
Google
Secteurs YMYL, valeur ajoutée en tant que réponse, « needs met », contenus utiles (HCU)
La HCU a introduit récemment de nouveaux critères qui ont changé les classements
Côté IA, on peut s’en servir sans subir les foudres de Google mais :
Pas simple de produire du contenu qui matche avec les critères de Google avec ces outils aujourd’hui
La qualité de ce qui est produit avec une IA dépend de vos inputs, et de votre capacité à générer des
prompts pertinents pour un contexte précis. Tout cela demande de gros efforts, du temps, et du talent.
Attention du coup à vos projets de créer de gros volumes de contenu avec de l’IA : pas sûr que vous
aurez des résultats satisfaisants
Contenu et IA, le problème c’est la HCU
19. Lancée en même temps, mais toujours en cours de
déploiement
20. L’impact est malgré tout visible
Nouvel outil chez Neper : barometre-seo.com
Impact beaucoup plus fort aux USA
qu’en France
21. Une « helpful content update »
Le « filtre » HCU est maintenant converti en signal embarqué dans le cœur de l’algorithme
Donc Google n’appelle pas cela HCU, mais les changements sont décrits comme s’il
s’agissait d’une HCU
Techniquement, non, mais en réalité oui
22. Les Helpful Content Update
Objectif :
Faire remonter les pages utiles pour les
internautes dans les classements, et
déclasser les pages optimisées pour capter
du trafic
23. La Helpful Content Update
D’abord déployée sur Google en anglais à la
rentrée 2022
Puis en français et d’autres langues fin 2022
Nouvelle mouture de l’algo la semaine
dernière, toujours en cours, avec un classifieur
amélioré
La mise à jour a introduit de nouveaux critères
sur les contenus, avec la volonté de privilégier
les contenus utiles dans les classements
https://developers.google.com/search/blog/20
22/08/helpful-content-update?hl=en
https://developers.google.com/search/updates/he
elpful-content-update
Une mise à jour majeure de l’algorithme de classement de Google
24. Les contenus « utiles » d’après Google
Questions sur le contenu et la qualité
Votre contenu fournit-il des informations, des rapports ou des travaux de recherche ou d'analyse véritablement originaux ?
Offre-t-il une description substantielle ou exhaustive du sujet ?
Fournit-il des informations réellement utiles et intéressantes ?
Si votre contenu s'appuie sur d'autres sources, l'avez-vous simplement recopié ou reformulé, ou y avez-vous apporté de la valeur ajoutée et une
touche d'originalité ?
Le titre résume-t-il clairement le contenu de la page ?
Utilise-t-il un langage approprié et non offensant ?
Est-ce le genre de page que vous aimeriez ajouter à vos favoris, partager avec un ami ou recommander ?
Ce contenu pourrait-il apparaître dans un magazine, une encyclopédie ou un livre en version papier ?
Le contenu offre-t-il des informations plus pertinentes que les autres pages dans les résultats de recherche ?
Questions sur le niveau d'expertise
Le contenu présente-t-il les informations d'une manière qui suscite la confiance ? Par exemple, cite-t-il ses sources, est-il en mesure de prouver
son niveau d'expertise, donne-t-il accès à la biographie de l'auteur ou fournit-il des informations générales sur les créateurs de la page ?
Si un internaute analysait le contenu du site, aurait-il l'impression qu'il est fiable ou qu'il fait autorité dans son domaine spécifique ?
Ce contenu est-il écrit par un expert ou un passionné qui maîtrise le sujet ?
Le contenu présente-t-il des erreurs factuelles facilement vérifiables ?
Ce sont eux pour lesquels vous répondez oui aux questions suivantes
25. Les contenus « utiles » d’après Google (suite)
Privilégier les contenus axés sur l'humain
De par votre entreprise ou votre site, avez-vous une audience existante ou ciblée qui
trouverait votre contenu utile si elle s'adressait directement à vous ?
Votre contenu démontre-t-il clairement une expertise et des connaissances sans égal
(expertise acquise après avoir utilisé un produit ou un service, ou après avoir visité un
par exemple) ?
Votre site a-t-il un objectif principal ?
Un internaute qui lit votre contenu se sentira-t-il suffisamment instruit sur un sujet
atteindre son objectif ?
Un internaute qui lit vos contenus aura-t-il l'impression d'en avoir bénéficié ?
Ce sont eux pour lesquels vous répondez oui aux questions suivantes
26. Les contenus déclassés par Google
Questions sur la présentation et la création du contenu
Le contenu présente-t-il des fautes d'orthographe ou des erreurs de style ?
Le contenu semble-t-il avoir été rédigé à la hâte ?
Le contenu est-il produit par un grand nombre de créateurs, sous-traité en grande
ou encore diffusé sur un vaste réseau de sites, ce qui fait que chaque page ou site ne
pas l'objet d'un contrôle très poussé ?
Le contenu inclut-il un nombre excessif d'annonces qui distraient les utilisateurs ou
interfèrent avec le contenu principal ?
Le contenu s'affiche-t-il mal sur les appareils mobile
Ce sont eux pour lesquels vous répondez oui aux questions suivantes
27. Les contenus déclassés par Google (suite)
Éviter de créer des contenus axés sur les moteurs de recherche
L'objectif principal du contenu est-il de générer des visites en provenance de moteurs de recherche ?
Produisez-vous beaucoup de contenu sur des sujets nombreux et variés dans l'espoir que certains d'entre eux seront
performants dans les résultats de recherche ?
Avez-vous recours à un haut niveau d'automatisation pour générer du contenu sur de nombreux sujets ?
Vous contentez-vous principalement à résumer ce que les autres ont à dire sans apporter d'informations utiles supplémentaires
?
Écrivez-vous simplement parce que le sujet est populaire en ce moment, même si le contenu ne correspond pas
particulièrement à votre audience ?
Votre contenu donne-t-il l'impression aux lecteurs qu'ils doivent effectuer une nouvelle recherche pour obtenir des informations
plus pertinentes provenant d'autres sources ?
Essayez-vous de respecter un nombre de mots spécifique, car vous avez entendu dire que Google préfère un certain nombre de
mots (ce qui n'est pas le cas, d'ailleurs) ?
Avez-vous décidé d'entrer dans un domaine de niche sans compétence réelle, mais parce que vous pensiez générer plus de trafic
de recherche ?
Votre contenu répond-il à une question dont la réponse n'est pas confirmée, par exemple en suggérant la date de sortie d'un
produit, d'un film ou d'une série TV alors que personne n'a accès à cette information ?
Ce sont eux pour lesquels vous répondez oui aux questions suivantes
28. Mais est-ce vraiment nouveau ?
C’est l’aboutissement d’une évolution
longue et continue…
Non, mais peut-être ne vous en êtes-vous pas rendu compte…
29. Par contre, les bonnes pratiques SEO ont déjà beaucoup
changé !
EEAT et Utilité/Qualité/Needs met
https://www.neper.fr/2023/01/18/oubliez-leat-pensez-eeat-a-present/
30. La notion de « needs met »
La page est-elle utile, répond elle aux besoins, compte tenu de l’intention derrière la recherche ?
30
31. Le guide du quality rater
Deux notes sont produites
PQ : page quality
Utility : utilité de la page
Nom officiel : « Search Quality Evaluator Guidelines »
Lien de téléchargement :
https://static.googleusercontent.com/media/www.google.com/
/en//insidesearch/howsearchworks/assets/searchqualityevaluat
torguidelines.pdf
Pour comprendre la vision de Google, lisez ce guide !
31
34. Quelles implications pour votre stratégie SEO ?
Attention aux tactiques SEO moisies qui ont cessé d’être 100% sûres il y’a parfois plus de
dix ans
Les expirés, c’est fini, le parasite SEO aussi, mais également le guest blogging etc.
Faites appel à des agences qui ont adapté leurs pratiques aux exigences de Google
Si vos pages web présentent des problèmes de qualité ou d’utilité pour les internautes,
Google ne vous classera pas en tête des résultats, même (et surtout si) vous avez suivi de
soi-disant bonnes pratiques SEO
Vous pouvez utiliser des IA génératives pour vous aider à produire du contenu, mais à
condition de veiller que ce contenu soit original, à forte valeur ajoutée, fiable et utile
C’est possible, mais cela demande un bon accompagnement pour y parvenir