2. Qui suis-je ?
2
• Oriane René-Perez
• 34 ans
• Rédactrice freelance depuis 8 ans
• Surnom : Orianator
3. Le contenu, mon quotidien
3
• Fiches produits e-commerce
• Communiqués de presse
• Articles de blogs
• Petites annonces
• Home pages / catégories
• Contenu orienté SEO
• Etc.
On a tous besoin de contenu de
qualité pour ranker :
4. La concurrence est rude…
4
• Pays francophones (main d’œuvre pas chère)
• Plateformes de rédaction
• Génération de contenu automatique
5. Le content spinning, c’est quoi ?
5
• Une seule structure
• Des milliers de textes tirés
• Le tout pour un prix bien plus intéressant $$$
= La mort du rédacteur ?
7. … de nombreux tirages
7
• Salut mon prénom est Marie
• Coucou mon prénom est Louanne
• Salut je suis Stéphanie
• Coucou mon prénom est Marie
• Coucou mon prénom est Sandrine
• Bonjour je me prénomme Stéphanie
• Bonjour je m’appelle Louanne
• Hello je suis Stéphanie
• Bonjour je m’appelle Marie
• Coucou mon prénom est Stéphanie
• Hello je m’appelle Stéphanie
• Hello mon prénom est Louanne
• Etc.
9. Démultiplier les phrases
9
Aujourd’hui, je participe à une conférence,
pour parler de contenu.
J’ai été invitée à parler de contenu dans une
conférence, à Toulouse.
10. Démultiplier les groupes de mots
10
{Aujourd’hui|Ce jour|Ce samedi 23
septembre|Actuellement}, {je participe à une
conférence, pour parler de contenu|j’évoque
la notion de contenu dans une conférence}.
{J’ai été invitée à parler de contenu dans une
conférence|David et Sandrine m’ont proposé
d’animer une conférence sur le contenu}, {à
Toulouse|tout près de chez moi|lors d’un
événement toulousain}.
11. Spinner les mots
11
{Aujourd’hui|Ce jour|Ce {|samedi }{{23|vingt-trois} septembre|23/09}|Actuellement},
{{je participe à|j’anime|je participe à} {une conférence|un colloque|un événement
{SEO|dédié au référencement}}, {pour {parler de|discuter de|parler} {contenu|rédaction
web|masterspin|content spinning}|sur {le contenu web|la rédaction web|le content
spinning|les masterspins}}|{j’{évoque|aborde} {la notion de|tout ce qui {touche
au|concerne le}} {contenu|masterspin|content spinning}|je m’intéresse avec vous {au
contenu|à la rédaction web|au content spinning|aux masterspins} {dans une
conférence|lors d’un {événement|event} {SEO|dédié au référencement}}}}.
{{{J’ai été {invitée|conviée}|On m’a {invitée|conviée}} à|Je suis {avec vous|en votre
compagnie|présente} pour} {{parler|discuter} de {contenu|content spinning|génération
de contenu|masterspin}|évoquer le sujet du {contenu|content spinning|masterspin}}
{dans |à l’occasion d’}une conférence|{David et Sandrine|Sandrine et David|Mes
{|copains }SEO {préférés|favoris}} m’ont {proposé {d’animer|d’organiser|de
tenir}|invitée à {tenir|animer|organiser}} une conférence {sur|concernant|ayant pour
sujet} {le contenu web|la rédaction web|le content spinning|les masterspins}}, {à
Toulouse|tout près de chez moi|lors d’un événement toulousain}.
12. Le résultat :
12
Ce samedi 23/09, je participe à un événement dédié au référencement, pour parler rédaction
web.
David et Sandrine m’ont proposé d’animer une conférence concernant le content spinning, à
Toulouse.
On m’a conviée à évoquer le sujet du masterspin dans une conférence, tout près de chez moi.
Ce jour, j’aborde tout ce qui touche au content spinning.
Je suis en votre compagnie pour évoquer le sujet du contenu à l’occasion d’une conférence, à
Toulouse.
Aujourd’hui, j’anime un colloque, sur les masterspins.
Etc.
13. Même phrase, spinnée automatiquement
13
{Aujourd'hui|En ce jour|Ce jour|Au jour d'aujourd'hui}, je
{participe|adhère|appartiens|assiste|collabore|concoure|contribue|convienne|conviens|c
oopère|dépend|encourage|intercède|partage|seconde} à une
{conférence|allocution|analyse|assemblée|briefing|colloque|congrès|conseil|conversation
|dialogue|discours|entretien|exposé|homélie|interview|meeting|narration|palabre|plaido
irie|plaidoyer|pourparler|propos|prédication|rassemblement|récit|réunion|sommet|sémi
naire}, {dans|chez|comme|dans lequel|en|entre|là-
dedans|où|par|parmi|pendant|pendant lequel|pour|sur|à|à cause} laquelle je
{parle|annonce|avoue|babille|bataille|bavarde|cancane|cause|chuchote|communique|co
nfère|controverse|dialogue|discoure|disserte|dit|divise|débats|déblatère|délibère|expose
|exprime|formule|informe|jacasse|jacte} de
{contenu|acception|appartement|arrêté|autorisé|caché|canalisé|circonspect|civil|clef|co
ncentré|condensé|contenance|corps|cubé|dedans|domestique|décent|définition|enferm
é}.
14. Les spuns :
14
Au jour d'aujourd'hui, je participe à une plaidoirie, en laquelle je jacte de autorisé.
En ce jour, je conviens à une plaidoirie, pendant lequel laquelle je babille de canalisé.
Aujourd'hui, je conviens à une analyse, pendant laquelle je communique de domestique.
Ce jour, je adhère à une discours, dans lequel laquelle je communique de contenu.
15. Quelques astuces
15
• Ajouter des mots optionnels : Le {|samedi}
23 septembre
• Mais aussi des phrases et paragraphes
optionnels (apparaissant ou n’apparaissant
pas dans les spuns, en fonction des tirages)
• Permuter phrases, paragraphes, mots…
16. Du masterspin artisanal
16
• Un bon masterspin doit être rédigé à la main (pas de synonymes
ajoutés en automatique)
• Pour la spintaxe, utiliser Xspin : sans doute le meilleur logiciel pour la
création de MS
• Attention aux coquilles : accords féminins, masculins, pluriels,
répétitions de mots, erreurs globales relatives à la spintaxe ou à la
structure (lecture /footprints)
• Relire chaque phrase en la faisant tourner au maximum, pour
détecter les éventuelles erreurs
17. Les variables
17
• Elles permettent d’améliorer l’unicité des spuns
• Idéales pour rendre un masterspin très polyvalent
• Elles sont utiles pour la géolocalisation ou pour ajouter des caractéristiques variant d’un
texte à l’autre
Exemple :
{Je {vis|réside}|J’habite} {sur|aux alentours de|dans la
{commune|ville} de|vers} $ville.
$ville sera remplacé dans chaque spun (manuellement ou automatiquement).
18. Le taux de similarité
18
• Il indique le degré de ressemblance entre chaque tirage
• Il permet de savoir quel est le taux de duplicate entre les spuns
• Pour une bonne indexation, il est conseillé de ne pas dépasser les
15%
• Utiliser Qualispin pour apprécier la qualité d’un masterspin, en
termes de similarité
• Tirer les spuns les plus éloignés, pour exploiter la puissance du
masterspin au maximum
19. Calcul de la similarité (Sylvain Deauré)
19
Quelles mesures ?
• Levensthein
• Cosinus de Salton
• Dice et Jaccard
• Simhash
20. Exemple :
20
La distance de Levensthein n’est pas adaptée pour calculer la ressemblance de deux textes.
Pour calculer la ressemblance de deux textes, la distance de Levensthein n’est pas adaptée.
Levensthein : 75
Similitude : 17%
21. Exemple :
21
La distance de Levensthein n’est pas adaptée pour calculer la
ressemblance de deux textes.
La distance calculée à vol d’oiseau de Paris à Marseille est de six cent
soixante deux km.
Levensthein : 64
Similitude : 29%
22. L’approche Qualispin
22
• Une unité de mesure universelle
• Une utilisation de Jaccard spécifique
• Une proximité avec les algos Google
• Considération du vocabulaire et de la structure
globale
24. Les limites du masterspin
24
Attention : On ne peut pas utiliser le content
spinning pour n’importe quel type de contenu, il
faut savoir l’employer à bon escient.
25. La titraille
25
On peut spinner la titraille (title, h1, h2 etc), cependant
ceux-ci peuvent générer des footprints, et faire chuter le
taux de similarité entre deux spuns.
Conseil : ne pas ajouter trop de titraille pour
obtenir un masterspin de bonne qualité.
26. Pas adapté aux réseaux de sites
26
Même à un bon niveau de similarité, un masterspin génère des n-grams.
N-gram : Enchaînement de mots qui se suivent.
Unigram = 1 mot
Bigram = 2 mots
Trigram = 3 mots
Quadrigram = 4 mots
Etc.
27. Quel risque ?
27
Le risque est de rendre le réseau de sites facilement
détectable, grâce à des outils poussés en matière de
détection de duplicate content (Kill Duplicate).
29. Et la taille dans tout ça ?
29
Idée reçue : Plus le masterspin est gros, plus il
est de bonne qualité.
Faux !
30. Exemple : les listes
30
7 couleurs au choix pour un t shirt, que je souhaite
faire apparaître dans mon masterspin. Mais
seulement 5 sur 7 par spun, et jamais dans le
même ordre.
32. Résultat :
32
Pour une simple liste de 5 mots, j’obtiens un fichier
de 80 ko (avec plus de 2500 possibilités), mais
faisant peu varier le taux de similarité global d’un
masterspin.
-> La taille n’est pas toujours un
critère
33. La bonne utilisation d’un MS
33
Fiches produits e-commerce
Textes géolocalisés
Petites annonces
Etc.
MAIS
Pas sur un réseau de sites
Sur une unique thématique