SlideShare une entreprise Scribd logo
Une stratégie de contenu basée sur
la data : Quoi ? Comment ?
Sylvain Peyronnet
@speyronnet
learning
to rank
pertinence
popularité
entrée de
l’utilisateur
classementclassementclassement
comprendre la
requête
antispam
pages
signaux
utilisateurs
spider
web
learning
to rank
pertinence
popularité
entrée de
l’utilisateur
classementclassementclassement
comprendre la
requête
antispam
pages
signaux
utilisateurs
spider
web
Ici	le	contenu	est	
un	levier
Ici	le	contenu	est	
un	levier
Ici	le	contenu	est	
un	levier
Ici	le	contenu	est	
un	levier
QU’EST CE QUE LE CONTENU ?
Dans	la	page,	doit-on	
considérer	tous	les	
éléments	?
QU’EST CE QUE LE CONTENU ?
Menus,	navigation,	pub,	
etc.	
C’EST	DU	CONTENU	DE	LA	
PAGE
QU’EST CE QUE LE CONTENU ?
ce	qu’un	être	humain	va	
vouloir	lire	
C’EST	DU	CONTENU	DE	LA	
PAGE
QU’EST CE QUE LE CONTENU ?
L’ancre	des	liens	vers	la	
page	?	
C’EST	DU	CONTENU	DE	LA	
PAGE
QU’EST CE QUE LE CONTENU ?
Les	contenus	des	pages	
connexes	?	
CE	N’EST	PAS	DU	CONTENU	
DE	LA	PAGE	
Mais	ça	contribue	à	la	
popularité	si	il	y	a	une	
adéquation	sémantique
très
proche
très
proche
très
proche
très
proche
proche
proche
proche
proche
proche
proche
proche
proche
QU’EST CE QU’UNE STRATÉGIE ?
Une	stratégie	est	un	«	ensemble	d'actions	
coordonnées,	d'opérations	habiles,	de	
manœuvres	en	vue	d'atteindre	un	but	
précis	»
QU’EST CE QU’UNE STRATÉGIE ?
Une	stratégie	est	un	«	ensemble	d'actions	
coordonnées,	d'opérations	habiles,	de	
manœuvres	en	vue	d'atteindre	un	but	
précis	»
STRATÉGIE DE CONTENU
Dans	un	
domaine	fixé	:	
cibler	les	
bonnes	
intentions
Choisir	le	bon	
schéma	de	
linking	interne	
(=trouver	les	
sujets	connexes)
Ecrire	des	
contenus	
optimisés	pour	
le	moteur
S’assurer	de	la	
qualité	
algorithmique
Obtenir	des	BL	
avec	les	bonnes	
ancres
Levier	:	
conversion
Levier	:	
popularité
Levier	:	
sémantique
Levier	:	
passer	les	
filtres
Levier	:	
popularité	ET	
sémantique
Avoir	une	UX	
«	quali	seo	»
Levier	:	
learning	to	
rank
Dans	un	
domaine	fixé	:	
cibler	les	
bonnes	
intentions
Pour trouver les intentions, il faut coupler
sujets + intention générique
Par exemple :
COMBIEN + MACHINE A CAFE
=
Acheter une machine à café pas chère
Un sujet seul n’a aucun intérêt, le moteur ne s’intéresses qu’aux
intentions
Dans	un	
domaine	fixé	:	
cibler	les	
bonnes	
intentions
Pour avoir les meilleures intentions (!) pour le moteur :
1. des phrases dans l’action
des verbes très clairs : acheter, vendre,
réparer, détartrer, choisir
2. des mots porteurs d’intention
explicitement
qui, quoi, comment, etc.
3. sous forme de questions
de quelle couleur est le cheval blanc d’Henri
IV ?
Dans	un	
domaine	fixé	:	
cibler	les	
bonnes	
intentions
A LA MAIN
Comment
Dans	un	
domaine	fixé	:	
cibler	les	
bonnes	
intentions
AUTOMATIQUEMENT
avec RDDZ Scrapper
Scrapping	
du	suggest	
automatisable	
avec	des	scripts	
ou	des	outils	
sur	étagère
Dans	un	
domaine	fixé	:	
cibler	les	
bonnes	
intentions
Certains	outils	
fournissent	même	
directement	la	data	
(answer	the	public	
ou	yourtextguru)
Choisir	le	bon	
schéma	de	
linking	interne	
(=trouver	les	
sujets	connexes)
Il	s’agit	de	créer	un	maillage	interne	
(certains	parlent	de	cocons,	de	silos,	de	
grappes,	etc.)	qui	soit	entre	textes	
proches	sémantiquement.	
L’astuce	:	utiliser	un	outil	d’analyse	
sémantique	pour	extraire	le	champ	
lexical	de	l’intention	porté	par	les	textes;	
et	faire	les	liens	en	cohérence	avec	la	
proximité	entre	champs	lexicaux.
Choisir	le	bon	
schéma	de	
linking	interne	
(=trouver	les	
sujets	connexes)
On	peut	ensuite	vérifier	
le	maillage	total	avec	
Gephi
Ecrire	des	
contenus	
optimisés	pour	
le	moteur
12"
SMX$Paris$8$et$9$JUIN$2015$
Cherchons$le$bon$vocabulaire$
petit!
être!
perdre!
forêt!
Le! petit! était! perdu!
dans! la! forêt!
Un texte est un
vecteur
?! ?! ?! ?! ?! ?! ?!
petit!
perdre!
être! forêt!
et$9$JUIN$2015$
Cherchons$le$bon$vocabulaire$
le
a
?! ?! ?! ?! ?! ?! ?!
petit!
perdre!
être! forêt!
14"
SMX$Paris$8$et$9$JUIN$2015$
Cherchons$le$bon$vocabulaire$
d1
d2
θ
d1
d2
La similarité est définie par le
cosinus de l’angle
Ecrire	des	
contenus	
optimisés	pour	
le	moteur
Il	existe	pléthore	
d’outils	pour	cela
S’assurer	de	la	
qualité	
algorithmique
Les	contenus	sont-ils	
en	duplication	?	
On	utilise	simhash,	
bonne	
approximation	des	
shingles
S’assurer	de	la	
qualité	
algorithmique
Les	contenus	sont-ils	
en	duplication	?	
On	utilise	simhash,	
bonne	
approximation	des	
shingles	
Cette	information	seule	
est	INUTILE
S’assurer	de	la	
qualité	
algorithmique
Avec	la	navigation	et	
les	menus	
Sans	la	navigation	et	
les	menus
S’assurer	de	la	
qualité	
algorithmique
Avec	la	navigation	et	
les	menus	
Sans	la	navigation	et	
les	menus
S’assurer	de	la	
qualité	
algorithmique
CRAWL
plusieurs
milliers de
pages
SELECTION
Création
d’un dataset
NOTATION
Quality
rating
QUALIFICATION
Reconnaitre la
qualité à partir de
critères stables
TAUX DE COMPRESSION
0.00
0.25
0.50
0.75
1.00
0 5 10
Proportiondubucket
Qualité Spam Basse Haute
0.00
0.05
0.10
0 5 10
Proportiondudataset
Comme en 2006, le spam est
composé de textes qui utilisent
ou trop de mots similaires, ou
trop de mots divers.
Taux	de	compression	
DENSITE DU TERME LE PLUS FREQU
0.00
0.25
0.50
0.75
1.00
0.0 0.1 0.2
Proportiondubucket
Qualité Spam Basse Haute
0.00
0.05
0.10
0.15
0.0 0.1 0.2
Proportiondudataset
• Le pic de qualité e
4%
• Au delà de 20% il
la poubelle
• Entre 0 et 10% on
ventilation raisonn
de qualité
Préco : ne pas
5% sur le term
fréque
Densité	du	terme	le	plus	fréquent	
Et	bien	d’autres	critères…
S’assurer	de	la	
qualité	
algorithmique
Méthode de classicaon A B C D E F SCORE
RPART 0 0 23 0 143 2 54.4 % D
Random Forest 0 0 0 0 152 16 48.4 % E
C5.0 0 0 26 0 138 4 54.8 % D
Adaboost 0 0 29 99 39 1 65.5 % D
Score global 54.4 % D
In fine, utilisation d’un classifieur (C = bonne note)
S’assurer	de	la	
qualité	
algorithmique
Vision radar de 5
critères très
importants
Obtenir	des	BL	
avec	les	bonnes	
ancres 1. échantillon hors marque/non-nav
= on détermine une marque à partir de la SERP
2. 20K requêtes triées par Interest décroissant,
sans les marques.
3. Top 100 résultats
4. Nettoyage manuel
5. Ajout des métriques Majestic
serrurier paris,serrurier,assurance auto,plombier,plombier paris,location voiture,banque en ligne,site de rencontre,credit,mutuelle,rachat de credit,assurance
habitation,suv,big data,serrurier creteil,faire part naissance,crm,iphone 6s,poker,serrurier paris 11,alarme maison,devis assurance auto,certificat de non
gage,serrurier paris 15,serrurier toulouse,crossover,banque,serrurier bordeaux,carte de visite,serrurier vincennes,voiture occasion,assurance,album
photo,serrurier poissy,candy crush,vol pas cher,ouvrir un compte bancaire,tinder,serrurier lyon,candy crush saga,comparateur de vol,mutuelle santé,voiture
electrique,plombier paris 7,pret personnel,trader,forex,ordinateur portable,faire part mariage,billet avion,serrurier paris 13,serrurier meudon,plombier paris
11,mutuelle obligatoire,plombier paris 15,carte grise,serrurier paris 17,iphone 6,casino en ligne,serrurier paris 16,assurance auto pas cher,billet d
avion,voyance,serrurerie,comparateur assurance auto,samsung galaxy s6,assurance voiture,piscine,alarme,loi pinel,iphone 5s,credit
immobilier,pneu,serrurier paris 14,portage salarial,comparateur assurance,demenagement,forfait mobile,matelas,hotel paris,assurance vie,pneu pas
cher,paris sportif,antivirus,bourse,jeux de guerre,livre photo,flash,nom de domaine,tablette,housse de couette,syrie,option binaire,serrurier clamart,robe de
soirée,cryolipolyse,credit auto,plombier versailles,serrurier versailles,stan smith,serrurier villejuif,rencontre,serrurier boulogne billancourt,site de rencontre
gratuit,canapé convertible,casino,erp, 4x4,covoiturage,pret immobilier,iphone,hotel,cap petite enfance,croisiere,
Kevin Richard
Seobserver
Avoir	une	UX	
«	quali	seo	»
Pour calibrer les poids des signaux, le moteur utilise en entrée une
évaluation de la qualité perçue par les utilisateurs :
Une estimation de la pertinence pour les humains
Comment estimer la qualité de la SERP à partir du comportement des
utilisateurs ?
On va regarder les taux de clics, le click skip, ou tout autre mesure de
qualité (temps de retour par exemple)
Le SEO a deux leviers pour augmenter la qualité perçue par le moteur :

1. Augmenter l’attractivité des pages en créant des snippets attractifs

2. Améliorer le ratio rétention - bounce
Avoir	une	UX	
«	quali	seo	»
Page Pages vues Temps moyen passé sur la pageTaux de rebondSorties (en %)Valeur de la pagescore
anonymous 5 1720,00 100,00 % 80,00 % 0,00 1376,00
anonymous 20 656,88 66,67 % 60,00 % 10,99 262,75
anonymous 18 444,33 75,00 % 66,67 % 0,00 222,17
anonymous 356 224,40 87,54 % 82,58 % 0,00 162,23
anonymous 67 233,87 84,85 % 53,73 % 0,00 106,62
anonymous 7 176,50 75,00 % 71,43 % 0,00 94,55
anonymous 879 194,71 68,99 % 63,48 % 0,43 85,28
anonymous 9134 197,30 75,72 % 51,40 % 0,47 76,79
anonymous 12 217,00 100,00 % 33,33 % 0,00 72,33
anonymous 33 135,41 100,00 % 48,48 % 0,00 65,65
anonymous 351 166,40 61,25 % 59,83 % 0,26 60,97
anonymous 1328 146,21 66,74 % 61,60 % 0,15 60,10
anonymous 6 117,00 100,00 % 50,00 % 0,00 58,50
anonymous 58533 110,76 104,01 % 49,93 % 1,49 57,52
anonymous 645 216,96 63,46 % 39,69 % 0,54 54,65
anonymous 39 133,37 76,92 % 51,28 % 0,00 52,61
anonymous 888 161,52 58,75 % 51,69 % 0,42 49,05
anonymous 2778 167,58 68,80 % 40,96 % 1,82 47,23
anonymous 14 124,89 100,00 % 35,71 % 0,00 44,60
anonymous 54 78,83 89,47 % 55,56 % 0,00 39,19
anonymous 2082 94,12 93,14 % 43,08 % 0,30 37,77
anonymous 161222 95,66 62,96 % 58,83 % 0,39 35,43
anonymous 29 83,76 100,00 % 41,38 % 0,00 34,66
anonymous 34471 89,66 84,37 % 43,63 % 0,29 33,00
anonymous 3 98,50 100,00 % 33,33 % 0,00 32,83
anonymous 8 146,80 50,00 % 37,50 % 3,74 27,53
anonymous 316 117,73 64,00 % 34,49 % 0,22 25,99
anonymous 1362 89,17 55,37 % 46,62 % 0,42 23,02
anonymous 20 90,33 46,15 % 55,00 % 0,00 22,93
anonymous 2 82,00 50,00 % 50,00 % 0,00 20,50
anonymous 7 23,00 100,00 % 85,71 % 0,00 19,71
anonymous 54 80,84 75,00 % 29,63 % 0,65 17,96
anonymous 20868 63,84 74,18 % 37,75 % 0,44 17,88
anonymous 140 73,58 57,14 % 35,71 % 0,66 15,02
anonymous 11 103,63 50,00 % 27,27 % 0,00 14,13
anonymous 189 74,35 50,00 % 37,04 % 0,61 13,77
63 138,67 33,33 % 28,57 % 1,25 13,21
6615 51,10 92,76 % 26,35 % 0,51 12,49
8 56,60 50,00 % 37,50 % 0,00 10,61
Score de qualité perçue
par les visiteurs
TEMPS * BR * TX SORTIE
Avoir	une	UX	
«	quali	seo	»
Avoir	une	UX	
«	quali	seo	»
Sylvain	Peyronnet	
@speyronnet		
DM	OUVERTS

Contenu connexe

Similaire à Une stratégie de contenu basée sur la data - Sylvain Peyronnet

OpinionWay pour Choisir.com : Les français et les sites comparateurs / Novemb...
OpinionWay pour Choisir.com : Les français et les sites comparateurs / Novemb...OpinionWay pour Choisir.com : Les français et les sites comparateurs / Novemb...
OpinionWay pour Choisir.com : Les français et les sites comparateurs / Novemb...
contactOpinionWay
 
Choisir.com - Les Français et les sites comparateurs - Novembre 2014
Choisir.com - Les Français et les sites comparateurs - Novembre 2014Choisir.com - Les Français et les sites comparateurs - Novembre 2014
Choisir.com - Les Français et les sites comparateurs - Novembre 2014
OpinionWay
 
Les 500 champions de la croissance (vidéo)
Les 500 champions de la croissance (vidéo)Les 500 champions de la croissance (vidéo)
Les 500 champions de la croissance (vidéo)
IKO System
 
Webconf SF - 5-07-2016 - SEO/SEA - Update sur les news S1 2016
Webconf SF - 5-07-2016 - SEO/SEA - Update sur les news S1 2016Webconf SF - 5-07-2016 - SEO/SEA - Update sur les news S1 2016
Webconf SF - 5-07-2016 - SEO/SEA - Update sur les news S1 2016
Peak Ace
 
SMX Paris 2018 - Comment optimiser votre visibilité en développant des synerg...
SMX Paris 2018 - Comment optimiser votre visibilité en développant des synerg...SMX Paris 2018 - Comment optimiser votre visibilité en développant des synerg...
SMX Paris 2018 - Comment optimiser votre visibilité en développant des synerg...
Peak Ace
 
User Profile & Analytics
User Profile & Analytics User Profile & Analytics
User Profile & Analytics
Thomas LEONETTI
 
Weconférence Search Dependence Index du 3 mai - Quel est le niveau de dépenda...
Weconférence Search Dependence Index du 3 mai - Quel est le niveau de dépenda...Weconférence Search Dependence Index du 3 mai - Quel est le niveau de dépenda...
Weconférence Search Dependence Index du 3 mai - Quel est le niveau de dépenda...
Peak Ace
 
Workshop : Optimiser votre conversion grâce à Google Analytics
Workshop : Optimiser  votre conversion grâce à Google AnalyticsWorkshop : Optimiser  votre conversion grâce à Google Analytics
Workshop : Optimiser votre conversion grâce à Google Analytics
Guillaume Eouzan
 
Qualité des parcours clients : Maîtrisez votre écosystème digital pour renfor...
Qualité des parcours clients : Maîtrisez votre écosystème digital pour renfor...Qualité des parcours clients : Maîtrisez votre écosystème digital pour renfor...
Qualité des parcours clients : Maîtrisez votre écosystème digital pour renfor...
Paris Retail Week
 
Étude sur la sécurité du mot de passe GMX 2015
Étude sur la sécurité du mot de passe GMX 2015Étude sur la sécurité du mot de passe GMX 2015
Étude sur la sécurité du mot de passe GMX 2015
GMX
 
Web Analytics : Générer de la valeur en allant au-delà du reporting
Web Analytics : Générer de la valeur en allant au-delà du reportingWeb Analytics : Générer de la valeur en allant au-delà du reporting
Web Analytics : Générer de la valeur en allant au-delà du reporting
altima°
 
Synodiance > Etude - Taux de Clics SEO - 18/12/2015
Synodiance > Etude - Taux de Clics SEO - 18/12/2015Synodiance > Etude - Taux de Clics SEO - 18/12/2015
Synodiance > Etude - Taux de Clics SEO - 18/12/2015
Search Foresight
 
Plateformes pour le commerce connecté : Conference Expertime - Sephora ECP14
Plateformes pour le commerce connecté : Conference Expertime - Sephora ECP14 Plateformes pour le commerce connecté : Conference Expertime - Sephora ECP14
Plateformes pour le commerce connecté : Conference Expertime - Sephora ECP14
François Duranton
 
#SEOCamp - People Also Ask : Comment les exploiter au mieux ? par Alexis Rylko
#SEOCamp - People Also Ask : Comment les exploiter au mieux ? par Alexis Rylko#SEOCamp - People Also Ask : Comment les exploiter au mieux ? par Alexis Rylko
#SEOCamp - People Also Ask : Comment les exploiter au mieux ? par Alexis Rylko
iProspect France
 
État de la nation interactive 2014-06
État de la nation interactive 2014-06État de la nation interactive 2014-06
État de la nation interactive 2014-06
Samuel-François Parent
 
Synodiance > Etude Authorship - 17/06/2014
Synodiance > Etude Authorship - 17/06/2014Synodiance > Etude Authorship - 17/06/2014
Synodiance > Etude Authorship - 17/06/2014
Search Foresight
 
Diagnostic numérique du Pays du bocage Vendée
Diagnostic numérique du Pays du bocage VendéeDiagnostic numérique du Pays du bocage Vendée
Diagnostic numérique du Pays du bocage Vendée
Sabrina Echappe Web Creatif
 
Altics livre blanc_etourisme_conversion_2013
Altics livre blanc_etourisme_conversion_2013Altics livre blanc_etourisme_conversion_2013
Altics livre blanc_etourisme_conversion_2013
Jérémie Daum
 
Séminaire TIC et Tourisme
Séminaire TIC et TourismeSéminaire TIC et Tourisme
Séminaire TIC et Tourisme
Ludovic Dublanchet
 

Similaire à Une stratégie de contenu basée sur la data - Sylvain Peyronnet (20)

OpinionWay pour Choisir.com : Les français et les sites comparateurs / Novemb...
OpinionWay pour Choisir.com : Les français et les sites comparateurs / Novemb...OpinionWay pour Choisir.com : Les français et les sites comparateurs / Novemb...
OpinionWay pour Choisir.com : Les français et les sites comparateurs / Novemb...
 
Choisir.com - Les Français et les sites comparateurs - Novembre 2014
Choisir.com - Les Français et les sites comparateurs - Novembre 2014Choisir.com - Les Français et les sites comparateurs - Novembre 2014
Choisir.com - Les Français et les sites comparateurs - Novembre 2014
 
Les 500 champions de la croissance (vidéo)
Les 500 champions de la croissance (vidéo)Les 500 champions de la croissance (vidéo)
Les 500 champions de la croissance (vidéo)
 
Webconf SF - 5-07-2016 - SEO/SEA - Update sur les news S1 2016
Webconf SF - 5-07-2016 - SEO/SEA - Update sur les news S1 2016Webconf SF - 5-07-2016 - SEO/SEA - Update sur les news S1 2016
Webconf SF - 5-07-2016 - SEO/SEA - Update sur les news S1 2016
 
SMX Paris 2018 - Comment optimiser votre visibilité en développant des synerg...
SMX Paris 2018 - Comment optimiser votre visibilité en développant des synerg...SMX Paris 2018 - Comment optimiser votre visibilité en développant des synerg...
SMX Paris 2018 - Comment optimiser votre visibilité en développant des synerg...
 
Livre blanc du monitoring
Livre blanc du monitoringLivre blanc du monitoring
Livre blanc du monitoring
 
User Profile & Analytics
User Profile & Analytics User Profile & Analytics
User Profile & Analytics
 
Weconférence Search Dependence Index du 3 mai - Quel est le niveau de dépenda...
Weconférence Search Dependence Index du 3 mai - Quel est le niveau de dépenda...Weconférence Search Dependence Index du 3 mai - Quel est le niveau de dépenda...
Weconférence Search Dependence Index du 3 mai - Quel est le niveau de dépenda...
 
Workshop : Optimiser votre conversion grâce à Google Analytics
Workshop : Optimiser  votre conversion grâce à Google AnalyticsWorkshop : Optimiser  votre conversion grâce à Google Analytics
Workshop : Optimiser votre conversion grâce à Google Analytics
 
Qualité des parcours clients : Maîtrisez votre écosystème digital pour renfor...
Qualité des parcours clients : Maîtrisez votre écosystème digital pour renfor...Qualité des parcours clients : Maîtrisez votre écosystème digital pour renfor...
Qualité des parcours clients : Maîtrisez votre écosystème digital pour renfor...
 
Étude sur la sécurité du mot de passe GMX 2015
Étude sur la sécurité du mot de passe GMX 2015Étude sur la sécurité du mot de passe GMX 2015
Étude sur la sécurité du mot de passe GMX 2015
 
Web Analytics : Générer de la valeur en allant au-delà du reporting
Web Analytics : Générer de la valeur en allant au-delà du reportingWeb Analytics : Générer de la valeur en allant au-delà du reporting
Web Analytics : Générer de la valeur en allant au-delà du reporting
 
Synodiance > Etude - Taux de Clics SEO - 18/12/2015
Synodiance > Etude - Taux de Clics SEO - 18/12/2015Synodiance > Etude - Taux de Clics SEO - 18/12/2015
Synodiance > Etude - Taux de Clics SEO - 18/12/2015
 
Plateformes pour le commerce connecté : Conference Expertime - Sephora ECP14
Plateformes pour le commerce connecté : Conference Expertime - Sephora ECP14 Plateformes pour le commerce connecté : Conference Expertime - Sephora ECP14
Plateformes pour le commerce connecté : Conference Expertime - Sephora ECP14
 
#SEOCamp - People Also Ask : Comment les exploiter au mieux ? par Alexis Rylko
#SEOCamp - People Also Ask : Comment les exploiter au mieux ? par Alexis Rylko#SEOCamp - People Also Ask : Comment les exploiter au mieux ? par Alexis Rylko
#SEOCamp - People Also Ask : Comment les exploiter au mieux ? par Alexis Rylko
 
État de la nation interactive 2014-06
État de la nation interactive 2014-06État de la nation interactive 2014-06
État de la nation interactive 2014-06
 
Synodiance > Etude Authorship - 17/06/2014
Synodiance > Etude Authorship - 17/06/2014Synodiance > Etude Authorship - 17/06/2014
Synodiance > Etude Authorship - 17/06/2014
 
Diagnostic numérique du Pays du bocage Vendée
Diagnostic numérique du Pays du bocage VendéeDiagnostic numérique du Pays du bocage Vendée
Diagnostic numérique du Pays du bocage Vendée
 
Altics livre blanc_etourisme_conversion_2013
Altics livre blanc_etourisme_conversion_2013Altics livre blanc_etourisme_conversion_2013
Altics livre blanc_etourisme_conversion_2013
 
Séminaire TIC et Tourisme
Séminaire TIC et TourismeSéminaire TIC et Tourisme
Séminaire TIC et Tourisme
 

Une stratégie de contenu basée sur la data - Sylvain Peyronnet