SlideShare une entreprise Scribd logo
Cours de 20h, donné auprès des étudiants du Master
IDEMM, université de Lille 3
Auteur : Sébastien Billard (s.billard@free.fr)
SEO (référencement naturel)
THEME ABORDES DURANT CES 20 HEURES
Auteur : Sébastien Billard (s.billard@free.fr)
- Notions de base : le web, son histoire, notions-clés
- Les outils de recherche : typologie, fonctionnement, fonctionnalités
- Le search marketing en général : marché, métier, bonnes et mauvaises pratiques
- Optimisation structurelle et accessibilité technique
- Optimisation éditoriale : écrire pour le web
- Optimisation de la popularité : créer du lien
- Mesure d'audience, analyse de trafic et contrôle de positionnement
- Contenus spécifiques : réferencement local, images,vidéos, flux RSS, actualités...
- Les liens sponsorisés : fonctionnement, marché, techniques d'optimisation
ORGANISATION DES COURS ET DE L'EXAMEN
Auteur : Sébastien Billard (s.billard@free.fr)
- Les questions et partages d'expériences sont bienvenus, aussi bien sur le contenu du cours
que sur l'actualité du référencement.
- L'examen se fait sous forme de QCM et de questions ouvertes (40 questions).
- La durée de l’examen est de 2 heures.
- Notes de cours, smartphones et ordinateurs sont interdits durant l’examen.
- Des points négatifs seront attribués en cas de mauvaises réponse à une question fermée.
- Les questions ouvertes et les questions avec plusieurs réponses bonnes possibles seront
notées au prorata.
- Des questions sur ce qui aura été vu et évoqué en cours seront posées.
AVERTISSEMENT PREALABLE
Auteur : Sébastien Billard (s.billard@free.fr)
- Le référencement n'est ni de la magie, ni de la science.
- Le référencement est un art (au sens d'artisan).
- Ne prenez pas ce que disent les experts pour argent comptant (le prof y compris).
- Expérimentez, faites-vous votre propre opinion !
LE WEB : NOTIONS FONDAMENTALES
Auteur : Sébastien Billard (s.billard@free.fr)
UNE BREVE HISTOIRE DU WEB ET DES OUTILS DE RECHERCHE
Auteur : Sébastien Billard (s.billard@free.fr)
1945 : Le Memex, décrit dans « As we may think » de Vannevar Bush.
1963 : Le terme « hypertexte » créé par Ted Nelson.
1971 : « A theory of indexing », par Gerard Salton, inventeur de cosinus du même nom.
1974 : Naissance du protocole TCP/IP.
1990: 1er serveur web, au CERN, par Tim Berners Lee et Robert Cailliau.
1991 : Le web devient public. Archie,1er moteur FTP . Virtual Librairy, 1er annuaire.
1993 : Wanderer, 1er robot (crawler). Jumpstation, 1er vrai moteur de recherche. HTML 1.0.
1994 : Annuaire Yahoo. Webcrawler 1er moteur full text. 1ère bannière publicitaire.
1995 : Naissance d'Altavista, et du terme SEO. HTML 2.0. Javascript apparaît.
1996 : Inktomi crée l'inclusion payante, naissance de Echo, futur Voila. Flash apparaît.
UNE BREVE HISTOIRE DU WEB ET DES OUTILS DE RECHERCHE
Auteur : Sébastien Billard (s.billard@free.fr)
1997 : Naissance d'Askjeeves. John Kleinberg invente HITS. HTML 3.2 et 4.0.
1998 : Naissances de Google, DMOZ, Goto qui crée les liens sponsorisés.
2000 : Lancement d'Adwords, effondrement de la bulle Internet.
2004 : Naissance de MSN Search. Lancement du moteur Yahoo.
2009 : Le moteur Yahoo disparaît au profit de Microsoft Bing.
2014 : Lancement d’HTML 5.
LE MEMEX DE VANNEVAR BUSH (AS WE MAY THINK)
Auteur : Sébastien Billard (s.billard@free.fr)
« Imaginons un appareil de l’avenir à usage individuel,
une sorte de classeur et de bibliothèque personnels et
mécaniques (...) Un memex, c’est un appareil dans lequel
une personne stocke tous ses livres, ses archives et sa
correspondance, et qui est mécanisé de façon à
permettre la consultation à une vitesse énorme et avec
une grande souplesse. Il s’agit d’un supplément agrandi
et intime de sa mémoire (...)
Une étape s’avère indispensable au classement par
association, dont le principe reposerait sur un système
permettant à tout article d’en sélectionner immédiatement
et automatiquement un autre. C’est ce processus reliant
deux articles l’un à l’autre qui caractérise le memex (...)
Ainsi, à tout moment, quand l’un de ces documents est
visible, l’autre peut être rappelé instantanément (...)
Des formes entièrement nouvelles d’encyclopédies vont
apparaître, prêtes à l’emploi avec un réseau de pistes
fonctionnant par association les traversant, prêtes à être
insérées et amplifiées dans le memex... »
« Le memex sous la forme d'un
bureau serait capable de
mettre à portée de main de
l'operateur les fichiers et
documents relatifs à n'importe
quel sujet »
LE COSINUS DE SALTON
Auteur : Sébastien Billard (s.billard@free.fr)
Documents dans l'index :
Texte 1 : « la loutre est dans la rivière »
Texte 2 : « la loutre est avec les loutres dans la rivière »
Lemmatisation + suppression des verbes et stopwords :
Texte 1 : loutre, rivière
Texte 2 : loutre, loutre, rivière
Calcul des fréquence et vectorisation dans l’espace des fréquences des mots rivière, loutre
(dans cet ordre) :
Texte 1 : (1/2, 1/2 )
Texte 2 : (1/3, 2/3)
Requête : « je suis dans la rivière
avec les loutres de la rivière »
Vecteur : 2/3, 1/3
Source : http://www.spoonylife.org/algorithms-and-computation/modele-vectoriel-et-cosinus-de-salton
LE WEB DECRIT PAR TIM BERNERS LEE ET ROBERT CAILLIAU
Auteur : Sébastien Billard (s.billard@free.fr)
STRUCTURE DU WEB : HOTES, DOMAINES ET DOCUMENTS
Auteur : Sébastien Billard (s.billard@free.fr)
World Wide Web
Hôtes
identifiés par leurs adresses IP
(ex : 209.85.229.147)
Domaines (sites)
Identifiés par leurs noms de domaines
(ex : google.fr)
Documents (pages)
Identifiés par leurs URLs
(ex : http://www.site.fr/page.html )
Note : une IP est spécifique à un hôte, mais un hôte peut avoir plusieurs IPs
QUE SE PASSE-T-IL LORS DE L'ACCES A UNE PAGE ?
DNS du FAI
Serveur web
« J'aimerais accéder à
www.exemple.fr/index.html »
« Bonjour hôte 209.85.229.99,
j'aimerais accéder à l'URL
www.exemple.fr/index.html »
« Je regarde dans ma base...
Ok ! L'IP du domaine exemple.fr est 209.85.229.99 »
« Voyons voir... Le domaine existe bien chez moi...
...Le document demandé également... Je vous envoie
le fichier ! »
HTTP
L’accès à une page se fait en réalité en deux temps :
Auteur : Sébastien Billard (s.billard@free.fr)
QUE SE PASSE-T-IL LORS DE L'ACCES A UNE PAGE ?
GET /referencement/ HTTP/1.1
Host: s.billard.free.fr
Connection: close
Accept: */*
User-Agent: Mozilla/4.0 (compatible; MSIE 7.0;
Windows NT 5.1; GTB6; .NET CLR 2.0.50727;
InfoPath.2; .NET CLR 3.0.4506.2152; .NET
CLR 3.5.30729)
HTTP/1.1 200 OK
Date: Fri, 02 Oct 2009 10:36:31 GMT
Server: Apache/ProXad [Aug 9 2008 02:45:09]
Cache-Control: must-revalidate, max-age=0
Pragma:
X-Powered-By: PHP/4.4.3-dev
Last-Modified: Wed, 30 Sep 2009 14:39:48 GMT
Connection: close
Content-Type: text/html; charset=ISO-8859-1
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0
Strict//EN" (...)
Exemple de requête HTTP : Exemple de réponse HTTP :
Auteur : Sébastien Billard (s.billard@free.fr)
Auteur : Sébastien Billard (s.billard@free.fr)
PLUSIEURS TYPES DE REPONSES HTTP
2XX : Succès
3XX : Redirections
4XX : Erreurs coté client
5XX : Erreurs coté serveur Pour voir les entêtes HTTP : outils
de développement web de Firefox,
rubrique réseau.
Auteur : Sébastien Billard (s.billard@free.fr)
LES CODES DE REPONSE HTTP (AUTRES QUE 200)
« Voyons voir... Le domaine existe bien chez moi...
...par contre je ne connais pas votre fichier »
« Voyons voir... Le domaine existe bien chez moi...
...par contre le fichier a définitivement changé d'adresse. La voici »
« Voyons voir... Le domaine existe bien chez moi...
...par contre le fichier e temporairement changé
d'adresse. La voici »
« Voyons voir... Le domaine existe bien chez moi...
...par contre l'accès au fichier est interdit »
« Voyons voir... Le domaine existe bien chez moi...
...par contre le site web est en panne »
404
301
404
302
500
403
« Voyons voir... Le domaine existe bien chez moi...
...par contre revenez plus tard le site est en
maintenance »
503
Auteur : Sébastien Billard (s.billard@free.fr)
PAGES STATIQUES ET DYNAMIQUES
Sites statiques
Chaque page pré-existe sur le serveur (1 page = 1 fichier HTML).
Sites dynamiques
Les pages sont générées à la demande, par un langage de script (PHP, ASP...). Les paramètres
pour construire la page sont souvent passés dans l'URL. Ex :
www.site.fr/index.php?paramètre1=a&parametre2=b
Attention : L'URL ne permet pas à 100% de déterminer si un site est statique.
« www.site.fr/catalogue/chemises-rouges.html » peut très bien être une page dynamique
Auteur : Sébastien Billard (s.billard@free.fr)
LIRE UNE ADRESSE INTERNET (URL)
http://www.exemple.fr/repertoire/fichier.html
http://catalogue.exemple.fr/index.php?gamme=3&couleur=vert
protocole
sous-domaine domaine répertoire
fichiertop level domain (TLD)
script PHP paramètres
Auteur : Sébastien Billard (s.billard@free.fr)
STRUCTURE D'UNE PAGE WEB : LE CODE HTML
Les balises définissent la fonction de chaque élément.
Elles s'ouvrent et se ferment. On peut les imbriquer.
Syntaxe : <balise>élément</balise> (en général)
Les attributs précisent les propriétés de
chaque élément. On peut les cumuler. Syntaxe
: <balise attribut= "valeur">élément</balise>
Auteur : Sébastien Billard (s.billard@free.fr)
STRUCTURE D'UNE PAGE WEB : PRINCIPALES BALISES ET ATTRIBUTS
Les balises fondamentales les balises <meta>
<html> <meta> description
<head> <meta> robots
<body>
<title>
Les balises structurantes du contenu (dans le <body>)
<a>
<p>
<h1> à <h6>
<strong>
<b>
<ul>,<ol> et <li>
<table>, <tr> et <td>
Les balises riches et multimedia (dans le <body>)
<img>
<script>
<embed> ou <object>
Auteur : Sébastien Billard (s.billard@free.fr)
SUGGESTIONS DE LECTURE
L'essentiel sur le
référencement
Un condensé sur
l'écriture web
Un pavé sur l'écriture
web, davantage
orienté SEO
Une référence sur le
« bien chercher »
Auteur : Sébastien Billard (s.billard@free.fr)
QUELQUES SITES POUR LA VEILLE
En français :
www.abondance.com
www.webrankinfo.com
webmaster-fr.googleblog.com
lemusclereferencement.com
www.seomix.fr
En anglais :
searchengineland.com
www.seobythesea.com
www.seomoz.org
webmasters.googleblog.com
LES OUTILS DE RECHERCHE
Auteur : Sébastien Billard (s.billard@free.fr)
Auteur : Sébastien Billard (s.billard@free.fr)
TYPOLOGIE DES OUTILS DE RECHERCHE : MOTEURS ET ANNUAIRES
Moteurs
- Gestion automatisée
- Entrée par indexation
- Tout le web a vocation à être indexé
- Tout le contenu des pages est indexé
- Navigation par requêtes
Annuaires
- Gestion humaine
- Entrée par soumission
- Des choix éditoriaux sont faits
- Seules les références aux sites sont
indexées
- Navigation arborescente (recherche
possible)
Auteur : Sébastien Billard (s.billard@free.fr)
FONCTIONNEMENT D'UN MOTEUR DE RECHERCHE (VERSION SIMPLE)
Index
Moteur
de recherche
IndexeurWeb
FONCTIONNEMENT D'UN MOTEUR (VERSION MOINS SIMPLE)
COMMENT PENSE UN MOTEUR ?
Juger de la pertinence d'une page web, c'est un peu comme juger du contenu
d'un livre dans une bibliothèque :
Contenu Titre
4ème de couverture
Table des matière
Contenu général
Balise <title>
Balise <meta> description
Titraille (balises <h1> à <h6>)
Ensemble des textes
Structure Lisibilité Accessibilité technique et
structuration
Popularité Recommandations Quantité, qualité et teneur des
liens entrants
Auteur : Sébastien Billard (s.billard@free.fr)
ANATOMIE GENERALE D’UNE PAGE DE RESULTATS
Auteur : Sébastien Billard (s.billard@free.fr)
Résultats
sponsorisés
Résultats
naturels
Résultats Google Shopping
(sponsorisés)
ELEMENTS D’INTERFACE GOOGLE
Auteur : Sébastien Billard (s.billard@free.fr)
Sitelinks
- Déterminés algorithmiquement
- Jusque 10 éléments
Classic sitelinks
- Déterminés algorithmiquement
- Jusque 4 éléments
Sitelinks searchbox
- Pour des requêtes « marque »
- Uniquement pour certains sites
- Mieux vaut mettre en place le script Google
Hiérarchie de site
- Basés sur le fil d’ariane
Jumplinks
- Contextuels
- Basés sur les ancres
ELEMENTS D’INTERFACE GOOGLE
Auteur : Sébastien Billard (s.billard@free.fr)
Position zéro
- Site source déterminé algorithmiquement
Résultats Onebox
- Réponses fournies directement par Google
- Réponses à de multiples questions
Carousel Knowledge graphBloc Knowledge graph
- Issus de la base de connaissance Google
RECHERCHE UNIVERSELLE
Auteur : Sébastien Billard (s.billard@free.fr)
Actualités
Knowledge graph
ages web
Images
La recherche universelle consiste à
présenter dans la page de résultats
(SERP) par défaut des résultats
issus des divers moteurs de
recherche verticaux.
Objectif : « faire tomber les silos de
l'information qui existent sur le
web » (Marissa Mayer, 16/05/07)
Peuvent apparaître dans les SERP
en plus des pages web : actualités,
images, vidéo, blocs Knowledge
Graph…
La recherche universelle ne doit pas
être confondue avec les
enrichissement visuels via les
microformats (ex : cas des recettes
de cuisine).
RECHERCHE UNIVERSELLE
Auteur : Sébastien Billard (s.billard@free.fr)
Plusieurs critères concourent à la personnalisation et à la contextualisation des résultats :
Localisation de l'utilisateur
(IP, langue du navigateur)
Comportement de
l'utilisateur (recherches
précédentes, sites
préférés)
Saisonnalité, actualité
de la requête
Interface utilisée
(.com, .fr...)
Depuis 2019, les résultats de recherche sont personnalisés pour tout le monde, que les
utilisateurs soient loggés ou non.
LES OPERATEURS UTILES A LA RECHERCHE ET AU SEO
Auteur : Sébastien Billard (s.billard@free.fr)
Les guillemets, pour rechercher une chaine de caractères, ou un terme exact sans synonymie :
Le signe « - », pour exclure un mot, une expression ou un autre critère de recherche :
La commande « site: » pour chercher sur un TLD, un domaine, un sous-domaine, un répertoire :
La commande « filetype: » pour chercher un type de fichier donné :
« inurl: » et « allinurl: » pour chercher les pages dont l'URL contient une expression :
LES OPERATEURS UTILES A LA RECHERCHE ET AU SEO
Auteur : Sébastien Billard (s.billard@free.fr)
« intitle: » et « allintitle: » pour chercher les pages dont le <title> contient une expression :
« cache: » pour obtenir la version en cache d’une page :
« src: » pour chercher les images hébergées sur un domaine ou sous-domaine :
« OR » pour chercher l’un ou l’autre des termes :
Les parenthèses pour grouper des termes :
COMBINAISONS ET EXEMPLES CONCRETS
Auteur : Sébastien Billard (s.billard@free.fr)
Trouver des sites qui hotlinkent vos images :
Trouver les sous-domaine d’un domaine :
Trouver les sous-rayons d’un site e-commerce :
Trouver produits épuisés d’un site e-commerce :
LE SEARCH MARKETING EN GENERAL
Auteur : Sébastien Billard (s.billard@free.fr)
Auteur : Sébastien Billard (s.billard@free.fr)
QU'EST CE QUE LE SEARCH MARKETING ?
Il s'agit de l'ensemble des moyens permettant de rendre un site visible dans un contexte de
recherche sur le web :
Référencement naturel (SEO)
Liens sponsorisés (SEA)
Shopping feeds
(comparateurs)
Auteur : Sébastien Billard (s.billard@free.fr)
LES MOTS ONT LEUR IMPORTANCE
Le « Search Marketing » ou SEM ne désigne pas les seuls liens sponsorisés comme cela est
parfois présenté !
SEM=SEO+SEA+SF
Auteur : Sébastien Billard (s.billard@free.fr)
LA JUNGLE DES TERMINOLOGIES
Le jargon du Search comprend de nombreux synonymes :
REFERENCEMENT
NATUREL
LIENS
SPONSORISES« référencement » « SEO »
« référencement organique »
« searche engine optimization »
« positionnement publicitaire »
«SEA »
« PPC »
« pay per click »
« search engine advertising »
« référencement payant »
SHOPPING FEEDS
« shop bots »
« comparateurs de prix »
« products feeds »
Auteur : Sébastien Billard (s.billard@free.fr)
Référencement naturel (SEO)
Liens sponsorisés (SEA)Shopping feeds
REFERENCEMENT NATUREL
Auteur : Sébastien Billard (s.billard@free.fr)
- Visibilité dans les moteurs de recherche généralistes et portails
- L'indexation est automatique, sans action obligatoire de l'éditeur
- C'est le contenu des pages qui est indexé
- L'indexation est gratuite
- Pas de garantie de position (classement algorithmique en fonction de la pertinence)
LIENS SPONSORISES
Auteur : Sébastien Billard (s.billard@free.fr)
- Visibilité dans les moteurs de recherche généralistes, portails et site de contenu
- Il faut enchérir sur des expressions-clés pour être visible
- Modèle de paiement au clic, avec prix variable déterminé par enchères
- La position est dépendante de ce que l'annonceur est prêt à payer (principalement)
SHOPPING FEEDS
Auteur : Sébastien Billard (s.billard@free.fr)
- Visibilité dans les comparateurs de prix et sites de contenu affiliés
- C'est un flux XML qui est indexé (base produits)
- Visibilité uniquement si l'on paye
- Modèle de paiement au clic, avec prix fixé par forfait ou enchères
- La position est dépendante en partie de ce que l'annonceur est prêt à payer
LE MARCHE DU SEARCH MARKETING
Auteur : Sébastien Billard (s.billard@free.fr)
LE PAYSAGE DES MOTEURS DE RECHERCHE : EUROPE
Auteur : Sébastien Billard (s.billard@free.fr)
LE PAYSAGE DES MOTEURS DE RECHERCHE : USA
Auteur : Sébastien Billard (s.billard@free.fr)
LE PAYSAGE DES MOTEURS DE RECHERCHE : RUSSIE
Auteur : Sébastien Billard (s.billard@free.fr)
LE PAYSAGE DES MOTEURS DE RECHERCHE : CHINE
Auteur : Sébastien Billard (s.billard@free.fr)
LE PAYSAGE DES MOTEURS DE RECHERCHE : JAPON
Auteur : Sébastien Billard (s.billard@free.fr)
QUELQUES DONNEES CLES
Auteur : Sébastien Billard (s.billard@free.fr)
- 46,6 millions d'internautes soit 89% des français (Mediametrie, septembre 2017)
- 82,7% des internautes effectuent des achats en ligne (Fevad, juin 2017)
- 1 consommateur sur 2 effectue au moins un achat par mois sur internet (Ipsos media, janvier
2015)
- La recherche d'information est l'activité la plus pratiquée sur le web, devant le web (Insee, mai
2006)
- Les moteurs représentent de 30 à 40% du trafic d'un site en moyenne
- Plus de 90% des clics ont lieu sur les 3 premières pages de résultats (iProspect, avril 2006)
DISTRIBUTION DES CLICS SUR UNE PAGE DE RESULTATS
Auteur : Sébastien Billard (s.billard@free.fr)
Position = visibilité = trafic . Mais le taux de clic décroît rapidement avec la position…
DISTRIBUTION DES CLICS SUR UNE PAGE DE RESULTATS
Auteur : Sébastien Billard (s.billard@free.fr)
y = 29,498x-0,855
0
10
20
30
40
50
60
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
CTR
… y compris sur les requêtes hors-marque (génériques)
REPARTITION DES CLICS : SEO vs SEA
Auteur : Sébastien Billard (s.billard@free.fr)
D’après une étude Seomoz de
décembre 2017, les liens naturels
draineraient 20X plus de trafic que
les liens sponsorisés
LE TRAVAIL DU REFERENCEUR
Auteur : Sébastien Billard (s.billard@free.fr)
Auteur : Sébastien Billard (s.billard@free.fr)
LA PYRAMIDE DU REFERENCEMENT
L'ensemble de ces composantes doit être optimisé pour obtenir une bonne visibilité :
CONTENU
STRUCTURE
POPULARITE
Le code qui contient le site et le met en forme
Essentiellement le contenu textuel du site
Ce que le web dit de votre site via les liens
Crédibilise Favorise
Valorise Redistribue
Le travail de référencement va consister à activer chacun de ces leviers.
Auteur : Sébastien Billard (s.billard@free.fr)
LA PYRAMIDE DU REFERENCEMENT
Le référenceur va ainsi agir sur les différents étages de la pyramide, par de multiples actions.
Quelques exemples (liste non exhaustive) :
CONTENU
STRUCTURE
POPULARITE
Accessibilité technique
Soumission aux annuaires Réseaux spécifiques
Communiqués de presseRéseaux sociaux
Optimisation des textes
Micro contenus
Recherche de mots-clés
Architecture de l'information
Intitulés des liens
Distribution interne de la popularité
Formation des rédacteurs
Balisage sémantique
Duplication de contenu
Qualité du code
Noms de domaine
Link baiting
Auteur : Sébastien Billard (s.billard@free.fr)
LA PYRAMIDE DU REFERENCEMENT
Pour mener à bien sa mission, le référenceur va devoir développer un certain nombre de
compétences :
CE QUI EST PERMIS, CE QUI NE L’EST PAS
Auteur : Sébastien Billard (s.billard@free.fr)
BONNES PRATIQUES PRONEES PAR LES MOTEURS
Auteur : Sébastien Billard (s.billard@free.fr)
Source : https://support.google.com/webmasters/answer/35769?hl=fr
PRATIQUES INTERDITES PAR LES MOTEURS
Auteur : Sébastien Billard (s.billard@free.fr)
- Systèmes de liens pour améliorer artificiellement la popularité
- Textes et liens cachés
- Cloaking et redirections trompeuses
- Mots-clés sans rapport avec le site
- Répétition abusives de mots-clés
- Contenus dupliqués dans le seul but de mieux se positionner
- Pages satellites
- Requêtes automatisées
SYSTEMES DES LIENS ARTIFICIELS
Auteur : Sébastien Billard (s.billard@free.fr)
Les private blog networks (PBN)
sont à la mode mais ne sont pas
appréciés des moteurs….
L’achat de liens (si découvert)
est également sanctionné
De même que les échanges
automatisés de liens
TEXTES ET LIENS CACHES
Auteur : Sébastien Billard (s.billard@free.fr)
Un snippet a priori pertinent,
quoique suspect...
Tiens ! Aucun
contenu visible...
L'examen du code source montre du texte caché
grâce à la balise <noembed>, texte qui plus est
visiblement écrit à destination des moteurs.
TEXTES ET LIENS CACHES
Auteur : Sébastien Billard (s.billard@free.fr)
Un site très ordinaire...
Mais la désactivation des CSS montre
des textes cachés visiblement
optimisés pour les moteurs
TEXTES ET LIENS CACHES : PRINCIPALES TECHNIQUES
Auteur : Sébastien Billard (s.billard@free.fr)
- Insertion dans balises <noframe>, <noscript>, <noembed>
- Utilisation d'une couleur de police similaire à celle du fond (via HTML ou CSS)
- Utilisation des propriétés CSS visibility:hidden et display:none
- Positionnement CSS hors de l'écran (coordonnées négatives)
CLOAKING
Auteur : Sébastien Billard (s.billard@free.fr)
Cloaking pour la bonne cause : le
site fournit un contenu différent en
mobile et en desktop
Mais la même technique pourrait
être utilisée pour tricher, par ex par
insertion de contenu invisible pour
les visiteurs humains
2 FORMES DE CLOAKING (+1)
Auteur : Sébastien Billard (s.billard@free.fr)
- IP delivery : le contenu affiché est déterminé en fonction de l'adresse IP du visiteur (IP d'un
moteur ? IP d'un FAI ?)
- User-agent delivery : le contenu est affiché en fonction de l'user-agent du visiteur (navigateur
desktop ? Navigateur mobile ? Googlebot ?)
- Cloaking sur referer : le contenu est affiché en fonction de la provenance du visiteur. Pas
d'utilité pour spammer, les moteurs ne transmettant pas de referers. Mais d'autres utilités...
PAGES SATELLITES
Auteur : Sébastien Billard (s.billard@free.fr)
Pas de redirection, pas de texte caché,
mais un contenu visiblement pensé pour
les seuls moteurs
REDIRECTIONS TROMPEUSES
Auteur : Sébastien Billard (s.billard@free.fr)
Un listing d'apparence ordinaire...
Mais la page renvoie
automatiquement vers
l'accueil du site
La désactivation de javascript
montre une page satellite, avec
texte caché par CSS, comprenant
une redirection javascript
REQUETES AUTOMATISEES
Auteur : Sébastien Billard (s.billard@free.fr)
Les moteurs n’apprécient pas les
requêtes automatisées
Mais il faut bien avouer qu'elle
peuvent être utiles au référenceur :).
QUELQUES PISTES POUR DETECTER LE SPAM
Auteur : Sébastien Billard (s.billard@free.fr)
- Contenu camouflé : Ctrl+A, et scrolling
- Contenu caché : examen du code source
- Redirections : désactivation de javascript (barre d'outils Web Developer pour Chrome)
- Répétitions abusives et mots-clés hors propos : lire !
- Cloaking sur user-agent : simulation de l'user agent d'un moteur (extension User agent
switcher pour Firefox)
- Cloaking sur IP : cache Google (rare), affichage dans Google Translate ou Google Analytics
(synthèse données/site)
- Réseaux de liens artificiels : analyse des liens
OPTIMISATION STRUCTURELLE POUR
LE REFERENCEMENT
Auteur : Sébastien Billard (s.billard@free.fr)
RAPPEL : LA PYRAMIDE DU REFERENCEMENT
Auteur : Sébastien Billard (s.billard@free.fr)
L'ensemble de ces composantes doit être optimisé pour obtenir une bonne visibilité :
CONTENU
STRUCTURE
POPULARITE
Le code qui contient le site et le met en forme
Essentiellement le contenu textuel du site
Ce que le web dit de votre site via les liens
Crédibilise Favorise
Valorise Redistribue
On va travailler aujourd'hui sur
cet étage (ou plutôt les fondations...)
ROLES DE L'OPTIMISATION STRUCTURELLE
Auteur : Sébastien Billard (s.billard@free.fr)
L'optimisation de la structure d'un site pour le référencement vise à satisfaire deux objectifs :
- A minima, assurer l'indexabilité du site par les robots d'indexation (accessibilité technique)
- Mettre en valeur le contenu pour un traitement optimal par les moteurs
CE QUI PEUT BLOQUER LES ROBOTS
Auteur : Sébastien Billard (s.billard@free.fr)
- Contenus au format Flash
- Contenus dans des formats tiers nécessitant l'installation d'un plugin (Flash, Silverlight...)
- Scripts javascript
- Scripts Ajax (javascript et XML)
- Contenus accessibles uniquement au travers d'un formulaire
- Fichiers robots.txt
CE QUI PEUT COMPLIQUER LE TRAVAIL DES MOTEURS
Auteur : Sébastien Billard (s.billard@free.fr)
- Contenus sous forme d'images
- Mauvais usage des balises sémantique (ou absence d'usage)
- Contenus dupliqués
- Méthodes de redirections non adaptées
- Contenu délivrés en fonction de l'user-agent ou de l'adresse IP
- Splash pages
- Frames (cadres)
VOIR LE WEB COMME UN ROBOT
Auteur : Sébastien Billard (s.billard@free.fr)
VOIR LE WEB COMME UN ROBOT : GRANDS PRINCIPES
Auteur : Sébastien Billard (s.billard@free.fr)
Une bonne façon d'appréhender la structure d'un site ou d'une page, outre l'examen du code,
est de se mettre dans la peau d'un robot, c'est-à-dire de naviguer avec les même limitations :
- Pas d'images (utilisation des attributs alt à la place)
- Pas de mise en forme (CSS)
- Pas de javascript
- Pas de Flash
- Pas de format tiers (Silverlight, Quicktime etc.)
- Lecture dans l'ordre du code (linéarisation)
- Pas de cookies
- Eventuellement en changeant son agent-utilisateur
VOIR LE WEB COMME UN ROBOT : LYNX
Auteur : Sébastien Billard (s.billard@free.fr)
Ouvrir une URL : "g"
Activer des liens : "↓" et "↑"
Défiler : "espace"
Cliquer : "entrée"
Page prec/suiv : "←" et "→"
Source : ""
Aide : "?"
Télécharger : https://www.cygwin.com/ (installer le package Lynx)
VOIR LE WEB COMME UN ROBOT : WEB DEVELOPER (CHROME)
Auteur : Sébastien Billard (s.billard@free.fr)
On désactive javascript…
… les cookies…
… les CSS…
… on remplace les images par
leurs attributs alt…
… et on linéarise la page
VOIR LE WEB COMME UN ROBOT : WEB DEVELOPER (CHROME)
Auteur : Sébastien Billard (s.billard@free.fr)
Rendu standard
navigateur
Rendu robots
VOIR LE WEB COMME UN ROBOT : CACHE GOOGLE
Auteur : Sébastien Billard (s.billard@free.fr)
La commande « cache: » dans Google permet
d’accéder à la dernière version indexée par le moteur
L’option « version en texte
seul » permet de voir la
page comme la voit le robot
CE QUI PEUT BLOQUER LES ROBOTS
Auteur : Sébastien Billard (s.billard@free.fr)
FLASH
Auteur : Sébastien Billard (s.billard@free.fr)
- Flash n'est à l'origine pas un outil de publication, mais d'animation.
- Flash nécessite un plugin pour être lu (Flash Player). Ce n'est pas un standard du web, même
si son usage est très répandu.
- Flash n'est pas correctement lu par les moteurs, même s'ils arrivent à extraire quelques
informations, car l’information y est mal structurée et contenue le plus souvent dans un fichier
unique. D’ailleurs Google ne remonte plus aujourd’hui de fichiers swf dans ses résultats
(commande filetype:swf)
- Il faut donc encore aujourd'hui considérer Flash comme étant totalement inaccessible (et
l'indexation éventuelle comme un bonus).
L'indexation de Flash pose / posait
de nombreux problèmes...
SITE 100% FLASH UN EXEMPLE
Auteur : Sébastien Billard (s.billard@free.fr)
Ce que voit l'utilisateur
(s'il a Flash)
Ce que voit le moteur
(c'est à dire pas grand chose)
Tout le site est inclus dans un fichier
Flash (swf), non lisible par les moteurs
OPTIMISATION DES CONTENUS FLASH : APPROCHES POSSIBLES
Auteur : Sébastien Billard (s.billard@free.fr)
- Ne pas construire de sites 100% Flash. Par contre l'inclusion d'éléments Flash dans des sites
majoritairement en HTML, avec du contenu autour, est parfaitement possible.
- Construire deux versions, une Flash, une HTML. Problème : la version Flash devient inutile
puisque c'est la version HTML qui sera la mieux référencée, et donc la plus visitée au final.
- Fournir un contenu alternatif : pis-aller pour un site Flash ordinaire (URL unique), intéressant
pour les sites Flash à plusieurs URLs. La méthode la plus connue est swfObject
(http://code.google.com/p/swfobject/).
<script type="text/javascript" src="swfobject.js"></script>
<div id="flashcontent">
Texte alternatif, visible pour les utilisateurs sans Flash ou sans javascript, ainsi que pour les moteurs
</div>
<script type="text/javascript"> var so = new SWFObject("flash.swf", "flash", 200, 100, 7, "#336699");
so.write("flashcontent");
</script>
Exemple d'utilisation de
SWFObject
JAVASCRIPT
Auteur : Sébastien Billard (s.billard@free.fr)
- Javascript est un langage de programmation interprété coté client (c'est le navigateur qui
exécute le code, pas le serveur).
- Javascript n'est pas interprété par les moteurs, même si des chaines de caractères comme
des URLs peuvent être extraites du code javascript et même si certains codes très spécifiques
peuvent être interprétés au cas par cas. (il faut d’ailleurs bien penser à crypter son code quand
on veut cacher des liens à Google...)
- Il est souvent possible d'utiliser Javascript tout en restant accessible (concept de dégradation
élégante ou d'amélioration progressive).
- Les applications de Javascript les plus problématiques pour le référencement sont
typiquement les menus, les pop-ups, les contenus AJAX et les lazy-loads.
EXEMPLES DE JAVASCRIPTS ACCESSIBLES ET NON-ACCESSIBLES
Auteur : Sébastien Billard (s.billard@free.fr)
Un clic sur ce lien ouvre
un pop-up, grâce à
javascript...
Ce popup reste accessible
aux moteurs et visiteurs, car
le code javascript vient en
surcouche de HTML
<a href = "javascript:ouvreFenetre(‘http://s.billard.free.fr/radio.blog/index.php', 300, 222)">FS Radio (popup)</a>
Ce code aurait été inaccessible
REFERENCEMENT ET JAVASCRIPT : APPROCHES POSSIBLES
Auteur : Sébastien Billard (s.billard@free.fr)
- Ne pas rendre la navigation d'un site dépendant de javascript : cela garantie un minimum
d'accessibilité pour les moteurs, comme pour les visiteurs.
- Pour être accessible, javascript doit venir en surcouche de HTML, pas en remplacement de
celui-ci.
- Si un menu javascript inaccessible ne peut être modifié, intégrer des liens alternatifs HTML
qui seront suivis par les robots. Cela peut être fait dans le contenu lui-même, dans la balise
<noscript>, dans le footer, dans un plan de site...
FORMULAIRES
Auteur : Sébastien Billard (s.billard@free.fr)
- Les moteurs ne savent par remplir un formulaire, ni sélectionner un élément, ni cliquer sur un
bouton radio.
- Seuls les résultats de type GET (avec paramètres passé dans l'URL) sont potentiellement
indexables.
- La méthode POST ne permet pas l'indexation, car le résultat du formulaire ne peut être
rappelé via une URL (l'URL résultante est toujours la même).
FORMULAIRES : EXEMPLE
Auteur : Sébastien Billard (s.billard@free.fr)
Hormis quelques liens vers les
recettes les plus populaires...
...la seule façon d'accéder à
l'intégralité du contenu était
de renseigner un formulaire
Une navigation alternative
a été proposée
FORMULAIRES : OPTIMISATIONS POSSIBLES
Auteur : Sébastien Billard (s.billard@free.fr)
- Ne pas utiliser de formulaires comme moyen unique de navigation si le site doit être indexé.
- Utiliser la méthode GET (paramètres passé dans l'URL), et non pas POST.
- Permettre une navigation arborescente alternative, utilisant des liens HTML.
Exemple d'arborescence
proposée pour un site de cuisine
ROBOTS.TXT
Auteur : Sébastien Billard (s.billard@free.fr)
- Ce protocole sert à restreindre volontairement l'indexation d'un site par les robots. Il y a de très
bonnes raisons de ne pas souhaiter l'indexation de certaines pages (prévention du duplicate
content, contenu inutiles...)
- On oublie parfois d'enlever le fichier robots.txt lors d'une mise en ligne, ou bien on se trompe
dans la syntaxe d'où des cas de non-indexation ou desindexation involontaires.
- Le fichier est un simple fichier texte. Il se place obligatoirement à la racine du site. Ex:
http://www.site.fr.robots.txt ou http://sous-domaine.site.fr/robots.txt.
- Le fichiers robots.txt n'est pas une protection contre les intrusions. Il n'empêche pas l'accès aux
pages. Les robots peuvent décider ou non de respecter le protocole (mais les moteurs courants
respectent tous les directives robots.txt).
- Attention à ne pas oublier le « s » à « robots » !
ROBOTS.TXT : SYNTAXE
Auteur : Sébastien Billard (s.billard@free.fr)
#commentaire#
User-agent: *
Disallow: /repertoire_un/
Disallow: /repertoire_deux/fichier.html
Disallow: *.xml
L’user-agent spécifie à quel(s) robot(s) s'adressent
les directives. Le wildcard (*) signifie tous les robots.
On aurait pu spécifier « Googlebot ». On peut
donner des instructions différentes selon les robots.
Le dièse permet d’insérer
des commentaires ou de
désactiver des instructions
sans les supprimer
Le disallow spécifie les
répertoires ou fichiers
interdits d'indexation
En savoir plus : http://www.robotstxt.org/
Le wildcard est accepté par les moteurs
majeurs pour les noms de fichiers, même si
cela ne fait pas partie du protocole originel
CE QUI PEUT COMPLIQUER LE
TRAVAIL DES MOTEURS
Auteur : Sébastien Billard (s.billard@free.fr)
IMAGES
Auteur : Sébastien Billard (s.billard@free.fr)
- Les moteurs ne savent pas lire les images. Toute information contenue dans une image non
optimisée peut être considérée comme inexistante pour les moteurs.
- Toute image porteuse d'information devrait être dotée d'un attribut alt pertinent, idéalement de
moins de 80 caractères (taille non critique).
- Les images décoratives devraient comporter un attribut alt vide.
- Une image peut être balisée sémantiquement, par exemple être intégrée dans une balise <hn>
s'il s'agit d'un titre en image.
- Un texte HTML est en général jugé plus efficace pour le référencement qu'un texte en image
doté d'un attribut alt.
<img src="logo-idemm.gif" alt="IDEMM – Ingénierie Documentaire, Edition et Mediation Multimedia " />
Exemple d'image dotée d'un
attribut alt pertinent
BALISAGE SEMANTIQUE
Auteur : Sébastien Billard (s.billard@free.fr)
- Les balises sémantiques servent à définir la fonction, le « sens », de chaque élément dans le
contenu.
- Certaines balises sémantiques se voient reconnaître un poids plus fort par les moteurs de
recherche : balises de titre (<hn>), emphases (<strong>)...
- Il faut utiliser les balises pour leur fonction, et non pas pour leur impact supposé sur le
référencement, ou leur rendu graphique (pas de détournement de balise !).
- Le détournement de balise est souvent contre-productif. Les poids sont relatifs : si tout est
balisé comme un titre, il n'y a alors plus de titre.
- Un certain nombre de balises sémantiques n'ont a l'heure actuelle pas une grande utilité pour le
référencement. Ce qui ne veut pas dire qu'il ne faut pas les utiliser, ni qu'elles ne seront jamais
prises en compte.
Spécifications HTML 4 en français : http://www.la-grange.net/w3c/html4.01/cover.html
Spécifications HTML 5 en anglais : https://www.w3.org/TR/html5/sections.html
DES BALISES MOINS UTILES (POUR LE REFERENCEMENT )
Auteur : Sébastien Billard (s.billard@free.fr)
Source : http://www.minet.net/spip/IMG/pdf/FichePratiqueHtmlSemantique-2-2-2.pdf
BALISAGE SEMANTIQUE : EXEMPLE DE RECOMMANDATIONS
Auteur : Sébastien Billard (s.billard@free.fr)
COMMENT BALISER LES ELEMENTS DUNE PAGE WEB ?
Auteur : Sébastien Billard (s.billard@free.fr)
- Un logo-titre : rien, ou <h1> (différentes opinions sur le sujet, rien semble préférable)
- Un titre ou un sous-titre : <h1>, <h2>, <h3>...
- Un bloc de texte : <p> (peut être considéré comme la balise par défaut)
- Un passage important, ou un chapô : <strong> (cette balise peut être incluse dans une autre,
par ex <p>)
- Une énumération non ordonnée (bullet points, tirets) : <ul>
- Une énumération ordonnée : <ol>
- Les liens d'un menu : <ul> (car un menu est une liste de liens)
TESTER LE BALISAGE SEMANTIQUE : LES OUTILS
Auteur : Sébastien Billard (s.billard@free.fr)
« Examiner l’élément » dans Firefox
ou « inspecter » dans Chrome
« Display element information »
dans l’extension Web developer
DUPLICATION DE CONTENU
Auteur : Sébastien Billard (s.billard@free.fr)
- Les moteurs de recherche sont des bases de données, et font donc la chasse aux doublons.
- Quand un même contenu est disponible sur plusieurs URLs, les moteurs vont en général
favoriser une URL. La loi de Murphy étant universelle, ce sera rarement la bonne ;)
- La duplication de contenu peut diluer la popularité, celle-ci se répartissant entre les différentes
URLs au lieu de se concentrer sur une seule.
- La duplication peut être complète, ou partielle (near duplicate).
SOURCES COURANTES DE DUPLICATION
Auteur : Sébastien Billard (s.billard@free.fr)
- Noms de domaines multiples (contenu visible sur un .fr et un .com, ou sur plusieurs domaines).
- Non canonisation des domaines (site accessible avec et sans « www »)
- Identifiants de sessions passé dans les URLs.
- Mauvaise gestion de la réécriture d'URLs (absence de redirection 301)
- Inversion de l'ordre des paramètres dans les URLs.
- Pages d'impression.
Mauvaise canonisation
Identifiants de session
Pages d'impression
EVITER LA DUPLICATION DE CONTENU
Auteur : Sébastien Billard (s.billard@free.fr)
- Utiliser un seul nom de domaine, et rediriger les autres vers celui-ci, via des redirections 301.
- Canonisation : faire en sorte qu'une seule version d’URL soit accessible, en redirigeant les
autres vers la première, via une redirection 301.
- Eviter les identifiants de session passé dans les URLs. Préférer l'identification par cookies.
- URL rewriting : toujours rediriger la version non-réécrite vers la version réécrite, via une
redirection 301.
- Inversion de l'ordre des paramètres dans les URLs : faire attention :) Trier les paramètre par
ordre alphabétique peut aider.
- Pages d'impression : interdire leur indexation par robots.txt, ou meta tags.
- Eventuellement : utiliser la balise <link> rel=canonical. Attention cette balise est une indication,
pas une directive. Les moteurs peuvent décider de les ignorer dans certains cas (rare).
EVITER LA DUPLICATION DE CONTENU : 301 ET REL=CANONICAL
Auteur : Sébastien Billard (s.billard@free.fr)
URL actuelleAncienne URL
301
Ok ! j'indexe l'URL
actuelle et lui transfère
le « linkjuice » des
anciennes URLs
URL canoniqueContenu dupliqué
rel=canonical
Ok ! j'indexe l'URL
canonique et lui
transfère le « linkjuice »
des versions dupliquées
La balise link rel=canonical s'insère dans le <head> des documents. Ne pas interdire
l'indexation sinon la balise ne pourra être prise en compte. Syntaxe :
<link rel="canonical" href="http://www.site.fr/version-canonique.html" />
REDIRECTIONS
Auteur : Sébastien Billard (s.billard@free.fr)
- Seules les redirections coté serveur (redirections HTTP) sont suivies par les moteurs. Elles
peuvent être gérée au niveau du serveur (.htaccess, mod_rewrite) ou du code des pages (header
en PHP).
- Les redirections à base de javascript ou de balises meta refresh sont à éviter.
- Parmi les redirections coté serveur, seules les redirections 301 (permanentes) transmettent
correctement la popularité et permettent une bonne indexation des pages. Eviter les redirections
302 (temporaires) pour des redirections définitives.
- Les redirections successives sont à éviter autant que possible, même les 301.
<meta http-equiv="refresh" content="0;url=http://www.site.fr/" />
<script type="text/javascript">
<!--
window.location = "http://www.site.fr/"
//-->
</script>
Exemple de redirection javascript,
à placer dans le <head>
Exemple de redirection utilisant
la balise meta refresh
COMPORTEMENT DES MOTEURS FACE AUX REDIRECTIONS 301 ET 302
Auteur : Sébastien Billard (s.billard@free.fr)
URL de destinationURL de base
302
Ok ! J'indexe le contenu
de l'URL actuelle mais
garde l'ancienne adresse.
Mon linkgraph reste le
même
URL de destinationAncienne URL
301
Ok ! j'indexe l'URL
actuelle et lui transfère le
« linkjuice » des
anciennes URLs
TESTER UNE REDIRECTION : LES OUTILS
Auteur : Sébastien Billard (s.billard@free.fr)
Outil « réseau » de Firefox
Screaming Frog SEO spider
en mode « list »
Extension « link redirect
trace » pour Firefox
TESTER LES REPONSES HTTP D’UN SITE : LES OUTILS
Auteur : Sébastien Billard (s.billard@free.fr)
Screaming Frog SEO spider en
mode « spider » (500 URLs max
dans la version gratuite)
NEGOCIATION DE CONTENU ET « CLOAKING » NON MALICIEUX
Auteur : Sébastien Billard (s.billard@free.fr)
- Il est possible de personnaliser le contenu d'une page en fonction de la localisation de
l'utilisateur, ou de sa langue. Cela peut poser des problèmes en matière de référencement, pour
trois raisons :
- L'adresse IP d'un robot d'indexation n'est en général pas localisée dans la même région que
vos visiteurs cibles.
- Les robots d'indexation ne déclarent pas de langage.
- Plusieurs versions d'un contenu vont se partager une URL unique, une seule version sera donc
indexée.
Mieux vaut donc éviter en général la négociation de contenu, et proposer à l'utilisateur de
sélectionner la langue et/ou le pays de son choix.
STRUCTURATION DES SITES INTERNATIONAUX (LOCALISATION)
Auteur : Sébastien Billard (s.billard@free.fr)
- Les extensions locales sont souvent favorisées par les versions locales des moteurs. Des
domaines séparés avec TLD locaux (.fr, .be, .co.uk...) sont donc la solution à préférer.
- Si certains TLD locaux ne sont pas disponibles, envisager un domaine avec extension
internationale (.com...). Le nom de domaine peut comporter un indicateur de localisation, par ex
: nom-societe-usa.com. Si possible utiliser les codes ISO 3166-1.
- Si tous les sites doivent être hébergés sur un domaine unique, bien séparer les versions
locales, par des sous-domaines (ex : usa.societe.com) ou par des répertoires (ex :
www.societe.com/usa/).
- Les sous-domaines sont préférables, car il est plus facile d'effectuer des actions de
référencement spécifiques.
Codes internationaux ISO : https://fr.wikipedia.org/wiki/ISO_3166-1
STRUCTURATION DES SITES INTERNATIONAUX (LANGUE)
Auteur : Sébastien Billard (s.billard@free.fr)
- La langue des documents est déterminée automatiquement par les moteurs de recherche, en
fonction des termes présents dans le contenu.
- L'attribut « lang » n'est pas pris en compte par les principaux moteurs.
OPTIMISATION EDITORIALE
POUR LE REFERENCEMENT
Auteur : Sébastien Billard (s.billard@free.fr)
RAPPEL : LA PYRAMIDE DU REFERENCEMENT
Auteur : Sébastien Billard (s.billard@free.fr)
L'ensemble de ces composantes doit être optimisé pour obtenir une bonne visibilité :
CONTENU
STRUCTURE
POPULARITE
Le code qui contient le site et le met en forme
Essentiellement le contenu textuel du site
Ce que le web dit de votre site via les liens
Crédibilise Favorise
Valorise Redistribue
On va travailler aujourd'hui sur ce qui
est au coeur du web : le contenu !
ROLE DE L'OPTIMISATION EDITORIALE
Auteur : Sébastien Billard (s.billard@free.fr)
- L'optimisation éditoriale vise à satisfaire un double objectif : être trouvé, et être lu.
- Il ne s'agit pas d'arbitrer entre utilisateurs et moteurs : il est parfaitement possible d'écrire des
textes efficaces aussi bien pour les moteurs que pour les visiteurs.
- Les bonnes pratiques d'optimisation éditoriale pour le référencement vont dans le sens d'une
meilleure accessibilité et d'une meilleure ergonomie des contenus, d'où une plus grande
satisfaction et de meilleures conversions.
Ecrire pour les
moteurs c'est
nul !
Oui mais non : il s'agit
d'écrire avant tout pour
les utilisateurs, tout en
prenant les moteurs en
compte !
SPECIFICITES DE LA LECTURE SUR LE WEB
Auteur : Sébastien Billard (s.billard@free.fr)
SPECIFICITES DE LA LECTURE SUR LE WEB
Auteur : Sébastien Billard (s.billard@free.fr)
- L’œil accorde instinctivement plus d’importance à certaines zones. Patterns souvent en « F » ou
en « E » (mais pas toujours).
- Le regards se pose d’abord sur les éléments de navigation (menus, liens…) puis seulement
après sur les images.
- Le contenu est d’abord scanné, puis ensuite lu (éventuellement).
- Les internautes lisent ! Parfois plus même que sur papier.
- L’efficacité d’un texte est plus grande quand le langage utilisé est simple, concis, scannable et
objectif.
LECTURE EN « F » OU EN « E »
Auteur : Sébastien Billard (s.billard@free.fr)
Il s'agit d'une tendance, pour des pages, homogènes essentiellement textuelles. S'il y a bien une
lecture en triangle à l'échelle d'une population d'internautes, ce n'est pas forcement le cas au
niveau de l'individu.
Source : http://www.useit.com/alertbox/reading_pattern.html
LECTURE EN « F » OU EN « E »
Auteur : Sébastien Billard (s.billard@free.fr)
L'insertion d'éléments rompant le rhytme des pages relativise par exemple le principe de lecture
en « F » :
Source : http://searchengineland.com/eye-tracking-on-universal-and-personalized-search-12233
Résultats classiques (2006)
La saillance influe sur
le parcours de l'oeil
Résultats universels
LE REGARD SE POSE D'ABORD SUR LES ELEMENTS DE NAVIGATION
Auteur : Sébastien Billard (s.billard@free.fr)
Visionner : http://www.youtube.com/watch?v=lo_a2cfBUGc
Les images attirent bien
moins l'attention qu'on ne
pourrait le penser
LES INTERNAUTES SCROLLENT, ET LISENT
Auteur : Sébastien Billard (s.billard@free.fr)
Les internautes n'hésitent pas à faire défiler le contenu des pages :
Source : Source : http://blog.clicktale.com/?p=19
LES CONTENUS WEB ET LEUR OPTIMISATION
Auteur : Sébastien Billard (s.billard@free.fr)
DIFFERENTES FORMES DE CONTENU
Auteur : Sébastien Billard (s.billard@free.fr)
Quand on parle de « contenus » en matière de SEO, on parle essentiellement des textes :
De toute façon les contenus non-textuels pour être visibles dans les moteurs doivent être décrits avec...
du texte.)
Textes HTML ordinaires
Balises <title>
Balises <meta> description
Attributs alt
NOTIONS DE DENSITE DES MOTS-CLES
Auteur : Sébastien Billard (s.billard@free.fr)
- Quelle couleur peut-on associer au carré de gauche ? à celui de droite ?
- Pour qu'une page soit jugée pertinente pour une expression donnée, il faut que cette
expression et ses variantes apparaissent un certain nombre de fois dans son contenu. On parle
« d'occurences », ou de « densité » (A noter que la densité est une abstraction, et n'est pas
utilisée en tant que tel par les moteurs. La densité idéale n'existe pas).
- Les expressions-clés visées doivent apparaître dans la page, en particulier dans les zones
chaudes (balises <title>, titres, ancres des liens...).
- Il est bon de multiplier les occurrences et variations (expressions connexes, genre, nombre etc.)
- Restez naturel ! Les répétitions abusives sont suspectes et altèrent la lisibilité.
EXEMPLE DE MAUVAISE GESTION DE LA DENSITE
Auteur : Sébastien Billard (s.billard@free.fr)
F490 : 12x
iPhone : 6x
Tactile : 6x
SGH : 4x
Mobile : 3x
Téléphone : 0x
Portable : 0x
LES ZONES CHAUDES D’UNE PAGE
Auteur : Sébastien Billard (s.billard@free.fr)
Balise <title>
Titraille
Liens
Textes standards
LES ZONES CHAUDES D’UNE PAGE
Auteur : Sébastien Billard (s.billard@free.fr)
- Balise <title> : stratégique pour le positionnement ! Longueur idéale théorique de 40 à 80
caractères (environ 75 caractères max affichés par Google). Mais on peut faire plus long si
nécessaire. Tout son contenu sera pris en compte par Google, même s’il est visuellement
tronqué. Doit être unique, riche en mots-clés et décrire précisément le contenu de la page.
- Titraille : doit être balisée comme telle (<hn>). Ce peut être un mot, une phrase, mais pas un
paragraphe. Doit introduire le contenu qui suit immédiatement en dessous.
- Liens : leur intitulé est spécialement important pour le positionnement de la page de destination
du lien. Un lien doit être explicite, c'est-à-dire permettre de deviner ce dont parle la page de
destination sans même la consulter. Il est donc important d'y faire figurer les mots-clés
stratégiques. Attentions aux intitulés génériques (« en savoir plus », « suite » etc.)
- Corps du texte : doit contenir vos expressions-clés, plus que pas assez, mais moins que trop ;)
Favoriser un langage clair. Parlez le langage de vos visiteurs.
PARLEZ LE LANGUAGE DE VOS VISITEURS
Auteur : Sébastien Billard (s.billard@free.fr)
- Ne parlez pas votre langue : parlez la leur ! C’est avec leurs mots que les internautes
recherchent dans les moteurs, pas avec les vôtres.
- Utilisez un langage simple et clair, favorisez les mots communs. Evitez le jargon marketing, les
termes métier (sauf si vous vous adressez à des professionnels).
- Recherchez les bons mots-clés (outils de suggestions, communautés…)
"Le groupe X réunit 39 000 personnes dans 36 pays. Son réseau mondial de
services lui permet d’être concurrentiel sur un marché mondialisé [...]
Européen, le modèle X ne propose pas de solution toute faite aux entreprises
mais prend en compte leurs spécificités afin de leur proposer des services
adaptés à leur culture et à leurs enjeux. Par ailleurs, la multiculturalité du
groupe permet aux collaborateurs de X de s’enrichir des expériences et des
best practices présentes dans l’ensemble des implantations afin de faire
bénéficier à leurs clients de la maturité du groupe en termes d’expérience et
d’offre [...] Parce que l’Homme tient une place particulièrement importante dans
l’entreprise, X se donne pour mission d’offrir à ses clients des solutions
innovantes en conjuguant talents et technologies. Les collaborateurs se
reconnaissent dans trois valeurs clés : innover, s’engager et être ouvert."
En savoir plus sur le langage clair :
http://btb.termiumplus.gc.ca/redac-chap?lang=fra&lettr=chapsect10&info0=10
PARLEZ LE LANGUAGE DE VOS VISITEURS : EXEMPLES
Auteur : Sébastien Billard (s.billard@free.fr)
Rachète ? Achète ?
Autorise ?
Logiciels ? Applications ?
Logiciels ?
PARLEZ LE LANGUAGE DE VOS VISITEURS : EXEMPLES
Auteur : Sébastien Billard (s.billard@free.fr)
Spécialistes de la peinture en trompe l’œil ?
Formations Castorama ?
Conseils pour bien ranger sa maison ?
Décoration style années 50 ?
Murs végétalisés ?
PARLEZ LE LANGUAGE DE VOS VISITEURS : EXEMPLES
Auteur : Sébastien Billard (s.billard@free.fr)
Un texte très abstrait
proposé aux visiteurs…
Le contenu alternatif par
contre lui est très concret ;)
TROUVER LES BONS MOTS-CLES
Auteur : Sébastien Billard (s.billard@free.fr)
- Faites appel à votre bon sens, faites preuve d'empathie.
- Brainstormez, observez les sites concurrents pour vous en inspirer (pas pour copier).
- Observez comment s'expriment vos visiteurs (communautés, moteurs de recherche internes,
questions aux intéressés…)
- Utilisez Google Trends, Ubersuggest…
- Utilisez les outils de suggestion de mots-clés des régies de liens sponsorisés telles que
Adwords.
TROUVER LES BONS MOTS-CLES : UNE METHODE
Auteur : Sébastien Billard (s.billard@free.fr)
Brainstorm
Données Google suggest
Etude des concurrents
Etudes des communautés
1ère liste de
mots-clés
Google Adwords
(volumes de
recherches et
nouvelles
suggestions)
Liste finale
de mots-clés
Optionnel : étude de
saisonnalité avec
Google trends
UN RUBRIQUAGE ORIENTE MOTS-CLES
Auteur : Sébastien Billard (s.billard@free.fr)
- Plus de contenu = plus de visibilité potentielle (effet longue traîne)
- 1 thème = 1 page (voire plusieurs)
- Associer 1 à 5 expressions-clés à chaque page, qui guideront son optimisation (charte de mots-
clés)
ABONDANCE DE CONTENU NE NUIT PAS
Auteur : Sébastien Billard (s.billard@free.fr)
Développer son contenu enrichit le champ lexical global du site et permet de développer un trafic
de longue traîne, où les mots-clés rares vont souvent représenter la plus grosse partie du trafic :
5 premiers mots-clés : 16% du trafic
20 premiers : 25%
100 premiers : 40%
250 premiers : 50%
1000 premiers : 65%
5000 premiers : 81%
10000 premiers : 87%
Total de 21568 mots-clés analysés
LA PYRAMIDE INVERSEE (FRONT LOADING)
Auteur : Sébastien Billard (s.billard@free.fr)
- Enoncez d'abord les faits essentiels pour ensuite détailler vos contenus (message le plus
important en premier).
- Les mots-clés visés doivent apparaître dès les premières phrases : cela est bon pour les
utilisateurs comme pour les moteurs.
INFORMATION PRINCIPALE
(reprise dans le <title>)
DEVELOPPEMENT DE L'INFORMATION PRINCIPALE
INFORMATIONS DE MOINDRE IMPORTANCE
5W+2H
Informations principales
Développement
Informations secondaires
LA PYRAMIDE INVERSEE : EXEMPLE
Auteur : Sébastien Billard (s.billard@free.fr)
Pour être efficace, sauf si vous êtes conteur ou romancier, évitez ce type d’introduction :
"Il était une fois une petite fille de village, la plus jolie qu’on eût su voir ; sa mère en était folle, et
sa mère-grand plus folle encore. Cette bonne femme lui fit faire un petit chaperon rouge, qui lui
seyait si bien, que partout on l'appelait le Petit Chaperon rouge... "
Préférez au contraire ceci :
"Une petite fille se fait dévorer par un loup usant de malice alors qu'elle allait porter des galettes
et du beurre à sa mère-grand, elle aussi victime de l'animal".
LES 5W+2H (OU QQOQP+CC)
Auteur : Sébastien Billard (s.billard@free.fr)
Ces questions peuvent vous aider à déterminer quelles informations sont les plus importantes. Il
ne s'agit pas de répondre systématiquement à chacune d'entre elles. Tout est question de
contexte.
- Who (qui ?)
- What (quoi ?)
- When (quand ?)
- Where (où ?)
- Why (pourquoi ?)
- How (comment ?)
- How much (combien ?)
UNE TITRAILLE PRESENTE ET PERTINENTE
Auteur : Sébastien Billard (s.billard@free.fr)
- Titraille = titre + sous-titres (avec balises <h1> à <h6>)
- Des titres et sous-titres explicites aident à une bonne visibilité
- Ils améliorent également la "scannabilité" du texte
Belle
titraille !
Version d'origine Version optimisée
ECRITURE EN 3 DIMENSIONS
Auteur : Sébastien Billard (s.billard@free.fr)
- Les liens ne sont pas réservés aux menus et éléments de navigation !
- L'hypertexte permet de renvoyer à d'autres contenus hors de la page.
- Ces liens sont fortement porteurs de pertinence, pour les moteurs de recherche comme pour
les utilisateurs.
Liens profonds au
sein du contenu
OPTIMISATION DE LA POPULARITE
Auteur : Sébastien Billard (s.billard@free.fr)
RAPPEL : LA PYRAMIDE DU REFERENCEMENT
Auteur : Sébastien Billard (s.billard@free.fr)
L'ensemble de ces composantes doit être optimisé pour obtenir une bonne visibilité :
CONTENU
STRUCTURE
POPULARITE
Le code qui contient le site et le met en forme
Essentiellement le contenu textuel du site
Ce que le web dit de votre site via les liens
Crédibilise Favorise
Valorise Redistribue
Voyons aujourd'hui en quoi il n'y a pas
de mal à se faire du lien !
LES LIENS : CONSIDERATIONS GENERALES
Auteur : Sébastien Billard (s.billard@free.fr)
EN QUOI LES LIENS SONT IMPORTANTS ?
Auteur : Sébastien Billard (s.billard@free.fr)
- Les critères « on page » ne sont pas les seuls pris en compte par les moteurs de recherche :
l'environnement d'une page web en dit aussi beaucoup sur sa pertinence.
- Le linking sert surtout à départager des pages à la pertinence proche. De fait, plus la
compétition est forte entre pages, plus la popularité est importante pour le positionnement.
- Les liens transmettent en réalité plusieurs type de signaux : la popularité pure (Pagerank), mais
aussi des informations relatives au contenu (ancres des liens), à la qualité (Trustrank et cie) etc.
Les SEOs parlent de « linkjuice » pour désigner ces signaux.
- Les liens permettent également d'être trouvé par les moteurs, et indexé. Un site populaire est
indexé plus fréquemment, et plus profondément.
Popularité
Ancre
Confiance
LINKJUICE
PRECISIONS SUR LE PAGERANK GOOGLE
Auteur : Sébastien Billard (s.billard@free.fr)
- Le Pagerank (ou PR) est une valeur qui mesure uniquement la popularité relative d'une page
par rapport au reste du web. Le PR est calculé à l'avance. Le Pagerank est un des élément du
score final d'une page.
- Le Pagerank d'une page mesure en fait la probabilité qu'a un surfeur aléatoire de visiter cette
page. Sa valeur réelle est donc comprise entre 0 et 1. La somme des PR de l'ensemble des
pages indexées par Google est égal à 1.
- Le Pagerank est toujours celui d'une page. Quand on parle du Pagerank d'un site, on parle en
général du PR de sa page d'accueil. Le PR d'un site est donc un abus de langage.
- Toute page indexée, même dépourvue de liens entrants possède un PageRank « inné ».
- Plus le PR d’une page est élevé, plus elle transmet du PR.
Final score = IR score * Pagerank
Score déterminant le
positionnement dans la
page de résultats
Score de pertinence
(lié au contenu, à la
structure)
Score de popularité
PAGERANK ET ALGORITHMES SIMILAIRES : FONCTIONNEMENT
Auteur : Sébastien Billard (s.billard@free.fr)
La formule originelle, décrite par Larry Page et Sergei Brin :
Chaque lien présent sur une page transmet aux pages de destination une quantité de Pagerank
égale à son propre PR, divisée par le nombre de liens présents sur la page, modéré par un
facteur d'amortissement (0.85 dans le papier original).
PR de la page T1 divisé par
le nombre de liens sortants
de la page T1
Facteur
d'amortissement
Web à 1 page Web à 2 pages
isolées
Web à 2 pages,
lien unidirectionnel
Web à 2 pages,
lien réciproque
PAGERANK ET ALGORITHMES SIMILAIRES : FONCTIONNEMENT
Auteur : Sébastien Billard (s.billard@free.fr)
Simulateur de PageRank : http://caccio.blogdns.net/archives/71
QUALITE DES LIENS
Auteur : Sébastien Billard (s.billard@free.fr)
Tous les liens ne présentent pas le même intérêt pour le référencement, du fait de leur incapacité
à être suivis ou à transmettre du PR :
- Les liens dans des fichiers Flash doivent encore êtres considérés comme inexistants (même si
les moteurs expérimentent).
- Les liens codés en javascript ne sont pas suivis par les moteurs (en général). Les liens HTML
additionnés de javascript peuvent être suivis et transmettre du Pagerank.
- Les liens dotés d'un attribut nofollow peuvent être suivis ou non par les moteurs, mais dans
tous les cas ils ne transmettent pas de « linkjuice ».
- Les liens images transmettent du PageRank, mais aucun signal lié à l’ancre, sauf si un attribut
alt est présent.
<a href="http://www.site.fr" rel="nofollow">Ancre du lien</a>
L'attribut nofollow
« stérilise » le lien
PAGERANK ET ATTRIBUT NOFOLLOW
Auteur : Sébastien Billard (s.billard@free.fr)
Il a pu être tentant à une époque de sculpter le Pagerank en utilisant l'attribut nofollow, dans le
but d'envoyer plus de PR vers les pages « utiles ». Ce n'est plus une technique efficace
aujourd'hui (à supposer qu'elle l'ait un jour été) :
33%
33%
33%
Le PR transmissible
était redistribué vers les
pages sans nofollow
Le PR transmissible du
lien nofollow s'évapore
Depuis juin 2009 :Avant juin 2009 :Sans nofollow :
50%
50%
nofollow
33%
33%
nofollow
CRÉER DU LIEN ENTRANT
Auteur : Sébastien Billard (s.billard@free.fr)
ESTIMER LA POPULARITE
Auteur : Sébastien Billard (s.billard@free.fr)
Pendant longtemps, Google a proposé une barre d’outil affichant une valeur de Pagerank sous
forme de note entre 0 et 10. Mais ce Pagerank n’est plus proposé depuis 2016.
La seule façon d’estimer la popularité d’une page désormais est de passer par des outils tiers
(Majestic SEO, MOZ, Ahrefs…). Problème : rien ne dit que leur version du Pagerank soit
équivalente à celle utilisée par Google, et leur index est de toute façon bien plus petit que celui
de Google…
Exemple d’alternative au Pagerank :
le page authority de MOZ
EVALUER LE LINKING D'UN SITE : MAJESTIC SEO
Auteur : Sébastien Billard (s.billard@free.fr)
Majestic SEO prend en compte la dimension temporelle. Il possède son propre index :
Evolution du
nombre de liens
COMMENT CREER DU LIEN ENTRANT ?
Auteur : Sébastien Billard (s.billard@free.fr)
- Exploitez votre réseau immédiat (partenaires, institutionnels, clients, fournisseurs...)
- Procédez à des échanges de liens avec des sites proches (privilégier la pertinence).
- Soumettez votre site aux annuaires généralistes et spécialisés (de plus en plus obsolète).
- Faites parler de vous, online et offline (interviews, communiqués, relations presse...)
- Exprimez-vous dans des communautés (signatures de forums, commentaires de blogs...)
- Proposez des contenus ou services attirant des liens spontanés (link baiting).
- Soyez actif dans les réseaux sociaux (même si beaucoup de liens sont en nofollow, le SMO
constitue une caisse de résonance de votre communication).
- Travaillez votre référencement : la visibilité attire le lien.
- Fuyez tout ce qui promet la création rapide de liens artificiels !
ANNUAIRES : CONSEILS POUR DES SOUMISSIONS DE QUALITE
Auteur : Sébastien Billard (s.billard@free.fr)
- Evitez les soumissions automatiques, les réseaux d'annuaires, les annuaires de mauvaise
qualité (par exemple sans contrôle éditorial).
- Evitez les annuaires exigeant un lien en retour.
- Assurez-vous que les liens proposés soient « en dur » (liens directs, sans redirections).
- Soumettez aux annuaire spécialisés (thématiques, locaux), et généralistes.
- Ne soumettez que des sites finis (pas de sites en construction).
- Sélectionnez la catégorie la plus pertinente de l'annuaire.
- Utilisez la racine du site ou d'un sous-domaine comme lien.
- Utilisez le nom du site comme titre, sauf indication contraire de l'éditeur.
- Rédigez la description du site avec soin. Variez les descriptions si possible.
TROUVER DES ANNUAIRES
Auteur : Sébastien Billard (s.billard@free.fr)
- Utilisez les annuaires d'annuaires (pas forcément à jour). Maintenez une liste perso.
- Cherchez des annuaires avec des requêtes de type « annuaire + mot-clé ».
- Cherchez des annuaires en exploitant leurs signatures (ex : « mot-clé + "ajouter votre site" »).
Avantage : on tombe souvent directement sur la bonne catégorie.
- Etudiez les liens entrants des concurrents, par ex à l'aide de Majestic SEO.
"Proposer un site"
"Proposer votre site"
"Ajouter un site"
"Ajoutez votre site"
"Inscrire votre site"
"Soumettre un site"
Signatures
d'annuaires typiques
LIENS EN NOFOLLOW
Auteur : Sébastien Billard (s.billard@free.fr)
Beaucoup de sites utilisent l'attributs nofollow aujourd'hui. Ces liens sont inutiles pour la
popularité, ce qui ne veut pas dire qu'ils n'aient aucune utilité : il peuvent générer du trafic et
participer à la visibilité globale.
L’extension nofollow permet
de mettre en évidence les
liens nofollow
LINK BAITING
Auteur : Sébastien Billard (s.billard@free.fr)
L'idée du link baiting est de pousser les internautes à faire des liens. Le link baiting comporte le
plus souvent une dimension virale (bouche à oreille). Quelques moyens couramment employés :
- Contenu qualitatif (même si ce n'est pas vraiment une technique)
- Services, goodies, widgets ou logiciels gratuits.
- Publications gratuites (ebooks, livre blanc).
- Organisation de concours.
- Publication d'articles polémiques.
- Publications de vidéos ou contenus viraux.
- Traduction de documents et ressources de références.
- Etc.
MESURER L'EFFICACITE DU REFERENCEMENT
Auteur : Sébastien Billard (s.billard@free.fr)
COMMENT CHOISIR DES INDICATEURS DE PERFORMANCE ?
Auteur : Sébastien Billard (s.billard@free.fr)
- Les indicateurs de performance (aussi appelés Key Performance Indicators, ou KPI) se
définissent toujours en fonction d'un certain contexte : par exemple un deblacklistage peut être
considéré comme un KPI pour un site auparavant banni. Pour un site e-commerce, le CA généré
ou le taux de transformation seront plus important que pour un site d’information.
- La difficulté en matière de SEO est de définir des KPIs qui soient fortement corrélés à la
visibilité ou à la présence dans les moteurs de recherche. Le trafic moteurs ou les performances
d'un site ne sont pas uniquement conditionnés par le référencement.
QUELQUES INDICATEURS DE PERFORMANCE POSSIBLES
Auteur : Sébastien Billard (s.billard@free.fr)
- Etendue de l'indexation (nombre ou pourcentage de pages indexées).
- Evolution des positions sur une sélection de mots-clés.
- Evolution du trafic en provenance des moteurs (hors notoriété).
- Part des différents moteurs dans le trafic.
- Couverture sémantique (nombre d’expressions générant du trafic).
- Pertinence des mots-clés tapés.
- Evolution de la réalisation d'objectifs.
- Evolution des indicateurs commerciaux pour le trafic SEO
LE MINIMUM DE LA VISIBILITE : LA PRESENCE
Auteur : Sébastien Billard (s.billard@free.fr)
Il est pertinent pour un nouveau site web de s'assurer que celui-ci est bien indexé par les
moteurs, et dans quel mesure :
- Comptabiliser le nombre d'URLs utiles indexables, via les sitemaps XML ou via des outils de
crawl.
- Regarder le nombre d'URLs indexées par les moteurs, à l'aide de la commande « site: » (Le
chiffre obtenu peut ne pas être 100% exact, mais donne un ordre de grandeur raisonnablement
précis la plupart du temps).
VISIBILITE : LE CONTRÔLE DE POSITIONNEMENT
Auteur : Sébastien Billard (s.billard@free.fr)
CONTRÔLE DE POSITIONNEMENT : A SAVOIR
Auteur : Sébastien Billard (s.billard@free.fr)
- Quantité de logiciels et services existent : Ranks, Yooda Seeurank, Advanced Web Ranking...
Certains sont gratuits. Si on suit un grand nombre d’expressions les services en ligne sont
préférables aux logiciels.
- On peut soit suivre des mots-clés que l’on détermine, soit utiliser le panel de mots-clés
préconstitué de l’outil.
- Il ne faut pas utiliser les APIs des moteurs, car les résultats des APIs sont différents des
résultats standards.
- Les requêtes automatisées ne sont pas autorisées par les moteurs (sauf APIs).Si le moteur est
trop requêté, l'adresse IP peut être bloquée temporairement. Pas de risque cependant pour le
site lui-même.
- Il peut y avoir de légère fluctuations dans les résultats, en fonction des datacenters interrogés.
Cela est normal. De même les résultats peuvent différer avec la personnalisation.
- Il est tout à fait normal que la position pour un mot-clé donné évolue d’un jour à l’autre. Un mot-
clé peut même disparaitre le temps d’un relevé. C’est quand la position évolue fortement et
durablement qu’il faut s’inquiéter ou se réjouir.
EXEMPLE D’OUTIL : RANKS
Auteur : Sébastien Billard (s.billard@free.fr)
Les mots-clés peuvent être
ajouté individuellement, ou
par lots
Un groupe thématique
peut être associé aux
mots-clés
On peut choisir les
moteurs interrogés
EXEMPLE D’OUTIL : RANKS
Auteur : Sébastien Billard (s.billard@free.fr)
Une vue synthétique permet
de se faire une idée de la
bonne santé SEO du site
EXEMPLE D’OUTIL : RANKS
Auteur : Sébastien Billard (s.billard@free.fr)
Les mêmes indicateurs sont
consultables pour les
groupes thématiques
EXEMPLE D’OUTIL : RANKS
Auteur : Sébastien Billard (s.billard@free.fr)
Le détail des positions
permet une analyse pour
chaque mot-clé
EXEMPLE D’OUTIL : RANKS
Auteur : Sébastien Billard (s.billard@free.fr)
Il est possible d’obtenir des
graphes, par exemple sur le
positionnement d’un mot-clé
GOOGLE SEARCH CONSOLE
Auteur : Sébastien Billard (s.billard@free.fr)
GOOGLE SEARCH CONSOLE
Auteur : Sébastien Billard (s.billard@free.fr)
Google Search Console (ex Webmaster Tools) est une interface à destination des webmasters,
proposé par Google. Après vérification du site, Webmaster Tools permet notamment :
- D'obtenir des informations sur la visibilité d'un site et sur le trafic généré par Google (jusque 16
mois en arrière)
- D’obtenir des informations sur les mots-clés tapés par les internautes. Cela est d’autant plus
utile que les mots-clés sont supprimés des référers Google depuis 2014 (remplacés par « not
provided »).
- D'accéder à une partie des liens entrants.
- De détecter et résoudre divers problème techniques.
- De contrôler l’indexation des pages du site (en complément au fichier robots.txt)
- De soumettre un sitemap XML.
MOTS CLES, VISIBILITE, TRAFIC
Auteur : Sébastien Billard (s.billard@free.fr)
L’outil performance permet de voir l’évolution
des visites en provenance de Google, du
nombre d’impressions, du taux de clic ainsi
que l’évolution de la position moyenne.
Des options de filtrage sur les
mots-clés, les URLs, le pays
ou l’appareil sont proposées
MOTS CLES, VISIBILITE, TRAFIC
Auteur : Sébastien Billard (s.billard@free.fr)
Search Console permet d’obtenir 999
mots-clés en une vue. Mais on peut en
obtenir bien plus en multipliant les vues
grâce aux options de filtrage
LIENS ENTRANTS
Auteur : Sébastien Billard (s.billard@free.fr)
L’outil liens vers votre site donne accès à un
certain nombre de lien, aux pages les plus
plus liées ainsi qu’aux ancres des liens
STATISTIQUES SUR L’EXPLORATION
Auteur : Sébastien Billard (s.billard@free.fr)
L’outil statistiques sur
l’exploration fournit une vue de
l’activité de Googlebot sur le site
STATISTIQUES SUR L’EXPLORATION
Auteur : Sébastien Billard (s.billard@free.fr)
L’outil erreurs d’exploration
permet de diagnostiquer les
difficultés que Googlebot
rencontre pour explorer le site
MESURE D’AUDIENCE
Auteur : Sébastien Billard (s.billard@free.fr)
DIFFERENTS TYPES DE MESURE D’AUDIENCE
Auteur : Sébastien Billard (s.billard@free.fr)
- La mesure de l'audience d'un site peut être « site centric » ou « user centric ».
- Les méthodes « user centric » se basent sur l'étude d'un panel d'utilisateurs, donc d’un
échantillon. Elles sont intéressantes pour comparer les trafic des sites en incluant des dimension
socio-démographiques. Mais elles apportent peu d'information pour un site en particulier, et sont
surtout réservées aux sites à fort trafic.
- Les méthodes « site centric » se basent sur l'étude du comportement de l’ensemble des
visiteurs du site. Les dimensions socio-démographiques ne sont pas prises en compte (en
général), mais l'information sur le comportement du visiteur dans le site est très précise. Les
méthodes « site centric » reposent soit sur l'analyse des fichiers log, soit sur l'insertion de tags
javascript (parfois d'images également).
- L'analyse des fichiers log permet d'obtenir des informations sur les visites des robots, ce que
les tags javascript ne permettent pas. Un script est à installer localement. Exemples d'analyseurs
de logs : Awstats, Webalizer...
- L'utilisation de tags javascript est plus aisée et permet de recueillir plus de données. Il s'agit
généralement de services web. C'est la méthode proposée par Xiti, eStats, Omniture, Google
Analytics...
GOOGLE ANALYTICS : INTERFACE GENERALE
Auteur : Sébastien Billard (s.billard@free.fr)
Période(s)
considéré(s)Segments personnalisables
GOOGLE ANALYTICS : VOIR LE TRAFIC MOTEURS
Auteur : Sébastien Billard (s.billard@free.fr)
Aller dans « Acquisition » /
« Canaux » puis sélectionner
« organic search » dans le tableau
GOOGLE ANALYTICS : REPARTITION DU TRAFIC MOTEURS
Auteur : Sébastien Billard (s.billard@free.fr)
Aller dans « Acquisition » /
« Canaux », sélectionner « organic
search » dans le tableau, et
« source » comme dimension
principale
Un clic sur l’icône secteur
permet d’obtenir une
visualisation par secteur
GOOGLE ANALYTICS : TROUVER LES REFERERS (LIENS ENTRANTS)
Auteur : Sébastien Billard (s.billard@free.fr)
Aller dans « Acquisition »
/ « Sites référents »
On accède aux pages referers en
cliquant sur les domaines listés.
GOOGLE ANALYTICS : RAPPORTS PERSONNALISES
Auteur : Sébastien Billard (s.billard@free.fr)
Au quotidien il est plus pratique de
créer des rapports personnalisés, qui
regrouperont les indicateurs favoris.
REFERENCEMENTS SPECIFIQUES
Auteur : Sébastien Billard (s.billard@free.fr)
LA RECHERCHE UNIVERSELLE OFFRE DE NOUVELLES OPPORTUNITES
Auteur : Sébastien Billard (s.billard@free.fr)
Images
Actualités
Vidéos
Résultats locaux
REFERENCEMENT LOCAL
Auteur : Sébastien Billard (s.billard@free.fr)
REFERENCEMENT LOCAL : CE QU'IL FAUT SAVOIR
Auteur : Sébastien Billard (s.billard@free.fr)
- Environ 15% des pages de résultats Google affichent une carte. Le pack local recevrait environ
1% des clics aux USA. 73% des activités en ligne incluraient une dimension locale (du moins aux
USA).
- Les méthodes d'optimisation classiques reste valables : optimisez les balises <title> et les
contenus en incluant la dimension locale quand cela est pertinent.
- Le meilleur moyen d'être visible lors des recherches locales est d'inscrire son site dans le Local
Business Center Google. L'inscription se fait par la complétion d'un formulaire suivie d'une
confirmation par courrier ou SMS.
REFERENCEMENT LOCAL : PISTES POUR L'OPTIMISATION DES PAGES
Auteur : Sébastien Billard (s.billard@free.fr)
La balise <title> est évidemment
un bon endroit pour mentionner sa
ville, son département, sa région...
Le contenu permet lui d'élargir le
champ sémantique local et de
renforcer sa pertinence...
Le fait de mentionner son adresse sur toutes
les pages pourrait être pris en compte par les
moteurs. Cela permet en tout cas à l'internaute
de vérifier que le résultat est pertinent.
OPTIMISER UN LISTING LOCAL BUSINESS CENTER
Auteur : Sébastien Billard (s.billard@free.fr)
- Le nom influe fortement sur le positionnement. Inclure éventuellement des mots-clés, quand
votre activité n’est pas évidente sur la base de votre seul nom, sans spammer (ex : « François
Dupont – Plombier chauffagiste »).
- L'adresse a aussi une influence considérable, mais difficile de tricher ;)
- Fournir une description riche en mots-clés et incitant au clic.
- Pour les activités, utiliser les catégories qui vous definissent le mieux.
https://support.google.com/business/answer/3038177
OPTIMISER UN LISTING LOCAL BUSINESS CENTER
Auteur : Sébastien Billard (s.billard@free.fr)
Lorsque une société ou un organisme possède plus de 10 établissements, il est possible
d'effectuer un transfert groupé des fiches, grâce à un tableau au format CSV.
REFERENCEMENT DANS GOOGLE ACTUALITES
Auteur : Sébastien Billard (s.billard@free.fr)
REFERENCEMENT DANS GOOGLE ACTUALITES
Auteur : Sébastien Billard (s.billard@free.fr)
- L'inclusion dans Google News est manuelle.
- Seules les sources d'information à plusieurs rédacteurs peuvent être incluses.
- La durée de vie d'une actualité dans l'index est de 30 jours.
- Seuls les contenus originaux sont indexés. Les contenus repris sont filtrés.
- Chaque actualité doit posséder une URL unique et permanente.
- Les sitemaps pour Google Actualité permettent une indexation plus efficaces, et autorisent
l'insertion de meta données.
- Une structure de page simple est préférable (idéalement mise en page CSS, avec divisions
logiques).
- Les contenus inaccessibles car réservés aux abonnés peuvent être indexés, si utilisation du
« premier clic gratuit ». Possibilité de limiter à 5 le nombre de clics gratuits par utilisateur et par
jour).
REFERENCEMENT DES IMAGES
Auteur : Sébastien Billard (s.billard@free.fr)
REFERENCEMENT DANS GOOGLE ACTUALITES
Auteur : Sébastien Billard (s.billard@free.fr)
- Les moteurs sont incapables de déterminer ce que représente une image.
- L'optimisation des images passe toujours par l'association de texte. Le texte associé peut être
interne (attribut alt, texte à proximité) ou externe à la page (ancres des liens, textes à proximité
des ancres).
- La popularité a une influence, de même que les critères usuels.
Attributs alt
Textes à proximité des
liens vers les images
Textes à proximité
de l'image
Le nom du fichier est pris en
compte mais son poids n'est pas
si fort comparé aux attributs alt et
textes associés
REFERENCEMENT DES VIDEOS
Auteur : Sébastien Billard (s.billard@free.fr)
REFERENCEMENT DES VIDEOS : CONSIDERATIONS GENERALES
Auteur : Sébastien Billard (s.billard@free.fr)
- Les moteurs ne sont pas capables de lire les vidéos (sauf expérimentations de transcription
automatique et moteurs spécialisés).
- Comme pour les images, l'optimisation des vidéos passe par l'adjonction de textes.
- La façon la plus simple de rendre visibles ses vidéos reste de passer par les services du type
Youtube, Google vidéo, Dailymotion etc.
La transcription automatique
reste perfectible…
REFERENCEMENT DES VIDEOS : PUBLICATION SUR SITE
Auteur : Sébastien Billard (s.billard@free.fr)
- L'indexation d'une vidéo publiée sur son propre site n'est jamais garantie, mais on peut la
favoriser.
- Les vidéos doivent être accessibles en HTTP. Le streaming n'est pas pris en charge par
Google. Format supportés : .mpg, .mpeg, .mp4, .mov, .wmv, .asf, .avi, .ra, .ram, .rm, .flv
- La taille des vidéos doit être inférieure à 30 Mo.
- L’utilisation du microformats schema.org/VideoObject est conseillées.
- Il est possible d'utiliser un fichier Sitemap pour vidéos, ou un fichier media RSS. Les deux
formats permettent l'insertion de meta données optimisables : titres, descriptions, tags,
transcripts (mRSS uniquement)...
- Il est vital d'associer du texte aux vidéos : balise <title>, titres, descriptions, idéalement un
transcript.
- Les méthodes habituelles d'optimisation des pages continuent d'être valables (balisage
sémantique, popularité...).
REFERENCEMENT DES VIDEOS : PUBLICATION SUR SITE
Auteur : Sébastien Billard (s.billard@free.fr)
Titres et textes optimisés
Insertion d'un transcript
REFERENCEMENT DES VIDEOS : PUBLICATION SUR PLATEFORME
Auteur : Sébastien Billard (s.billard@free.fr)
- La publication sur les plateformes est la plus simple. Du fait que les pages sont structurées et
les plateformes populaires, les vidéos sont indexées facilement.
- La publication sur plateforme peut venir en complément d’une publication sur site.
- La publication sur plateforme permet de bénéficier de l'effet de communauté et favorise la
diffusion de la vidéo. Elle génère cependant assez peu de trafic sur le site source.
OPTIMISER SON REFERENCEMENT SUR YOUTUBE (ET CONSORTS)
Auteur : Sébastien Billard (s.billard@free.fr)
Où placer ses mots-clés ?
Titre de la vidéo
Description
Les tags ne sont plus affichés depuis
quelques années, mais restent présent
dans l’interface de gestion des vidéos.
Ils sont donc à optimiser

Contenu connexe

Tendances

Deeb web
Deeb webDeeb web
Les étapes de création d'un site web
Les étapes de création d'un site webLes étapes de création d'un site web
Les étapes de création d'un site web
Chris Gaillard
 
Veille : une méthode simple pour une veille quotidienne
Veille : une méthode simple pour une veille quotidienneVeille : une méthode simple pour une veille quotidienne
Veille : une méthode simple pour une veille quotidienne
Faber Content
 
METHODE ET OUTILS POUR LA VEILLE SUR INTERNET
METHODE ET OUTILS POUR LA VEILLE SUR INTERNETMETHODE ET OUTILS POUR LA VEILLE SUR INTERNET
METHODE ET OUTILS POUR LA VEILLE SUR INTERNETLoïc Haÿ
 
Mettre en place une stratégie de veille professionnelle en bibliothèque
Mettre en place une stratégie de veille professionnelle en bibliothèqueMettre en place une stratégie de veille professionnelle en bibliothèque
Mettre en place une stratégie de veille professionnelle en bibliothèque
Anne-Gaëlle Gaudion
 
Formation html5 css3 java script
Formation html5 css3 java scriptFormation html5 css3 java script
Formation html5 css3 java script
Arrow Group
 
Les réseaux sociaux en bibliothèque
Les réseaux sociaux en bibliothèqueLes réseaux sociaux en bibliothèque
Les réseaux sociaux en bibliothèque
Anne-Gaëlle Gaudion
 
Introduction à l’architecture des ordinateurs
Introduction à l’architecture des ordinateursIntroduction à l’architecture des ordinateurs
Introduction à l’architecture des ordinateursAbdoulaye Dieng
 
Mini projet webservice soap
Mini projet   webservice soapMini projet   webservice soap
Mini projet webservice soap
Youcef Aliarous
 
La bibliothèque, un espace de participation
La bibliothèque, un espace de participationLa bibliothèque, un espace de participation
La bibliothèque, un espace de participationDujol Lionel
 
Et si on remixait la bibliothèque ? Nouveaux usages créatifs et collaboratifs...
Et si on remixait la bibliothèque ? Nouveaux usages créatifs et collaboratifs...Et si on remixait la bibliothèque ? Nouveaux usages créatifs et collaboratifs...
Et si on remixait la bibliothèque ? Nouveaux usages créatifs et collaboratifs...
Bibliothèque publique d'information - Centre Pompidou
 
Introduction à la veille : outils et méthodes
Introduction à la veille : outils et méthodesIntroduction à la veille : outils et méthodes
Introduction à la veille : outils et méthodes
Bibliothèque Michel Serres de Centrale de Lyon
 
Une loi pour les bibliothèques territoriales : bonne nouvelle ?
Une loi pour les bibliothèques territoriales : bonne nouvelle ?Une loi pour les bibliothèques territoriales : bonne nouvelle ?
Une loi pour les bibliothèques territoriales : bonne nouvelle ?
Dominique Lahary
 
La bibliothèque hybride et les services en bibliothèque
La bibliothèque hybride et les services en bibliothèqueLa bibliothèque hybride et les services en bibliothèque
La bibliothèque hybride et les services en bibliothèqueThomas Chaimbault-Petitjean
 
Veille 2.0 et ses outils
Veille 2.0 et ses outilsVeille 2.0 et ses outils
Veille 2.0 et ses outilsDujol Lionel
 
Formation WordPress 2023.pptx
Formation WordPress 2023.pptxFormation WordPress 2023.pptx
Formation WordPress 2023.pptx
Palmsquare
 
Metadonnees Introduction
Metadonnees IntroductionMetadonnees Introduction
Metadonnees Introductionjbcomte
 
HTML, CSS et Javascript
HTML, CSS et JavascriptHTML, CSS et Javascript
HTML, CSS et Javascript
ECAM Brussels Engineering School
 
Les bibliotheques aujourdhui
Les bibliotheques aujourdhuiLes bibliotheques aujourdhui
Les bibliotheques aujourdhui
Françoise HECQUARD
 

Tendances (20)

Deeb web
Deeb webDeeb web
Deeb web
 
Les étapes de création d'un site web
Les étapes de création d'un site webLes étapes de création d'un site web
Les étapes de création d'un site web
 
Veille : une méthode simple pour une veille quotidienne
Veille : une méthode simple pour une veille quotidienneVeille : une méthode simple pour une veille quotidienne
Veille : une méthode simple pour une veille quotidienne
 
METHODE ET OUTILS POUR LA VEILLE SUR INTERNET
METHODE ET OUTILS POUR LA VEILLE SUR INTERNETMETHODE ET OUTILS POUR LA VEILLE SUR INTERNET
METHODE ET OUTILS POUR LA VEILLE SUR INTERNET
 
Mettre en place une stratégie de veille professionnelle en bibliothèque
Mettre en place une stratégie de veille professionnelle en bibliothèqueMettre en place une stratégie de veille professionnelle en bibliothèque
Mettre en place une stratégie de veille professionnelle en bibliothèque
 
Formation html5 css3 java script
Formation html5 css3 java scriptFormation html5 css3 java script
Formation html5 css3 java script
 
Les réseaux sociaux en bibliothèque
Les réseaux sociaux en bibliothèqueLes réseaux sociaux en bibliothèque
Les réseaux sociaux en bibliothèque
 
Introduction à l’architecture des ordinateurs
Introduction à l’architecture des ordinateursIntroduction à l’architecture des ordinateurs
Introduction à l’architecture des ordinateurs
 
Mini projet webservice soap
Mini projet   webservice soapMini projet   webservice soap
Mini projet webservice soap
 
La bibliothèque, un espace de participation
La bibliothèque, un espace de participationLa bibliothèque, un espace de participation
La bibliothèque, un espace de participation
 
Et si on remixait la bibliothèque ? Nouveaux usages créatifs et collaboratifs...
Et si on remixait la bibliothèque ? Nouveaux usages créatifs et collaboratifs...Et si on remixait la bibliothèque ? Nouveaux usages créatifs et collaboratifs...
Et si on remixait la bibliothèque ? Nouveaux usages créatifs et collaboratifs...
 
Introduction à la veille : outils et méthodes
Introduction à la veille : outils et méthodesIntroduction à la veille : outils et méthodes
Introduction à la veille : outils et méthodes
 
Une loi pour les bibliothèques territoriales : bonne nouvelle ?
Une loi pour les bibliothèques territoriales : bonne nouvelle ?Une loi pour les bibliothèques territoriales : bonne nouvelle ?
Une loi pour les bibliothèques territoriales : bonne nouvelle ?
 
La bibliothèque hybride et les services en bibliothèque
La bibliothèque hybride et les services en bibliothèqueLa bibliothèque hybride et les services en bibliothèque
La bibliothèque hybride et les services en bibliothèque
 
Veille Informationnelle
Veille InformationnelleVeille Informationnelle
Veille Informationnelle
 
Veille 2.0 et ses outils
Veille 2.0 et ses outilsVeille 2.0 et ses outils
Veille 2.0 et ses outils
 
Formation WordPress 2023.pptx
Formation WordPress 2023.pptxFormation WordPress 2023.pptx
Formation WordPress 2023.pptx
 
Metadonnees Introduction
Metadonnees IntroductionMetadonnees Introduction
Metadonnees Introduction
 
HTML, CSS et Javascript
HTML, CSS et JavascriptHTML, CSS et Javascript
HTML, CSS et Javascript
 
Les bibliotheques aujourdhui
Les bibliotheques aujourdhuiLes bibliotheques aujourdhui
Les bibliotheques aujourdhui
 

Similaire à Cours SEO Master IDEMM 2018 - Sébastien Billard

Methodologie Recherche Je 15 Dec
Methodologie Recherche Je 15 DecMethodologie Recherche Je 15 Dec
Methodologie Recherche Je 15 DecBibliolab
 
Master IDEMM - Optimisation structurelle pour le référencement
Master IDEMM - Optimisation structurelle pour le référencementMaster IDEMM - Optimisation structurelle pour le référencement
Master IDEMM - Optimisation structurelle pour le référencement
Sébastien Billard
 
Web 2.0 : Blogs, RSS & Wikis
Web 2.0 : Blogs, RSS & WikisWeb 2.0 : Blogs, RSS & Wikis
Web 2.0 : Blogs, RSS & Wikis
Bruno Bernard SIMON
 
Introduction aux blogs
Introduction aux blogsIntroduction aux blogs
Introduction aux blogs
olivier
 
Tour d'horizon des CMS Open Source
Tour d'horizon des CMS Open SourceTour d'horizon des CMS Open Source
Tour d'horizon des CMS Open Source
Yannick Pavard
 
Les outils du web 2.0 pour la recherche scientifique - Master 1 SACIM
Les outils du web 2.0 pour la recherche scientifique - Master 1 SACIMLes outils du web 2.0 pour la recherche scientifique - Master 1 SACIM
Les outils du web 2.0 pour la recherche scientifique - Master 1 SACIM
Magalie Le Gall
 
Introduction à l'informatique documentaire - 2011
Introduction à l'informatique documentaire - 2011Introduction à l'informatique documentaire - 2011
Introduction à l'informatique documentaire - 2011Sylvain Machefert
 
L avenir du web au prisme de la resource
L avenir du web au prisme de la resourceL avenir du web au prisme de la resource
L avenir du web au prisme de la resource
Fabien Gandon
 
Presentation webschool pour centraider
Presentation webschool pour centraiderPresentation webschool pour centraider
Presentation webschool pour centraider
webschooltours
 
Nouveaux catalogues de bibliothèques
Nouveaux catalogues de bibliothèquesNouveaux catalogues de bibliothèques
Nouveaux catalogues de bibliothèques
Fleury Christine
 
2 focus web
2 focus web2 focus web
2 focus webABES
 
Des Outils 2.0 En Bdp 19 FéVrier Bdp 13
Des Outils 2.0 En Bdp 19 FéVrier Bdp 13Des Outils 2.0 En Bdp 19 FéVrier Bdp 13
Des Outils 2.0 En Bdp 19 FéVrier Bdp 13
Franck Queyraud
 
Microformats - Métad0nnées pour Humains & Machines
Microformats - Métad0nnées pour  Humains & MachinesMicroformats - Métad0nnées pour  Humains & Machines
Microformats - Métad0nnées pour Humains & Machines
Sylvain Carle
 
Introduction aux outils_pour_le_web_-_chapitre_0_-_introduction.key
Introduction aux outils_pour_le_web_-_chapitre_0_-_introduction.keyIntroduction aux outils_pour_le_web_-_chapitre_0_-_introduction.key
Introduction aux outils_pour_le_web_-_chapitre_0_-_introduction.key
Alpha Oumar Barry
 
Créer un blog de bibliothèque
Créer un blog de bibliothèqueCréer un blog de bibliothèque
Créer un blog de bibliothèque
webmaster87
 
Qu est ce que le web 2.0. Par Veronique Mesguich - Responsable Infotheque En...
 Qu est ce que le web 2.0. Par Veronique Mesguich - Responsable Infotheque En... Qu est ce que le web 2.0. Par Veronique Mesguich - Responsable Infotheque En...
Qu est ce que le web 2.0. Par Veronique Mesguich - Responsable Infotheque En...
juriconnexion
 
Formation cloud site-referencement-twitter
Formation cloud site-referencement-twitterFormation cloud site-referencement-twitter
Formation cloud site-referencement-twitter
CRIJ Poitou-Charentes
 
Introduction dans la Programmation Web Course 1
Introduction dans la Programmation Web Course 1Introduction dans la Programmation Web Course 1
Introduction dans la Programmation Web Course 1Vlad Posea
 
Comprendre le web pour se positionner
Comprendre le web pour se positionnerComprendre le web pour se positionner
Comprendre le web pour se positionner
Guillaume-Nicolas Meyer
 
Outils web et leurs usages en bibliothèque
Outils web et leurs usages en bibliothèqueOutils web et leurs usages en bibliothèque
Outils web et leurs usages en bibliothèquexavberton
 

Similaire à Cours SEO Master IDEMM 2018 - Sébastien Billard (20)

Methodologie Recherche Je 15 Dec
Methodologie Recherche Je 15 DecMethodologie Recherche Je 15 Dec
Methodologie Recherche Je 15 Dec
 
Master IDEMM - Optimisation structurelle pour le référencement
Master IDEMM - Optimisation structurelle pour le référencementMaster IDEMM - Optimisation structurelle pour le référencement
Master IDEMM - Optimisation structurelle pour le référencement
 
Web 2.0 : Blogs, RSS & Wikis
Web 2.0 : Blogs, RSS & WikisWeb 2.0 : Blogs, RSS & Wikis
Web 2.0 : Blogs, RSS & Wikis
 
Introduction aux blogs
Introduction aux blogsIntroduction aux blogs
Introduction aux blogs
 
Tour d'horizon des CMS Open Source
Tour d'horizon des CMS Open SourceTour d'horizon des CMS Open Source
Tour d'horizon des CMS Open Source
 
Les outils du web 2.0 pour la recherche scientifique - Master 1 SACIM
Les outils du web 2.0 pour la recherche scientifique - Master 1 SACIMLes outils du web 2.0 pour la recherche scientifique - Master 1 SACIM
Les outils du web 2.0 pour la recherche scientifique - Master 1 SACIM
 
Introduction à l'informatique documentaire - 2011
Introduction à l'informatique documentaire - 2011Introduction à l'informatique documentaire - 2011
Introduction à l'informatique documentaire - 2011
 
L avenir du web au prisme de la resource
L avenir du web au prisme de la resourceL avenir du web au prisme de la resource
L avenir du web au prisme de la resource
 
Presentation webschool pour centraider
Presentation webschool pour centraiderPresentation webschool pour centraider
Presentation webschool pour centraider
 
Nouveaux catalogues de bibliothèques
Nouveaux catalogues de bibliothèquesNouveaux catalogues de bibliothèques
Nouveaux catalogues de bibliothèques
 
2 focus web
2 focus web2 focus web
2 focus web
 
Des Outils 2.0 En Bdp 19 FéVrier Bdp 13
Des Outils 2.0 En Bdp 19 FéVrier Bdp 13Des Outils 2.0 En Bdp 19 FéVrier Bdp 13
Des Outils 2.0 En Bdp 19 FéVrier Bdp 13
 
Microformats - Métad0nnées pour Humains & Machines
Microformats - Métad0nnées pour  Humains & MachinesMicroformats - Métad0nnées pour  Humains & Machines
Microformats - Métad0nnées pour Humains & Machines
 
Introduction aux outils_pour_le_web_-_chapitre_0_-_introduction.key
Introduction aux outils_pour_le_web_-_chapitre_0_-_introduction.keyIntroduction aux outils_pour_le_web_-_chapitre_0_-_introduction.key
Introduction aux outils_pour_le_web_-_chapitre_0_-_introduction.key
 
Créer un blog de bibliothèque
Créer un blog de bibliothèqueCréer un blog de bibliothèque
Créer un blog de bibliothèque
 
Qu est ce que le web 2.0. Par Veronique Mesguich - Responsable Infotheque En...
 Qu est ce que le web 2.0. Par Veronique Mesguich - Responsable Infotheque En... Qu est ce que le web 2.0. Par Veronique Mesguich - Responsable Infotheque En...
Qu est ce que le web 2.0. Par Veronique Mesguich - Responsable Infotheque En...
 
Formation cloud site-referencement-twitter
Formation cloud site-referencement-twitterFormation cloud site-referencement-twitter
Formation cloud site-referencement-twitter
 
Introduction dans la Programmation Web Course 1
Introduction dans la Programmation Web Course 1Introduction dans la Programmation Web Course 1
Introduction dans la Programmation Web Course 1
 
Comprendre le web pour se positionner
Comprendre le web pour se positionnerComprendre le web pour se positionner
Comprendre le web pour se positionner
 
Outils web et leurs usages en bibliothèque
Outils web et leurs usages en bibliothèqueOutils web et leurs usages en bibliothèque
Outils web et leurs usages en bibliothèque
 

Plus de Sébastien Billard

Master IDEMM Cours 9 intro liens sponsorises
Master IDEMM Cours 9   intro liens sponsorisesMaster IDEMM Cours 9   intro liens sponsorises
Master IDEMM Cours 9 intro liens sponsorises
Sébastien Billard
 
Navigations à facettes et SEO (Seo Campus Lille 7 dec 2013)
Navigations à facettes et SEO (Seo Campus Lille 7 dec 2013)Navigations à facettes et SEO (Seo Campus Lille 7 dec 2013)
Navigations à facettes et SEO (Seo Campus Lille 7 dec 2013)
Sébastien Billard
 
Cours inaugural licence Référenceur et Rédacteur web
Cours inaugural licence Référenceur et Rédacteur webCours inaugural licence Référenceur et Rédacteur web
Cours inaugural licence Référenceur et Rédacteur web
Sébastien Billard
 
Master Idemm - Le référencement des contenus spécifiques
Master Idemm - Le référencement des contenus spécifiquesMaster Idemm - Le référencement des contenus spécifiques
Master Idemm - Le référencement des contenus spécifiques
Sébastien Billard
 
Master IDEMM - Controler et mesurer son référencement
Master IDEMM - Controler et mesurer son référencementMaster IDEMM - Controler et mesurer son référencement
Master IDEMM - Controler et mesurer son référencementSébastien Billard
 
Master IDEMM - Optimisation de la popularité et référencement
Master IDEMM - Optimisation de la popularité et référencementMaster IDEMM - Optimisation de la popularité et référencement
Master IDEMM - Optimisation de la popularité et référencement
Sébastien Billard
 
Master IDEMM - Optimisation éditoriale pour le référencement
Master IDEMM - Optimisation éditoriale pour le référencementMaster IDEMM - Optimisation éditoriale pour le référencement
Master IDEMM - Optimisation éditoriale pour le référencement
Sébastien Billard
 
Master IDEMM. Le Search Marketing, bonnes et mauvaises pratiques
Master IDEMM. Le Search Marketing, bonnes et mauvaises pratiquesMaster IDEMM. Le Search Marketing, bonnes et mauvaises pratiques
Master IDEMM. Le Search Marketing, bonnes et mauvaises pratiques
Sébastien Billard
 
Master IDEMM - Fonctionnement des moteurs de recherche
Master IDEMM - Fonctionnement des moteurs de rechercheMaster IDEMM - Fonctionnement des moteurs de recherche
Master IDEMM - Fonctionnement des moteurs de recherche
Sébastien Billard
 
Master IDEMM - Introduction au référencement
Master IDEMM - Introduction au référencementMaster IDEMM - Introduction au référencement
Master IDEMM - Introduction au référencement
Sébastien Billard
 

Plus de Sébastien Billard (10)

Master IDEMM Cours 9 intro liens sponsorises
Master IDEMM Cours 9   intro liens sponsorisesMaster IDEMM Cours 9   intro liens sponsorises
Master IDEMM Cours 9 intro liens sponsorises
 
Navigations à facettes et SEO (Seo Campus Lille 7 dec 2013)
Navigations à facettes et SEO (Seo Campus Lille 7 dec 2013)Navigations à facettes et SEO (Seo Campus Lille 7 dec 2013)
Navigations à facettes et SEO (Seo Campus Lille 7 dec 2013)
 
Cours inaugural licence Référenceur et Rédacteur web
Cours inaugural licence Référenceur et Rédacteur webCours inaugural licence Référenceur et Rédacteur web
Cours inaugural licence Référenceur et Rédacteur web
 
Master Idemm - Le référencement des contenus spécifiques
Master Idemm - Le référencement des contenus spécifiquesMaster Idemm - Le référencement des contenus spécifiques
Master Idemm - Le référencement des contenus spécifiques
 
Master IDEMM - Controler et mesurer son référencement
Master IDEMM - Controler et mesurer son référencementMaster IDEMM - Controler et mesurer son référencement
Master IDEMM - Controler et mesurer son référencement
 
Master IDEMM - Optimisation de la popularité et référencement
Master IDEMM - Optimisation de la popularité et référencementMaster IDEMM - Optimisation de la popularité et référencement
Master IDEMM - Optimisation de la popularité et référencement
 
Master IDEMM - Optimisation éditoriale pour le référencement
Master IDEMM - Optimisation éditoriale pour le référencementMaster IDEMM - Optimisation éditoriale pour le référencement
Master IDEMM - Optimisation éditoriale pour le référencement
 
Master IDEMM. Le Search Marketing, bonnes et mauvaises pratiques
Master IDEMM. Le Search Marketing, bonnes et mauvaises pratiquesMaster IDEMM. Le Search Marketing, bonnes et mauvaises pratiques
Master IDEMM. Le Search Marketing, bonnes et mauvaises pratiques
 
Master IDEMM - Fonctionnement des moteurs de recherche
Master IDEMM - Fonctionnement des moteurs de rechercheMaster IDEMM - Fonctionnement des moteurs de recherche
Master IDEMM - Fonctionnement des moteurs de recherche
 
Master IDEMM - Introduction au référencement
Master IDEMM - Introduction au référencementMaster IDEMM - Introduction au référencement
Master IDEMM - Introduction au référencement
 

Cours SEO Master IDEMM 2018 - Sébastien Billard

  • 1. Cours de 20h, donné auprès des étudiants du Master IDEMM, université de Lille 3 Auteur : Sébastien Billard (s.billard@free.fr) SEO (référencement naturel)
  • 2. THEME ABORDES DURANT CES 20 HEURES Auteur : Sébastien Billard (s.billard@free.fr) - Notions de base : le web, son histoire, notions-clés - Les outils de recherche : typologie, fonctionnement, fonctionnalités - Le search marketing en général : marché, métier, bonnes et mauvaises pratiques - Optimisation structurelle et accessibilité technique - Optimisation éditoriale : écrire pour le web - Optimisation de la popularité : créer du lien - Mesure d'audience, analyse de trafic et contrôle de positionnement - Contenus spécifiques : réferencement local, images,vidéos, flux RSS, actualités... - Les liens sponsorisés : fonctionnement, marché, techniques d'optimisation
  • 3. ORGANISATION DES COURS ET DE L'EXAMEN Auteur : Sébastien Billard (s.billard@free.fr) - Les questions et partages d'expériences sont bienvenus, aussi bien sur le contenu du cours que sur l'actualité du référencement. - L'examen se fait sous forme de QCM et de questions ouvertes (40 questions). - La durée de l’examen est de 2 heures. - Notes de cours, smartphones et ordinateurs sont interdits durant l’examen. - Des points négatifs seront attribués en cas de mauvaises réponse à une question fermée. - Les questions ouvertes et les questions avec plusieurs réponses bonnes possibles seront notées au prorata. - Des questions sur ce qui aura été vu et évoqué en cours seront posées.
  • 4. AVERTISSEMENT PREALABLE Auteur : Sébastien Billard (s.billard@free.fr) - Le référencement n'est ni de la magie, ni de la science. - Le référencement est un art (au sens d'artisan). - Ne prenez pas ce que disent les experts pour argent comptant (le prof y compris). - Expérimentez, faites-vous votre propre opinion !
  • 5. LE WEB : NOTIONS FONDAMENTALES Auteur : Sébastien Billard (s.billard@free.fr)
  • 6. UNE BREVE HISTOIRE DU WEB ET DES OUTILS DE RECHERCHE Auteur : Sébastien Billard (s.billard@free.fr) 1945 : Le Memex, décrit dans « As we may think » de Vannevar Bush. 1963 : Le terme « hypertexte » créé par Ted Nelson. 1971 : « A theory of indexing », par Gerard Salton, inventeur de cosinus du même nom. 1974 : Naissance du protocole TCP/IP. 1990: 1er serveur web, au CERN, par Tim Berners Lee et Robert Cailliau. 1991 : Le web devient public. Archie,1er moteur FTP . Virtual Librairy, 1er annuaire. 1993 : Wanderer, 1er robot (crawler). Jumpstation, 1er vrai moteur de recherche. HTML 1.0. 1994 : Annuaire Yahoo. Webcrawler 1er moteur full text. 1ère bannière publicitaire. 1995 : Naissance d'Altavista, et du terme SEO. HTML 2.0. Javascript apparaît. 1996 : Inktomi crée l'inclusion payante, naissance de Echo, futur Voila. Flash apparaît.
  • 7. UNE BREVE HISTOIRE DU WEB ET DES OUTILS DE RECHERCHE Auteur : Sébastien Billard (s.billard@free.fr) 1997 : Naissance d'Askjeeves. John Kleinberg invente HITS. HTML 3.2 et 4.0. 1998 : Naissances de Google, DMOZ, Goto qui crée les liens sponsorisés. 2000 : Lancement d'Adwords, effondrement de la bulle Internet. 2004 : Naissance de MSN Search. Lancement du moteur Yahoo. 2009 : Le moteur Yahoo disparaît au profit de Microsoft Bing. 2014 : Lancement d’HTML 5.
  • 8. LE MEMEX DE VANNEVAR BUSH (AS WE MAY THINK) Auteur : Sébastien Billard (s.billard@free.fr) « Imaginons un appareil de l’avenir à usage individuel, une sorte de classeur et de bibliothèque personnels et mécaniques (...) Un memex, c’est un appareil dans lequel une personne stocke tous ses livres, ses archives et sa correspondance, et qui est mécanisé de façon à permettre la consultation à une vitesse énorme et avec une grande souplesse. Il s’agit d’un supplément agrandi et intime de sa mémoire (...) Une étape s’avère indispensable au classement par association, dont le principe reposerait sur un système permettant à tout article d’en sélectionner immédiatement et automatiquement un autre. C’est ce processus reliant deux articles l’un à l’autre qui caractérise le memex (...) Ainsi, à tout moment, quand l’un de ces documents est visible, l’autre peut être rappelé instantanément (...) Des formes entièrement nouvelles d’encyclopédies vont apparaître, prêtes à l’emploi avec un réseau de pistes fonctionnant par association les traversant, prêtes à être insérées et amplifiées dans le memex... » « Le memex sous la forme d'un bureau serait capable de mettre à portée de main de l'operateur les fichiers et documents relatifs à n'importe quel sujet »
  • 9. LE COSINUS DE SALTON Auteur : Sébastien Billard (s.billard@free.fr) Documents dans l'index : Texte 1 : « la loutre est dans la rivière » Texte 2 : « la loutre est avec les loutres dans la rivière » Lemmatisation + suppression des verbes et stopwords : Texte 1 : loutre, rivière Texte 2 : loutre, loutre, rivière Calcul des fréquence et vectorisation dans l’espace des fréquences des mots rivière, loutre (dans cet ordre) : Texte 1 : (1/2, 1/2 ) Texte 2 : (1/3, 2/3) Requête : « je suis dans la rivière avec les loutres de la rivière » Vecteur : 2/3, 1/3 Source : http://www.spoonylife.org/algorithms-and-computation/modele-vectoriel-et-cosinus-de-salton
  • 10. LE WEB DECRIT PAR TIM BERNERS LEE ET ROBERT CAILLIAU Auteur : Sébastien Billard (s.billard@free.fr)
  • 11. STRUCTURE DU WEB : HOTES, DOMAINES ET DOCUMENTS Auteur : Sébastien Billard (s.billard@free.fr) World Wide Web Hôtes identifiés par leurs adresses IP (ex : 209.85.229.147) Domaines (sites) Identifiés par leurs noms de domaines (ex : google.fr) Documents (pages) Identifiés par leurs URLs (ex : http://www.site.fr/page.html ) Note : une IP est spécifique à un hôte, mais un hôte peut avoir plusieurs IPs
  • 12. QUE SE PASSE-T-IL LORS DE L'ACCES A UNE PAGE ? DNS du FAI Serveur web « J'aimerais accéder à www.exemple.fr/index.html » « Bonjour hôte 209.85.229.99, j'aimerais accéder à l'URL www.exemple.fr/index.html » « Je regarde dans ma base... Ok ! L'IP du domaine exemple.fr est 209.85.229.99 » « Voyons voir... Le domaine existe bien chez moi... ...Le document demandé également... Je vous envoie le fichier ! » HTTP L’accès à une page se fait en réalité en deux temps : Auteur : Sébastien Billard (s.billard@free.fr)
  • 13. QUE SE PASSE-T-IL LORS DE L'ACCES A UNE PAGE ? GET /referencement/ HTTP/1.1 Host: s.billard.free.fr Connection: close Accept: */* User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; GTB6; .NET CLR 2.0.50727; InfoPath.2; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729) HTTP/1.1 200 OK Date: Fri, 02 Oct 2009 10:36:31 GMT Server: Apache/ProXad [Aug 9 2008 02:45:09] Cache-Control: must-revalidate, max-age=0 Pragma: X-Powered-By: PHP/4.4.3-dev Last-Modified: Wed, 30 Sep 2009 14:39:48 GMT Connection: close Content-Type: text/html; charset=ISO-8859-1 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" (...) Exemple de requête HTTP : Exemple de réponse HTTP : Auteur : Sébastien Billard (s.billard@free.fr)
  • 14. Auteur : Sébastien Billard (s.billard@free.fr) PLUSIEURS TYPES DE REPONSES HTTP 2XX : Succès 3XX : Redirections 4XX : Erreurs coté client 5XX : Erreurs coté serveur Pour voir les entêtes HTTP : outils de développement web de Firefox, rubrique réseau.
  • 15. Auteur : Sébastien Billard (s.billard@free.fr) LES CODES DE REPONSE HTTP (AUTRES QUE 200) « Voyons voir... Le domaine existe bien chez moi... ...par contre je ne connais pas votre fichier » « Voyons voir... Le domaine existe bien chez moi... ...par contre le fichier a définitivement changé d'adresse. La voici » « Voyons voir... Le domaine existe bien chez moi... ...par contre le fichier e temporairement changé d'adresse. La voici » « Voyons voir... Le domaine existe bien chez moi... ...par contre l'accès au fichier est interdit » « Voyons voir... Le domaine existe bien chez moi... ...par contre le site web est en panne » 404 301 404 302 500 403 « Voyons voir... Le domaine existe bien chez moi... ...par contre revenez plus tard le site est en maintenance » 503
  • 16. Auteur : Sébastien Billard (s.billard@free.fr) PAGES STATIQUES ET DYNAMIQUES Sites statiques Chaque page pré-existe sur le serveur (1 page = 1 fichier HTML). Sites dynamiques Les pages sont générées à la demande, par un langage de script (PHP, ASP...). Les paramètres pour construire la page sont souvent passés dans l'URL. Ex : www.site.fr/index.php?paramètre1=a&parametre2=b Attention : L'URL ne permet pas à 100% de déterminer si un site est statique. « www.site.fr/catalogue/chemises-rouges.html » peut très bien être une page dynamique
  • 17. Auteur : Sébastien Billard (s.billard@free.fr) LIRE UNE ADRESSE INTERNET (URL) http://www.exemple.fr/repertoire/fichier.html http://catalogue.exemple.fr/index.php?gamme=3&couleur=vert protocole sous-domaine domaine répertoire fichiertop level domain (TLD) script PHP paramètres
  • 18. Auteur : Sébastien Billard (s.billard@free.fr) STRUCTURE D'UNE PAGE WEB : LE CODE HTML Les balises définissent la fonction de chaque élément. Elles s'ouvrent et se ferment. On peut les imbriquer. Syntaxe : <balise>élément</balise> (en général) Les attributs précisent les propriétés de chaque élément. On peut les cumuler. Syntaxe : <balise attribut= "valeur">élément</balise>
  • 19. Auteur : Sébastien Billard (s.billard@free.fr) STRUCTURE D'UNE PAGE WEB : PRINCIPALES BALISES ET ATTRIBUTS Les balises fondamentales les balises <meta> <html> <meta> description <head> <meta> robots <body> <title> Les balises structurantes du contenu (dans le <body>) <a> <p> <h1> à <h6> <strong> <b> <ul>,<ol> et <li> <table>, <tr> et <td> Les balises riches et multimedia (dans le <body>) <img> <script> <embed> ou <object>
  • 20. Auteur : Sébastien Billard (s.billard@free.fr) SUGGESTIONS DE LECTURE L'essentiel sur le référencement Un condensé sur l'écriture web Un pavé sur l'écriture web, davantage orienté SEO Une référence sur le « bien chercher »
  • 21. Auteur : Sébastien Billard (s.billard@free.fr) QUELQUES SITES POUR LA VEILLE En français : www.abondance.com www.webrankinfo.com webmaster-fr.googleblog.com lemusclereferencement.com www.seomix.fr En anglais : searchengineland.com www.seobythesea.com www.seomoz.org webmasters.googleblog.com
  • 22. LES OUTILS DE RECHERCHE Auteur : Sébastien Billard (s.billard@free.fr)
  • 23. Auteur : Sébastien Billard (s.billard@free.fr) TYPOLOGIE DES OUTILS DE RECHERCHE : MOTEURS ET ANNUAIRES Moteurs - Gestion automatisée - Entrée par indexation - Tout le web a vocation à être indexé - Tout le contenu des pages est indexé - Navigation par requêtes Annuaires - Gestion humaine - Entrée par soumission - Des choix éditoriaux sont faits - Seules les références aux sites sont indexées - Navigation arborescente (recherche possible)
  • 24. Auteur : Sébastien Billard (s.billard@free.fr) FONCTIONNEMENT D'UN MOTEUR DE RECHERCHE (VERSION SIMPLE) Index Moteur de recherche IndexeurWeb
  • 25. FONCTIONNEMENT D'UN MOTEUR (VERSION MOINS SIMPLE)
  • 26. COMMENT PENSE UN MOTEUR ? Juger de la pertinence d'une page web, c'est un peu comme juger du contenu d'un livre dans une bibliothèque : Contenu Titre 4ème de couverture Table des matière Contenu général Balise <title> Balise <meta> description Titraille (balises <h1> à <h6>) Ensemble des textes Structure Lisibilité Accessibilité technique et structuration Popularité Recommandations Quantité, qualité et teneur des liens entrants Auteur : Sébastien Billard (s.billard@free.fr)
  • 27. ANATOMIE GENERALE D’UNE PAGE DE RESULTATS Auteur : Sébastien Billard (s.billard@free.fr) Résultats sponsorisés Résultats naturels Résultats Google Shopping (sponsorisés)
  • 28. ELEMENTS D’INTERFACE GOOGLE Auteur : Sébastien Billard (s.billard@free.fr) Sitelinks - Déterminés algorithmiquement - Jusque 10 éléments Classic sitelinks - Déterminés algorithmiquement - Jusque 4 éléments Sitelinks searchbox - Pour des requêtes « marque » - Uniquement pour certains sites - Mieux vaut mettre en place le script Google Hiérarchie de site - Basés sur le fil d’ariane Jumplinks - Contextuels - Basés sur les ancres
  • 29. ELEMENTS D’INTERFACE GOOGLE Auteur : Sébastien Billard (s.billard@free.fr) Position zéro - Site source déterminé algorithmiquement Résultats Onebox - Réponses fournies directement par Google - Réponses à de multiples questions Carousel Knowledge graphBloc Knowledge graph - Issus de la base de connaissance Google
  • 30. RECHERCHE UNIVERSELLE Auteur : Sébastien Billard (s.billard@free.fr) Actualités Knowledge graph ages web Images La recherche universelle consiste à présenter dans la page de résultats (SERP) par défaut des résultats issus des divers moteurs de recherche verticaux. Objectif : « faire tomber les silos de l'information qui existent sur le web » (Marissa Mayer, 16/05/07) Peuvent apparaître dans les SERP en plus des pages web : actualités, images, vidéo, blocs Knowledge Graph… La recherche universelle ne doit pas être confondue avec les enrichissement visuels via les microformats (ex : cas des recettes de cuisine).
  • 31. RECHERCHE UNIVERSELLE Auteur : Sébastien Billard (s.billard@free.fr) Plusieurs critères concourent à la personnalisation et à la contextualisation des résultats : Localisation de l'utilisateur (IP, langue du navigateur) Comportement de l'utilisateur (recherches précédentes, sites préférés) Saisonnalité, actualité de la requête Interface utilisée (.com, .fr...) Depuis 2019, les résultats de recherche sont personnalisés pour tout le monde, que les utilisateurs soient loggés ou non.
  • 32. LES OPERATEURS UTILES A LA RECHERCHE ET AU SEO Auteur : Sébastien Billard (s.billard@free.fr) Les guillemets, pour rechercher une chaine de caractères, ou un terme exact sans synonymie : Le signe « - », pour exclure un mot, une expression ou un autre critère de recherche : La commande « site: » pour chercher sur un TLD, un domaine, un sous-domaine, un répertoire : La commande « filetype: » pour chercher un type de fichier donné : « inurl: » et « allinurl: » pour chercher les pages dont l'URL contient une expression :
  • 33. LES OPERATEURS UTILES A LA RECHERCHE ET AU SEO Auteur : Sébastien Billard (s.billard@free.fr) « intitle: » et « allintitle: » pour chercher les pages dont le <title> contient une expression : « cache: » pour obtenir la version en cache d’une page : « src: » pour chercher les images hébergées sur un domaine ou sous-domaine : « OR » pour chercher l’un ou l’autre des termes : Les parenthèses pour grouper des termes :
  • 34. COMBINAISONS ET EXEMPLES CONCRETS Auteur : Sébastien Billard (s.billard@free.fr) Trouver des sites qui hotlinkent vos images : Trouver les sous-domaine d’un domaine : Trouver les sous-rayons d’un site e-commerce : Trouver produits épuisés d’un site e-commerce :
  • 35. LE SEARCH MARKETING EN GENERAL Auteur : Sébastien Billard (s.billard@free.fr)
  • 36. Auteur : Sébastien Billard (s.billard@free.fr) QU'EST CE QUE LE SEARCH MARKETING ? Il s'agit de l'ensemble des moyens permettant de rendre un site visible dans un contexte de recherche sur le web : Référencement naturel (SEO) Liens sponsorisés (SEA) Shopping feeds (comparateurs)
  • 37. Auteur : Sébastien Billard (s.billard@free.fr) LES MOTS ONT LEUR IMPORTANCE Le « Search Marketing » ou SEM ne désigne pas les seuls liens sponsorisés comme cela est parfois présenté ! SEM=SEO+SEA+SF
  • 38. Auteur : Sébastien Billard (s.billard@free.fr) LA JUNGLE DES TERMINOLOGIES Le jargon du Search comprend de nombreux synonymes : REFERENCEMENT NATUREL LIENS SPONSORISES« référencement » « SEO » « référencement organique » « searche engine optimization » « positionnement publicitaire » «SEA » « PPC » « pay per click » « search engine advertising » « référencement payant » SHOPPING FEEDS « shop bots » « comparateurs de prix » « products feeds »
  • 39. Auteur : Sébastien Billard (s.billard@free.fr) Référencement naturel (SEO) Liens sponsorisés (SEA)Shopping feeds
  • 40. REFERENCEMENT NATUREL Auteur : Sébastien Billard (s.billard@free.fr) - Visibilité dans les moteurs de recherche généralistes et portails - L'indexation est automatique, sans action obligatoire de l'éditeur - C'est le contenu des pages qui est indexé - L'indexation est gratuite - Pas de garantie de position (classement algorithmique en fonction de la pertinence)
  • 41. LIENS SPONSORISES Auteur : Sébastien Billard (s.billard@free.fr) - Visibilité dans les moteurs de recherche généralistes, portails et site de contenu - Il faut enchérir sur des expressions-clés pour être visible - Modèle de paiement au clic, avec prix variable déterminé par enchères - La position est dépendante de ce que l'annonceur est prêt à payer (principalement)
  • 42. SHOPPING FEEDS Auteur : Sébastien Billard (s.billard@free.fr) - Visibilité dans les comparateurs de prix et sites de contenu affiliés - C'est un flux XML qui est indexé (base produits) - Visibilité uniquement si l'on paye - Modèle de paiement au clic, avec prix fixé par forfait ou enchères - La position est dépendante en partie de ce que l'annonceur est prêt à payer
  • 43. LE MARCHE DU SEARCH MARKETING Auteur : Sébastien Billard (s.billard@free.fr)
  • 44. LE PAYSAGE DES MOTEURS DE RECHERCHE : EUROPE Auteur : Sébastien Billard (s.billard@free.fr)
  • 45. LE PAYSAGE DES MOTEURS DE RECHERCHE : USA Auteur : Sébastien Billard (s.billard@free.fr)
  • 46. LE PAYSAGE DES MOTEURS DE RECHERCHE : RUSSIE Auteur : Sébastien Billard (s.billard@free.fr)
  • 47. LE PAYSAGE DES MOTEURS DE RECHERCHE : CHINE Auteur : Sébastien Billard (s.billard@free.fr)
  • 48. LE PAYSAGE DES MOTEURS DE RECHERCHE : JAPON Auteur : Sébastien Billard (s.billard@free.fr)
  • 49. QUELQUES DONNEES CLES Auteur : Sébastien Billard (s.billard@free.fr) - 46,6 millions d'internautes soit 89% des français (Mediametrie, septembre 2017) - 82,7% des internautes effectuent des achats en ligne (Fevad, juin 2017) - 1 consommateur sur 2 effectue au moins un achat par mois sur internet (Ipsos media, janvier 2015) - La recherche d'information est l'activité la plus pratiquée sur le web, devant le web (Insee, mai 2006) - Les moteurs représentent de 30 à 40% du trafic d'un site en moyenne - Plus de 90% des clics ont lieu sur les 3 premières pages de résultats (iProspect, avril 2006)
  • 50. DISTRIBUTION DES CLICS SUR UNE PAGE DE RESULTATS Auteur : Sébastien Billard (s.billard@free.fr) Position = visibilité = trafic . Mais le taux de clic décroît rapidement avec la position…
  • 51. DISTRIBUTION DES CLICS SUR UNE PAGE DE RESULTATS Auteur : Sébastien Billard (s.billard@free.fr) y = 29,498x-0,855 0 10 20 30 40 50 60 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 CTR … y compris sur les requêtes hors-marque (génériques)
  • 52. REPARTITION DES CLICS : SEO vs SEA Auteur : Sébastien Billard (s.billard@free.fr) D’après une étude Seomoz de décembre 2017, les liens naturels draineraient 20X plus de trafic que les liens sponsorisés
  • 53. LE TRAVAIL DU REFERENCEUR Auteur : Sébastien Billard (s.billard@free.fr)
  • 54. Auteur : Sébastien Billard (s.billard@free.fr) LA PYRAMIDE DU REFERENCEMENT L'ensemble de ces composantes doit être optimisé pour obtenir une bonne visibilité : CONTENU STRUCTURE POPULARITE Le code qui contient le site et le met en forme Essentiellement le contenu textuel du site Ce que le web dit de votre site via les liens Crédibilise Favorise Valorise Redistribue Le travail de référencement va consister à activer chacun de ces leviers.
  • 55. Auteur : Sébastien Billard (s.billard@free.fr) LA PYRAMIDE DU REFERENCEMENT Le référenceur va ainsi agir sur les différents étages de la pyramide, par de multiples actions. Quelques exemples (liste non exhaustive) : CONTENU STRUCTURE POPULARITE Accessibilité technique Soumission aux annuaires Réseaux spécifiques Communiqués de presseRéseaux sociaux Optimisation des textes Micro contenus Recherche de mots-clés Architecture de l'information Intitulés des liens Distribution interne de la popularité Formation des rédacteurs Balisage sémantique Duplication de contenu Qualité du code Noms de domaine Link baiting
  • 56. Auteur : Sébastien Billard (s.billard@free.fr) LA PYRAMIDE DU REFERENCEMENT Pour mener à bien sa mission, le référenceur va devoir développer un certain nombre de compétences :
  • 57. CE QUI EST PERMIS, CE QUI NE L’EST PAS Auteur : Sébastien Billard (s.billard@free.fr)
  • 58. BONNES PRATIQUES PRONEES PAR LES MOTEURS Auteur : Sébastien Billard (s.billard@free.fr) Source : https://support.google.com/webmasters/answer/35769?hl=fr
  • 59. PRATIQUES INTERDITES PAR LES MOTEURS Auteur : Sébastien Billard (s.billard@free.fr) - Systèmes de liens pour améliorer artificiellement la popularité - Textes et liens cachés - Cloaking et redirections trompeuses - Mots-clés sans rapport avec le site - Répétition abusives de mots-clés - Contenus dupliqués dans le seul but de mieux se positionner - Pages satellites - Requêtes automatisées
  • 60. SYSTEMES DES LIENS ARTIFICIELS Auteur : Sébastien Billard (s.billard@free.fr) Les private blog networks (PBN) sont à la mode mais ne sont pas appréciés des moteurs…. L’achat de liens (si découvert) est également sanctionné De même que les échanges automatisés de liens
  • 61. TEXTES ET LIENS CACHES Auteur : Sébastien Billard (s.billard@free.fr) Un snippet a priori pertinent, quoique suspect... Tiens ! Aucun contenu visible... L'examen du code source montre du texte caché grâce à la balise <noembed>, texte qui plus est visiblement écrit à destination des moteurs.
  • 62. TEXTES ET LIENS CACHES Auteur : Sébastien Billard (s.billard@free.fr) Un site très ordinaire... Mais la désactivation des CSS montre des textes cachés visiblement optimisés pour les moteurs
  • 63. TEXTES ET LIENS CACHES : PRINCIPALES TECHNIQUES Auteur : Sébastien Billard (s.billard@free.fr) - Insertion dans balises <noframe>, <noscript>, <noembed> - Utilisation d'une couleur de police similaire à celle du fond (via HTML ou CSS) - Utilisation des propriétés CSS visibility:hidden et display:none - Positionnement CSS hors de l'écran (coordonnées négatives)
  • 64. CLOAKING Auteur : Sébastien Billard (s.billard@free.fr) Cloaking pour la bonne cause : le site fournit un contenu différent en mobile et en desktop Mais la même technique pourrait être utilisée pour tricher, par ex par insertion de contenu invisible pour les visiteurs humains
  • 65. 2 FORMES DE CLOAKING (+1) Auteur : Sébastien Billard (s.billard@free.fr) - IP delivery : le contenu affiché est déterminé en fonction de l'adresse IP du visiteur (IP d'un moteur ? IP d'un FAI ?) - User-agent delivery : le contenu est affiché en fonction de l'user-agent du visiteur (navigateur desktop ? Navigateur mobile ? Googlebot ?) - Cloaking sur referer : le contenu est affiché en fonction de la provenance du visiteur. Pas d'utilité pour spammer, les moteurs ne transmettant pas de referers. Mais d'autres utilités...
  • 66. PAGES SATELLITES Auteur : Sébastien Billard (s.billard@free.fr) Pas de redirection, pas de texte caché, mais un contenu visiblement pensé pour les seuls moteurs
  • 67. REDIRECTIONS TROMPEUSES Auteur : Sébastien Billard (s.billard@free.fr) Un listing d'apparence ordinaire... Mais la page renvoie automatiquement vers l'accueil du site La désactivation de javascript montre une page satellite, avec texte caché par CSS, comprenant une redirection javascript
  • 68. REQUETES AUTOMATISEES Auteur : Sébastien Billard (s.billard@free.fr) Les moteurs n’apprécient pas les requêtes automatisées Mais il faut bien avouer qu'elle peuvent être utiles au référenceur :).
  • 69. QUELQUES PISTES POUR DETECTER LE SPAM Auteur : Sébastien Billard (s.billard@free.fr) - Contenu camouflé : Ctrl+A, et scrolling - Contenu caché : examen du code source - Redirections : désactivation de javascript (barre d'outils Web Developer pour Chrome) - Répétitions abusives et mots-clés hors propos : lire ! - Cloaking sur user-agent : simulation de l'user agent d'un moteur (extension User agent switcher pour Firefox) - Cloaking sur IP : cache Google (rare), affichage dans Google Translate ou Google Analytics (synthèse données/site) - Réseaux de liens artificiels : analyse des liens
  • 70. OPTIMISATION STRUCTURELLE POUR LE REFERENCEMENT Auteur : Sébastien Billard (s.billard@free.fr)
  • 71. RAPPEL : LA PYRAMIDE DU REFERENCEMENT Auteur : Sébastien Billard (s.billard@free.fr) L'ensemble de ces composantes doit être optimisé pour obtenir une bonne visibilité : CONTENU STRUCTURE POPULARITE Le code qui contient le site et le met en forme Essentiellement le contenu textuel du site Ce que le web dit de votre site via les liens Crédibilise Favorise Valorise Redistribue On va travailler aujourd'hui sur cet étage (ou plutôt les fondations...)
  • 72. ROLES DE L'OPTIMISATION STRUCTURELLE Auteur : Sébastien Billard (s.billard@free.fr) L'optimisation de la structure d'un site pour le référencement vise à satisfaire deux objectifs : - A minima, assurer l'indexabilité du site par les robots d'indexation (accessibilité technique) - Mettre en valeur le contenu pour un traitement optimal par les moteurs
  • 73. CE QUI PEUT BLOQUER LES ROBOTS Auteur : Sébastien Billard (s.billard@free.fr) - Contenus au format Flash - Contenus dans des formats tiers nécessitant l'installation d'un plugin (Flash, Silverlight...) - Scripts javascript - Scripts Ajax (javascript et XML) - Contenus accessibles uniquement au travers d'un formulaire - Fichiers robots.txt
  • 74. CE QUI PEUT COMPLIQUER LE TRAVAIL DES MOTEURS Auteur : Sébastien Billard (s.billard@free.fr) - Contenus sous forme d'images - Mauvais usage des balises sémantique (ou absence d'usage) - Contenus dupliqués - Méthodes de redirections non adaptées - Contenu délivrés en fonction de l'user-agent ou de l'adresse IP - Splash pages - Frames (cadres)
  • 75. VOIR LE WEB COMME UN ROBOT Auteur : Sébastien Billard (s.billard@free.fr)
  • 76. VOIR LE WEB COMME UN ROBOT : GRANDS PRINCIPES Auteur : Sébastien Billard (s.billard@free.fr) Une bonne façon d'appréhender la structure d'un site ou d'une page, outre l'examen du code, est de se mettre dans la peau d'un robot, c'est-à-dire de naviguer avec les même limitations : - Pas d'images (utilisation des attributs alt à la place) - Pas de mise en forme (CSS) - Pas de javascript - Pas de Flash - Pas de format tiers (Silverlight, Quicktime etc.) - Lecture dans l'ordre du code (linéarisation) - Pas de cookies - Eventuellement en changeant son agent-utilisateur
  • 77. VOIR LE WEB COMME UN ROBOT : LYNX Auteur : Sébastien Billard (s.billard@free.fr) Ouvrir une URL : "g" Activer des liens : "↓" et "↑" Défiler : "espace" Cliquer : "entrée" Page prec/suiv : "←" et "→" Source : "" Aide : "?" Télécharger : https://www.cygwin.com/ (installer le package Lynx)
  • 78. VOIR LE WEB COMME UN ROBOT : WEB DEVELOPER (CHROME) Auteur : Sébastien Billard (s.billard@free.fr) On désactive javascript… … les cookies… … les CSS… … on remplace les images par leurs attributs alt… … et on linéarise la page
  • 79. VOIR LE WEB COMME UN ROBOT : WEB DEVELOPER (CHROME) Auteur : Sébastien Billard (s.billard@free.fr) Rendu standard navigateur Rendu robots
  • 80. VOIR LE WEB COMME UN ROBOT : CACHE GOOGLE Auteur : Sébastien Billard (s.billard@free.fr) La commande « cache: » dans Google permet d’accéder à la dernière version indexée par le moteur L’option « version en texte seul » permet de voir la page comme la voit le robot
  • 81. CE QUI PEUT BLOQUER LES ROBOTS Auteur : Sébastien Billard (s.billard@free.fr)
  • 82. FLASH Auteur : Sébastien Billard (s.billard@free.fr) - Flash n'est à l'origine pas un outil de publication, mais d'animation. - Flash nécessite un plugin pour être lu (Flash Player). Ce n'est pas un standard du web, même si son usage est très répandu. - Flash n'est pas correctement lu par les moteurs, même s'ils arrivent à extraire quelques informations, car l’information y est mal structurée et contenue le plus souvent dans un fichier unique. D’ailleurs Google ne remonte plus aujourd’hui de fichiers swf dans ses résultats (commande filetype:swf) - Il faut donc encore aujourd'hui considérer Flash comme étant totalement inaccessible (et l'indexation éventuelle comme un bonus). L'indexation de Flash pose / posait de nombreux problèmes...
  • 83. SITE 100% FLASH UN EXEMPLE Auteur : Sébastien Billard (s.billard@free.fr) Ce que voit l'utilisateur (s'il a Flash) Ce que voit le moteur (c'est à dire pas grand chose) Tout le site est inclus dans un fichier Flash (swf), non lisible par les moteurs
  • 84. OPTIMISATION DES CONTENUS FLASH : APPROCHES POSSIBLES Auteur : Sébastien Billard (s.billard@free.fr) - Ne pas construire de sites 100% Flash. Par contre l'inclusion d'éléments Flash dans des sites majoritairement en HTML, avec du contenu autour, est parfaitement possible. - Construire deux versions, une Flash, une HTML. Problème : la version Flash devient inutile puisque c'est la version HTML qui sera la mieux référencée, et donc la plus visitée au final. - Fournir un contenu alternatif : pis-aller pour un site Flash ordinaire (URL unique), intéressant pour les sites Flash à plusieurs URLs. La méthode la plus connue est swfObject (http://code.google.com/p/swfobject/). <script type="text/javascript" src="swfobject.js"></script> <div id="flashcontent"> Texte alternatif, visible pour les utilisateurs sans Flash ou sans javascript, ainsi que pour les moteurs </div> <script type="text/javascript"> var so = new SWFObject("flash.swf", "flash", 200, 100, 7, "#336699"); so.write("flashcontent"); </script> Exemple d'utilisation de SWFObject
  • 85. JAVASCRIPT Auteur : Sébastien Billard (s.billard@free.fr) - Javascript est un langage de programmation interprété coté client (c'est le navigateur qui exécute le code, pas le serveur). - Javascript n'est pas interprété par les moteurs, même si des chaines de caractères comme des URLs peuvent être extraites du code javascript et même si certains codes très spécifiques peuvent être interprétés au cas par cas. (il faut d’ailleurs bien penser à crypter son code quand on veut cacher des liens à Google...) - Il est souvent possible d'utiliser Javascript tout en restant accessible (concept de dégradation élégante ou d'amélioration progressive). - Les applications de Javascript les plus problématiques pour le référencement sont typiquement les menus, les pop-ups, les contenus AJAX et les lazy-loads.
  • 86. EXEMPLES DE JAVASCRIPTS ACCESSIBLES ET NON-ACCESSIBLES Auteur : Sébastien Billard (s.billard@free.fr) Un clic sur ce lien ouvre un pop-up, grâce à javascript... Ce popup reste accessible aux moteurs et visiteurs, car le code javascript vient en surcouche de HTML <a href = "javascript:ouvreFenetre(‘http://s.billard.free.fr/radio.blog/index.php', 300, 222)">FS Radio (popup)</a> Ce code aurait été inaccessible
  • 87. REFERENCEMENT ET JAVASCRIPT : APPROCHES POSSIBLES Auteur : Sébastien Billard (s.billard@free.fr) - Ne pas rendre la navigation d'un site dépendant de javascript : cela garantie un minimum d'accessibilité pour les moteurs, comme pour les visiteurs. - Pour être accessible, javascript doit venir en surcouche de HTML, pas en remplacement de celui-ci. - Si un menu javascript inaccessible ne peut être modifié, intégrer des liens alternatifs HTML qui seront suivis par les robots. Cela peut être fait dans le contenu lui-même, dans la balise <noscript>, dans le footer, dans un plan de site...
  • 88. FORMULAIRES Auteur : Sébastien Billard (s.billard@free.fr) - Les moteurs ne savent par remplir un formulaire, ni sélectionner un élément, ni cliquer sur un bouton radio. - Seuls les résultats de type GET (avec paramètres passé dans l'URL) sont potentiellement indexables. - La méthode POST ne permet pas l'indexation, car le résultat du formulaire ne peut être rappelé via une URL (l'URL résultante est toujours la même).
  • 89. FORMULAIRES : EXEMPLE Auteur : Sébastien Billard (s.billard@free.fr) Hormis quelques liens vers les recettes les plus populaires... ...la seule façon d'accéder à l'intégralité du contenu était de renseigner un formulaire Une navigation alternative a été proposée
  • 90. FORMULAIRES : OPTIMISATIONS POSSIBLES Auteur : Sébastien Billard (s.billard@free.fr) - Ne pas utiliser de formulaires comme moyen unique de navigation si le site doit être indexé. - Utiliser la méthode GET (paramètres passé dans l'URL), et non pas POST. - Permettre une navigation arborescente alternative, utilisant des liens HTML. Exemple d'arborescence proposée pour un site de cuisine
  • 91. ROBOTS.TXT Auteur : Sébastien Billard (s.billard@free.fr) - Ce protocole sert à restreindre volontairement l'indexation d'un site par les robots. Il y a de très bonnes raisons de ne pas souhaiter l'indexation de certaines pages (prévention du duplicate content, contenu inutiles...) - On oublie parfois d'enlever le fichier robots.txt lors d'une mise en ligne, ou bien on se trompe dans la syntaxe d'où des cas de non-indexation ou desindexation involontaires. - Le fichier est un simple fichier texte. Il se place obligatoirement à la racine du site. Ex: http://www.site.fr.robots.txt ou http://sous-domaine.site.fr/robots.txt. - Le fichiers robots.txt n'est pas une protection contre les intrusions. Il n'empêche pas l'accès aux pages. Les robots peuvent décider ou non de respecter le protocole (mais les moteurs courants respectent tous les directives robots.txt). - Attention à ne pas oublier le « s » à « robots » !
  • 92. ROBOTS.TXT : SYNTAXE Auteur : Sébastien Billard (s.billard@free.fr) #commentaire# User-agent: * Disallow: /repertoire_un/ Disallow: /repertoire_deux/fichier.html Disallow: *.xml L’user-agent spécifie à quel(s) robot(s) s'adressent les directives. Le wildcard (*) signifie tous les robots. On aurait pu spécifier « Googlebot ». On peut donner des instructions différentes selon les robots. Le dièse permet d’insérer des commentaires ou de désactiver des instructions sans les supprimer Le disallow spécifie les répertoires ou fichiers interdits d'indexation En savoir plus : http://www.robotstxt.org/ Le wildcard est accepté par les moteurs majeurs pour les noms de fichiers, même si cela ne fait pas partie du protocole originel
  • 93. CE QUI PEUT COMPLIQUER LE TRAVAIL DES MOTEURS Auteur : Sébastien Billard (s.billard@free.fr)
  • 94. IMAGES Auteur : Sébastien Billard (s.billard@free.fr) - Les moteurs ne savent pas lire les images. Toute information contenue dans une image non optimisée peut être considérée comme inexistante pour les moteurs. - Toute image porteuse d'information devrait être dotée d'un attribut alt pertinent, idéalement de moins de 80 caractères (taille non critique). - Les images décoratives devraient comporter un attribut alt vide. - Une image peut être balisée sémantiquement, par exemple être intégrée dans une balise <hn> s'il s'agit d'un titre en image. - Un texte HTML est en général jugé plus efficace pour le référencement qu'un texte en image doté d'un attribut alt. <img src="logo-idemm.gif" alt="IDEMM – Ingénierie Documentaire, Edition et Mediation Multimedia " /> Exemple d'image dotée d'un attribut alt pertinent
  • 95. BALISAGE SEMANTIQUE Auteur : Sébastien Billard (s.billard@free.fr) - Les balises sémantiques servent à définir la fonction, le « sens », de chaque élément dans le contenu. - Certaines balises sémantiques se voient reconnaître un poids plus fort par les moteurs de recherche : balises de titre (<hn>), emphases (<strong>)... - Il faut utiliser les balises pour leur fonction, et non pas pour leur impact supposé sur le référencement, ou leur rendu graphique (pas de détournement de balise !). - Le détournement de balise est souvent contre-productif. Les poids sont relatifs : si tout est balisé comme un titre, il n'y a alors plus de titre. - Un certain nombre de balises sémantiques n'ont a l'heure actuelle pas une grande utilité pour le référencement. Ce qui ne veut pas dire qu'il ne faut pas les utiliser, ni qu'elles ne seront jamais prises en compte. Spécifications HTML 4 en français : http://www.la-grange.net/w3c/html4.01/cover.html Spécifications HTML 5 en anglais : https://www.w3.org/TR/html5/sections.html
  • 96. DES BALISES MOINS UTILES (POUR LE REFERENCEMENT ) Auteur : Sébastien Billard (s.billard@free.fr) Source : http://www.minet.net/spip/IMG/pdf/FichePratiqueHtmlSemantique-2-2-2.pdf
  • 97. BALISAGE SEMANTIQUE : EXEMPLE DE RECOMMANDATIONS Auteur : Sébastien Billard (s.billard@free.fr)
  • 98. COMMENT BALISER LES ELEMENTS DUNE PAGE WEB ? Auteur : Sébastien Billard (s.billard@free.fr) - Un logo-titre : rien, ou <h1> (différentes opinions sur le sujet, rien semble préférable) - Un titre ou un sous-titre : <h1>, <h2>, <h3>... - Un bloc de texte : <p> (peut être considéré comme la balise par défaut) - Un passage important, ou un chapô : <strong> (cette balise peut être incluse dans une autre, par ex <p>) - Une énumération non ordonnée (bullet points, tirets) : <ul> - Une énumération ordonnée : <ol> - Les liens d'un menu : <ul> (car un menu est une liste de liens)
  • 99. TESTER LE BALISAGE SEMANTIQUE : LES OUTILS Auteur : Sébastien Billard (s.billard@free.fr) « Examiner l’élément » dans Firefox ou « inspecter » dans Chrome « Display element information » dans l’extension Web developer
  • 100. DUPLICATION DE CONTENU Auteur : Sébastien Billard (s.billard@free.fr) - Les moteurs de recherche sont des bases de données, et font donc la chasse aux doublons. - Quand un même contenu est disponible sur plusieurs URLs, les moteurs vont en général favoriser une URL. La loi de Murphy étant universelle, ce sera rarement la bonne ;) - La duplication de contenu peut diluer la popularité, celle-ci se répartissant entre les différentes URLs au lieu de se concentrer sur une seule. - La duplication peut être complète, ou partielle (near duplicate).
  • 101. SOURCES COURANTES DE DUPLICATION Auteur : Sébastien Billard (s.billard@free.fr) - Noms de domaines multiples (contenu visible sur un .fr et un .com, ou sur plusieurs domaines). - Non canonisation des domaines (site accessible avec et sans « www ») - Identifiants de sessions passé dans les URLs. - Mauvaise gestion de la réécriture d'URLs (absence de redirection 301) - Inversion de l'ordre des paramètres dans les URLs. - Pages d'impression. Mauvaise canonisation Identifiants de session Pages d'impression
  • 102. EVITER LA DUPLICATION DE CONTENU Auteur : Sébastien Billard (s.billard@free.fr) - Utiliser un seul nom de domaine, et rediriger les autres vers celui-ci, via des redirections 301. - Canonisation : faire en sorte qu'une seule version d’URL soit accessible, en redirigeant les autres vers la première, via une redirection 301. - Eviter les identifiants de session passé dans les URLs. Préférer l'identification par cookies. - URL rewriting : toujours rediriger la version non-réécrite vers la version réécrite, via une redirection 301. - Inversion de l'ordre des paramètres dans les URLs : faire attention :) Trier les paramètre par ordre alphabétique peut aider. - Pages d'impression : interdire leur indexation par robots.txt, ou meta tags. - Eventuellement : utiliser la balise <link> rel=canonical. Attention cette balise est une indication, pas une directive. Les moteurs peuvent décider de les ignorer dans certains cas (rare).
  • 103. EVITER LA DUPLICATION DE CONTENU : 301 ET REL=CANONICAL Auteur : Sébastien Billard (s.billard@free.fr) URL actuelleAncienne URL 301 Ok ! j'indexe l'URL actuelle et lui transfère le « linkjuice » des anciennes URLs URL canoniqueContenu dupliqué rel=canonical Ok ! j'indexe l'URL canonique et lui transfère le « linkjuice » des versions dupliquées La balise link rel=canonical s'insère dans le <head> des documents. Ne pas interdire l'indexation sinon la balise ne pourra être prise en compte. Syntaxe : <link rel="canonical" href="http://www.site.fr/version-canonique.html" />
  • 104. REDIRECTIONS Auteur : Sébastien Billard (s.billard@free.fr) - Seules les redirections coté serveur (redirections HTTP) sont suivies par les moteurs. Elles peuvent être gérée au niveau du serveur (.htaccess, mod_rewrite) ou du code des pages (header en PHP). - Les redirections à base de javascript ou de balises meta refresh sont à éviter. - Parmi les redirections coté serveur, seules les redirections 301 (permanentes) transmettent correctement la popularité et permettent une bonne indexation des pages. Eviter les redirections 302 (temporaires) pour des redirections définitives. - Les redirections successives sont à éviter autant que possible, même les 301. <meta http-equiv="refresh" content="0;url=http://www.site.fr/" /> <script type="text/javascript"> <!-- window.location = "http://www.site.fr/" //--> </script> Exemple de redirection javascript, à placer dans le <head> Exemple de redirection utilisant la balise meta refresh
  • 105. COMPORTEMENT DES MOTEURS FACE AUX REDIRECTIONS 301 ET 302 Auteur : Sébastien Billard (s.billard@free.fr) URL de destinationURL de base 302 Ok ! J'indexe le contenu de l'URL actuelle mais garde l'ancienne adresse. Mon linkgraph reste le même URL de destinationAncienne URL 301 Ok ! j'indexe l'URL actuelle et lui transfère le « linkjuice » des anciennes URLs
  • 106. TESTER UNE REDIRECTION : LES OUTILS Auteur : Sébastien Billard (s.billard@free.fr) Outil « réseau » de Firefox Screaming Frog SEO spider en mode « list » Extension « link redirect trace » pour Firefox
  • 107. TESTER LES REPONSES HTTP D’UN SITE : LES OUTILS Auteur : Sébastien Billard (s.billard@free.fr) Screaming Frog SEO spider en mode « spider » (500 URLs max dans la version gratuite)
  • 108. NEGOCIATION DE CONTENU ET « CLOAKING » NON MALICIEUX Auteur : Sébastien Billard (s.billard@free.fr) - Il est possible de personnaliser le contenu d'une page en fonction de la localisation de l'utilisateur, ou de sa langue. Cela peut poser des problèmes en matière de référencement, pour trois raisons : - L'adresse IP d'un robot d'indexation n'est en général pas localisée dans la même région que vos visiteurs cibles. - Les robots d'indexation ne déclarent pas de langage. - Plusieurs versions d'un contenu vont se partager une URL unique, une seule version sera donc indexée. Mieux vaut donc éviter en général la négociation de contenu, et proposer à l'utilisateur de sélectionner la langue et/ou le pays de son choix.
  • 109. STRUCTURATION DES SITES INTERNATIONAUX (LOCALISATION) Auteur : Sébastien Billard (s.billard@free.fr) - Les extensions locales sont souvent favorisées par les versions locales des moteurs. Des domaines séparés avec TLD locaux (.fr, .be, .co.uk...) sont donc la solution à préférer. - Si certains TLD locaux ne sont pas disponibles, envisager un domaine avec extension internationale (.com...). Le nom de domaine peut comporter un indicateur de localisation, par ex : nom-societe-usa.com. Si possible utiliser les codes ISO 3166-1. - Si tous les sites doivent être hébergés sur un domaine unique, bien séparer les versions locales, par des sous-domaines (ex : usa.societe.com) ou par des répertoires (ex : www.societe.com/usa/). - Les sous-domaines sont préférables, car il est plus facile d'effectuer des actions de référencement spécifiques. Codes internationaux ISO : https://fr.wikipedia.org/wiki/ISO_3166-1
  • 110. STRUCTURATION DES SITES INTERNATIONAUX (LANGUE) Auteur : Sébastien Billard (s.billard@free.fr) - La langue des documents est déterminée automatiquement par les moteurs de recherche, en fonction des termes présents dans le contenu. - L'attribut « lang » n'est pas pris en compte par les principaux moteurs.
  • 111. OPTIMISATION EDITORIALE POUR LE REFERENCEMENT Auteur : Sébastien Billard (s.billard@free.fr)
  • 112. RAPPEL : LA PYRAMIDE DU REFERENCEMENT Auteur : Sébastien Billard (s.billard@free.fr) L'ensemble de ces composantes doit être optimisé pour obtenir une bonne visibilité : CONTENU STRUCTURE POPULARITE Le code qui contient le site et le met en forme Essentiellement le contenu textuel du site Ce que le web dit de votre site via les liens Crédibilise Favorise Valorise Redistribue On va travailler aujourd'hui sur ce qui est au coeur du web : le contenu !
  • 113. ROLE DE L'OPTIMISATION EDITORIALE Auteur : Sébastien Billard (s.billard@free.fr) - L'optimisation éditoriale vise à satisfaire un double objectif : être trouvé, et être lu. - Il ne s'agit pas d'arbitrer entre utilisateurs et moteurs : il est parfaitement possible d'écrire des textes efficaces aussi bien pour les moteurs que pour les visiteurs. - Les bonnes pratiques d'optimisation éditoriale pour le référencement vont dans le sens d'une meilleure accessibilité et d'une meilleure ergonomie des contenus, d'où une plus grande satisfaction et de meilleures conversions. Ecrire pour les moteurs c'est nul ! Oui mais non : il s'agit d'écrire avant tout pour les utilisateurs, tout en prenant les moteurs en compte !
  • 114. SPECIFICITES DE LA LECTURE SUR LE WEB Auteur : Sébastien Billard (s.billard@free.fr)
  • 115. SPECIFICITES DE LA LECTURE SUR LE WEB Auteur : Sébastien Billard (s.billard@free.fr) - L’œil accorde instinctivement plus d’importance à certaines zones. Patterns souvent en « F » ou en « E » (mais pas toujours). - Le regards se pose d’abord sur les éléments de navigation (menus, liens…) puis seulement après sur les images. - Le contenu est d’abord scanné, puis ensuite lu (éventuellement). - Les internautes lisent ! Parfois plus même que sur papier. - L’efficacité d’un texte est plus grande quand le langage utilisé est simple, concis, scannable et objectif.
  • 116. LECTURE EN « F » OU EN « E » Auteur : Sébastien Billard (s.billard@free.fr) Il s'agit d'une tendance, pour des pages, homogènes essentiellement textuelles. S'il y a bien une lecture en triangle à l'échelle d'une population d'internautes, ce n'est pas forcement le cas au niveau de l'individu. Source : http://www.useit.com/alertbox/reading_pattern.html
  • 117. LECTURE EN « F » OU EN « E » Auteur : Sébastien Billard (s.billard@free.fr) L'insertion d'éléments rompant le rhytme des pages relativise par exemple le principe de lecture en « F » : Source : http://searchengineland.com/eye-tracking-on-universal-and-personalized-search-12233 Résultats classiques (2006) La saillance influe sur le parcours de l'oeil Résultats universels
  • 118. LE REGARD SE POSE D'ABORD SUR LES ELEMENTS DE NAVIGATION Auteur : Sébastien Billard (s.billard@free.fr) Visionner : http://www.youtube.com/watch?v=lo_a2cfBUGc Les images attirent bien moins l'attention qu'on ne pourrait le penser
  • 119. LES INTERNAUTES SCROLLENT, ET LISENT Auteur : Sébastien Billard (s.billard@free.fr) Les internautes n'hésitent pas à faire défiler le contenu des pages : Source : Source : http://blog.clicktale.com/?p=19
  • 120. LES CONTENUS WEB ET LEUR OPTIMISATION Auteur : Sébastien Billard (s.billard@free.fr)
  • 121. DIFFERENTES FORMES DE CONTENU Auteur : Sébastien Billard (s.billard@free.fr) Quand on parle de « contenus » en matière de SEO, on parle essentiellement des textes : De toute façon les contenus non-textuels pour être visibles dans les moteurs doivent être décrits avec... du texte.) Textes HTML ordinaires Balises <title> Balises <meta> description Attributs alt
  • 122. NOTIONS DE DENSITE DES MOTS-CLES Auteur : Sébastien Billard (s.billard@free.fr) - Quelle couleur peut-on associer au carré de gauche ? à celui de droite ? - Pour qu'une page soit jugée pertinente pour une expression donnée, il faut que cette expression et ses variantes apparaissent un certain nombre de fois dans son contenu. On parle « d'occurences », ou de « densité » (A noter que la densité est une abstraction, et n'est pas utilisée en tant que tel par les moteurs. La densité idéale n'existe pas). - Les expressions-clés visées doivent apparaître dans la page, en particulier dans les zones chaudes (balises <title>, titres, ancres des liens...). - Il est bon de multiplier les occurrences et variations (expressions connexes, genre, nombre etc.) - Restez naturel ! Les répétitions abusives sont suspectes et altèrent la lisibilité.
  • 123. EXEMPLE DE MAUVAISE GESTION DE LA DENSITE Auteur : Sébastien Billard (s.billard@free.fr) F490 : 12x iPhone : 6x Tactile : 6x SGH : 4x Mobile : 3x Téléphone : 0x Portable : 0x
  • 124. LES ZONES CHAUDES D’UNE PAGE Auteur : Sébastien Billard (s.billard@free.fr) Balise <title> Titraille Liens Textes standards
  • 125. LES ZONES CHAUDES D’UNE PAGE Auteur : Sébastien Billard (s.billard@free.fr) - Balise <title> : stratégique pour le positionnement ! Longueur idéale théorique de 40 à 80 caractères (environ 75 caractères max affichés par Google). Mais on peut faire plus long si nécessaire. Tout son contenu sera pris en compte par Google, même s’il est visuellement tronqué. Doit être unique, riche en mots-clés et décrire précisément le contenu de la page. - Titraille : doit être balisée comme telle (<hn>). Ce peut être un mot, une phrase, mais pas un paragraphe. Doit introduire le contenu qui suit immédiatement en dessous. - Liens : leur intitulé est spécialement important pour le positionnement de la page de destination du lien. Un lien doit être explicite, c'est-à-dire permettre de deviner ce dont parle la page de destination sans même la consulter. Il est donc important d'y faire figurer les mots-clés stratégiques. Attentions aux intitulés génériques (« en savoir plus », « suite » etc.) - Corps du texte : doit contenir vos expressions-clés, plus que pas assez, mais moins que trop ;) Favoriser un langage clair. Parlez le langage de vos visiteurs.
  • 126. PARLEZ LE LANGUAGE DE VOS VISITEURS Auteur : Sébastien Billard (s.billard@free.fr) - Ne parlez pas votre langue : parlez la leur ! C’est avec leurs mots que les internautes recherchent dans les moteurs, pas avec les vôtres. - Utilisez un langage simple et clair, favorisez les mots communs. Evitez le jargon marketing, les termes métier (sauf si vous vous adressez à des professionnels). - Recherchez les bons mots-clés (outils de suggestions, communautés…) "Le groupe X réunit 39 000 personnes dans 36 pays. Son réseau mondial de services lui permet d’être concurrentiel sur un marché mondialisé [...] Européen, le modèle X ne propose pas de solution toute faite aux entreprises mais prend en compte leurs spécificités afin de leur proposer des services adaptés à leur culture et à leurs enjeux. Par ailleurs, la multiculturalité du groupe permet aux collaborateurs de X de s’enrichir des expériences et des best practices présentes dans l’ensemble des implantations afin de faire bénéficier à leurs clients de la maturité du groupe en termes d’expérience et d’offre [...] Parce que l’Homme tient une place particulièrement importante dans l’entreprise, X se donne pour mission d’offrir à ses clients des solutions innovantes en conjuguant talents et technologies. Les collaborateurs se reconnaissent dans trois valeurs clés : innover, s’engager et être ouvert." En savoir plus sur le langage clair : http://btb.termiumplus.gc.ca/redac-chap?lang=fra&lettr=chapsect10&info0=10
  • 127. PARLEZ LE LANGUAGE DE VOS VISITEURS : EXEMPLES Auteur : Sébastien Billard (s.billard@free.fr) Rachète ? Achète ? Autorise ? Logiciels ? Applications ? Logiciels ?
  • 128. PARLEZ LE LANGUAGE DE VOS VISITEURS : EXEMPLES Auteur : Sébastien Billard (s.billard@free.fr) Spécialistes de la peinture en trompe l’œil ? Formations Castorama ? Conseils pour bien ranger sa maison ? Décoration style années 50 ? Murs végétalisés ?
  • 129. PARLEZ LE LANGUAGE DE VOS VISITEURS : EXEMPLES Auteur : Sébastien Billard (s.billard@free.fr) Un texte très abstrait proposé aux visiteurs… Le contenu alternatif par contre lui est très concret ;)
  • 130. TROUVER LES BONS MOTS-CLES Auteur : Sébastien Billard (s.billard@free.fr) - Faites appel à votre bon sens, faites preuve d'empathie. - Brainstormez, observez les sites concurrents pour vous en inspirer (pas pour copier). - Observez comment s'expriment vos visiteurs (communautés, moteurs de recherche internes, questions aux intéressés…) - Utilisez Google Trends, Ubersuggest… - Utilisez les outils de suggestion de mots-clés des régies de liens sponsorisés telles que Adwords.
  • 131. TROUVER LES BONS MOTS-CLES : UNE METHODE Auteur : Sébastien Billard (s.billard@free.fr) Brainstorm Données Google suggest Etude des concurrents Etudes des communautés 1ère liste de mots-clés Google Adwords (volumes de recherches et nouvelles suggestions) Liste finale de mots-clés Optionnel : étude de saisonnalité avec Google trends
  • 132. UN RUBRIQUAGE ORIENTE MOTS-CLES Auteur : Sébastien Billard (s.billard@free.fr) - Plus de contenu = plus de visibilité potentielle (effet longue traîne) - 1 thème = 1 page (voire plusieurs) - Associer 1 à 5 expressions-clés à chaque page, qui guideront son optimisation (charte de mots- clés)
  • 133. ABONDANCE DE CONTENU NE NUIT PAS Auteur : Sébastien Billard (s.billard@free.fr) Développer son contenu enrichit le champ lexical global du site et permet de développer un trafic de longue traîne, où les mots-clés rares vont souvent représenter la plus grosse partie du trafic : 5 premiers mots-clés : 16% du trafic 20 premiers : 25% 100 premiers : 40% 250 premiers : 50% 1000 premiers : 65% 5000 premiers : 81% 10000 premiers : 87% Total de 21568 mots-clés analysés
  • 134. LA PYRAMIDE INVERSEE (FRONT LOADING) Auteur : Sébastien Billard (s.billard@free.fr) - Enoncez d'abord les faits essentiels pour ensuite détailler vos contenus (message le plus important en premier). - Les mots-clés visés doivent apparaître dès les premières phrases : cela est bon pour les utilisateurs comme pour les moteurs. INFORMATION PRINCIPALE (reprise dans le <title>) DEVELOPPEMENT DE L'INFORMATION PRINCIPALE INFORMATIONS DE MOINDRE IMPORTANCE 5W+2H Informations principales Développement Informations secondaires
  • 135. LA PYRAMIDE INVERSEE : EXEMPLE Auteur : Sébastien Billard (s.billard@free.fr) Pour être efficace, sauf si vous êtes conteur ou romancier, évitez ce type d’introduction : "Il était une fois une petite fille de village, la plus jolie qu’on eût su voir ; sa mère en était folle, et sa mère-grand plus folle encore. Cette bonne femme lui fit faire un petit chaperon rouge, qui lui seyait si bien, que partout on l'appelait le Petit Chaperon rouge... " Préférez au contraire ceci : "Une petite fille se fait dévorer par un loup usant de malice alors qu'elle allait porter des galettes et du beurre à sa mère-grand, elle aussi victime de l'animal".
  • 136. LES 5W+2H (OU QQOQP+CC) Auteur : Sébastien Billard (s.billard@free.fr) Ces questions peuvent vous aider à déterminer quelles informations sont les plus importantes. Il ne s'agit pas de répondre systématiquement à chacune d'entre elles. Tout est question de contexte. - Who (qui ?) - What (quoi ?) - When (quand ?) - Where (où ?) - Why (pourquoi ?) - How (comment ?) - How much (combien ?)
  • 137. UNE TITRAILLE PRESENTE ET PERTINENTE Auteur : Sébastien Billard (s.billard@free.fr) - Titraille = titre + sous-titres (avec balises <h1> à <h6>) - Des titres et sous-titres explicites aident à une bonne visibilité - Ils améliorent également la "scannabilité" du texte Belle titraille ! Version d'origine Version optimisée
  • 138. ECRITURE EN 3 DIMENSIONS Auteur : Sébastien Billard (s.billard@free.fr) - Les liens ne sont pas réservés aux menus et éléments de navigation ! - L'hypertexte permet de renvoyer à d'autres contenus hors de la page. - Ces liens sont fortement porteurs de pertinence, pour les moteurs de recherche comme pour les utilisateurs. Liens profonds au sein du contenu
  • 139. OPTIMISATION DE LA POPULARITE Auteur : Sébastien Billard (s.billard@free.fr)
  • 140. RAPPEL : LA PYRAMIDE DU REFERENCEMENT Auteur : Sébastien Billard (s.billard@free.fr) L'ensemble de ces composantes doit être optimisé pour obtenir une bonne visibilité : CONTENU STRUCTURE POPULARITE Le code qui contient le site et le met en forme Essentiellement le contenu textuel du site Ce que le web dit de votre site via les liens Crédibilise Favorise Valorise Redistribue Voyons aujourd'hui en quoi il n'y a pas de mal à se faire du lien !
  • 141. LES LIENS : CONSIDERATIONS GENERALES Auteur : Sébastien Billard (s.billard@free.fr)
  • 142. EN QUOI LES LIENS SONT IMPORTANTS ? Auteur : Sébastien Billard (s.billard@free.fr) - Les critères « on page » ne sont pas les seuls pris en compte par les moteurs de recherche : l'environnement d'une page web en dit aussi beaucoup sur sa pertinence. - Le linking sert surtout à départager des pages à la pertinence proche. De fait, plus la compétition est forte entre pages, plus la popularité est importante pour le positionnement. - Les liens transmettent en réalité plusieurs type de signaux : la popularité pure (Pagerank), mais aussi des informations relatives au contenu (ancres des liens), à la qualité (Trustrank et cie) etc. Les SEOs parlent de « linkjuice » pour désigner ces signaux. - Les liens permettent également d'être trouvé par les moteurs, et indexé. Un site populaire est indexé plus fréquemment, et plus profondément. Popularité Ancre Confiance LINKJUICE
  • 143. PRECISIONS SUR LE PAGERANK GOOGLE Auteur : Sébastien Billard (s.billard@free.fr) - Le Pagerank (ou PR) est une valeur qui mesure uniquement la popularité relative d'une page par rapport au reste du web. Le PR est calculé à l'avance. Le Pagerank est un des élément du score final d'une page. - Le Pagerank d'une page mesure en fait la probabilité qu'a un surfeur aléatoire de visiter cette page. Sa valeur réelle est donc comprise entre 0 et 1. La somme des PR de l'ensemble des pages indexées par Google est égal à 1. - Le Pagerank est toujours celui d'une page. Quand on parle du Pagerank d'un site, on parle en général du PR de sa page d'accueil. Le PR d'un site est donc un abus de langage. - Toute page indexée, même dépourvue de liens entrants possède un PageRank « inné ». - Plus le PR d’une page est élevé, plus elle transmet du PR. Final score = IR score * Pagerank Score déterminant le positionnement dans la page de résultats Score de pertinence (lié au contenu, à la structure) Score de popularité
  • 144. PAGERANK ET ALGORITHMES SIMILAIRES : FONCTIONNEMENT Auteur : Sébastien Billard (s.billard@free.fr) La formule originelle, décrite par Larry Page et Sergei Brin : Chaque lien présent sur une page transmet aux pages de destination une quantité de Pagerank égale à son propre PR, divisée par le nombre de liens présents sur la page, modéré par un facteur d'amortissement (0.85 dans le papier original). PR de la page T1 divisé par le nombre de liens sortants de la page T1 Facteur d'amortissement Web à 1 page Web à 2 pages isolées Web à 2 pages, lien unidirectionnel Web à 2 pages, lien réciproque
  • 145. PAGERANK ET ALGORITHMES SIMILAIRES : FONCTIONNEMENT Auteur : Sébastien Billard (s.billard@free.fr) Simulateur de PageRank : http://caccio.blogdns.net/archives/71
  • 146. QUALITE DES LIENS Auteur : Sébastien Billard (s.billard@free.fr) Tous les liens ne présentent pas le même intérêt pour le référencement, du fait de leur incapacité à être suivis ou à transmettre du PR : - Les liens dans des fichiers Flash doivent encore êtres considérés comme inexistants (même si les moteurs expérimentent). - Les liens codés en javascript ne sont pas suivis par les moteurs (en général). Les liens HTML additionnés de javascript peuvent être suivis et transmettre du Pagerank. - Les liens dotés d'un attribut nofollow peuvent être suivis ou non par les moteurs, mais dans tous les cas ils ne transmettent pas de « linkjuice ». - Les liens images transmettent du PageRank, mais aucun signal lié à l’ancre, sauf si un attribut alt est présent. <a href="http://www.site.fr" rel="nofollow">Ancre du lien</a> L'attribut nofollow « stérilise » le lien
  • 147. PAGERANK ET ATTRIBUT NOFOLLOW Auteur : Sébastien Billard (s.billard@free.fr) Il a pu être tentant à une époque de sculpter le Pagerank en utilisant l'attribut nofollow, dans le but d'envoyer plus de PR vers les pages « utiles ». Ce n'est plus une technique efficace aujourd'hui (à supposer qu'elle l'ait un jour été) : 33% 33% 33% Le PR transmissible était redistribué vers les pages sans nofollow Le PR transmissible du lien nofollow s'évapore Depuis juin 2009 :Avant juin 2009 :Sans nofollow : 50% 50% nofollow 33% 33% nofollow
  • 148. CRÉER DU LIEN ENTRANT Auteur : Sébastien Billard (s.billard@free.fr)
  • 149. ESTIMER LA POPULARITE Auteur : Sébastien Billard (s.billard@free.fr) Pendant longtemps, Google a proposé une barre d’outil affichant une valeur de Pagerank sous forme de note entre 0 et 10. Mais ce Pagerank n’est plus proposé depuis 2016. La seule façon d’estimer la popularité d’une page désormais est de passer par des outils tiers (Majestic SEO, MOZ, Ahrefs…). Problème : rien ne dit que leur version du Pagerank soit équivalente à celle utilisée par Google, et leur index est de toute façon bien plus petit que celui de Google… Exemple d’alternative au Pagerank : le page authority de MOZ
  • 150. EVALUER LE LINKING D'UN SITE : MAJESTIC SEO Auteur : Sébastien Billard (s.billard@free.fr) Majestic SEO prend en compte la dimension temporelle. Il possède son propre index : Evolution du nombre de liens
  • 151. COMMENT CREER DU LIEN ENTRANT ? Auteur : Sébastien Billard (s.billard@free.fr) - Exploitez votre réseau immédiat (partenaires, institutionnels, clients, fournisseurs...) - Procédez à des échanges de liens avec des sites proches (privilégier la pertinence). - Soumettez votre site aux annuaires généralistes et spécialisés (de plus en plus obsolète). - Faites parler de vous, online et offline (interviews, communiqués, relations presse...) - Exprimez-vous dans des communautés (signatures de forums, commentaires de blogs...) - Proposez des contenus ou services attirant des liens spontanés (link baiting). - Soyez actif dans les réseaux sociaux (même si beaucoup de liens sont en nofollow, le SMO constitue une caisse de résonance de votre communication). - Travaillez votre référencement : la visibilité attire le lien. - Fuyez tout ce qui promet la création rapide de liens artificiels !
  • 152. ANNUAIRES : CONSEILS POUR DES SOUMISSIONS DE QUALITE Auteur : Sébastien Billard (s.billard@free.fr) - Evitez les soumissions automatiques, les réseaux d'annuaires, les annuaires de mauvaise qualité (par exemple sans contrôle éditorial). - Evitez les annuaires exigeant un lien en retour. - Assurez-vous que les liens proposés soient « en dur » (liens directs, sans redirections). - Soumettez aux annuaire spécialisés (thématiques, locaux), et généralistes. - Ne soumettez que des sites finis (pas de sites en construction). - Sélectionnez la catégorie la plus pertinente de l'annuaire. - Utilisez la racine du site ou d'un sous-domaine comme lien. - Utilisez le nom du site comme titre, sauf indication contraire de l'éditeur. - Rédigez la description du site avec soin. Variez les descriptions si possible.
  • 153. TROUVER DES ANNUAIRES Auteur : Sébastien Billard (s.billard@free.fr) - Utilisez les annuaires d'annuaires (pas forcément à jour). Maintenez une liste perso. - Cherchez des annuaires avec des requêtes de type « annuaire + mot-clé ». - Cherchez des annuaires en exploitant leurs signatures (ex : « mot-clé + "ajouter votre site" »). Avantage : on tombe souvent directement sur la bonne catégorie. - Etudiez les liens entrants des concurrents, par ex à l'aide de Majestic SEO. "Proposer un site" "Proposer votre site" "Ajouter un site" "Ajoutez votre site" "Inscrire votre site" "Soumettre un site" Signatures d'annuaires typiques
  • 154. LIENS EN NOFOLLOW Auteur : Sébastien Billard (s.billard@free.fr) Beaucoup de sites utilisent l'attributs nofollow aujourd'hui. Ces liens sont inutiles pour la popularité, ce qui ne veut pas dire qu'ils n'aient aucune utilité : il peuvent générer du trafic et participer à la visibilité globale. L’extension nofollow permet de mettre en évidence les liens nofollow
  • 155. LINK BAITING Auteur : Sébastien Billard (s.billard@free.fr) L'idée du link baiting est de pousser les internautes à faire des liens. Le link baiting comporte le plus souvent une dimension virale (bouche à oreille). Quelques moyens couramment employés : - Contenu qualitatif (même si ce n'est pas vraiment une technique) - Services, goodies, widgets ou logiciels gratuits. - Publications gratuites (ebooks, livre blanc). - Organisation de concours. - Publication d'articles polémiques. - Publications de vidéos ou contenus viraux. - Traduction de documents et ressources de références. - Etc.
  • 156. MESURER L'EFFICACITE DU REFERENCEMENT Auteur : Sébastien Billard (s.billard@free.fr)
  • 157. COMMENT CHOISIR DES INDICATEURS DE PERFORMANCE ? Auteur : Sébastien Billard (s.billard@free.fr) - Les indicateurs de performance (aussi appelés Key Performance Indicators, ou KPI) se définissent toujours en fonction d'un certain contexte : par exemple un deblacklistage peut être considéré comme un KPI pour un site auparavant banni. Pour un site e-commerce, le CA généré ou le taux de transformation seront plus important que pour un site d’information. - La difficulté en matière de SEO est de définir des KPIs qui soient fortement corrélés à la visibilité ou à la présence dans les moteurs de recherche. Le trafic moteurs ou les performances d'un site ne sont pas uniquement conditionnés par le référencement.
  • 158. QUELQUES INDICATEURS DE PERFORMANCE POSSIBLES Auteur : Sébastien Billard (s.billard@free.fr) - Etendue de l'indexation (nombre ou pourcentage de pages indexées). - Evolution des positions sur une sélection de mots-clés. - Evolution du trafic en provenance des moteurs (hors notoriété). - Part des différents moteurs dans le trafic. - Couverture sémantique (nombre d’expressions générant du trafic). - Pertinence des mots-clés tapés. - Evolution de la réalisation d'objectifs. - Evolution des indicateurs commerciaux pour le trafic SEO
  • 159. LE MINIMUM DE LA VISIBILITE : LA PRESENCE Auteur : Sébastien Billard (s.billard@free.fr) Il est pertinent pour un nouveau site web de s'assurer que celui-ci est bien indexé par les moteurs, et dans quel mesure : - Comptabiliser le nombre d'URLs utiles indexables, via les sitemaps XML ou via des outils de crawl. - Regarder le nombre d'URLs indexées par les moteurs, à l'aide de la commande « site: » (Le chiffre obtenu peut ne pas être 100% exact, mais donne un ordre de grandeur raisonnablement précis la plupart du temps).
  • 160. VISIBILITE : LE CONTRÔLE DE POSITIONNEMENT Auteur : Sébastien Billard (s.billard@free.fr)
  • 161. CONTRÔLE DE POSITIONNEMENT : A SAVOIR Auteur : Sébastien Billard (s.billard@free.fr) - Quantité de logiciels et services existent : Ranks, Yooda Seeurank, Advanced Web Ranking... Certains sont gratuits. Si on suit un grand nombre d’expressions les services en ligne sont préférables aux logiciels. - On peut soit suivre des mots-clés que l’on détermine, soit utiliser le panel de mots-clés préconstitué de l’outil. - Il ne faut pas utiliser les APIs des moteurs, car les résultats des APIs sont différents des résultats standards. - Les requêtes automatisées ne sont pas autorisées par les moteurs (sauf APIs).Si le moteur est trop requêté, l'adresse IP peut être bloquée temporairement. Pas de risque cependant pour le site lui-même. - Il peut y avoir de légère fluctuations dans les résultats, en fonction des datacenters interrogés. Cela est normal. De même les résultats peuvent différer avec la personnalisation. - Il est tout à fait normal que la position pour un mot-clé donné évolue d’un jour à l’autre. Un mot- clé peut même disparaitre le temps d’un relevé. C’est quand la position évolue fortement et durablement qu’il faut s’inquiéter ou se réjouir.
  • 162. EXEMPLE D’OUTIL : RANKS Auteur : Sébastien Billard (s.billard@free.fr) Les mots-clés peuvent être ajouté individuellement, ou par lots Un groupe thématique peut être associé aux mots-clés On peut choisir les moteurs interrogés
  • 163. EXEMPLE D’OUTIL : RANKS Auteur : Sébastien Billard (s.billard@free.fr) Une vue synthétique permet de se faire une idée de la bonne santé SEO du site
  • 164. EXEMPLE D’OUTIL : RANKS Auteur : Sébastien Billard (s.billard@free.fr) Les mêmes indicateurs sont consultables pour les groupes thématiques
  • 165. EXEMPLE D’OUTIL : RANKS Auteur : Sébastien Billard (s.billard@free.fr) Le détail des positions permet une analyse pour chaque mot-clé
  • 166. EXEMPLE D’OUTIL : RANKS Auteur : Sébastien Billard (s.billard@free.fr) Il est possible d’obtenir des graphes, par exemple sur le positionnement d’un mot-clé
  • 167. GOOGLE SEARCH CONSOLE Auteur : Sébastien Billard (s.billard@free.fr)
  • 168. GOOGLE SEARCH CONSOLE Auteur : Sébastien Billard (s.billard@free.fr) Google Search Console (ex Webmaster Tools) est une interface à destination des webmasters, proposé par Google. Après vérification du site, Webmaster Tools permet notamment : - D'obtenir des informations sur la visibilité d'un site et sur le trafic généré par Google (jusque 16 mois en arrière) - D’obtenir des informations sur les mots-clés tapés par les internautes. Cela est d’autant plus utile que les mots-clés sont supprimés des référers Google depuis 2014 (remplacés par « not provided »). - D'accéder à une partie des liens entrants. - De détecter et résoudre divers problème techniques. - De contrôler l’indexation des pages du site (en complément au fichier robots.txt) - De soumettre un sitemap XML.
  • 169. MOTS CLES, VISIBILITE, TRAFIC Auteur : Sébastien Billard (s.billard@free.fr) L’outil performance permet de voir l’évolution des visites en provenance de Google, du nombre d’impressions, du taux de clic ainsi que l’évolution de la position moyenne. Des options de filtrage sur les mots-clés, les URLs, le pays ou l’appareil sont proposées
  • 170. MOTS CLES, VISIBILITE, TRAFIC Auteur : Sébastien Billard (s.billard@free.fr) Search Console permet d’obtenir 999 mots-clés en une vue. Mais on peut en obtenir bien plus en multipliant les vues grâce aux options de filtrage
  • 171. LIENS ENTRANTS Auteur : Sébastien Billard (s.billard@free.fr) L’outil liens vers votre site donne accès à un certain nombre de lien, aux pages les plus plus liées ainsi qu’aux ancres des liens
  • 172. STATISTIQUES SUR L’EXPLORATION Auteur : Sébastien Billard (s.billard@free.fr) L’outil statistiques sur l’exploration fournit une vue de l’activité de Googlebot sur le site
  • 173. STATISTIQUES SUR L’EXPLORATION Auteur : Sébastien Billard (s.billard@free.fr) L’outil erreurs d’exploration permet de diagnostiquer les difficultés que Googlebot rencontre pour explorer le site
  • 174. MESURE D’AUDIENCE Auteur : Sébastien Billard (s.billard@free.fr)
  • 175. DIFFERENTS TYPES DE MESURE D’AUDIENCE Auteur : Sébastien Billard (s.billard@free.fr) - La mesure de l'audience d'un site peut être « site centric » ou « user centric ». - Les méthodes « user centric » se basent sur l'étude d'un panel d'utilisateurs, donc d’un échantillon. Elles sont intéressantes pour comparer les trafic des sites en incluant des dimension socio-démographiques. Mais elles apportent peu d'information pour un site en particulier, et sont surtout réservées aux sites à fort trafic. - Les méthodes « site centric » se basent sur l'étude du comportement de l’ensemble des visiteurs du site. Les dimensions socio-démographiques ne sont pas prises en compte (en général), mais l'information sur le comportement du visiteur dans le site est très précise. Les méthodes « site centric » reposent soit sur l'analyse des fichiers log, soit sur l'insertion de tags javascript (parfois d'images également). - L'analyse des fichiers log permet d'obtenir des informations sur les visites des robots, ce que les tags javascript ne permettent pas. Un script est à installer localement. Exemples d'analyseurs de logs : Awstats, Webalizer... - L'utilisation de tags javascript est plus aisée et permet de recueillir plus de données. Il s'agit généralement de services web. C'est la méthode proposée par Xiti, eStats, Omniture, Google Analytics...
  • 176. GOOGLE ANALYTICS : INTERFACE GENERALE Auteur : Sébastien Billard (s.billard@free.fr) Période(s) considéré(s)Segments personnalisables
  • 177. GOOGLE ANALYTICS : VOIR LE TRAFIC MOTEURS Auteur : Sébastien Billard (s.billard@free.fr) Aller dans « Acquisition » / « Canaux » puis sélectionner « organic search » dans le tableau
  • 178. GOOGLE ANALYTICS : REPARTITION DU TRAFIC MOTEURS Auteur : Sébastien Billard (s.billard@free.fr) Aller dans « Acquisition » / « Canaux », sélectionner « organic search » dans le tableau, et « source » comme dimension principale Un clic sur l’icône secteur permet d’obtenir une visualisation par secteur
  • 179. GOOGLE ANALYTICS : TROUVER LES REFERERS (LIENS ENTRANTS) Auteur : Sébastien Billard (s.billard@free.fr) Aller dans « Acquisition » / « Sites référents » On accède aux pages referers en cliquant sur les domaines listés.
  • 180. GOOGLE ANALYTICS : RAPPORTS PERSONNALISES Auteur : Sébastien Billard (s.billard@free.fr) Au quotidien il est plus pratique de créer des rapports personnalisés, qui regrouperont les indicateurs favoris.
  • 181. REFERENCEMENTS SPECIFIQUES Auteur : Sébastien Billard (s.billard@free.fr)
  • 182. LA RECHERCHE UNIVERSELLE OFFRE DE NOUVELLES OPPORTUNITES Auteur : Sébastien Billard (s.billard@free.fr) Images Actualités Vidéos Résultats locaux
  • 183. REFERENCEMENT LOCAL Auteur : Sébastien Billard (s.billard@free.fr)
  • 184. REFERENCEMENT LOCAL : CE QU'IL FAUT SAVOIR Auteur : Sébastien Billard (s.billard@free.fr) - Environ 15% des pages de résultats Google affichent une carte. Le pack local recevrait environ 1% des clics aux USA. 73% des activités en ligne incluraient une dimension locale (du moins aux USA). - Les méthodes d'optimisation classiques reste valables : optimisez les balises <title> et les contenus en incluant la dimension locale quand cela est pertinent. - Le meilleur moyen d'être visible lors des recherches locales est d'inscrire son site dans le Local Business Center Google. L'inscription se fait par la complétion d'un formulaire suivie d'une confirmation par courrier ou SMS.
  • 185. REFERENCEMENT LOCAL : PISTES POUR L'OPTIMISATION DES PAGES Auteur : Sébastien Billard (s.billard@free.fr) La balise <title> est évidemment un bon endroit pour mentionner sa ville, son département, sa région... Le contenu permet lui d'élargir le champ sémantique local et de renforcer sa pertinence... Le fait de mentionner son adresse sur toutes les pages pourrait être pris en compte par les moteurs. Cela permet en tout cas à l'internaute de vérifier que le résultat est pertinent.
  • 186. OPTIMISER UN LISTING LOCAL BUSINESS CENTER Auteur : Sébastien Billard (s.billard@free.fr) - Le nom influe fortement sur le positionnement. Inclure éventuellement des mots-clés, quand votre activité n’est pas évidente sur la base de votre seul nom, sans spammer (ex : « François Dupont – Plombier chauffagiste »). - L'adresse a aussi une influence considérable, mais difficile de tricher ;) - Fournir une description riche en mots-clés et incitant au clic. - Pour les activités, utiliser les catégories qui vous definissent le mieux. https://support.google.com/business/answer/3038177
  • 187. OPTIMISER UN LISTING LOCAL BUSINESS CENTER Auteur : Sébastien Billard (s.billard@free.fr) Lorsque une société ou un organisme possède plus de 10 établissements, il est possible d'effectuer un transfert groupé des fiches, grâce à un tableau au format CSV.
  • 188. REFERENCEMENT DANS GOOGLE ACTUALITES Auteur : Sébastien Billard (s.billard@free.fr)
  • 189. REFERENCEMENT DANS GOOGLE ACTUALITES Auteur : Sébastien Billard (s.billard@free.fr) - L'inclusion dans Google News est manuelle. - Seules les sources d'information à plusieurs rédacteurs peuvent être incluses. - La durée de vie d'une actualité dans l'index est de 30 jours. - Seuls les contenus originaux sont indexés. Les contenus repris sont filtrés. - Chaque actualité doit posséder une URL unique et permanente. - Les sitemaps pour Google Actualité permettent une indexation plus efficaces, et autorisent l'insertion de meta données. - Une structure de page simple est préférable (idéalement mise en page CSS, avec divisions logiques). - Les contenus inaccessibles car réservés aux abonnés peuvent être indexés, si utilisation du « premier clic gratuit ». Possibilité de limiter à 5 le nombre de clics gratuits par utilisateur et par jour).
  • 190. REFERENCEMENT DES IMAGES Auteur : Sébastien Billard (s.billard@free.fr)
  • 191. REFERENCEMENT DANS GOOGLE ACTUALITES Auteur : Sébastien Billard (s.billard@free.fr) - Les moteurs sont incapables de déterminer ce que représente une image. - L'optimisation des images passe toujours par l'association de texte. Le texte associé peut être interne (attribut alt, texte à proximité) ou externe à la page (ancres des liens, textes à proximité des ancres). - La popularité a une influence, de même que les critères usuels. Attributs alt Textes à proximité des liens vers les images Textes à proximité de l'image Le nom du fichier est pris en compte mais son poids n'est pas si fort comparé aux attributs alt et textes associés
  • 192. REFERENCEMENT DES VIDEOS Auteur : Sébastien Billard (s.billard@free.fr)
  • 193. REFERENCEMENT DES VIDEOS : CONSIDERATIONS GENERALES Auteur : Sébastien Billard (s.billard@free.fr) - Les moteurs ne sont pas capables de lire les vidéos (sauf expérimentations de transcription automatique et moteurs spécialisés). - Comme pour les images, l'optimisation des vidéos passe par l'adjonction de textes. - La façon la plus simple de rendre visibles ses vidéos reste de passer par les services du type Youtube, Google vidéo, Dailymotion etc. La transcription automatique reste perfectible…
  • 194. REFERENCEMENT DES VIDEOS : PUBLICATION SUR SITE Auteur : Sébastien Billard (s.billard@free.fr) - L'indexation d'une vidéo publiée sur son propre site n'est jamais garantie, mais on peut la favoriser. - Les vidéos doivent être accessibles en HTTP. Le streaming n'est pas pris en charge par Google. Format supportés : .mpg, .mpeg, .mp4, .mov, .wmv, .asf, .avi, .ra, .ram, .rm, .flv - La taille des vidéos doit être inférieure à 30 Mo. - L’utilisation du microformats schema.org/VideoObject est conseillées. - Il est possible d'utiliser un fichier Sitemap pour vidéos, ou un fichier media RSS. Les deux formats permettent l'insertion de meta données optimisables : titres, descriptions, tags, transcripts (mRSS uniquement)... - Il est vital d'associer du texte aux vidéos : balise <title>, titres, descriptions, idéalement un transcript. - Les méthodes habituelles d'optimisation des pages continuent d'être valables (balisage sémantique, popularité...).
  • 195. REFERENCEMENT DES VIDEOS : PUBLICATION SUR SITE Auteur : Sébastien Billard (s.billard@free.fr) Titres et textes optimisés Insertion d'un transcript
  • 196. REFERENCEMENT DES VIDEOS : PUBLICATION SUR PLATEFORME Auteur : Sébastien Billard (s.billard@free.fr) - La publication sur les plateformes est la plus simple. Du fait que les pages sont structurées et les plateformes populaires, les vidéos sont indexées facilement. - La publication sur plateforme peut venir en complément d’une publication sur site. - La publication sur plateforme permet de bénéficier de l'effet de communauté et favorise la diffusion de la vidéo. Elle génère cependant assez peu de trafic sur le site source.
  • 197. OPTIMISER SON REFERENCEMENT SUR YOUTUBE (ET CONSORTS) Auteur : Sébastien Billard (s.billard@free.fr) Où placer ses mots-clés ? Titre de la vidéo Description Les tags ne sont plus affichés depuis quelques années, mais restent présent dans l’interface de gestion des vidéos. Ils sont donc à optimiser