SlideShare une entreprise Scribd logo
1  sur  34
Analyse de logs
Pour qui ? Pour quoi ? Comment ?
Julien Deneuville
• 27 ans
• Monte des sites depuis 2004
• SEO pro depuis 2011
• Twitter : @diije
• Blog : http://blog.1-clic.info/
• Musique
• Vélo
Qui suis-je ?
Hello, World!
L’analyse de logs : les grandes lignes
Est-ce fait pour moi ?
A quels KPI m’intéresser ?
Outils et perspectives
3
Analyse de logs
Sommaire
Analyse de logs
De quoi parle-t-on ?
Client - Serveur
5
Quelques notions de réseau
Client :
• Envoie une requête au serveur
• Attend la réponse
• Affiche la réponse
6
Serveur :
• Reçoit des requêtes
• Effectue les traitements
• Renvoie les résultats
Client - Serveur
Quelques notions de réseau
• Navigateur web
• Client mail
• Spotify
• …
• Robot de moteur de recherche
• Serveur web (Apache, Nginx, IIS, …)
• Serveur mail
• Application spécifique
Client :
• Envoie une requête au serveur
• Attend la réponse
• Affiche la réponse
• Navigateur web
• Client mail
• Spotify
• …
• Robot de moteur de recherche
7
Serveur :
• Reçoit des requêtes
• Effectue les traitements
• Renvoie les résultats
• Serveur web (Apache, Nginx, IIS, …)
• Serveur mail
• Application spécifique
Client - Serveur
Quelques notions de réseau
Les logs serveur
Les serveurs web enregistrent toutes les demandes qu’ils reçoivent dans des
fichiers texte : ce sont les logs serveur.
Ils permettent notamment :
• D’obtenir des statistiques de fréquentation d’un site
• De débuguer un composant problématique
• De détecter les attaques de hackers
• … 8
Qu’est-ce que c’est quoi donc ?
Rappels :
• Googlebot ne déclenche pas les tags des
outils de webanalytics
• Les données de Google Search Console
sont-elles fiables ?
Avec les logs serveur on peut :
• Voir les pages que Googlebot visite
• Compléter Google Analytics et détecter
les visites en provenance de Google
• Trouver de nombreuses pistes
d’amélioration
9
Et en SEO ?
Pourquoi vouloir analyser les logs ?
Pour qui ?
Pour les sites à gros volume
• Quelques centaines de milliers de pages
Audit : une mine d’informations pour les optimisations
• Crawl utile/inutile
• Pages actives/inactives
• Trous de crawl
• …
Monitoring : un outil d’alerte indispensable
10
Et mon site dans tout ça ?
Pour tous les autres aussi :
il n’y a pas que les « gros » qui ont des problèmes !
Kit de survie
Logs 101
Accéder à vos logs
• Exemple pour un mutualisé OVH :
http://logs.ovh.net/mon-domaine.tld
• Récupérer les logs d’accès
Un terminal
• Intégré à Linux et Mac OS
• Installez Cygwin sous Windows
12
Starter Kit
De quoi ai-je besoin ?
La ligne de commande
Compter les hits de Googlebot
• ~$ grep "Googlebot" access.log | wc –l
Compter les hits de Googlebot par URL
• ~$ grep "Googlebot" access.log | cut –d " " –f7 | sort | uniq –c
Envoyer les résultats dans un fichier
• ~$ grep "Googlebot" access.log | sort | uniq –c > resultats.txt
13
Quelques exemples simples
Vous pouvez déjà faire 100% des analyses de logs dont vous
avez besoin !
Allez plus loin
Un article de l’excellent Paul Courtois :
http://blog.pole-conseils.com/maitrisez-lanalyse-de-logs-les-5-commandes-
indispensables-pour-devenir-autonome/
La rolls de l’analyse de logs en console : awk chez Jean-Benoît Moingt
http://www.watussi.fr/lanalyse-des-logs-serveur-une-mine-dinformation-pour-
le-seo
14
Liens utiles
Quels KPI ?
Un peu de méthode
Le crawl : le compagnon
indispensable de l’analyse de logs
Des outils :
• Logiciels : Xenu, Screaming Frog
• En SaaS : Botify, Oncrawl …
• Pour les geeks : Scrapy, Mnogosearch,
Nutch ...
16
Step 1 : crawler
Tâtez le terrain
Step 1 : crawler
Quels indicateurs ?
• Nombre de pages
• Codes réponse
• Profondeur de l’arborescence
• Titres dupliqués
• Maillage interne
• Temps de chargement
• …
En savoir plus sur le sujet ?
• Mode d’emploi de Xenu chez Daniel Roch : http://www.seomix.fr/xenu/
17
Tâtez le terrain
Crawlers
Crawlez souvent
• En recette, en prod
• Après chaque mise en production
• Périodiquement pour vous assurer que tout va bien
Ne crawlez pas toujours tout votre site
• Ca peut être long
• Rarement possible d’analyser de nombreux rapports
• Selon le site, les 4 ou 5 premiers niveaux sont suffisants
Conservez vos données
• Pour avoir un historique
• Pour comparer les crawls entre eux 18
Tips & tricks
Step 2 : analyse de logs
19
Vers l’infini et au-delà !
Googlebot hait les erreurs.
Erreurs 5xx
• 500 : souvent le signe d’un problème de
code à corrigez-le
• 503 : votre serveur tient-il la charge ?
Erreurs 4xx
• Liens internes erronés (trouvez-les dans
le crawl)
• Liens externes erronés (trouvez-les avec
Majestic/Ahrefs)
• Dans les deux cas : correction +
redirection 301 20
Codes réponse
Envoyez le bon signal
Combien de temps maintenir une
redirection 301 ?
Attention : les 301 peuvent gonfler
artificiellement le volume de crawl !
21
Le cas des 301
Permanent jusqu’à quand ?
A maintenir de manière permanente …
Comparez les indicateurs :
• Nombre d’URLs dans les logs
• Dans le crawl
• Dans Google Search Console
• Dans Analytics
• Sur « site:monsite.com »
Trop de pages dans les logs ?
• Des paramètres qui entraînent la duplication de contenu
?
• ...
Pas assez ?
• Vos liens internes sont-ils seo-friendly ?
• … 22
Volume de pages
Google crawle-t-il un nombre raisonnable de pages ?
Comparez les pages les plus crawlées
et celles qui vous importent le plus :
• Googlebot visite-t-il assez souvent vos
pages stratégiques ?
• Perd-t-il son temps sur des pages inutiles
?
Que faire en cas de problème ?
• Revoir le maillage interne pour booster
les bonnes pages
• Savoir supprimer des pages inutiles
23
Pages actives
S’intéresser aux bonnes pages
Post-audit, mettez en place une
analyse de vos logs en continu :
• Recette facilité lors des mises en
production
• Alerting en cas de problème technique
• Suivi du délai d’indexation des
nouvelles pages
• Changements de comportement de
Googlebot
• …
24
Step 3 : monitoring
Gardez le contrôle
Quelques outils
Serious Business
Avantages :
• Gratuit
• Simple à mettre en place
• A héberger soi-même
Inconvénients
• A héberger soi-même
• Simpliste
• Pas mis à jour
Watussi
Un bon début
Idéal pour quelques dizaines de pages !
http://box.watussi.fr/
Avantages :
• Sûrement l’interface la plus aboutie
• Associé à un crawler
• Service client à l’écoute
• En SaaS
Inconvénients
• Cher
• Parfois peu intuitif
Botify
Artillerie lourde
Si vous avez le budget, foncez !
https://www.botify.com/
Avantages :
• En beta gratuite
• Des fonctionnalités innovantes
• En SaaS
Inconvénients
• Peu de documentation
• Support reposant sur une seule personne
Spiderlog
Le petit nouveau
L’outsider que vous devriez tester !
https://spiderlog.serphacker.com/
Avantages :
• Parfait pour le monitoring
• Analyse crawl vs logs (bientôt)
• Service client à l’écoute
• En SaaS
Inconvénients
• Pas aussi complet qu’un Botify
http://kelo.gs/
Kelogs
#ROI
Le meilleur rapport Qualité/Prix du marché !
Avantages
• Sur-mesure
• Vous gardez vos données
• Une possibilité d’analyse inégalable
Inconvénients
• Coût de développement
• Coût de maintenance
• Nécessite une bonne connaissance du
sujet
30
Homemade
On n’est jamais aussi bien servi que par soi-même
Forcément le plus adapté à vos besoins !
Next steps
1. Crawlez votre site
2. Récupérez les logs
3. Faites une première analyse
4. Mettez en place un outil de
monitoring
32
Au boulot !
Homework
Ajoutez des infos dans vos logs
• Apache : voir ici
• Temps de chargement
• Host
Croisez vos données
• Analytics
• Ventes
• Inventaire
• …
33
Allez plus loin
Devenez un roi de la Data
www.1-clic.info
Merci de votre attention !
Bon appétit J
Mail
julien@1-clic.info
Blog
http://blog.1-clic.info/
Twitter
@diije

Contenu connexe

Tendances

02 seo principes - referencement seo
02 seo    principes - referencement seo02 seo    principes - referencement seo
02 seo principes - referencement seoJCDomenget
 
Rustで楽しむ競技プログラミング
Rustで楽しむ競技プログラミングRustで楽しむ競技プログラミング
Rustで楽しむ競技プログラミングyoshrc
 
ppt sur le Référencement
ppt sur le Référencementppt sur le Référencement
ppt sur le Référencement3Market
 
Le publipostage sous word
Le publipostage sous wordLe publipostage sous word
Le publipostage sous wordResosphere
 
Arbre de décision.pdf
Arbre de décision.pdfArbre de décision.pdf
Arbre de décision.pdfimane26
 
Fiche pédagogique 07b internet exercices
Fiche pédagogique 07b internet exercicesFiche pédagogique 07b internet exercices
Fiche pédagogique 07b internet exercicescourgette
 
E-mail Restart 2024: Lukáš Balek - Keynote: Výsledky průzkumu o roli AI v čes...
E-mail Restart 2024: Lukáš Balek - Keynote: Výsledky průzkumu o roli AI v čes...E-mail Restart 2024: Lukáš Balek - Keynote: Výsledky průzkumu o roli AI v čes...
E-mail Restart 2024: Lukáš Balek - Keynote: Výsledky průzkumu o roli AI v čes...Taste
 
ダブリング
ダブリングダブリング
ダブリングsatanic
 
Veille 2.0
Veille 2.0Veille 2.0
Veille 2.0Zebrure
 
Audit comptable-financier-objectifs-demarches-et-techniques
Audit comptable-financier-objectifs-demarches-et-techniquesAudit comptable-financier-objectifs-demarches-et-techniques
Audit comptable-financier-objectifs-demarches-et-techniquesYoussef Bensafi
 
ユークリッド最小全域木
ユークリッド最小全域木ユークリッド最小全域木
ユークリッド最小全域木理玖 川崎
 
第21回アルゴリズム勉強会
第21回アルゴリズム勉強会第21回アルゴリズム勉強会
第21回アルゴリズム勉強会Yuuki Ono
 
Webサイト改善の手順
Webサイト改善の手順Webサイト改善の手順
Webサイト改善の手順Ptmind_jp
 
BMSKIT, 캔버스 활용 비즈니스 모델링 스타터 툴킷
BMSKIT, 캔버스 활용 비즈니스 모델링 스타터 툴킷BMSKIT, 캔버스 활용 비즈니스 모델링 스타터 툴킷
BMSKIT, 캔버스 활용 비즈니스 모델링 스타터 툴킷HwanJin 'David' Choi
 
Les tableaux de bord & les indicateurs de performance
Les tableaux de bord & les indicateurs de performanceLes tableaux de bord & les indicateurs de performance
Les tableaux de bord & les indicateurs de performanceAhmed Mesellem
 
Seo : trucs et astuces d'un bon référencement
Seo : trucs et astuces d'un bon référencementSeo : trucs et astuces d'un bon référencement
Seo : trucs et astuces d'un bon référencementJulien Dereumaux
 

Tendances (20)

02 seo principes - referencement seo
02 seo    principes - referencement seo02 seo    principes - referencement seo
02 seo principes - referencement seo
 
Rustで楽しむ競技プログラミング
Rustで楽しむ競技プログラミングRustで楽しむ競技プログラミング
Rustで楽しむ競技プログラミング
 
ppt sur le Référencement
ppt sur le Référencementppt sur le Référencement
ppt sur le Référencement
 
Le publipostage sous word
Le publipostage sous wordLe publipostage sous word
Le publipostage sous word
 
Arbre de décision
Arbre de décisionArbre de décision
Arbre de décision
 
Arbre de décision.pdf
Arbre de décision.pdfArbre de décision.pdf
Arbre de décision.pdf
 
Fiche pédagogique 07b internet exercices
Fiche pédagogique 07b internet exercicesFiche pédagogique 07b internet exercices
Fiche pédagogique 07b internet exercices
 
E-mail Restart 2024: Lukáš Balek - Keynote: Výsledky průzkumu o roli AI v čes...
E-mail Restart 2024: Lukáš Balek - Keynote: Výsledky průzkumu o roli AI v čes...E-mail Restart 2024: Lukáš Balek - Keynote: Výsledky průzkumu o roli AI v čes...
E-mail Restart 2024: Lukáš Balek - Keynote: Výsledky průzkumu o roli AI v čes...
 
ダブリング
ダブリングダブリング
ダブリング
 
Fractional cascading
Fractional cascadingFractional cascading
Fractional cascading
 
Veille 2.0
Veille 2.0Veille 2.0
Veille 2.0
 
Audit comptable-financier-objectifs-demarches-et-techniques
Audit comptable-financier-objectifs-demarches-et-techniquesAudit comptable-financier-objectifs-demarches-et-techniques
Audit comptable-financier-objectifs-demarches-et-techniques
 
ユークリッド最小全域木
ユークリッド最小全域木ユークリッド最小全域木
ユークリッド最小全域木
 
第21回アルゴリズム勉強会
第21回アルゴリズム勉強会第21回アルゴリズム勉強会
第21回アルゴリズム勉強会
 
Webサイト改善の手順
Webサイト改善の手順Webサイト改善の手順
Webサイト改善の手順
 
BMSKIT, 캔버스 활용 비즈니스 모델링 스타터 툴킷
BMSKIT, 캔버스 활용 비즈니스 모델링 스타터 툴킷BMSKIT, 캔버스 활용 비즈니스 모델링 스타터 툴킷
BMSKIT, 캔버스 활용 비즈니스 모델링 스타터 툴킷
 
Les tableaux de bord & les indicateurs de performance
Les tableaux de bord & les indicateurs de performanceLes tableaux de bord & les indicateurs de performance
Les tableaux de bord & les indicateurs de performance
 
Seo : trucs et astuces d'un bon référencement
Seo : trucs et astuces d'un bon référencementSeo : trucs et astuces d'un bon référencement
Seo : trucs et astuces d'un bon référencement
 
Organiser une veille juridique
Organiser une veille juridiqueOrganiser une veille juridique
Organiser une veille juridique
 
Topological sort
Topological sortTopological sort
Topological sort
 

En vedette

Machine Learning & SEO - SEO Camp'Us Paris 2016
Machine Learning & SEO - SEO Camp'Us Paris 2016Machine Learning & SEO - SEO Camp'Us Paris 2016
Machine Learning & SEO - SEO Camp'Us Paris 2016Julien Deneuville
 
Mesurer les performances du SEO grâce à des tableaux de bord
Mesurer les performances du SEO grâce à des tableaux de bordMesurer les performances du SEO grâce à des tableaux de bord
Mesurer les performances du SEO grâce à des tableaux de bordFabien Fournillon
 
Microprogramme UX HEC Montréal
Microprogramme UX HEC MontréalMicroprogramme UX HEC Montréal
Microprogramme UX HEC MontréalSylvain Senecal
 
Brochure connectique pour les zones aseptiques et humides (2008)
Brochure connectique pour les zones aseptiques et humides (2008)Brochure connectique pour les zones aseptiques et humides (2008)
Brochure connectique pour les zones aseptiques et humides (2008)ifm electronic gmbh
 
Copte 11 05_21_maclassecopte_free_fr
Copte 11 05_21_maclassecopte_free_frCopte 11 05_21_maclassecopte_free_fr
Copte 11 05_21_maclassecopte_free_frHermione220589
 
Système tégumentaire
Système tégumentaireSystème tégumentaire
Système tégumentaireIsaDio0173
 
Présentation de la stratégie numérique d'Ile de Ré Tourisme - Mars 2013
Présentation de la stratégie numérique d'Ile de Ré Tourisme - Mars 2013Présentation de la stratégie numérique d'Ile de Ré Tourisme - Mars 2013
Présentation de la stratégie numérique d'Ile de Ré Tourisme - Mars 2013Céline MAROTTE
 
Verso le PR di domani : il ruolo dell’Influencer Marketing
Verso le PR di domani : il ruolo dell’Influencer MarketingVerso le PR di domani : il ruolo dell’Influencer Marketing
Verso le PR di domani : il ruolo dell’Influencer MarketingAugure Reputation Management
 
Animation de l'atelier et retour d'expérience - R-Evolutions Touristiques de ...
Animation de l'atelier et retour d'expérience - R-Evolutions Touristiques de ...Animation de l'atelier et retour d'expérience - R-Evolutions Touristiques de ...
Animation de l'atelier et retour d'expérience - R-Evolutions Touristiques de ...Céline MAROTTE
 
ValueClick mediaplex 2013 centraliser achat media, adserving, adtracking
ValueClick mediaplex 2013 centraliser achat media, adserving, adtrackingValueClick mediaplex 2013 centraliser achat media, adserving, adtracking
ValueClick mediaplex 2013 centraliser achat media, adserving, adtrackingValueClick France
 
Nouvelle vs Prep
Nouvelle vs PrepNouvelle vs Prep
Nouvelle vs PrepIsaDio0173
 
Catalogue Innovations (novembre 2012)
Catalogue Innovations (novembre 2012)Catalogue Innovations (novembre 2012)
Catalogue Innovations (novembre 2012)ifm electronic gmbh
 
Présentation green and connected territories lbmg worklabs
Présentation green and connected territories   lbmg worklabsPrésentation green and connected territories   lbmg worklabs
Présentation green and connected territories lbmg worklabsLBMG Worklabs
 
Magazine surface - De l'énergie verte a revendre - Alain Fortier
Magazine surface  - De l'énergie verte a revendre - Alain FortierMagazine surface  - De l'énergie verte a revendre - Alain Fortier
Magazine surface - De l'énergie verte a revendre - Alain FortierAlain Fortier
 

En vedette (20)

Machine Learning & SEO - SEO Camp'Us Paris 2016
Machine Learning & SEO - SEO Camp'Us Paris 2016Machine Learning & SEO - SEO Camp'Us Paris 2016
Machine Learning & SEO - SEO Camp'Us Paris 2016
 
Mesurer les performances du SEO grâce à des tableaux de bord
Mesurer les performances du SEO grâce à des tableaux de bordMesurer les performances du SEO grâce à des tableaux de bord
Mesurer les performances du SEO grâce à des tableaux de bord
 
Ecommerce Live : suivre efficacement ses performances SEO
Ecommerce Live : suivre efficacement ses performances SEOEcommerce Live : suivre efficacement ses performances SEO
Ecommerce Live : suivre efficacement ses performances SEO
 
Microprogramme UX HEC Montréal
Microprogramme UX HEC MontréalMicroprogramme UX HEC Montréal
Microprogramme UX HEC Montréal
 
Des RP vers l'Influencer Engagement
Des RP vers l'Influencer EngagementDes RP vers l'Influencer Engagement
Des RP vers l'Influencer Engagement
 
Shake15 augure
Shake15 augureShake15 augure
Shake15 augure
 
Brochure connectique pour les zones aseptiques et humides (2008)
Brochure connectique pour les zones aseptiques et humides (2008)Brochure connectique pour les zones aseptiques et humides (2008)
Brochure connectique pour les zones aseptiques et humides (2008)
 
Copte 11 05_21_maclassecopte_free_fr
Copte 11 05_21_maclassecopte_free_frCopte 11 05_21_maclassecopte_free_fr
Copte 11 05_21_maclassecopte_free_fr
 
Système tégumentaire
Système tégumentaireSystème tégumentaire
Système tégumentaire
 
Présentation de la stratégie numérique d'Ile de Ré Tourisme - Mars 2013
Présentation de la stratégie numérique d'Ile de Ré Tourisme - Mars 2013Présentation de la stratégie numérique d'Ile de Ré Tourisme - Mars 2013
Présentation de la stratégie numérique d'Ile de Ré Tourisme - Mars 2013
 
Verso le PR di domani : il ruolo dell’Influencer Marketing
Verso le PR di domani : il ruolo dell’Influencer MarketingVerso le PR di domani : il ruolo dell’Influencer Marketing
Verso le PR di domani : il ruolo dell’Influencer Marketing
 
Mml sublissime
Mml sublissimeMml sublissime
Mml sublissime
 
Animation de l'atelier et retour d'expérience - R-Evolutions Touristiques de ...
Animation de l'atelier et retour d'expérience - R-Evolutions Touristiques de ...Animation de l'atelier et retour d'expérience - R-Evolutions Touristiques de ...
Animation de l'atelier et retour d'expérience - R-Evolutions Touristiques de ...
 
ValueClick mediaplex 2013 centraliser achat media, adserving, adtracking
ValueClick mediaplex 2013 centraliser achat media, adserving, adtrackingValueClick mediaplex 2013 centraliser achat media, adserving, adtracking
ValueClick mediaplex 2013 centraliser achat media, adserving, adtracking
 
Teste
TesteTeste
Teste
 
Nouvelle vs Prep
Nouvelle vs PrepNouvelle vs Prep
Nouvelle vs Prep
 
Physical design vlsi circuits jan 2013
Physical design vlsi circuits jan 2013Physical design vlsi circuits jan 2013
Physical design vlsi circuits jan 2013
 
Catalogue Innovations (novembre 2012)
Catalogue Innovations (novembre 2012)Catalogue Innovations (novembre 2012)
Catalogue Innovations (novembre 2012)
 
Présentation green and connected territories lbmg worklabs
Présentation green and connected territories   lbmg worklabsPrésentation green and connected territories   lbmg worklabs
Présentation green and connected territories lbmg worklabs
 
Magazine surface - De l'énergie verte a revendre - Alain Fortier
Magazine surface  - De l'énergie verte a revendre - Alain FortierMagazine surface  - De l'énergie verte a revendre - Alain Fortier
Magazine surface - De l'énergie verte a revendre - Alain Fortier
 

Similaire à Analyse de logs SEO : pour qui, pour quoi, comment ?

La vitesse d’un site web : un levier de croissance peu exploité
La vitesse d’un site web : un levier de croissance peu exploitéLa vitesse d’un site web : un levier de croissance peu exploité
La vitesse d’un site web : un levier de croissance peu exploitéFasterize
 
Conference drupal 8 au Forum PHP 2013 à Paris
Conference drupal 8 au Forum PHP 2013 à ParisConference drupal 8 au Forum PHP 2013 à Paris
Conference drupal 8 au Forum PHP 2013 à ParisChipway
 
Techniques d'accélération des pages web
Techniques d'accélération des pages webTechniques d'accélération des pages web
Techniques d'accélération des pages webJean-Pierre Vincent
 
Comment choisir son cms
Comment choisir son cmsComment choisir son cms
Comment choisir son cmsStrasWeb
 
Deck seo campus 2011 utiliser les logs serveurs
Deck seo campus 2011   utiliser les logs serveursDeck seo campus 2011   utiliser les logs serveurs
Deck seo campus 2011 utiliser les logs serveursPhilippe YONNET
 
Paris Web 2015 - Atelier désendettement Javascript legacy
Paris Web 2015 - Atelier désendettement Javascript legacyParis Web 2015 - Atelier désendettement Javascript legacy
Paris Web 2015 - Atelier désendettement Javascript legacyFrançois Petitit
 
Vitrine virtuelle
Vitrine virtuelleVitrine virtuelle
Vitrine virtuellem_rogerp
 
WordPress sous stéroïdes : votre site Web vers les sommets !
WordPress sous stéroïdes : votre site Web vers les sommets !WordPress sous stéroïdes : votre site Web vers les sommets !
WordPress sous stéroïdes : votre site Web vers les sommets !Aurélien Denis
 
Référencement avec Joomla - SEO Camp
Référencement avec Joomla - SEO CampRéférencement avec Joomla - SEO Camp
Référencement avec Joomla - SEO CampSEO CAMP
 
Le suivi post référencement (SEO)
Le suivi post référencement (SEO)Le suivi post référencement (SEO)
Le suivi post référencement (SEO)Sandrine Bertrand
 
Utilisation avancée d'un crawler - SEO Camp'us 2015
Utilisation avancée d'un crawler - SEO Camp'us 2015Utilisation avancée d'un crawler - SEO Camp'us 2015
Utilisation avancée d'un crawler - SEO Camp'us 2015Philippe YONNET
 
Optimiser réellement le référencement naturel de WordPress
Optimiser réellement le référencement naturel de WordPressOptimiser réellement le référencement naturel de WordPress
Optimiser réellement le référencement naturel de WordPressDaniel Roch - SeoMix
 
Techniques d’accélération des pages Web
Techniques d’accélération des pages WebTechniques d’accélération des pages Web
Techniques d’accélération des pages WebMicrosoft
 
Seo Camp'us 2018 - SEO & FRAMEWORK JAVASCRIPT - Philippe Yonnet - Directeur G...
Seo Camp'us 2018 - SEO & FRAMEWORK JAVASCRIPT - Philippe Yonnet - Directeur G...Seo Camp'us 2018 - SEO & FRAMEWORK JAVASCRIPT - Philippe Yonnet - Directeur G...
Seo Camp'us 2018 - SEO & FRAMEWORK JAVASCRIPT - Philippe Yonnet - Directeur G...Peak Ace
 
Utiliser un crawler pour le seo
Utiliser un crawler pour le seoUtiliser un crawler pour le seo
Utiliser un crawler pour le seoPhilippe YONNET
 
Cours SEO / Référencement Naturel - août 2013
Cours SEO / Référencement Naturel - août 2013Cours SEO / Référencement Naturel - août 2013
Cours SEO / Référencement Naturel - août 2013Pierre Ammeloot
 
1&1, e-Monsite, Jimdo, Wix, … Les platesformes clés-en-main permettent-elles ...
1&1, e-Monsite, Jimdo, Wix, … Les platesformes clés-en-main permettent-elles ...1&1, e-Monsite, Jimdo, Wix, … Les platesformes clés-en-main permettent-elles ...
1&1, e-Monsite, Jimdo, Wix, … Les platesformes clés-en-main permettent-elles ...Olivier Andrieu
 

Similaire à Analyse de logs SEO : pour qui, pour quoi, comment ? (20)

La vitesse d’un site web : un levier de croissance peu exploité
La vitesse d’un site web : un levier de croissance peu exploitéLa vitesse d’un site web : un levier de croissance peu exploité
La vitesse d’un site web : un levier de croissance peu exploité
 
Conference drupal 8 au Forum PHP 2013 à Paris
Conference drupal 8 au Forum PHP 2013 à ParisConference drupal 8 au Forum PHP 2013 à Paris
Conference drupal 8 au Forum PHP 2013 à Paris
 
Techniques d'accélération des pages web
Techniques d'accélération des pages webTechniques d'accélération des pages web
Techniques d'accélération des pages web
 
Comment choisir son cms
Comment choisir son cmsComment choisir son cms
Comment choisir son cms
 
Deck seo campus 2011 utiliser les logs serveurs
Deck seo campus 2011   utiliser les logs serveursDeck seo campus 2011   utiliser les logs serveurs
Deck seo campus 2011 utiliser les logs serveurs
 
CMS et Wordpress
CMS et WordpressCMS et Wordpress
CMS et Wordpress
 
Paris Web 2015 - Atelier désendettement Javascript legacy
Paris Web 2015 - Atelier désendettement Javascript legacyParis Web 2015 - Atelier désendettement Javascript legacy
Paris Web 2015 - Atelier désendettement Javascript legacy
 
Vitrine virtuelle
Vitrine virtuelleVitrine virtuelle
Vitrine virtuelle
 
WordPress sous stéroïdes : votre site Web vers les sommets !
WordPress sous stéroïdes : votre site Web vers les sommets !WordPress sous stéroïdes : votre site Web vers les sommets !
WordPress sous stéroïdes : votre site Web vers les sommets !
 
Référencement avec Joomla - SEO Camp
Référencement avec Joomla - SEO CampRéférencement avec Joomla - SEO Camp
Référencement avec Joomla - SEO Camp
 
Le suivi post référencement (SEO)
Le suivi post référencement (SEO)Le suivi post référencement (SEO)
Le suivi post référencement (SEO)
 
Utilisation avancée d'un crawler - SEO Camp'us 2015
Utilisation avancée d'un crawler - SEO Camp'us 2015Utilisation avancée d'un crawler - SEO Camp'us 2015
Utilisation avancée d'un crawler - SEO Camp'us 2015
 
Optimiser réellement le référencement naturel de WordPress
Optimiser réellement le référencement naturel de WordPressOptimiser réellement le référencement naturel de WordPress
Optimiser réellement le référencement naturel de WordPress
 
Techniques d’accélération des pages Web
Techniques d’accélération des pages WebTechniques d’accélération des pages Web
Techniques d’accélération des pages Web
 
The DevOps Wonder @ PHPTour Lyon 2014
The DevOps Wonder @ PHPTour Lyon 2014The DevOps Wonder @ PHPTour Lyon 2014
The DevOps Wonder @ PHPTour Lyon 2014
 
Seo Camp'us 2018 - SEO & FRAMEWORK JAVASCRIPT - Philippe Yonnet - Directeur G...
Seo Camp'us 2018 - SEO & FRAMEWORK JAVASCRIPT - Philippe Yonnet - Directeur G...Seo Camp'us 2018 - SEO & FRAMEWORK JAVASCRIPT - Philippe Yonnet - Directeur G...
Seo Camp'us 2018 - SEO & FRAMEWORK JAVASCRIPT - Philippe Yonnet - Directeur G...
 
Utiliser un crawler pour le seo
Utiliser un crawler pour le seoUtiliser un crawler pour le seo
Utiliser un crawler pour le seo
 
Cours SEO / Référencement Naturel - août 2013
Cours SEO / Référencement Naturel - août 2013Cours SEO / Référencement Naturel - août 2013
Cours SEO / Référencement Naturel - août 2013
 
1&1, e-Monsite, Jimdo, Wix, … Les platesformes clés-en-main permettent-elles ...
1&1, e-Monsite, Jimdo, Wix, … Les platesformes clés-en-main permettent-elles ...1&1, e-Monsite, Jimdo, Wix, … Les platesformes clés-en-main permettent-elles ...
1&1, e-Monsite, Jimdo, Wix, … Les platesformes clés-en-main permettent-elles ...
 
Comment déveloper son entreprise grâce au web
Comment déveloper son entreprise grâce au webComment déveloper son entreprise grâce au web
Comment déveloper son entreprise grâce au web
 

Plus de Julien Deneuville

Monitoring SEO : dormez tranquille !
Monitoring SEO : dormez tranquille !Monitoring SEO : dormez tranquille !
Monitoring SEO : dormez tranquille !Julien Deneuville
 
En route vers le Data+SEO [SEO Camp'US 2019]
En route vers le Data+SEO [SEO Camp'US 2019]En route vers le Data+SEO [SEO Camp'US 2019]
En route vers le Data+SEO [SEO Camp'US 2019]Julien Deneuville
 
Meetup AFUP Reims: Le crawl pour les développeurs
Meetup AFUP Reims: Le crawl pour les développeursMeetup AFUP Reims: Le crawl pour les développeurs
Meetup AFUP Reims: Le crawl pour les développeursJulien Deneuville
 
De la Data pour le SEO - QueDuWeb 2016
De la Data pour le SEO - QueDuWeb 2016De la Data pour le SEO - QueDuWeb 2016
De la Data pour le SEO - QueDuWeb 2016Julien Deneuville
 
Netlinking : de vraies solutions pour 2014 (Meetup SEO France du 15/01/14)
Netlinking : de vraies solutions pour 2014 (Meetup SEO France du 15/01/14)Netlinking : de vraies solutions pour 2014 (Meetup SEO France du 15/01/14)
Netlinking : de vraies solutions pour 2014 (Meetup SEO France du 15/01/14)Julien Deneuville
 

Plus de Julien Deneuville (7)

Monitoring SEO : dormez tranquille !
Monitoring SEO : dormez tranquille !Monitoring SEO : dormez tranquille !
Monitoring SEO : dormez tranquille !
 
En route vers le Data+SEO [SEO Camp'US 2019]
En route vers le Data+SEO [SEO Camp'US 2019]En route vers le Data+SEO [SEO Camp'US 2019]
En route vers le Data+SEO [SEO Camp'US 2019]
 
Meetup AFUP Reims: Le crawl pour les développeurs
Meetup AFUP Reims: Le crawl pour les développeursMeetup AFUP Reims: Le crawl pour les développeurs
Meetup AFUP Reims: Le crawl pour les développeurs
 
De la Data pour le SEO - QueDuWeb 2016
De la Data pour le SEO - QueDuWeb 2016De la Data pour le SEO - QueDuWeb 2016
De la Data pour le SEO - QueDuWeb 2016
 
Netlinking : de vraies solutions pour 2014 (Meetup SEO France du 15/01/14)
Netlinking : de vraies solutions pour 2014 (Meetup SEO France du 15/01/14)Netlinking : de vraies solutions pour 2014 (Meetup SEO France du 15/01/14)
Netlinking : de vraies solutions pour 2014 (Meetup SEO France du 15/01/14)
 
Art Your Mind
Art Your MindArt Your Mind
Art Your Mind
 
Coca Cola : Stratégie SMM
Coca Cola : Stratégie SMMCoca Cola : Stratégie SMM
Coca Cola : Stratégie SMM
 

Analyse de logs SEO : pour qui, pour quoi, comment ?

  • 1. Analyse de logs Pour qui ? Pour quoi ? Comment ?
  • 2. Julien Deneuville • 27 ans • Monte des sites depuis 2004 • SEO pro depuis 2011 • Twitter : @diije • Blog : http://blog.1-clic.info/ • Musique • Vélo Qui suis-je ? Hello, World!
  • 3. L’analyse de logs : les grandes lignes Est-ce fait pour moi ? A quels KPI m’intéresser ? Outils et perspectives 3 Analyse de logs Sommaire
  • 4. Analyse de logs De quoi parle-t-on ?
  • 5. Client - Serveur 5 Quelques notions de réseau
  • 6. Client : • Envoie une requête au serveur • Attend la réponse • Affiche la réponse 6 Serveur : • Reçoit des requêtes • Effectue les traitements • Renvoie les résultats Client - Serveur Quelques notions de réseau • Navigateur web • Client mail • Spotify • … • Robot de moteur de recherche • Serveur web (Apache, Nginx, IIS, …) • Serveur mail • Application spécifique
  • 7. Client : • Envoie une requête au serveur • Attend la réponse • Affiche la réponse • Navigateur web • Client mail • Spotify • … • Robot de moteur de recherche 7 Serveur : • Reçoit des requêtes • Effectue les traitements • Renvoie les résultats • Serveur web (Apache, Nginx, IIS, …) • Serveur mail • Application spécifique Client - Serveur Quelques notions de réseau
  • 8. Les logs serveur Les serveurs web enregistrent toutes les demandes qu’ils reçoivent dans des fichiers texte : ce sont les logs serveur. Ils permettent notamment : • D’obtenir des statistiques de fréquentation d’un site • De débuguer un composant problématique • De détecter les attaques de hackers • … 8 Qu’est-ce que c’est quoi donc ?
  • 9. Rappels : • Googlebot ne déclenche pas les tags des outils de webanalytics • Les données de Google Search Console sont-elles fiables ? Avec les logs serveur on peut : • Voir les pages que Googlebot visite • Compléter Google Analytics et détecter les visites en provenance de Google • Trouver de nombreuses pistes d’amélioration 9 Et en SEO ? Pourquoi vouloir analyser les logs ?
  • 10. Pour qui ? Pour les sites à gros volume • Quelques centaines de milliers de pages Audit : une mine d’informations pour les optimisations • Crawl utile/inutile • Pages actives/inactives • Trous de crawl • … Monitoring : un outil d’alerte indispensable 10 Et mon site dans tout ça ? Pour tous les autres aussi : il n’y a pas que les « gros » qui ont des problèmes !
  • 12. Accéder à vos logs • Exemple pour un mutualisé OVH : http://logs.ovh.net/mon-domaine.tld • Récupérer les logs d’accès Un terminal • Intégré à Linux et Mac OS • Installez Cygwin sous Windows 12 Starter Kit De quoi ai-je besoin ?
  • 13. La ligne de commande Compter les hits de Googlebot • ~$ grep "Googlebot" access.log | wc –l Compter les hits de Googlebot par URL • ~$ grep "Googlebot" access.log | cut –d " " –f7 | sort | uniq –c Envoyer les résultats dans un fichier • ~$ grep "Googlebot" access.log | sort | uniq –c > resultats.txt 13 Quelques exemples simples Vous pouvez déjà faire 100% des analyses de logs dont vous avez besoin !
  • 14. Allez plus loin Un article de l’excellent Paul Courtois : http://blog.pole-conseils.com/maitrisez-lanalyse-de-logs-les-5-commandes- indispensables-pour-devenir-autonome/ La rolls de l’analyse de logs en console : awk chez Jean-Benoît Moingt http://www.watussi.fr/lanalyse-des-logs-serveur-une-mine-dinformation-pour- le-seo 14 Liens utiles
  • 15. Quels KPI ? Un peu de méthode
  • 16. Le crawl : le compagnon indispensable de l’analyse de logs Des outils : • Logiciels : Xenu, Screaming Frog • En SaaS : Botify, Oncrawl … • Pour les geeks : Scrapy, Mnogosearch, Nutch ... 16 Step 1 : crawler Tâtez le terrain
  • 17. Step 1 : crawler Quels indicateurs ? • Nombre de pages • Codes réponse • Profondeur de l’arborescence • Titres dupliqués • Maillage interne • Temps de chargement • … En savoir plus sur le sujet ? • Mode d’emploi de Xenu chez Daniel Roch : http://www.seomix.fr/xenu/ 17 Tâtez le terrain
  • 18. Crawlers Crawlez souvent • En recette, en prod • Après chaque mise en production • Périodiquement pour vous assurer que tout va bien Ne crawlez pas toujours tout votre site • Ca peut être long • Rarement possible d’analyser de nombreux rapports • Selon le site, les 4 ou 5 premiers niveaux sont suffisants Conservez vos données • Pour avoir un historique • Pour comparer les crawls entre eux 18 Tips & tricks
  • 19. Step 2 : analyse de logs 19 Vers l’infini et au-delà !
  • 20. Googlebot hait les erreurs. Erreurs 5xx • 500 : souvent le signe d’un problème de code à corrigez-le • 503 : votre serveur tient-il la charge ? Erreurs 4xx • Liens internes erronés (trouvez-les dans le crawl) • Liens externes erronés (trouvez-les avec Majestic/Ahrefs) • Dans les deux cas : correction + redirection 301 20 Codes réponse Envoyez le bon signal
  • 21. Combien de temps maintenir une redirection 301 ? Attention : les 301 peuvent gonfler artificiellement le volume de crawl ! 21 Le cas des 301 Permanent jusqu’à quand ? A maintenir de manière permanente …
  • 22. Comparez les indicateurs : • Nombre d’URLs dans les logs • Dans le crawl • Dans Google Search Console • Dans Analytics • Sur « site:monsite.com » Trop de pages dans les logs ? • Des paramètres qui entraînent la duplication de contenu ? • ... Pas assez ? • Vos liens internes sont-ils seo-friendly ? • … 22 Volume de pages Google crawle-t-il un nombre raisonnable de pages ?
  • 23. Comparez les pages les plus crawlées et celles qui vous importent le plus : • Googlebot visite-t-il assez souvent vos pages stratégiques ? • Perd-t-il son temps sur des pages inutiles ? Que faire en cas de problème ? • Revoir le maillage interne pour booster les bonnes pages • Savoir supprimer des pages inutiles 23 Pages actives S’intéresser aux bonnes pages
  • 24. Post-audit, mettez en place une analyse de vos logs en continu : • Recette facilité lors des mises en production • Alerting en cas de problème technique • Suivi du délai d’indexation des nouvelles pages • Changements de comportement de Googlebot • … 24 Step 3 : monitoring Gardez le contrôle
  • 26. Avantages : • Gratuit • Simple à mettre en place • A héberger soi-même Inconvénients • A héberger soi-même • Simpliste • Pas mis à jour Watussi Un bon début Idéal pour quelques dizaines de pages ! http://box.watussi.fr/
  • 27. Avantages : • Sûrement l’interface la plus aboutie • Associé à un crawler • Service client à l’écoute • En SaaS Inconvénients • Cher • Parfois peu intuitif Botify Artillerie lourde Si vous avez le budget, foncez ! https://www.botify.com/
  • 28. Avantages : • En beta gratuite • Des fonctionnalités innovantes • En SaaS Inconvénients • Peu de documentation • Support reposant sur une seule personne Spiderlog Le petit nouveau L’outsider que vous devriez tester ! https://spiderlog.serphacker.com/
  • 29. Avantages : • Parfait pour le monitoring • Analyse crawl vs logs (bientôt) • Service client à l’écoute • En SaaS Inconvénients • Pas aussi complet qu’un Botify http://kelo.gs/ Kelogs #ROI Le meilleur rapport Qualité/Prix du marché !
  • 30. Avantages • Sur-mesure • Vous gardez vos données • Une possibilité d’analyse inégalable Inconvénients • Coût de développement • Coût de maintenance • Nécessite une bonne connaissance du sujet 30 Homemade On n’est jamais aussi bien servi que par soi-même Forcément le plus adapté à vos besoins !
  • 32. 1. Crawlez votre site 2. Récupérez les logs 3. Faites une première analyse 4. Mettez en place un outil de monitoring 32 Au boulot ! Homework
  • 33. Ajoutez des infos dans vos logs • Apache : voir ici • Temps de chargement • Host Croisez vos données • Analytics • Ventes • Inventaire • … 33 Allez plus loin Devenez un roi de la Data
  • 34. www.1-clic.info Merci de votre attention ! Bon appétit J Mail julien@1-clic.info Blog http://blog.1-clic.info/ Twitter @diije