Au Menu:
- Les données indispensables au SEO
- Comment les rendre actionnables?
- Pourquoi utiliser un outil de crawling?
- Faire de l’analyse de logs (presque) gratuitement
3. AU MENU
1. Les données indispensables au SEO
2. Comment les rendre actionnables?
3. Pourquoi utiliser un outil de crawling?
4. Faire de l’analyse de logs (presque) gratuitement
4. 10 years SEO experience
Serial entrepreneur
Business Angel
Membre du CA SeoCamp
6. AU MENU
1. Les données indispensables au SEO
2. Comment les rendre actionnables?
3. Pourquoi utiliser un outil de crawling?
4. Faire de l’analyse de logs (presque) gratuitement
9. #OncrawlBreakfast - @Oncrawl
Et changer l’approche du SEO
Besoin critique de données fiables
– Le SEO influence le produit
– La fonction SEO devient transverse
Pour faire mieux et plus vite
– Reporting
– Prise de décision / plan d’actions
Pour évangéliser sur vos enjeux
10. #OncrawlBreakfast - @Oncrawl
5 familles de metrics indispensables
Offsite
User Experience
Contenu
HTML Quality
Performance
11. #OncrawlBreakfast - @Oncrawl
Offsite : Linking by the numbers
Nécessité de maitriser :
– Nombre total de backlinks
– Nombre de Domaines Référents
– Trust
– Popularité
12. #OncrawlBreakfast - @Oncrawl
Offsite : Linking vs QUALITY
Toujours avoir un oeil sur
– La répartition des ancres
– Suivre son Topical Trust Flow
13. #OncrawlBreakfast - @Oncrawl
Offsite
Bien piloter son netlinking
– Evaluer la concurrence
61
54
57 57
55 55
53
45
63
59
68
62
64
42
0
10
20
30
40
50
60
70
80
w
w
w
.cdiscount.com
/
w
w
w
.fnac.com
/
w
w
w
.rueducom
m
erce.fr/
w
w
w
.pricem
inister.com
/
w
w
w
.darty.com
/
w
w
w
.auchan.fr/
w
w
w
.easycash.fr
Cita onFlow TrustFlow Moyenne CF Moyenne TF
15935
20131
9152
13968
6874
4982
376
0
5000
10000
15000
20000
25000
w
w
w
.cdiscount.com
/
w
w
w
.fnac.com
/
w
w
w
.rueducom
m
erce.fr/
w
w
w
.pricem
inister.com
/
w
w
w
.darty.com
/
w
w
w
.auchan.fr/
w
w
w
.easycash.fr
RefDomains Moyenne RefDomains
14. #OncrawlBreakfast - @Oncrawl
User Experience
Temps passé sur vos landing pages SEO
– Par catégorie de page
• Produit / Listing / Rayon / Articles…
Taux de rebond du trafic SEO
– Il existe des pénalité / modérations automatiques dont l’impact
est visible en quelques jours
Taux de conversion de vos visites SEO
– Pour identifier les groupes de pages prioritaires
15. #OncrawlBreakfast - @Oncrawl
Contenu
Avoir conscience de la répartition de son contenu
– Nb de pages indexables vs No index
– Nb de pages indexables vs indexées réellement
– Nb de mots par page
19. AU MENU
1. Les données indispensables au SEO
2. Comment les rendre actionnables?
3. Pourquoi utiliser un outil de crawling?
4. Faire de l’analyse de logs (presque) gratuitement
21. #OncrawlBreakfast - @Oncrawl
Tous vos metrics offsite avec l’API de Majestic
Vous pouvez accéder aux données de majestic :
– Open Apps
– Light API
Deux étapes :
22. #OncrawlBreakfast - @Oncrawl
Tous vos metrics offsite avec l’API de Majestic
Apprenez à vous servir des requètes à l’API de Majestic
Ex :
• Nombre de Backlinks
• Nombre de refdomains
• Nombre de liens perdus / Gagnés
• Ancres des liens
• Trust Flow
• Citation Flow
• Search by Keywords
Rendez la donnée actionnable
28. AU MENU
1. Les données indispensables au SEO
2. Comment les rendre actionnables?
3. Pourquoi utiliser un outil de crawling?
4. Faire de l’analyse de logs (presque) gratuitement
29. #OncrawlBreakfast - @Oncrawl
Pour voir votre site avec les yeux d’un Robot
Un crawler va simuler le comportement de
GoogleBot sur votre site
Il permet d’identifier ce qui peut géner ou
freiner l’exploration de votre site
35. #OncrawlBreakfast - @Oncrawl
#4 : Suivre ses liens sortants
De chaque page
– Vers l’exterieur
– Vers mon réseau
– Vers mes autres pages
36. #OncrawlBreakfast - @Oncrawl
#5 : Analyser le ‘Near Duplicate’
Nous calculons un Simhash = Empreinte digitale
– Nous les comparons
– Nous détectons un contenu proche sémantiquement
37. 360° SEO VIEW
En croisant les données de crawl, vos données issues de vos
outils d’analyse d’audience et vos logs, nous vous permettons
de maitriser l’ensemble de vos paramètres SEO
Crawl Analytics Logs
38. AU MENU
1. Les données indispensables au SEO
2. Comment les rendre actionnables?
3. Pourquoi utiliser un outil de crawling?
4. Faire de l’analyse de logs (presque) gratuitement
42. #OncrawlBreakfast - @Oncrawl
Quelles pages ont le plus de valeur pour Google ?
Découvrez vos pages Actives
Et faites une analyse par famille
43. #OncrawlBreakfast - @Oncrawl
La clé est dans le croisement
Pages actives
– Qui génèrent du trafic
Pages orphelines
– Qui n’ont plus de liens
Volume de trafic apporté
44. www.oncrawl.com
Logs Analytics made easy
Track all bots activities, identify crawl patterns & active pages
Make the bots crawl in the right direction. www.oncrawl.com
45. Comprendre le comportement
de Google Bot
Keep track of bots activity
Monitor Nb of fetched pages
Control Activity on orphan pages
Map your website and check if
your most valuable content is
crawled
Real-time monitoring
Get alerts (Increase of 4xx, 3XX,…)
Check any type of bot
46. The easiest and most secure
Log analyzer for SEOs
Nous avons décidé de réaliser un fork de la stack
ELK** et de le rendre simple à installer grâce à
Docker. Les SEOs peuvent désormais accéder à
l’analyse de Logs quasiment gratuitement. Si vous
avez besoin que hébergions l’analyseur de logs,
notre infrastructure vous rendra la tâche d’autant
plus facile.
- Tanguy Moal, CTO
“
Open Source version
Disponible sur Github
Install avec Docker Compose
Hosting by Oncrawl Disponible*
*: Ask us a quote
**: Elastic Search, Logstache, Kibana
47. Get your content on track
Analyze your pages performance
Status code
Most active pages
Size & Load time
Spot Orphan pages with Oncrawl crawler
Pages crawled by Google with no inlinks
Check your SEO active pages
Crawlable & crawled
Generating search traffic
48. Technical requirements
Docker compose (available on 64-bits Linux and Mac OS X as of
Nov. 2015)
Your Web server log files Apache, Nginx, IIS supported out of the
box. Our stack is format agnostic but some special formats may
require extra configuration.
49. Install Docker Compose
Download OnCrawl ELK docker-compose.yml from Github
Start Kinematic UI and run docker-compose.yml
OR
Run the command: ,
Copy your web server log files to logs/apache or logs/nginx or logs/iis
Visit http://localhost:9000 (Linux) or http://<docker-host-ip:9000 (OS X)
docker-compose -f docker-compose.yml up -d
Install Process : can’t be easier
50. Croisez les analyses : Audience / Logs / Crawl
Analysez votre site par type de page
Articles / Produits / Listes…
Découvrez les zones de votre site que Google ne crawle pas
Identifiez les pages orphelines
Les pages qui sont crawlées par Google mais qui n’ont aucun lien sur votre site
Identifiez vos pages SEO actives
Découvrez les types de pages qui génèrent du trafic SEO
Remaniez votre architecture de site avec une vision SEO à 360 degrés
51. 1. CRAWL
Nos robots parcourent votre site comme Google peut le
faire et nous récupérons tout votre code HTML et
l’ensemble des données SEO de votre site web.
Découvrez comment Google interprète votre site web
MERCI !
Votre contact:
hello@oncrawl.com
Follow us :
52.
53. SO WE BUILT THE PLATFORM
Big Data
Semantic
web
54. For our very own needs
Data
Connectors
Semantic
Extractors
Dictionnaries
Ressources
Builders
Indexes
Datasets
APIs
#Collect #Understand #Clean #Provide
Front
/ App