SlideShare une entreprise Scribd logo
1  sur  80
SERVER LOGY A JAK JE
POUŽÍT PRO
SEO
Co je vlastně log?
Tohle!
Ale Google to vysvětluje lépe :-)
Představ si tabulku běžců. Každý nový řádek s pozicí a časem je vlastně nový řádek logu
Jakýkoli přístup na web se zaznamená do access logu
✓ Server log
✓ Access log
✓ Error log
Pozor, logů je více. Budeme se bavit o access logu
WEB
LOGS
Který spolehlivě pokrývá největší část vašeho webu. I když udělá screaming frog v rámci
crawlingu dotaz, zapíše se tak i do access logu.
K čemu nám můžou sloužit?
Dávají nám odpovědi! Jako třeba na:
Jak často mě boti crawlují?
Které stránky nejvíce navštěvují?
Jak často a kteří mě boti crawlují?
Které stránky prochází lidé a boti
se na ně nedostanou
Kde se dostávají na chybové stránky
Kde se uživatelé dostávají na chybové
stránky
Necrawluje někdo moje stránky?
A neschovává za bot user-agent?
Jaké stavové kódy dostávají při
průchodu webem uživatelé a boti?
Nedostávají se boti nebo uživatelé
tam, kam by neměli?
Využití?
✓ Optimalizace crawl budgetu
✓ Chyby v interním/externím prolinkování
✓ Identifikace priorit robotů
Typy zpracování
Zdroj: https://litabi.com/evolution-of-storage-devices/
GB
Pozor, jsou fakt velké... většinou v rámci GB či TB.
Stupně stupidity při otevírání velkých logu
Stupně stupidity při otevírání velkých logu
1)Zkusil jsem to prostě otevřít
Stupně stupidity při otevírání velkých logu
1)Zkusil jsem to prostě otevřít
7) Zkusil jsem to otevřít v Excelu
Static Real-time
Zpracování logů dělíme na statické a real-time zpracování.
Static
GNU +
Real-time
ELK
Docela drahá sranda...
GNU +
My si dneska budeme hrát s GNU.
Work Work
Macbooky a Linuxáci jsou v pohodě. Windowsáci si musí nainstalovat GOW.
Bit.ly/voknagnu
filetype:log inurl:access
Aneb jak si jednoduše najít podkladové logy
http://www.smallbusinessseospecialists.com/access.log
Tyto logy jsem použil já k ukázce.
GNU Basics
Podklady
- http://www.panix.com/~elflord/unix/grep.html
- http://www.grymoire.com/Unix/Awk.html
- https://docstore.mik.ua/orelly/unix/sedawk/
--help
Pomoz!!!
>>
Export do ...
|
Pipeline
Grep "word" filename
Hledej v souboru
Sort
Seřaď výstup sestupně
Uniq
Vyhoď duplicity.
Uniq -c
Vyhoď duplicity a spočti jejich výskyt
Dotazy botů
grep "nazev-bota" soubor.log >> bot.log
Dotazy botů na chybové
stránky
grep "nazev-bota" soubor.log | grep "404" >>
error.log
Serverové chyby botů na
stránkách
grep "nazev-bota" soubor.log | grep "50" >>
error.log
Výpis přehledu stavových
kódů
awk "{print $9}" access.log | sort | uniq -c | sort
Výpis přehledu stavových
kódů pro Googlebota
grep "Googlebot" access.log | awk "{print $9}" | sort
| uniq -c | sort
Nejnavštěvovanější stránky
Googlebota
grep "Googlebot" access.log.txt | awk "{print $7,$9}"
| sort | uniq -c | sort
Nejnavštěvovanější chybové
stránky Googlebotem
grep "Googlebot" access.log.txt | grep "404" | awk
"{print $7,$9}" | sort | uniq -c | sort
Nejnavštěvovanější parametry
grep "?" access.log.txt >> otazniky
Využití GNU
- Exporty z GA či GSC
- Práce s crawl logy Xenu a
Screaming Frog
- Zpracování dat z analýzy
interního prolinkování
Zpracování
V čem poté zpracovávat a vizualizovat výstupy?
A co dál?
Co by se třeba dalo dělat dál?
Třeba rozšířit logy o další metriky (počet interních/externích odkazů,...)
✓ ✗
Identifikovat stránky kam chodí boti a lidé ne.
Zdroj: https://www.ladyvirtual.cz/Mining dat o URL, ke kterému lze použít:
URL minery
Na co si dát pozor?
Disallow: /soubor/ <meta name="robots"
content="noindex,nofollow">
Pro noindex si bot stejně musí stáhnout obsah stránky. Pro větší vzory používejte Disallow
na úrovni robots.txt.
Pozor na nekončné stránkování a zacyklení na něm.
Podívejte se do Search Console do sekce parametrů a zjistěte, které bot crawluje zbytečně a
odstřihněte je v robots.txt.
✗ Kanonizované
✗ Neindexovatelné
+ Pozor na skryté bloky
Pozor na to, kde a jak moc crawleři procházejí kanonizované a neindexovatelné URL. A také pozor na bloky
indexace, které nejsou přímo ve zdrojovém kódu (hlavička, odstřihnutí user-agenta,...)
Pozor na tzv. thin content a míru jeho crawlingu boty.
Speed Matters
Rychlost načtení rozhoduje. V tomto případě hlavně rychlost odezvy serveru.
Zdroj: https://varvy.com/ifmodified.html
If-Modified-Since:
U webů, kde to dává smysl a obsah se tak čast nemění,používejte if-modified-since.
Dopady optimalizace
crawl budgetu
Seologer naživo - Analýza logů
Seologer naživo - Analýza logů

Contenu connexe

Similaire à Seologer naživo - Analýza logů

Hobby Developer 3.0: Tipy a triky pro web
Hobby Developer 3.0: Tipy a triky pro webHobby Developer 3.0: Tipy a triky pro web
Hobby Developer 3.0: Tipy a triky pro webTomáš Muchka
 
SEO pohledem datového analytika
SEO pohledem datového analytikaSEO pohledem datového analytika
SEO pohledem datového analytikaTaste Medio
 
Glami - jak řešíme performance, aneb jak neshodit web TV reklamou
Glami - jak řešíme performance, aneb jak neshodit web TV reklamouGlami - jak řešíme performance, aneb jak neshodit web TV reklamou
Glami - jak řešíme performance, aneb jak neshodit web TV reklamouPetr Bechyně
 
Google Tag Manager a analytika ve WordPress
Google Tag Manager a analytika ve WordPressGoogle Tag Manager a analytika ve WordPress
Google Tag Manager a analytika ve WordPressVladimír Smitka
 
Tomáš Poner a Vladislav Musílek, Nejlepší affiliate pluginy pro WordPress
Tomáš Poner a Vladislav Musílek, Nejlepší affiliate pluginy pro WordPressTomáš Poner a Vladislav Musílek, Nejlepší affiliate pluginy pro WordPress
Tomáš Poner a Vladislav Musílek, Nejlepší affiliate pluginy pro WordPressColpirio.com s.r.o.
 
Lex Vjatkin + Ondřej procházka: Jak to děláme ve Wikidi
Lex Vjatkin + Ondřej procházka: Jak to děláme ve WikidiLex Vjatkin + Ondřej procházka: Jak to děláme ve Wikidi
Lex Vjatkin + Ondřej procházka: Jak to děláme ve WikidiDevelcz
 
Vytvořeno pro SEO (Designed for SEO)
Vytvořeno pro SEO (Designed for SEO)Vytvořeno pro SEO (Designed for SEO)
Vytvořeno pro SEO (Designed for SEO)Pavel Ungr
 
Pavel ungr designed_for_seo
Pavel ungr designed_for_seoPavel ungr designed_for_seo
Pavel ungr designed_for_seoH1.cz
 
Vyhledávače a JavaScript
Vyhledávače a JavaScriptVyhledávače a JavaScript
Vyhledávače a JavaScriptTaste Medio
 
SEO nástroje, které možná neznáte
SEO nástroje, které možná neznáteSEO nástroje, které možná neznáte
SEO nástroje, které možná neznáteCollabim
 
Představení Ruby on Rails
Představení Ruby on RailsPředstavení Ruby on Rails
Představení Ruby on Railsigloonet
 
Ivan Kutil: Google Apps pro firmy
Ivan Kutil: Google Apps pro firmyIvan Kutil: Google Apps pro firmy
Ivan Kutil: Google Apps pro firmyIvan K
 
Adaptace webu: Audit návštěvnosti a jeho praktické důsledky
Adaptace webu: Audit návštěvnosti a jeho praktické důsledkyAdaptace webu: Audit návštěvnosti a jeho praktické důsledky
Adaptace webu: Audit návštěvnosti a jeho praktické důsledkyVítězslav Šimon
 
Čtvrtkon #71 - Marian Benčat - Angular a NativeScript
Čtvrtkon #71 - Marian Benčat - Angular a NativeScriptČtvrtkon #71 - Marian Benčat - Angular a NativeScript
Čtvrtkon #71 - Marian Benčat - Angular a NativeScriptCtvrtkoncz
 
SEO jako Brno - Technické SEO
SEO jako Brno - Technické SEOSEO jako Brno - Technické SEO
SEO jako Brno - Technické SEOFilip Podstavec
 
20110511 Vývoj software - produktivně, efektivně, kvalitně
20110511 Vývoj software - produktivně, efektivně, kvalitně20110511 Vývoj software - produktivně, efektivně, kvalitně
20110511 Vývoj software - produktivně, efektivně, kvalitněJiří Mareš
 
Trendy a nové možnosti test automation
Trendy a nové možnosti test automationTrendy a nové možnosti test automation
Trendy a nové možnosti test automationOndřej Machulda
 
JavaScript v GTM - Measure Camp Brno 2017
JavaScript v GTM - Measure Camp Brno 2017JavaScript v GTM - Measure Camp Brno 2017
JavaScript v GTM - Measure Camp Brno 2017Michal Blažek
 
SEO Restart 2023: Lukáš Kostka - AI a R studio – optimalizace meta tagů na ,,...
SEO Restart 2023: Lukáš Kostka - AI a R studio – optimalizace meta tagů na ,,...SEO Restart 2023: Lukáš Kostka - AI a R studio – optimalizace meta tagů na ,,...
SEO Restart 2023: Lukáš Kostka - AI a R studio – optimalizace meta tagů na ,,...Taste
 

Similaire à Seologer naživo - Analýza logů (20)

Hobby Developer 3.0: Tipy a triky pro web
Hobby Developer 3.0: Tipy a triky pro webHobby Developer 3.0: Tipy a triky pro web
Hobby Developer 3.0: Tipy a triky pro web
 
SEO pohledem datového analytika
SEO pohledem datového analytikaSEO pohledem datového analytika
SEO pohledem datového analytika
 
Glami - jak řešíme performance, aneb jak neshodit web TV reklamou
Glami - jak řešíme performance, aneb jak neshodit web TV reklamouGlami - jak řešíme performance, aneb jak neshodit web TV reklamou
Glami - jak řešíme performance, aneb jak neshodit web TV reklamou
 
Google Tag Manager a analytika ve WordPress
Google Tag Manager a analytika ve WordPressGoogle Tag Manager a analytika ve WordPress
Google Tag Manager a analytika ve WordPress
 
Tomáš Poner a Vladislav Musílek, Nejlepší affiliate pluginy pro WordPress
Tomáš Poner a Vladislav Musílek, Nejlepší affiliate pluginy pro WordPressTomáš Poner a Vladislav Musílek, Nejlepší affiliate pluginy pro WordPress
Tomáš Poner a Vladislav Musílek, Nejlepší affiliate pluginy pro WordPress
 
Lex Vjatkin + Ondřej procházka: Jak to děláme ve Wikidi
Lex Vjatkin + Ondřej procházka: Jak to děláme ve WikidiLex Vjatkin + Ondřej procházka: Jak to děláme ve Wikidi
Lex Vjatkin + Ondřej procházka: Jak to děláme ve Wikidi
 
Vytvořeno pro SEO (Designed for SEO)
Vytvořeno pro SEO (Designed for SEO)Vytvořeno pro SEO (Designed for SEO)
Vytvořeno pro SEO (Designed for SEO)
 
Pavel ungr designed_for_seo
Pavel ungr designed_for_seoPavel ungr designed_for_seo
Pavel ungr designed_for_seo
 
Vyhledávače a JavaScript
Vyhledávače a JavaScriptVyhledávače a JavaScript
Vyhledávače a JavaScript
 
SEO nástroje, které možná neznáte
SEO nástroje, které možná neznáteSEO nástroje, které možná neznáte
SEO nástroje, které možná neznáte
 
Představení Ruby on Rails
Představení Ruby on RailsPředstavení Ruby on Rails
Představení Ruby on Rails
 
Ivan Kutil: Google Apps pro firmy
Ivan Kutil: Google Apps pro firmyIvan Kutil: Google Apps pro firmy
Ivan Kutil: Google Apps pro firmy
 
Adaptace webu: Audit návštěvnosti a jeho praktické důsledky
Adaptace webu: Audit návštěvnosti a jeho praktické důsledkyAdaptace webu: Audit návštěvnosti a jeho praktické důsledky
Adaptace webu: Audit návštěvnosti a jeho praktické důsledky
 
Screen scraping se ScraperWiki (Jindřich Mynarz)
Screen scraping se ScraperWiki (Jindřich Mynarz)Screen scraping se ScraperWiki (Jindřich Mynarz)
Screen scraping se ScraperWiki (Jindřich Mynarz)
 
Čtvrtkon #71 - Marian Benčat - Angular a NativeScript
Čtvrtkon #71 - Marian Benčat - Angular a NativeScriptČtvrtkon #71 - Marian Benčat - Angular a NativeScript
Čtvrtkon #71 - Marian Benčat - Angular a NativeScript
 
SEO jako Brno - Technické SEO
SEO jako Brno - Technické SEOSEO jako Brno - Technické SEO
SEO jako Brno - Technické SEO
 
20110511 Vývoj software - produktivně, efektivně, kvalitně
20110511 Vývoj software - produktivně, efektivně, kvalitně20110511 Vývoj software - produktivně, efektivně, kvalitně
20110511 Vývoj software - produktivně, efektivně, kvalitně
 
Trendy a nové možnosti test automation
Trendy a nové možnosti test automationTrendy a nové možnosti test automation
Trendy a nové možnosti test automation
 
JavaScript v GTM - Measure Camp Brno 2017
JavaScript v GTM - Measure Camp Brno 2017JavaScript v GTM - Measure Camp Brno 2017
JavaScript v GTM - Measure Camp Brno 2017
 
SEO Restart 2023: Lukáš Kostka - AI a R studio – optimalizace meta tagů na ,,...
SEO Restart 2023: Lukáš Kostka - AI a R studio – optimalizace meta tagů na ,,...SEO Restart 2023: Lukáš Kostka - AI a R studio – optimalizace meta tagů na ,,...
SEO Restart 2023: Lukáš Kostka - AI a R studio – optimalizace meta tagů na ,,...
 

Plus de Filip Podstavec

Keynote: Affiliate konference
Keynote: Affiliate konferenceKeynote: Affiliate konference
Keynote: Affiliate konferenceFilip Podstavec
 
How to get inside the search engine crawler head - Marketing Festival
How to get inside the search engine crawler head - Marketing FestivalHow to get inside the search engine crawler head - Marketing Festival
How to get inside the search engine crawler head - Marketing FestivalFilip Podstavec
 
Customer Score - Nekonference
Customer Score - NekonferenceCustomer Score - Nekonference
Customer Score - NekonferenceFilip Podstavec
 
Broken linkbuilding od B do G - SEO Restart
Broken linkbuilding od B do G - SEO RestartBroken linkbuilding od B do G - SEO Restart
Broken linkbuilding od B do G - SEO RestartFilip Podstavec
 
White hat linkbuilding | Plzeňský Barcamp
White hat linkbuilding | Plzeňský BarcampWhite hat linkbuilding | Plzeňský Barcamp
White hat linkbuilding | Plzeňský BarcampFilip Podstavec
 
Aktualizace vyhledávačů Google a Seznam
Aktualizace vyhledávačů Google a SeznamAktualizace vyhledávačů Google a Seznam
Aktualizace vyhledávačů Google a SeznamFilip Podstavec
 
Google+ Authorship - CopyCamp 2013
Google+ Authorship - CopyCamp 2013Google+ Authorship - CopyCamp 2013
Google+ Authorship - CopyCamp 2013Filip Podstavec
 
Minulost, současnost a budoucnost získávání odkazů
Minulost, současnost a budoucnost získávání odkazůMinulost, současnost a budoucnost získávání odkazů
Minulost, současnost a budoucnost získávání odkazůFilip Podstavec
 

Plus de Filip Podstavec (14)

Keynote: Affiliate konference
Keynote: Affiliate konferenceKeynote: Affiliate konference
Keynote: Affiliate konference
 
How to get inside the search engine crawler head - Marketing Festival
How to get inside the search engine crawler head - Marketing FestivalHow to get inside the search engine crawler head - Marketing Festival
How to get inside the search engine crawler head - Marketing Festival
 
Frontendisti prezentace
Frontendisti prezentaceFrontendisti prezentace
Frontendisti prezentace
 
Eshop summit prezentace
Eshop summit prezentaceEshop summit prezentace
Eshop summit prezentace
 
Word camp prezentace
Word camp prezentaceWord camp prezentace
Word camp prezentace
 
Ignite SEO Restart
Ignite SEO RestartIgnite SEO Restart
Ignite SEO Restart
 
Customer Score - Nekonference
Customer Score - NekonferenceCustomer Score - Nekonference
Customer Score - Nekonference
 
Broken linkbuilding od B do G - SEO Restart
Broken linkbuilding od B do G - SEO RestartBroken linkbuilding od B do G - SEO Restart
Broken linkbuilding od B do G - SEO Restart
 
White hat linkbuilding | Plzeňský Barcamp
White hat linkbuilding | Plzeňský BarcampWhite hat linkbuilding | Plzeňský Barcamp
White hat linkbuilding | Plzeňský Barcamp
 
Aktualizace vyhledávačů Google a Seznam
Aktualizace vyhledávačů Google a SeznamAktualizace vyhledávačů Google a Seznam
Aktualizace vyhledávačů Google a Seznam
 
Search updates
Search updatesSearch updates
Search updates
 
Google+ Authorship - CopyCamp 2013
Google+ Authorship - CopyCamp 2013Google+ Authorship - CopyCamp 2013
Google+ Authorship - CopyCamp 2013
 
Guest blogging v praxi
Guest blogging v praxiGuest blogging v praxi
Guest blogging v praxi
 
Minulost, současnost a budoucnost získávání odkazů
Minulost, současnost a budoucnost získávání odkazůMinulost, současnost a budoucnost získávání odkazů
Minulost, současnost a budoucnost získávání odkazů
 

Seologer naživo - Analýza logů

Notes de l'éditeur

  1. Rozdělují se na statické a real-time To co budete mít, budou asi static co vám pošlou