SlideShare une entreprise Scribd logo
1  sur  20
Télécharger pour lire hors ligne
CRAWL
BUDGET
VLADIMÍR SAUR
saur@dedouch.cz
@dedouch
JAKÝ JE CRAWL BUDGET
VAŠEHO WEBU?
JAKÝ JE CRAWL BUDGET
VAŠEHO WEBU?
JE TO MOC?
CO OVLIVŇUJE PŘIDĚLENÝ
CRAWL BUDGET?
CO OVLIVŇUJE PŘIDĚLENÝ
CRAWL BUDGET?
• Počet stránek webu
• Rank/popularita
• Častost aktualizace
• Rychlost webu/odezvy serveru
SEZNAM VS. GOOGLE
SEZNAMBOT
robots.txt 552x
homepage 10x
sitemap 16x
URL GET
Vše 20 700 27 600
HTML 11 400 15 200
Obrázky 9 300 11 700
<lastmod>
Stahuje se i se starším
datem
GOOGLEBOT
URL GET POST OPTIONS
Vše 85 700 304 700 14 400 130
HTML 52 500 103 100 14 400 130
Obrázky 32 700 79 900
Fonty 5 32 000
CSS 1 2 000
Javascript 15 86 700
<lastmod>
Stahuje jen poslední
datum (aktuální
den), starší ne
robots.txt 68x
homepage 196x
sitemap 11x
JAK SI CRAWL BUDGET CO
NEJLÉPE VYPLÁCAT?
Velký počet URL
s nízkou
hodnotou
• Duplicity
• Podobnosti
• Soft errors
JAK SI CRAWL BUDGET CO
NEJLÉPE VYPLÁCAT?
Další linkované
soubory
• Javascripty
• CSS
• Fonty
JAK SI CRAWL BUDGET CO
NEJLÉPE VYPLÁCAT?
Technické
nedostatky
• Redirect chains
• URL bez obsahu
JAK SI CRAWL BUDGET CO
NEJLÉPE VYPLÁCAT?
SPA
(Single-Page
Applications)
Indexace pomocí hashbang:
1. www.example.com/#!klic1=hod
nota1&klic2=hodnota2
2. <meta name="fragment"
content="!">
3. www.example.com/?
_escaped_fragment_=klic1=hod
nota1%26klic2=hodnota2
ŘÍZENÍ CRAWLINGU – CO
(TÉMĚŘ) NEFUNGUJE?
• Meta robots
• X-Robots-Tag
• Javascriptové odkazy
• Kanonizace
ŘÍZENÍ CRAWLINGU – CO
MŮŽE FUNGOVAT?
• Sitemaps
• Google Search Console – parametry
• Robots.txt
• If-Modified-Since v HTTP hlavičce
SITEMAPS
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
GOOGLE SEARCH CONSOLE
– PARAMETRY
ROBOTS.TXT
User-agent: *
Disallow: /
User-agent: SeznamBot
Disallow:
User-agent: googlebot
Disallow: /cat*.php
Disallow: /cat*.php3$
ROBOTS.TXT 2.0
User-agent: *
Robot-version: 2.0
Disallow: /test*
Disallow: /ko??
Disallow: /file?
Disallow: /[0-9][^0-9]*
?
VLADIMÍR SAUR
saur@dedouch.cz
@dedouch

Contenu connexe

En vedette

En vedette (8)

SEO restart 2017 - Případová studie Meyra
SEO restart 2017 - Případová studie MeyraSEO restart 2017 - Případová studie Meyra
SEO restart 2017 - Případová studie Meyra
 
Přestaňme dělat analýzy, začněme dělat SEO!
Přestaňme dělat analýzy, začněme dělat SEO!Přestaňme dělat analýzy, začněme dělat SEO!
Přestaňme dělat analýzy, začněme dělat SEO!
 
Jak se dostat do Featured Snippets - SEO restart 2017
Jak se dostat do Featured Snippets - SEO restart 2017Jak se dostat do Featured Snippets - SEO restart 2017
Jak se dostat do Featured Snippets - SEO restart 2017
 
Rychlá analýza zahraničních trhů pro SEO a PPC
Rychlá analýza zahraničních trhů pro SEO a PPCRychlá analýza zahraničních trhů pro SEO a PPC
Rychlá analýza zahraničních trhů pro SEO a PPC
 
HTTPS vs. Heureka (Martin Humpál)
HTTPS vs. Heureka (Martin Humpál)HTTPS vs. Heureka (Martin Humpál)
HTTPS vs. Heureka (Martin Humpál)
 
Deutsche seo (Milan Fiala)
Deutsche seo (Milan Fiala)Deutsche seo (Milan Fiala)
Deutsche seo (Milan Fiala)
 
Lokalizace webu z pohledu SEO (SEO restart 2017)
Lokalizace webu z pohledu SEO (SEO restart 2017)Lokalizace webu z pohledu SEO (SEO restart 2017)
Lokalizace webu z pohledu SEO (SEO restart 2017)
 
Marketing Festival 2017 By Istropolitana Ogilvy
Marketing Festival 2017 By Istropolitana OgilvyMarketing Festival 2017 By Istropolitana Ogilvy
Marketing Festival 2017 By Istropolitana Ogilvy
 

Similaire à Crawl budget (Vladimír Saur)

Similaire à Crawl budget (Vladimír Saur) (14)

SEOloger: Optimalizace crawl budgetu (host: Vladimír Saur)
SEOloger: Optimalizace crawl budgetu (host: Vladimír Saur)SEOloger: Optimalizace crawl budgetu (host: Vladimír Saur)
SEOloger: Optimalizace crawl budgetu (host: Vladimír Saur)
 
Vyhledávače a JavaScript
Vyhledávače a JavaScriptVyhledávače a JavaScript
Vyhledávače a JavaScript
 
Expertia Digital SEO Best practices při redesignu webu
Expertia Digital SEO Best practices při redesignu webuExpertia Digital SEO Best practices při redesignu webu
Expertia Digital SEO Best practices při redesignu webu
 
Workshop Analýza klíčových slov
Workshop Analýza klíčových slovWorkshop Analýza klíčových slov
Workshop Analýza klíčových slov
 
Oxygen Builder - Kyslík pro WordPress
Oxygen Builder - Kyslík pro WordPressOxygen Builder - Kyslík pro WordPress
Oxygen Builder - Kyslík pro WordPress
 
Rychlejší web snadno a rychle: Nové technologie a nástroje pro vývojáře
Rychlejší web snadno a rychle: Nové technologie a nástroje pro vývojářeRychlejší web snadno a rychle: Nové technologie a nástroje pro vývojáře
Rychlejší web snadno a rychle: Nové technologie a nástroje pro vývojáře
 
Screen scraping se ScraperWiki (Jindřich Mynarz)
Screen scraping se ScraperWiki (Jindřich Mynarz)Screen scraping se ScraperWiki (Jindřich Mynarz)
Screen scraping se ScraperWiki (Jindřich Mynarz)
 
Lukáš Pítra: Analýza klíčových slov (Shopcamp 2014)
Lukáš Pítra: Analýza klíčových slov (Shopcamp 2014)Lukáš Pítra: Analýza klíčových slov (Shopcamp 2014)
Lukáš Pítra: Analýza klíčových slov (Shopcamp 2014)
 
Optimalizace webových aplikací
Optimalizace webových aplikacíOptimalizace webových aplikací
Optimalizace webových aplikací
 
Základy internetu
Základy internetuZáklady internetu
Základy internetu
 
SEO pohledem datového analytika
SEO pohledem datového analytikaSEO pohledem datového analytika
SEO pohledem datového analytika
 
PoSobota 96 ČB 28.4.2018
PoSobota 96 ČB 28.4.2018PoSobota 96 ČB 28.4.2018
PoSobota 96 ČB 28.4.2018
 
Hobby Developer 3.0: Tipy a triky pro web
Hobby Developer 3.0: Tipy a triky pro webHobby Developer 3.0: Tipy a triky pro web
Hobby Developer 3.0: Tipy a triky pro web
 
Čtvrtkon #71 - Marian Benčat - Angular a NativeScript
Čtvrtkon #71 - Marian Benčat - Angular a NativeScriptČtvrtkon #71 - Marian Benčat - Angular a NativeScript
Čtvrtkon #71 - Marian Benčat - Angular a NativeScript
 

Plus de Taste Medio

Plus de Taste Medio (20)

Zodpovědně na automatizovaný účet
Zodpovědně na automatizovaný účetZodpovědně na automatizovaný účet
Zodpovědně na automatizovaný účet
 
Pépécéčkaři versus Google Analytics 4
Pépécéčkaři versus Google Analytics 4Pépécéčkaři versus Google Analytics 4
Pépécéčkaři versus Google Analytics 4
 
Jak (a proč) pracovat s klíčovkou?
Jak (a proč) pracovat s klíčovkou?Jak (a proč) pracovat s klíčovkou?
Jak (a proč) pracovat s klíčovkou?
 
Vyhodnocování tendrů aneb insighty z B2B průzkumů
Vyhodnocování tendrů aneb insighty z B2B průzkumůVyhodnocování tendrů aneb insighty z B2B průzkumů
Vyhodnocování tendrů aneb insighty z B2B průzkumů
 
Právní bitvy o PPCčka aneb věděli jste, že...?
Právní bitvy o PPCčka aneb věděli jste, že...?Právní bitvy o PPCčka aneb věděli jste, že...?
Právní bitvy o PPCčka aneb věděli jste, že...?
 
Retenční analýza - krok za krokem
 Retenční analýza - krok za krokem Retenční analýza - krok za krokem
Retenční analýza - krok za krokem
 
Dejte data z vašeho XML feedu do správné kondice
Dejte data z vašeho XML feedu do správné kondiceDejte data z vašeho XML feedu do správné kondice
Dejte data z vašeho XML feedu do správné kondice
 
Impresní remarketing RTB a FB
Impresní remarketing RTB a FBImpresní remarketing RTB a FB
Impresní remarketing RTB a FB
 
Symboly značky prakticky
Symboly značky praktickySymboly značky prakticky
Symboly značky prakticky
 
Marketingový framework PAVRD
Marketingový framework PAVRDMarketingový framework PAVRD
Marketingový framework PAVRD
 
Pozornost jako spouštěč i zabiják krizí
Pozornost jako spouštěč i zabiják krizíPozornost jako spouštěč i zabiják krizí
Pozornost jako spouštěč i zabiják krizí
 
DOBRO-INFLUENCE: Jak propojit síť influencerů ke smysluplné změně?
DOBRO-INFLUENCE: Jak propojit síť influencerů ke smysluplné změně?DOBRO-INFLUENCE: Jak propojit síť influencerů ke smysluplné změně?
DOBRO-INFLUENCE: Jak propojit síť influencerů ke smysluplné změně?
 
Od luxusu k ekologické odpovědnosti, aneb jak s pomocí PR a kampaně na sociál...
Od luxusu k ekologické odpovědnosti, aneb jak s pomocí PR a kampaně na sociál...Od luxusu k ekologické odpovědnosti, aneb jak s pomocí PR a kampaně na sociál...
Od luxusu k ekologické odpovědnosti, aneb jak s pomocí PR a kampaně na sociál...
 
Bageta plná hejtu
Bageta plná hejtuBageta plná hejtu
Bageta plná hejtu
 
Collabim: behind the scene (part #001)
Collabim: behind the scene (part #001)Collabim: behind the scene (part #001)
Collabim: behind the scene (part #001)
 
"Jak výhodně incestovat" aneb srandy s klíčovkami
"Jak výhodně incestovat" aneb srandy s klíčovkami"Jak výhodně incestovat" aneb srandy s klíčovkami
"Jak výhodně incestovat" aneb srandy s klíčovkami
 
Agentura/In-house/Freelance - kde dělat SEO?
Agentura/In-house/Freelance - kde dělat SEO?Agentura/In-house/Freelance - kde dělat SEO?
Agentura/In-house/Freelance - kde dělat SEO?
 
Příběh zákazníka po 3 letech od první návštěvy až k CLV a vlastní atribuci
Příběh zákazníka po 3 letech od první návštěvy až k CLV a vlastní atribuciPříběh zákazníka po 3 letech od první návštěvy až k CLV a vlastní atribuci
Příběh zákazníka po 3 letech od první návštěvy až k CLV a vlastní atribuci
 
Kde jsou limity zákaznické 360°?
 Kde jsou limity zákaznické 360°? Kde jsou limity zákaznické 360°?
Kde jsou limity zákaznické 360°?
 
Marketing a data. Umíme v nich najít hodnotu?
Marketing a data. Umíme v nich najít hodnotu?Marketing a data. Umíme v nich najít hodnotu?
Marketing a data. Umíme v nich najít hodnotu?
 

Crawl budget (Vladimír Saur)