SlideShare une entreprise Scribd logo
1  sur  18
Vyhledávače	
  a	
  JavaScript	
  
Jan	
  Tichý	
  
!chy@medio.cz	
  
Proč	
  by	
  měl	
  vyhledávače	
  JS	
  zajímat	
  	
  
•  Protože	
  web	
  už	
  dnes	
  není	
  jen	
  HTML	
  s	
  troškou	
  
nevýznamných	
  skriptů	
  pro	
  obveselení	
  uživatelů	
  
•  Fulltext	
  lépe	
  porozumí	
  tomu,	
  co	
  vidí	
  uživatelé	
  
•  Dostane	
  se	
  k	
  zajímavému	
  obsahu	
  –	
  deep	
  web	
  
•  Získává	
  dodatečné	
  faktory	
  pro	
  řazení	
  
•  Lépe	
  pozná	
  mobilní	
  web	
  
•  Snáze	
  odhalí	
  podvody	
  a	
  nekalé	
  prak!ky	
  
A	
  zajímá	
  skutečně	
  vyhledávače?	
  
•  Google	
  
–  Rozpoznání	
  základních	
  JS	
  konstrukcí	
  ve	
  zdrojáku	
  
–  2009	
  –	
  HashBang	
  
–  2011	
  –	
  indexování	
  vybraného	
  JS	
  obsahu	
  
–  2014	
  –	
  spouštění	
  skriptů	
  na	
  stránkách	
  	
  
•  Seznam	
  
–  2014	
  –	
  HashBang	
  
•  Nejde	
  jen	
  o	
  fulltexty!	
  
–  Facebook,	
  Twi^er,	
  PPC	
  systémy,	
  záložky	
  a	
  historie…	
  
Na	
  co	
  se	
  zaměřit?	
  
•  Indexace	
  stránky	
  
•  Průchodnost	
  webu	
  
Indexace	
  stránky	
  
Pokročilost	
  indexace	
  stránek	
  
•  Indexace	
  čistě	
  HTML	
  stránek	
  
–  Stále	
  i	
  dnes	
  plab	
  pro	
  Facebook,	
  Twi^er,	
  PPC	
  systémy…	
  
•  Rozpoznání	
  známých	
  konstruktů	
  ve	
  zdrojáku	
  
–  document.write,	
  loca!on.href	
  
•  Ad	
  hoc	
  indexace	
  vybraného	
  JS	
  obsahu	
  
–  Facebook	
  diskuze	
  
•  Spouštění	
  skriptů,	
  vykreslování	
  stránek	
  
–  Fulltext	
  vidí	
  skutečnou	
  podobu	
  stránek	
  
–  Skryté	
  texty	
  či	
  bloky,	
  překryvy,	
  míra	
  reklamy	
  
–  Rychlost	
  načítání	
  a	
  vykreslování	
  stránky	
  
–  Mobilní	
  či	
  responzivní	
  verze	
  
Jak	
  podpořit	
  indexaci	
  stránky?	
  
•  Být	
  maximálně	
  konzerva!vní	
  
– Nejavascriptový	
  indexovatelný	
  HTML	
  základ	
  
– Javascript	
  mít	
  jako	
  „nice-­‐to-­‐have“	
  vrstvu	
  nad	
  bm	
  
– Hlavně	
  kvůli	
  Seznamu,	
  Facebooku,	
  PPC…	
  
	
  
•  Na	
  druhou	
  stranu:	
  
– Nechat	
  crawler,	
  ať	
  si	
  spoušb	
  JavaScript	
  a	
  CSS	
  
– Neblokovat	
  externí	
  skripty	
  a	
  styly	
  v	
  robots.txt	
  
– Nepodsouvat	
  cloakingem	
  nejavascript	
  verzi	
  
Další	
  poznámky	
  k	
  indexaci	
  stránky	
  
•  JS	
  se	
  spoušb	
  při	
  renderování,	
  ne	
  událos!	
  
– Infinite	
  scroll	
  není	
  zpravidla	
  součásb	
  stránky	
  
•  HTTP	
  dotazy	
  crawlera	
  jsou	
  zabm	
  state-­‐less	
  
– Nepracuje	
  s	
  cookies	
  ani	
  jinými	
  klientskými	
  uložiš!	
  
•  Client-­‐side	
  JS	
  frameworky	
  dělají	
  často	
  bordel	
  
– Házejí	
  crawleru	
  klacky	
  pod	
  nohy	
  
– Masivní	
  duplicity,	
  divoká	
  či	
  neindexovatelná	
  URL	
  
Dynamicky	
  načítaný	
  obsah	
  (AJAX)	
  
•  Donačítané	
  boxy,	
  infinite	
  scroll…	
  
•  Z	
  pohledu	
  vyhledávače	
  de	
  facto	
  další	
  stránka	
  
•  Musíte	
  to	
  tak	
  také	
  chápat!	
  
•  Čili	
  další	
  obsah	
  =	
  další	
  indexovatelná	
  URL	
  
Průchodnost	
  webu	
  
Tři	
  pravidla	
  průchodnosN	
  webu	
  
1.  Každý	
  obsah	
  musí	
  mít	
  svou	
  URL	
  
2.  Robot	
  musí	
  umět	
  obsah	
  z	
  dané	
  URL	
  stáhnout	
  	
  
3.  Robot	
  se	
  o	
  této	
  URL	
  musí	
  nějak	
  dozvědět	
  
Každý	
  obsah	
  musí	
  mít	
  svou	
  URL	
  
www.medio.cz/zamestnani	
  
www.medio.cz/?stranka=zamestnani	
  
www.medio.cz/#zamestnani	
  
www.medio.cz/#!/zamestnani	
  
•  Z	
  pohledu	
  vyhledávačů	
  1	
  URL	
  =	
  1	
  „stránka“	
  
•  Dynamické	
  načítání	
  obsahu	
  s	
  pomocí	
  AJAXu	
  
–  Infinite	
  scroll,	
  zpožděné	
  bloky	
  textu	
  
–  I	
  ty	
  musí	
  mít	
  svou	
  vlastní	
  další	
  URL	
  
•  Uživatel	
  by	
  měl	
  vždy	
  vidět	
  tu	
  správnou	
  aktuální	
  URL	
  
–  Odkazy,	
  loca!on.href,	
  history.pushState()	
  
Robot	
  musí	
  umět	
  stáhnout	
  obsah	
  
h^p://www.medio.cz/zamestnani	
  
h^p://www.medio.cz/?stranka=zamestnani	
  
•  Žádný	
  problém	
  –	
  normálně	
  crawlovatelné	
  
•  Pro	
  dynamický	
  obsah	
  AJAXem	
  se	
  toho	
  
dosáhne	
  jedině	
  přes	
  pushState	
  
Robot	
  musí	
  umět	
  stáhnout	
  obsah	
  
h^p://www.medio.cz/#zamestnani	
  
•  Neindexovatelný	
  obsah!	
  
•  Mřížku	
  využívá	
  spousta	
  JS	
  frameworků	
  
•  Uživatelům	
  vše	
  funguje	
  OK,	
  mají	
  JavaScript	
  
•  Při	
  nejavascriptovém	
  základu	
  pod	
  bm	
  problém	
  s	
  
chybným	
  cílením	
  zpětných	
  odkazů	
  
•  Dá	
  se	
  využít	
  třeba	
  u	
  e-­‐shopů	
  pro	
  odlišení	
  filtrů,	
  
které	
  chci	
  a	
  které	
  nechci	
  indexovat	
  
HashBang	
  
•  Crawlovatelné,	
  musí	
  být	
  ale	
  explicitní	
  podpora	
  na	
  
straně	
  vyhledávače	
  i	
  samotného	
  webu:	
  
	
  
h^p://www.medio.cz/#!/zamestnani	
  
h^p://www.medio.cz/?_escaped_fragment_=/zamestnani	
  
<meta	
  name="fragment"	
  content="!">	
  
•  h^ps://developers.google.com/webmasters/ajax-­‐crawling/	
  
•  h^p://napoveda.seznam.cz/cz/ajax-­‐indexace.html	
  
Robot	
  se	
  o	
  URL	
  musí	
  dozvědět	
  
•  Starý	
  dobrý	
  A	
  HREF	
  ve	
  zdrojáku	
  
•  Metahlavičky	
  –	
  link	
  (prev,	
  next,	
  canonical…)	
  
•  Sitemap.xml	
  
•  Ruční	
  submit	
  
•  document.loca!on	
  
•  …	
  	
  
	
  
Poznámky	
  k	
  průchodnosN	
  
•  Nejen	
  průchodnost,	
  ale	
  i	
  rank	
  
– Silně	
  preferujeme	
  staré	
  dobré	
  odkazy	
  
•  Necrawlují	
  se	
  zpravidla	
  obsah	
  a	
  odkazy	
  
generované	
  až	
  po	
  vyrenderování	
  stránky	
  
– Infinite	
  scroll	
  
– Musí	
  se	
  doplnit	
  skrytými	
  odkazy	
  
Díky	
  za	
  pozornost!	
  
•  Prezentace: 	
  slideshare.net/mediocz	
  
•  Twi^er: 	
   	
  @jan!chy	
  
	
  
•  E-­‐mail: 	
   	
  !chy@medio.cz	
  	
  
	
   	
  	
  

Contenu connexe

Tendances

SEO - optimalizace pro vyhledávače
SEO - optimalizace pro vyhledávačeSEO - optimalizace pro vyhledávače
SEO - optimalizace pro vyhledávače
seznamVyvojari
 
Já dělám "to SEO" dobře, jen vyhledávače ho zatím nepochopily... BarCamp Brno...
Já dělám "to SEO" dobře, jen vyhledávače ho zatím nepochopily... BarCamp Brno...Já dělám "to SEO" dobře, jen vyhledávače ho zatím nepochopily... BarCamp Brno...
Já dělám "to SEO" dobře, jen vyhledávače ho zatím nepochopily... BarCamp Brno...
Jan Kalianko
 
AdWords - Dynamic Search Ads
AdWords - Dynamic Search AdsAdWords - Dynamic Search Ads
AdWords - Dynamic Search Ads
Marek Mašek
 

Tendances (20)

Zrychlování mobilního webu aneb LTE máme jenom v Praze | Jarda Hanslík - Slev...
Zrychlování mobilního webu aneb LTE máme jenom v Praze | Jarda Hanslík - Slev...Zrychlování mobilního webu aneb LTE máme jenom v Praze | Jarda Hanslík - Slev...
Zrychlování mobilního webu aneb LTE máme jenom v Praze | Jarda Hanslík - Slev...
 
Zrychlování webu
Zrychlování webuZrychlování webu
Zrychlování webu
 
R. Kracik-začátky SEO - ovládněte nastroje
R. Kracik-začátky SEO - ovládněte nastrojeR. Kracik-začátky SEO - ovládněte nastroje
R. Kracik-začátky SEO - ovládněte nastroje
 
Zrychlujeme web
Zrychlujeme webZrychlujeme web
Zrychlujeme web
 
Content je king, ale...
Content je king, ale...Content je king, ale...
Content je king, ale...
 
Nejčastejší problémy WordPress webů
Nejčastejší problémy WordPress webůNejčastejší problémy WordPress webů
Nejčastejší problémy WordPress webů
 
SEO & affiliate - #seologer naživo 2019
SEO & affiliate - #seologer naživo 2019SEO & affiliate - #seologer naživo 2019
SEO & affiliate - #seologer naživo 2019
 
Tomáš Poner a Vladislav Musílek, Nejlepší affiliate pluginy pro WordPress
Tomáš Poner a Vladislav Musílek, Nejlepší affiliate pluginy pro WordPressTomáš Poner a Vladislav Musílek, Nejlepší affiliate pluginy pro WordPress
Tomáš Poner a Vladislav Musílek, Nejlepší affiliate pluginy pro WordPress
 
Glami - jak řešíme performance, aneb jak neshodit web TV reklamou
Glami - jak řešíme performance, aneb jak neshodit web TV reklamouGlami - jak řešíme performance, aneb jak neshodit web TV reklamou
Glami - jak řešíme performance, aneb jak neshodit web TV reklamou
 
SEO - optimalizace pro vyhledávače
SEO - optimalizace pro vyhledávačeSEO - optimalizace pro vyhledávače
SEO - optimalizace pro vyhledávače
 
SEO pohledem datového analytika
SEO pohledem datového analytikaSEO pohledem datového analytika
SEO pohledem datového analytika
 
WordPress Affiliate a XML feedy
WordPress Affiliate a XML feedyWordPress Affiliate a XML feedy
WordPress Affiliate a XML feedy
 
WordPress ve světě hostingu, Václav Peter
WordPress ve světě hostingu, Václav PeterWordPress ve světě hostingu, Václav Peter
WordPress ve světě hostingu, Václav Peter
 
Říjnový SEOloger 2019 - Screaming Frog a crawlování webů
Říjnový SEOloger 2019 - Screaming Frog a crawlování webůŘíjnový SEOloger 2019 - Screaming Frog a crawlování webů
Říjnový SEOloger 2019 - Screaming Frog a crawlování webů
 
Analýza klíčových slov na maximum – interpretace
Analýza klíčových slov na maximum – interpretaceAnalýza klíčových slov na maximum – interpretace
Analýza klíčových slov na maximum – interpretace
 
Tvorba knihy na Kindle a další ebooky - obhajova odborné maturitní práce
Tvorba knihy na Kindle a další ebooky - obhajova odborné maturitní práceTvorba knihy na Kindle a další ebooky - obhajova odborné maturitní práce
Tvorba knihy na Kindle a další ebooky - obhajova odborné maturitní práce
 
Já dělám "to SEO" dobře, jen vyhledávače ho zatím nepochopily... BarCamp Brno...
Já dělám "to SEO" dobře, jen vyhledávače ho zatím nepochopily... BarCamp Brno...Já dělám "to SEO" dobře, jen vyhledávače ho zatím nepochopily... BarCamp Brno...
Já dělám "to SEO" dobře, jen vyhledávače ho zatím nepochopily... BarCamp Brno...
 
10 rad, jak uspět na webu v roce 2014
10 rad, jak uspět na webu v roce 201410 rad, jak uspět na webu v roce 2014
10 rad, jak uspět na webu v roce 2014
 
Optimalizace webových aplikací
Optimalizace webových aplikacíOptimalizace webových aplikací
Optimalizace webových aplikací
 
AdWords - Dynamic Search Ads
AdWords - Dynamic Search AdsAdWords - Dynamic Search Ads
AdWords - Dynamic Search Ads
 

Similaire à Vyhledávače a JavaScript

Pavel ungr designed_for_seo
Pavel ungr designed_for_seoPavel ungr designed_for_seo
Pavel ungr designed_for_seo
H1.cz
 
Seo Pro Drupal Developery
Seo Pro Drupal DeveloperySeo Pro Drupal Developery
Seo Pro Drupal Developery
Jozef Toth
 

Similaire à Vyhledávače a JavaScript (20)

SEO ve světě JavaScriptu
SEO ve světě JavaScriptuSEO ve světě JavaScriptu
SEO ve světě JavaScriptu
 
Oxygen Builder - Kyslík pro WordPress
Oxygen Builder - Kyslík pro WordPressOxygen Builder - Kyslík pro WordPress
Oxygen Builder - Kyslík pro WordPress
 
Vytvořeno pro SEO (Designed for SEO)
Vytvořeno pro SEO (Designed for SEO)Vytvořeno pro SEO (Designed for SEO)
Vytvořeno pro SEO (Designed for SEO)
 
Pavel ungr designed_for_seo
Pavel ungr designed_for_seoPavel ungr designed_for_seo
Pavel ungr designed_for_seo
 
Digisemestr - Broken linkbuilding, strukturovaná data a další možnosti pokroč...
Digisemestr - Broken linkbuilding, strukturovaná data a další možnosti pokroč...Digisemestr - Broken linkbuilding, strukturovaná data a další možnosti pokroč...
Digisemestr - Broken linkbuilding, strukturovaná data a další možnosti pokroč...
 
SEO Date #3: Šárka Rolná Jakubcová - Klientské a vývojářské SEO omyly a mýty
SEO Date #3: Šárka Rolná Jakubcová - Klientské a vývojářské SEO omyly a mýtySEO Date #3: Šárka Rolná Jakubcová - Klientské a vývojářské SEO omyly a mýty
SEO Date #3: Šárka Rolná Jakubcová - Klientské a vývojářské SEO omyly a mýty
 
Čtvrtkon #71 - Marian Benčat - Angular a NativeScript
Čtvrtkon #71 - Marian Benčat - Angular a NativeScriptČtvrtkon #71 - Marian Benčat - Angular a NativeScript
Čtvrtkon #71 - Marian Benčat - Angular a NativeScript
 
Seo Pro Drupal Developery
Seo Pro Drupal DeveloperySeo Pro Drupal Developery
Seo Pro Drupal Developery
 
TNPW2-2012-03
TNPW2-2012-03TNPW2-2012-03
TNPW2-2012-03
 
Screen scraping se ScraperWiki (Jindřich Mynarz)
Screen scraping se ScraperWiki (Jindřich Mynarz)Screen scraping se ScraperWiki (Jindřich Mynarz)
Screen scraping se ScraperWiki (Jindřich Mynarz)
 
PoSobota 96 ČB 28.4.2018
PoSobota 96 ČB 28.4.2018PoSobota 96 ČB 28.4.2018
PoSobota 96 ČB 28.4.2018
 
Základy internetu
Základy internetuZáklady internetu
Základy internetu
 
TNPW2-2013-03
TNPW2-2013-03TNPW2-2013-03
TNPW2-2013-03
 
Hobby Developer 3.0: Tipy a triky pro web
Hobby Developer 3.0: Tipy a triky pro webHobby Developer 3.0: Tipy a triky pro web
Hobby Developer 3.0: Tipy a triky pro web
 
Webová prezentace - case study - Ibis interiér
Webová prezentace - case study - Ibis interiérWebová prezentace - case study - Ibis interiér
Webová prezentace - case study - Ibis interiér
 
Webová prezentace - case study - DHL Express (Slovakia)
Webová prezentace - case study - DHL Express (Slovakia)Webová prezentace - case study - DHL Express (Slovakia)
Webová prezentace - case study - DHL Express (Slovakia)
 
Tipy ze života linkbuildera
Tipy ze života linkbuilderaTipy ze života linkbuildera
Tipy ze života linkbuildera
 
Jak nám vývojáři hážou klacky pod nohy?
Jak nám vývojáři hážou klacky pod nohy?Jak nám vývojáři hážou klacky pod nohy?
Jak nám vývojáři hážou klacky pod nohy?
 
SEO - Jak ovladnout vyhledavace? Magie ci Veda?
SEO - Jak ovladnout vyhledavace? Magie ci Veda?SEO - Jak ovladnout vyhledavace? Magie ci Veda?
SEO - Jak ovladnout vyhledavace? Magie ci Veda?
 
SEO - Jak ovladnout vyhledavace, Magie ci Veda?
SEO - Jak ovladnout vyhledavace, Magie ci Veda?SEO - Jak ovladnout vyhledavace, Magie ci Veda?
SEO - Jak ovladnout vyhledavace, Magie ci Veda?
 

Plus de Taste Medio

Plus de Taste Medio (20)

Zodpovědně na automatizovaný účet
Zodpovědně na automatizovaný účetZodpovědně na automatizovaný účet
Zodpovědně na automatizovaný účet
 
Pépécéčkaři versus Google Analytics 4
Pépécéčkaři versus Google Analytics 4Pépécéčkaři versus Google Analytics 4
Pépécéčkaři versus Google Analytics 4
 
Jak (a proč) pracovat s klíčovkou?
Jak (a proč) pracovat s klíčovkou?Jak (a proč) pracovat s klíčovkou?
Jak (a proč) pracovat s klíčovkou?
 
Vyhodnocování tendrů aneb insighty z B2B průzkumů
Vyhodnocování tendrů aneb insighty z B2B průzkumůVyhodnocování tendrů aneb insighty z B2B průzkumů
Vyhodnocování tendrů aneb insighty z B2B průzkumů
 
Právní bitvy o PPCčka aneb věděli jste, že...?
Právní bitvy o PPCčka aneb věděli jste, že...?Právní bitvy o PPCčka aneb věděli jste, že...?
Právní bitvy o PPCčka aneb věděli jste, že...?
 
Retenční analýza - krok za krokem
 Retenční analýza - krok za krokem Retenční analýza - krok za krokem
Retenční analýza - krok za krokem
 
Dejte data z vašeho XML feedu do správné kondice
Dejte data z vašeho XML feedu do správné kondiceDejte data z vašeho XML feedu do správné kondice
Dejte data z vašeho XML feedu do správné kondice
 
Impresní remarketing RTB a FB
Impresní remarketing RTB a FBImpresní remarketing RTB a FB
Impresní remarketing RTB a FB
 
Symboly značky prakticky
Symboly značky praktickySymboly značky prakticky
Symboly značky prakticky
 
Marketingový framework PAVRD
Marketingový framework PAVRDMarketingový framework PAVRD
Marketingový framework PAVRD
 
Pozornost jako spouštěč i zabiják krizí
Pozornost jako spouštěč i zabiják krizíPozornost jako spouštěč i zabiják krizí
Pozornost jako spouštěč i zabiják krizí
 
DOBRO-INFLUENCE: Jak propojit síť influencerů ke smysluplné změně?
DOBRO-INFLUENCE: Jak propojit síť influencerů ke smysluplné změně?DOBRO-INFLUENCE: Jak propojit síť influencerů ke smysluplné změně?
DOBRO-INFLUENCE: Jak propojit síť influencerů ke smysluplné změně?
 
Od luxusu k ekologické odpovědnosti, aneb jak s pomocí PR a kampaně na sociál...
Od luxusu k ekologické odpovědnosti, aneb jak s pomocí PR a kampaně na sociál...Od luxusu k ekologické odpovědnosti, aneb jak s pomocí PR a kampaně na sociál...
Od luxusu k ekologické odpovědnosti, aneb jak s pomocí PR a kampaně na sociál...
 
Bageta plná hejtu
Bageta plná hejtuBageta plná hejtu
Bageta plná hejtu
 
Collabim: behind the scene (part #001)
Collabim: behind the scene (part #001)Collabim: behind the scene (part #001)
Collabim: behind the scene (part #001)
 
"Jak výhodně incestovat" aneb srandy s klíčovkami
"Jak výhodně incestovat" aneb srandy s klíčovkami"Jak výhodně incestovat" aneb srandy s klíčovkami
"Jak výhodně incestovat" aneb srandy s klíčovkami
 
Agentura/In-house/Freelance - kde dělat SEO?
Agentura/In-house/Freelance - kde dělat SEO?Agentura/In-house/Freelance - kde dělat SEO?
Agentura/In-house/Freelance - kde dělat SEO?
 
Příběh zákazníka po 3 letech od první návštěvy až k CLV a vlastní atribuci
Příběh zákazníka po 3 letech od první návštěvy až k CLV a vlastní atribuciPříběh zákazníka po 3 letech od první návštěvy až k CLV a vlastní atribuci
Příběh zákazníka po 3 letech od první návštěvy až k CLV a vlastní atribuci
 
Kde jsou limity zákaznické 360°?
 Kde jsou limity zákaznické 360°? Kde jsou limity zákaznické 360°?
Kde jsou limity zákaznické 360°?
 
Marketing a data. Umíme v nich najít hodnotu?
Marketing a data. Umíme v nich najít hodnotu?Marketing a data. Umíme v nich najít hodnotu?
Marketing a data. Umíme v nich najít hodnotu?
 

Vyhledávače a JavaScript

  • 1. Vyhledávače  a  JavaScript   Jan  Tichý   !chy@medio.cz  
  • 2. Proč  by  měl  vyhledávače  JS  zajímat     •  Protože  web  už  dnes  není  jen  HTML  s  troškou   nevýznamných  skriptů  pro  obveselení  uživatelů   •  Fulltext  lépe  porozumí  tomu,  co  vidí  uživatelé   •  Dostane  se  k  zajímavému  obsahu  –  deep  web   •  Získává  dodatečné  faktory  pro  řazení   •  Lépe  pozná  mobilní  web   •  Snáze  odhalí  podvody  a  nekalé  prak!ky  
  • 3. A  zajímá  skutečně  vyhledávače?   •  Google   –  Rozpoznání  základních  JS  konstrukcí  ve  zdrojáku   –  2009  –  HashBang   –  2011  –  indexování  vybraného  JS  obsahu   –  2014  –  spouštění  skriptů  na  stránkách     •  Seznam   –  2014  –  HashBang   •  Nejde  jen  o  fulltexty!   –  Facebook,  Twi^er,  PPC  systémy,  záložky  a  historie…  
  • 4. Na  co  se  zaměřit?   •  Indexace  stránky   •  Průchodnost  webu  
  • 6. Pokročilost  indexace  stránek   •  Indexace  čistě  HTML  stránek   –  Stále  i  dnes  plab  pro  Facebook,  Twi^er,  PPC  systémy…   •  Rozpoznání  známých  konstruktů  ve  zdrojáku   –  document.write,  loca!on.href   •  Ad  hoc  indexace  vybraného  JS  obsahu   –  Facebook  diskuze   •  Spouštění  skriptů,  vykreslování  stránek   –  Fulltext  vidí  skutečnou  podobu  stránek   –  Skryté  texty  či  bloky,  překryvy,  míra  reklamy   –  Rychlost  načítání  a  vykreslování  stránky   –  Mobilní  či  responzivní  verze  
  • 7. Jak  podpořit  indexaci  stránky?   •  Být  maximálně  konzerva!vní   – Nejavascriptový  indexovatelný  HTML  základ   – Javascript  mít  jako  „nice-­‐to-­‐have“  vrstvu  nad  bm   – Hlavně  kvůli  Seznamu,  Facebooku,  PPC…     •  Na  druhou  stranu:   – Nechat  crawler,  ať  si  spoušb  JavaScript  a  CSS   – Neblokovat  externí  skripty  a  styly  v  robots.txt   – Nepodsouvat  cloakingem  nejavascript  verzi  
  • 8. Další  poznámky  k  indexaci  stránky   •  JS  se  spoušb  při  renderování,  ne  událos!   – Infinite  scroll  není  zpravidla  součásb  stránky   •  HTTP  dotazy  crawlera  jsou  zabm  state-­‐less   – Nepracuje  s  cookies  ani  jinými  klientskými  uložiš!   •  Client-­‐side  JS  frameworky  dělají  často  bordel   – Házejí  crawleru  klacky  pod  nohy   – Masivní  duplicity,  divoká  či  neindexovatelná  URL  
  • 9. Dynamicky  načítaný  obsah  (AJAX)   •  Donačítané  boxy,  infinite  scroll…   •  Z  pohledu  vyhledávače  de  facto  další  stránka   •  Musíte  to  tak  také  chápat!   •  Čili  další  obsah  =  další  indexovatelná  URL  
  • 11. Tři  pravidla  průchodnosN  webu   1.  Každý  obsah  musí  mít  svou  URL   2.  Robot  musí  umět  obsah  z  dané  URL  stáhnout     3.  Robot  se  o  této  URL  musí  nějak  dozvědět  
  • 12. Každý  obsah  musí  mít  svou  URL   www.medio.cz/zamestnani   www.medio.cz/?stranka=zamestnani   www.medio.cz/#zamestnani   www.medio.cz/#!/zamestnani   •  Z  pohledu  vyhledávačů  1  URL  =  1  „stránka“   •  Dynamické  načítání  obsahu  s  pomocí  AJAXu   –  Infinite  scroll,  zpožděné  bloky  textu   –  I  ty  musí  mít  svou  vlastní  další  URL   •  Uživatel  by  měl  vždy  vidět  tu  správnou  aktuální  URL   –  Odkazy,  loca!on.href,  history.pushState()  
  • 13. Robot  musí  umět  stáhnout  obsah   h^p://www.medio.cz/zamestnani   h^p://www.medio.cz/?stranka=zamestnani   •  Žádný  problém  –  normálně  crawlovatelné   •  Pro  dynamický  obsah  AJAXem  se  toho   dosáhne  jedině  přes  pushState  
  • 14. Robot  musí  umět  stáhnout  obsah   h^p://www.medio.cz/#zamestnani   •  Neindexovatelný  obsah!   •  Mřížku  využívá  spousta  JS  frameworků   •  Uživatelům  vše  funguje  OK,  mají  JavaScript   •  Při  nejavascriptovém  základu  pod  bm  problém  s   chybným  cílením  zpětných  odkazů   •  Dá  se  využít  třeba  u  e-­‐shopů  pro  odlišení  filtrů,   které  chci  a  které  nechci  indexovat  
  • 15. HashBang   •  Crawlovatelné,  musí  být  ale  explicitní  podpora  na   straně  vyhledávače  i  samotného  webu:     h^p://www.medio.cz/#!/zamestnani   h^p://www.medio.cz/?_escaped_fragment_=/zamestnani   <meta  name="fragment"  content="!">   •  h^ps://developers.google.com/webmasters/ajax-­‐crawling/   •  h^p://napoveda.seznam.cz/cz/ajax-­‐indexace.html  
  • 16. Robot  se  o  URL  musí  dozvědět   •  Starý  dobrý  A  HREF  ve  zdrojáku   •  Metahlavičky  –  link  (prev,  next,  canonical…)   •  Sitemap.xml   •  Ruční  submit   •  document.loca!on   •  …      
  • 17. Poznámky  k  průchodnosN   •  Nejen  průchodnost,  ale  i  rank   – Silně  preferujeme  staré  dobré  odkazy   •  Necrawlují  se  zpravidla  obsah  a  odkazy   generované  až  po  vyrenderování  stránky   – Infinite  scroll   – Musí  se  doplnit  skrytými  odkazy  
  • 18. Díky  za  pozornost!   •  Prezentace:  slideshare.net/mediocz   •  Twi^er:    @jan!chy     •  E-­‐mail:    !chy@medio.cz