Ce diaporama a bien été signalé.
Nous utilisons votre profil LinkedIn et vos données d’activité pour vous proposer des publicités personnalisées et pertinentes. Vous pouvez changer vos préférences de publicités à tout moment.

BlackHat Analytics

1 805 vues

Publié le

Prezentacja z XV SEMcampu w Warszawie jest wprowadzeniem do tematyki związanej z BlackHatem w Google Analytics.

Publié dans : Internet
  • Soyez le premier à commenter

BlackHat Analytics

  1. 1. @lewwwinSEMcamp SEMcamp BlackHat Analytics Wprowadzenie. SkyNet. Przygotuj się! Maciej Lewiński - @lewwwin XV SEMCamp @ Warszawa
  2. 2. @lewwwinSEMcamp UWAGA! Przedstawione w niniejszej prezentacji przykłady oraz techniki BlackHatu są przytaczane tylko w celach edukacyjnych. Autor niniejszej prezentacji nie bierze odpowiedzialności za wcielenie omawianych metod w życie.
  3. 3. @lewwwinSEMcamp
  4. 4. @lewwwinSEMcamp Definicja BlackHat
  5. 5. @lewwwinSEMcamp Podsumowanie ostatnich 15 SEMcampów ;) BlackHat SEO • ukryty tekst • cloaking • keyword stuffing • automatyczne generowanie treści • SWL • infekowanie linkami • budowanie zaplecza BlackHat PPC • boty generujące wyświetlenia • wyklikiwanie budżetu dziennego • CTR Nuke • ominięcie ograniczeń znaków towarowych • manipulowanie zawartością stron docelowych • ukrywanie reklam przed konkurencją
  6. 6. @lewwwinSEMcamp Dlaczego BlackHat Analytics? Trend Automatyka Kasa
  7. 7. @lewwwinSEMcamp Definicja BlackHat Analytics Celowe działanie zakłócające, usuwające, przechwytujące dane WA przy użyciu luk technicznych lub prawnych; celem czerpania zysków finansowych, lub uzyskania przewagi konkurencyjnej. Phil Pearce
  8. 8. @lewwwinSEMcamp Nasze dane
  9. 9. @lewwwinSEMcamp BlackHat Analytics Zrozumied. Wykryd. Zareagowad. Zapobiec.
  10. 10. @lewwwinSEMcamp SEMcamp Na czym opiera się analityka?
  11. 11. @lewwwinSEMcamp Ciasteczkologia #1 1st party cookies 3rd party cookies Jak się ich pozbyd? Wyczyścid zawartośd przeglądarki ;)
  12. 12. @lewwwinSEMcamp Czytanie z ciastek <script type="text/javascript"> function readCookie(name) { var nameEQ = name + "="; var ca = document.cookie.split(';'); for(var i=0;i < ca.length;i++) { var c = ca[i]; while (c.charAt(0)==' ') c = c.substring(1,c.length); if (c.indexOf(nameEQ) == 0) return c.substring(nameEQ.length,c.length); } return null; } function googleCookieReferrer() { var feed=readCookie("__utmz"); feed=feed.split("|"); feed=feed[0].split("="); return feed[1];}; if (googleCookieReferrer() == "google") { document.location.href("http://www.akademiaanlytics.pl/pogoda/");} </script>
  13. 13. @lewwwinSEMcamp Ciasteczkologia #2 Flash cookies Jak się ich pozbyd? Windows XP C:Documents and Settings[Twój Profil]Application DataMacromediaFlash Player#SharedObjects[Random Name][Web Site Path] Windows 7/Vista C:Users[Twój Profil]AppDataRoamingMacromediaFlash Player#SharedObjects[Random Name][Web Site Path] MacOS ~/Library » Preferences » Macromedia » Flash Player » macromedia.com » support » flashplayer » sys http://www.wired.com/2009/08/you-deleted-your-cookies-think-again/
  14. 14. @lewwwinSEMcamp
  15. 15. @lewwwinSEMcamp Prawie Ciasteczkologia #3 EverCookie Jak się go pozbyd? Jakby to ująd? :) http://samy.pl/evercookie/
  16. 16. @lewwwinSEMcamp EverCookie w praktyce http://samy.pl/evercookie/
  17. 17. @lewwwinSEMcamp Coś więcej niż Ciasteczkologia #4 FingerPrint Jak się go pozbyd? Zmieo przeglądarkę https://github.com/carlo/jquery-browser-fingerprint
  18. 18. @lewwwinSEMcamp Ile % z UU to ludzie? 3304 / 4100 * 100% = 80% Czyści ciacha? 
  19. 19. @lewwwinSEMcamp Fingerprint, a UU 1745/1808 *100% = 96% https://github.com/carlo/jquery-browser-fingerprint
  20. 20. @lewwwinSEMcamp SEMcamp Ograniczenia w Web Analytics
  21. 21. @lewwwinSEMcamp Użytkownik jest najważniejszy (not provided)
  22. 22. @lewwwinSEMcamp #takabranża
  23. 23. @lewwwinSEMcamp Modyfikacja klasycznego GATC <script type="text/javascript"> var _gaq = _gaq || []; _gaq.push(['_setAccount', 'UA-123456789-1']); _gaq.push(['_trackPageview']); (function() { var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true; ga.src = ('https:' == document.location.protocol ? 'https://' : 'http://') + 'stats.g.doubleclick.net/dc.js'; var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s); })(); </script>
  24. 24. @lewwwinSEMcamp Co muszę zrobić?
  25. 25. @lewwwinSEMcamp Progi w GA
  26. 26. @lewwwinSEMcamp Czego NIE mogę przechowywać w GA? • Danych osobowych • Adresów e-mail • Numerów telefonów • Adresów IP oraz wszelkich pozostałych danych wrażliwych: • Dokładna data urodzin • Preferencje seksualne • Upodobania polityczne • Itp.. http://www.google.com/analytics/terms/us.html
  27. 27. @lewwwinSEMcamp Konsekwencje http://www.google.com/analytics/terms/us.html
  28. 28. @lewwwinSEMcamp Przykład 1: celowe działanie
  29. 29. @lewwwinSEMcamp Przykład 2: „przypadkowe” działanie site:konkurent.pl inurl:”utm_content * gmail.com” http://www.google.pl/#q=inurl:pl+inurl:utm_content+*+g mail&pws=0&num=100&filter=0& as_qdr=all www.twojadomena.pl https://support.google.com/adwords/answer/8206?contact=1&rd=1# lub
  30. 30. @lewwwinSEMcamp Zabezpieczenie ;) Wyklucz parametry: email, mail utm_source, utm_medium, utm_campaign, utm_content, utm_keyword lub User-agent: * Disallow: /*utm_medium=email Disallow: /*gmail.com Noarchive: /*utm_medium=email Noarchive: /*gmail.com
  31. 31. @lewwwinSEMcamp SEMcamp 3:> Dane, dane, dane…
  32. 32. @lewwwinSEMcamp Współczynnik konwersji Cele/Transakcje Sesje 100%. Mogę popsud :) Mogę popsud :)
  33. 33. @lewwwinSEMcamp Przypadek 1: zaprzyjaźnieni porywacze :) 30% ruchu nie należy do mnie
  34. 34. @lewwwinSEMcamp Zabezpieczenie :)
  35. 35. @lewwwinSEMcamp Przykładowy podział konta GA
  36. 36. @lewwwinSEMcamp Przypadek: 2 - Skynet http://www.incapsula.com/blog/bot-traffic-report-2013.html
  37. 37. @lewwwinSEMcamp Co nagle to po diable
  38. 38. @lewwwinSEMcamp Co nagle to po diable
  39. 39. @lewwwinSEMcamp Przypadek 2: roboty sieciowe atakują
  40. 40. @lewwwinSEMcamp Rozwiązanie: wyklucz ^(inktomi corporation|iac search.*|yahoo! inc.|facebook inc.|stumbleupon inc.|dub6 ec2|site confidence.* |apache ltd.|nielsen netratings|affinity internet inc|dub6 ec2|Amazon (A9|Web|Data|Tech).*|microsoft corp)$
  41. 41. @lewwwinSEMcamp Uwaga na bezgłowe roboty! • Zombie.js • Phantom.js • HtmlUnit http://moz.com/blog/just-how-smart-are-search-robots
  42. 42. @lewwwinSEMcamp Pułapka na robota 1. Utwórz katalog i zablokuj ruch do niego w robots.txt dla wszystkich agentów. 2. Na swojej stronie daj link np. z obrazka 1x1px do zablokowanego katalogu. 3. Tylko złe roboty dostaną się do tego katalogu. 4. Te roboty możesz teraz przekierować na skrypt, który wyciągnie z nich adresy IP, User Agent itp. 5. Powyższe dane dodaj do pliku .htaccess, aby je banować :)
  43. 43. @lewwwinSEMcamp Ukrywanie się przed innymi .htaccess Options +FollowSymLinks RewriteEngine on <Files .htaccess> order allow,deny deny from all </Files> <Limit GET HEAD POST> order allow,deny deny from 74.53.36.242 deny from 65.39.72.142 deny from keywordspy.com deny from keywordspypro.com allow from all </LIMIT> RewriteCond %{HTTP_REFERER} keywordspy.com [NC,OR] RewriteCond %{HTTP_REFERER} keywordspypro.com RewriteRule .* - [F]
  44. 44. @lewwwinSEMcamp Nie przesadź, bo…
  45. 45. @lewwwinSEMcamp HARD CORE Tylo dla e-commerce
  46. 46. @lewwwinSEMcamp Przypadek 3: psucie danych javascript:_gaq.push(['_setAccount','UA-xxxxxx-1'],[' _addTrans','8148350','affiliation','-9223372036854775807','- 9223372036854775807','0.00','-','-','-'],['_addItem','SKU 00001','8148350','BIG refund','-','- 9223372036854775807','1'],['_trackTrans']);http://www.google- analytics.com/__utm.gif?utmwv=5.4.6&utms=44&utmn=393079074&utmhn= twojadomena.pl&utmt=tran&utmtid=8148350&utmtst= affiliation&utmtto=-9223372036854775807&utmttx=- 9223372036854775807&utmtsp=0.00&utmtci=-&utmtrg=-&utmtco=-&utmcs= UTF-8&utmsr=1366x768&utmvp=1366x550&utmsc=24- bit&utmul=en- us&utmje=1&utmfl=11.9r900&utmdt=TITLE&utmhid=509485053&utmr=- &utmp=/&utmht=1385061484294&utmac=UA-XXXXX-1&utmc c=__utma=251194116.2116214072.1385060410.1385060410.1385060410.1; __utmz=251194116.1385060410.1.1.utmcsr=(direct)|utmccn=(direct)|u tmcmd=(none)
  47. 47. @lewwwinSEMcamp Mieszanie w danych
  48. 48. @lewwwinSEMcamp Czy temat BHA został wyczerpany? • Hackowanie WiFi • DDoS Analytics • Zrzut 3rd cookies przez banery/iFrame • Infekowanie ga.js • Wyciąganie danych z autouzupełniania przeglądarki
  49. 49. @lewwwinSEMcamp SEMcamp Na wynos
  50. 50. @lewwwinSEMcamp Przejrzyj swoje widoki danych • Uwzględnij tylko swój Hostname (^|.)twojadomena.pl$ • Wyklucz boty, roboty, crawlery, itp. • Przejrzyj raport najlepszych treści (email|mail|kod|tel) lub [?&](.+)=(.*)gmail.com • Monitoruj w dane zbierane w zdarzeniach, zmiennych niestandardowych, własnych wymiarach • Przejrzyj czysty profil • Zaplanuj przegląd serwisu raz w miesiącu
  51. 51. @lewwwinSEMcamp
  52. 52. @lewwwinSEMcamp
  53. 53. @lewwwinSEMcamp SEMcamp Dzięki, że dotrwaliście do końca Twitter G+ Web @lewwin +MaciejLewinski www.akademiaanalytics.pl Slajdy @ SlideShare.net

×