Ce diaporama a bien été signalé.
Le téléchargement de votre SlideShare est en cours. ×

Shall we dance

Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Publicité
Prochain SlideShare
Zaverecny ukol
Zaverecny ukol
Chargement dans…3
×

Consultez-les par la suite

1 sur 58 Publicité

Plus De Contenu Connexe

Plus par Josef Šlerka (20)

Plus récents (20)

Publicité

Shall we dance

  1. 1. Science is tango between data and theory. James Kobielus, IBM's big data evangelist
  2. 2. Shall we dance Josef Šlerka, New Media Inspiration 2013 Studia nových médií, Ataxo Interactive a.s.
  3. 3. Všechno co potřebuji vědět o datech... ... mne naučili filosofie
  4. 4. Myšlenky bez obsahu jsou prázdné, názory bez pojmů jsou slepé. Immanuel Kant, německý osvícenecký filosof
  5. 5. Obrazotvornost!
  6. 6. Žádný algoritmus z nebe nespadl... staré programátorské přísloví
  7. 7. Sémiotická průprava Typologie znaků a otázka sémiosis S čím si obrazotvornost hraje
  8. 8. A sign, or representamen, is something which stands to somebody for something in some respect or capacity. Charles Sanders Peirce, semiotik
  9. 9. Typologie znaků znak (sign), jeho Objekt a jeho interpretant sémiosis je činnost, která spojuje Z-O-I sémiosis je potencionálně nekonečná komplexní systém znaků nejznámější ikon, index, symbol
  10. 10. Ikon a index Ikon je znak, který se vztahuje k Objektu a denotuje ho jen díky svým vlastním rysům, které má bez ohledu na to, zda nějaký Objekt skutečně existuje anebo ne. Index je znak, který se vztahuje na Objekt a denotuje ho tím, že je jím skutečně ovlivněný. Příkladem indexu je klepání na dveře. Ikony ani indexy však nic netvrdí, nýbrž ukazují.
  11. 11. Symbol Symbol je znak, který se vztahuje k Objektu a denotuje ho díky zákonu, většinou asociaci všeobecné ideje a tento zákon způsobuje interpretaci. Jinými slovy znak tu nemá vztah ani podobnosti a ani faktické souvislosti, ale jaké si značky pravidla, které nám umožňuje spojení mezi jinak nespojitými věcmi.
  12. 12. Data jsou symbolická (konvenční) vyjádření indexů reality, už obsahují určitý pohled. Ale nic neříkají.
  13. 13. Nejsou data jako data.
  14. 14. Poslední filosofická lekce....
  15. 15. There are only two hard things in Computer Science: cache invalidation and naming things Phil Karlton, computer programmer
  16. 16. ... programátoři jsou vlastně filosofové
  17. 17. Facebook normalized distance ... ... příběh jedné hypotézy a problémy, které jí provázejí a provazely
  18. 18. Google distance počítá se sémantická vzdálenost autory jsou Rudi Cilibrasi a Paul M. B. Vitanyi podobné věci sdílí stejné vlastnosti tudíž se o nich mluví častěji dohromady dvě reprezentace jsou si tím podobnější, čím méně složitých změn je třeba k převodu jedné v druhou
  19. 19. NGD je vyjádřená vzorcem: m = log10(počet všech indexovaných stránek); fx = log10(počet výsledků pro slovo X); fy = log10(počet výsledků pro slovo Y); fxy = log10(počet výsledků pro slovo X a Y); GND = ((max(fx,fy) - fxy) / (m - min(fx,fy))
  20. 20. http://www.mechanicalcinderella.com/
  21. 21. FND Facebook normalized distance vychází z Google normalized distance Lidé komentují na stránkách kandidátů, vůči kterým se především pozitivně, ale i negativně vymezují. Pohybují se v určitých myšlenkovinách rovinách či diskursech
  22. 22. FND je vyjádřená vzorcem: m = log10(počet všech českých účtů); fx = log10(počet komentujících na stránce X); fy = log10(počet komentujících na stránce Y); fxy = log10(počet společných komentujících); FND = ((max(fx,fy) - fxy) / (m - min(fx,fy))
  23. 23. Aplikace buď objevování příbuzných stránek a témat či k mapování vztahů mezi stránkami
  24. 24. Vyhledávání Najdi mi stránky, které mají blízko k mojí
  25. 25. Vztahování Kde se nachází moje stránka mezi ostatními
  26. 26. Mediální mapa FB Jaké typy stránek máme mezi FB stránkami serveru
  27. 27. Velká mapa stránek Neziskovky, strany, média....
  28. 28. Případová studie Prezidentské volby 2013
  29. 29. Mapa prezidentských kandidátů 14. 1. 2013
  30. 30. Mapa prezidentských kandidátů 14. 1. 2013
  31. 31. Validace? zatím nepřímé analýza chování fanoušků při přesunu mezi voliči stran a kandidátů (bude o ní mluvit Kamil Gregor) analýza zájmů fanoušků (bude mluvit o ní Jan Schmid) validace smysluplností
  32. 32. Hlavní úskalí velikosti korpus a průniku (vzorec funguje “vždy”) validace úplnost korpusu při objevování relativní drahost
  33. 33. A ještě jedna ... Jak je to s fanoušky prezidentů teď...
  34. 34. Mapa prezidentských kandidátů 18. 1. 2013
  35. 35. Věda je tango mezi teorií a daty. To tango, které hraje je ale lidská představivost. Bez ní je věda nemožná.
  36. 36. Děkuji za pozornost! Otázky? Odpovědi?

×