2. Miért?
A rendszerváltás hozta el a szabad
véleménynyilvánítás jogát
Mancs, INteRNeTTo, Index nyelvileg is újított
Webkettes technológiák megjelenése ráerősített a
véleményújságírásra
Webkettes tartalmak integrálása a „hagyományos”
felületekbe általános trend (pl. Index2, 444 blogok)
Milyen a viszonya a két szférának?
3. Miért fontos?
Filter bubble
Politikai párbeszéd
Közélet
Fuzzy borders: az
online és offline
világ határai
elmosódnak
4. Hipotézisek
A magyar politikai blogok
széttagoltak, egymással nem
igazán foglalkoznak
A politikai blogok nem
tematizálják a diskurzust, csak
követik a híroldalakat
5. Technikai háttér 1.
Seed lista: 80 magyar
politikai blog
Python crawler
Segaran: Programming
Collvetive Intelligence
nyomán
Tartalmi linkelemzés,
nem klasszikus crawling
6. Technikai háttér 2. – felhasznált
eszközök
Python szkriptek az adatbázis
átalakításához
Python igraph a gráfok generálásához
Python NLTK, langid a nyelvi elemzéshez
R igraph a gráfelemzéshez
Gephi vizualizáció
MALLET topic modeling
18. Pay-level gráf – fontosabb
szereplők
tenytar.hu (369)
youtube (1048)
Wikipedia (533)
Atlatszo (876)
Index (788)
HVG (838)
19. Magyar embernek magyar gráfot!
Webkettes tartalmak (Wikipedia, wikik, stb.)
torzítanak
Video oldalak (YouTube, Vimeo stb)
Külföldi oldalak központi szerepe (Guardian, NY
Times, Le Monde)
Nagyon gyorsan kikerülünk a körből (linktemetőbe
vagy teljesen más témára vetődünk)
Külön kell vizsgálnunk a magyar nyelvű tartalmakat!!
20. A gráf szűrése
Közösségi média (Twitter, Facebook, G+)
kiszűrése
Nem szöveges tartalmak szűrése
Nyelvfelismerés langid segítségével
Csak validálható dátum esetén kerülhet a
korpuszba oldal (url, vagy a tartalom
alapján)
21. Egyszerűsített gráf 1.
2435 csomópont
3328 él
Utak átlagos hossza: 4.24
Átmérő 10
63% híroldal – 37% blog és egyéb
tartalom
22. Egyszerűsített gráf 2.
Központban a híroldalak,
és a hozzájuk kapcsolódó
blogok
TASZ, Átlátszó, K-Monitor,
Mandiner a
középpontban
A periférián szinte csak
saját oldalaikat linkelő
blogok találhatóak
23. Egyszerűsített pay-level gráf 1.
270 csomópont
828 él
Utak átlagos hossza 2.67
Átmérő 5
127 blog (nem feltétlenül politikai!)
Átlagosan 2.94 oldal / csomópont
32. Hogyan terjednek?
Az óriás összefüggő
komponens
irányítja az
érzelmeket
A negatív érzelmek
kifelé erősödnek
A pozitív érzelmek
szintje megmarad