Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus
1. Verkostoanalyysi 2011, TTY – 11.3.2011 1
Verkostoanalyysin peruskäsitteitä ja visualisointia
Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
Thumas Miilumäki
thumas.miilumaki@tut.fi
Tampereen teknillinen yliopisto
Hypermedialaboratorio
Matematiikan laitos
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
2. Sisältö 2
• SNA-graafit ja niiden ominaisuudet
• SNA-matriisit ja niiden ominaisuudet
• Suuntaamattomien verkostojen keskeisyyden tunnusluvut
• Suunnattujen verkostojen toimijoiden arvostuksen tunnusluvut
• Taustalla pääosin Wassermanin ja Faustin Social Network
Analysis: Methods and Applications (1994) teokessa esitetyt
SNA-teoriat
• Laajennuksia Ruohosen Graafiteoria (2006)
opetusmonisteesta sekä Knoken ja Yangin (2008) ja Scottin
(2000) teoksista
• Termistön suomennokset pohjautuvat Ruohosen (2006),
Johanssonin et al. (1995) ja Miilumäki (2010) teoksissa
käytettyihin suomennoksiin
• Esitysaineisto noudattaa sisällöltään pitkälti aiempia
seminaariesityksiä (Miilumäki, 2008; 2009a ; 2009b)
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
3. 3
SNA-graafit
Taustat
Määritelmät
Ominaisuudet
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
4. Taustaa 4
• Tapoja sosiaalisten verkostojen mallintamiseen on useita
• Käytettävät menetelmät riippuvat mallinnuksen kohteesta,
näkökulmasta ja tavoitteesta
• Esimerkiksi monet tilastolliset mallinnusmenetelmät ovat
sovellettavissa sosiaalisten verkostojen mallinnuksessa, mikäli
verkostodata on valittuun tarkoitukseen relevanttia
• Edelleen monet diagrammit ja kaaviot ovat sovellettavissa
sosiaalisen verkoston datan käsittelyyn
• Graafeilla pyritään luomaan mahdollisimman todenmukainen
visualisointi, ikään kuin valokuva, tarkasteltavasta verkostosta,
jossa toimijat ja niiden väliset yhteydet on esitetty selkeästi
• Graafin ja todellisuuden yhteensovittaminen on haasteellista,
sillä graafi luodaan usein diskreetistä ja rajallisesta määrästä
verkostodataa
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
5. Perusteluja graafien käytölle 5
• SNA:ssa (Social Network Analysis) graafien käytölle on useita
perusteita
• Graafiteoreettinen sanasto soveltuu sosiaalisten rakenteiden kuvaamiseen
ja merkitsemiseen
• Useimmat sosiaalisten rakenteiden ja ominaisuuksien kvantitatiiviset
tunnusluvut ovat laskettavissa graafiteoreorian sisältämien matemaattisten
menetelmien avulla
• Graafiteoreettinen notaatio ja sanasto sekä sen sisältämä matematiikka
tarjoavat mahdollisuuden erilaisten graafeja koskevien teoreemien
todistamiseen, ja siten myös sosiaalisia rakenteita koskevat väitteet ovat
todistettavissa (Wasserman & Faust 1994, 93.)
• Graafiteoria tarjoaa mahdollisuuden sosiaalisen verkoston
mallintamiseen
• Graafi on esitys tarkasteltavasta verkosta
• Reaalimaailman toimijat esitetään graafissa solmuina / (kärki)pisteinä (a
node, nodes / a vertex, vertices) ja niiden väliset yhteydet solmuja
yhdistävinä kaarina (an edge, edges) tai nuolina (an arc, arcs)
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
6. Historiaa graafeista ja niiden käytöstä SNA:ssa 6
• Jacob Levy Moreno esitteli jo 1930-luvulla sosiogrammin
(sociogram), joka on edelleen pohjana graafiteoreettisessa
SNA:ssa ja verkostojen visualisoinnissa (Moreno, 1953)
• Graafiteoria on ollut voimakkaasti käytössä
• Antropologiassa
• Kommunikaatiotutkimuksissa
• Elinkeino- ja liiketaloustutkimuksissa
• Organisaatiotutkimuksissa
• Maantieteissä (Wasserman & Faust 1994, 94.)
• Piiriteoriassa ja -analyysissa
• Kaikissa em. tieteen- ja tutkimuksenaloilla on aina jollain tapaa
ja jollain asteella mukana ihmisten muodostama sosiaalinen
verkosto, jota graafiteoreettisin menetelmin on hyvä lähestyä ja
analysoida
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
7. Graafit 7
• Seuraavassa esitellään suuntaamaton (undirected) ja
kaksiarvoinen (dichotomous) graafi verkoston mallina
• Suuntaamattomassa graafissa verkoston toimijoiden väliset
yhteydet ovat aina kaksisuuntaisia
• Kaksiarvoisessa graafissa
yhteyksien voimakkuutta ei
oteta huomioon vaan
ainoastaan yhteyden
olemassaoloon otetaan
kantaa, ts. yhteys joko on
olemassa tai ei ole
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
8. Suuntaamaton graafi 8
• Suuntaamaton graafi G koostuu kahdesta joukosta:
• Toimijoita kuvaava solmujen joukko N = {n1,n2,…,ng} (a set of nodes)
• Yhteyksiä kuvaava kaarien (viivojen) joukko L = {l1,l2,…,lL} (a set of lines)
• Graafissa G (N , L ) on siis yhteensä g solmua ja solmuja yhdistäviä
kaaria yhteensä L kappaletta
• Suuntaamattomassa graafissa jokainen kaari on kahden erillisen
solmun ni ja nj ei-järjestetty pari, ts. kaari
lk = (ni,nj) = (nj,ni)
• Kaarta, jonka alku- ja päätepisteenä on yksi ja sama solmu ni,
sanotaan silmukaksi (a loop) tai sisä-/refleksiivisidokseksi (a reflexive
tie)
• Silmukoita ei useinkaan käytetä sosiogrammeissa
• Sosiogrammit yksinkertaisia (simple) graafeja
• Arvotetuilla/painotetuilla (valued, weighted) graafeilla silmukoita voidaan
hyödyntää kuvaamaan itseisiä toimintoja ja niiden määriä
• Voidaan merkitä graafiin kaaren sijasta solmun kokoa muuttaen
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
9. Perusmääritelmiä 9
• Kaksi solmua ni ja nj ovat vierekkäiset (adjacent), jos kaari
lk=(ni,nj) on joukossa L ts.
lk = (ni,nj) ∈ L
• Solmu ni on liittynyt (incident) kaareen lk, jos se on toinen
solmuista, jotka muodostavat kaaren lk määrittelevän
järjestämättömän parin lk=(ni,nj)
• Graafia, jossa on vain yksi solmu, sanotaan triviaaliksi (trivial)
• Tyhjässä (empty) graafissa ei ole yhtään kaarta solmujen
välissä, ts.
G (N , L ): N = {n1,n2,…,ng}, L = Ø
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
10. Solmun aste 10
• Suuntaamattomassa graafissa solmun aste (degree) d(ni)
kertoo solmuun ni liittyneiden kaarien lukumäärän
• Kun graafissa G on g solmua, kullakin solmulla on aste, joka
voi olla
• Minimissään 0, jolloin solmuun ni ei ole liittynyt yhtään kaarta
• Maksimissaan g-1, jolloin kaikki muut graafin solmut ovat liittyneet
suoraan erillisillä kaarilla solmuun ni
• Graafin G , jossa on g solmua ja L kaarta, solmujen asteiden
keskiaste (mean degree) määritellään
∑ ig=1 d (ni ) 2 L
d = =
g g
• Edelleen astelukujen varianssi (variance of degrees)
∑ ig=1 (d (ni ) − d ) 2
S =
2
D
g
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
11. Graafin tiheys 11
• Graafin G (N , L ) tiheys (density) on graafin kaarien osuus
graafin kaikista mahdollisista kaarista
• Yksinkertaisessa (ei silmukoita, eikä rinnakkaisia (parallel)
kaaria) graafissa, jossa on g solmua, on kaaria maksimissaan
⎛ g ⎞ g (g − 1)
⎜ ⎟=
⎜2⎟
⎝ ⎠ 2
• Jos graafissa G (N , L ) on L kaarta, saadaan graafin tiheydelle
∆ määritelmä
L 2L
Δ= =
g ( g − 1) / 2 g ( g − 1)
• Tiheys voi olla
• Minimissään 0, jos graafissa ei ole lainkaan kaaria (L = 0)
• Maksimissaan 1, jos graafi on täydellinen (complete) eli graafin
kaikki mahdolliset kaaret ovat edustettuina (L = g(g-1)/2)
• Täydellistä graafia, jossa on g solmua, merkitään Kg
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
12. Graafin tiheys 12
• Suuntaamattomassa g solmun graafissa kaikkien solmujen
asteiden summa on 2L, mikä antaa keskiasteeksi 2L/g
• Täten tiheys voidaan kirjoittaa muodossa
2L d
Δ= =
g ( g − 1) ( g − 1)
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
13. Suunnattu graafi eli digraafi 13
• Jos verkoston yhteydet tulkitaan
suunnatuiksi, on nuoli (an arc) lk kahden
solmun ni ja nj järjestetty pari se., lk =
<ni,nj> ≠ <nj,ni> (Wasserman & Faust,
1994.)
• Mikäli yhteys tomijaparin välillä
vaikuttaa molempiin suuntiin, on
digraafissa tällöin rinnakkaiset
vastakkaissuuntaiset nuolet solmuparin
välillä
• Digraafilla on käytännössä samat
perusominaisuudet kuin graafilla
• Muistettava on kuitenkin, että
digraafissa nuolia voi olla kaksi
kertaa enemmän verrattuna
vastaavan toimijajoukon graafin
kaarien lukumäärään
– Yhteyden tulkinnassa on ero
• Yksityiskohtaisemmat määritelmät
esim. digraafin tiheydelle on esitetty
teoksessa Miilumäki (2010)
Thumas Miilumäki – Keskeisyys ja arvostus, matriisit ja graafit
11.3.2011
14. Kulku, reitti ja polku 14
• Kulku (a walk, walks) on graafin G (N , L ) solmujen ja kaarien
äärellinen jakso
W = ni0, lj0, ni1, lj1, … , ljk, nik
• Kulku alkaa aina solmusta ja päättyy solmuun
• Mikäli kulun alkusolmu ni0 ja loppusolmu nik ovat yksi ja sama solmu n,
on kulku suljettu (closed)
• Kulku voi sisältää saman kaaren ja solmun useammin kuin kerran
jaksossa
• Kulun pituus (length) on kulun sisältämien kaarien lukumäärä
• Jos jokin kaari on kulussa useampaan kertaan lasketaan ne erillisinä
kaarina kulun pituuteen
• Kulun vastakulku W -1 on itse kulku käänteisessä järjestyksessä
• Reitti (a trail, trails) on kulku, jossa kukin kaari esiintyy vain kerran
• Polku (a path, paths) on kulku, jossa kukin solmu ja kaari esiintyy vain
kerran
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
15. Geodeesi, etäisyys, halkaisija ja eksentrisyys 15
• Geodeesi (a geodesic, geodesics) on lyhin polku graafin kahden
solmun välillä
• Geodeettinen etäisyys (geodesic distance), yksinkertaisemmin
etäisyys (distance), kahden solmun välillä määritellään solmujen
geodeesin pituutena
• Etäisyyttä solmujen ni ja nj välillä merkitään d(i,j)
• Solmujen ni ja nj välinen etäisyys on minkä tahansa geodeesin pituus ko.
solmujen välillä
• Mikäli solmuparin välillä ei ole polkua, on ko. solmujen välinen etäisyys
ääretön (tai määrittämätön)
• Suuntaamattomilla graafeilla d(i,j) = d(j,i)
• Graafin halkaisija (diameter) on yhtä suuri kuin graafin minkä tahansa
solmuparin suurin geodeettinen etäisyys
• Solmun ni eksentrisyys (eccentricity) eli epäkeskisyys (myös ns.
suhdeluku (association number)) on suurin geodeettinen etäisyys
solmun ni ja minkä tahansa graafin muun solmun nj kanssa
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
16. 16
SNA-matriisit
Määritelmät
Ominaisuudet
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
17. Sosiomatriisi 17
• Verkoston toimijat ja eri toimijaparien väliset suunnatut /
suuntaamattomat yhteydet voidaan esittää yhtenä matriisina
• Jos verkosto koostuu g toimijasta, joiden välillä joko on yhteys
tai yhteys puuttuu, voidaan toimijoiden väliset yhteydet kuvata
taulukkona, jossa kullekin toimijalle on merkitty oma vaakarivi
ja vastaava pystysarake
• Taulukkoon merkitään binääriluvuilla 0 ja 1 toimijoiden välisen
yhteyden olemassa olo se., alkio saa arvon 0, jos yhteyttä ei
ole, ja arvon 1, jos toimijoiden välillä on yhteys
• Koska silmukoita ei sallita verkostossa, n n n n4
1 2 3
taulukon lävistäjän alkiot jätetään n - 1 0 1 1
n 1 - 1 0
määrittelemättä n 0 1 -
2
1
3
n4 0 1 0 -
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
18. Sosiomatriisi 18
• Taulukko on g x g vieruspistematriisi (an adjacency matrix) X,
joka alkiot xij määritellään
⎧0, lk = (ni , n j ) ei ole olemassa
xij = ⎨
⎩ 1, lk = (ni , n j ) on olemassa
• Tätä vieruspistematriisia nimitetään SNA:ssa sosiomatriisiksi
(a sociomatrix, sociomatrices)
• Edellä esitetystä taulukosta saadaan siis sosiomatriisi X
n1 n
2 n
3 4n ⎡− 1 0 1 ⎤
n
1 - 1 0 1 ⎢1 − 1 0 ⎥
n
2 1 - 1 0 X =⎢ ⎥
n 0 1 - 1 ⎢0 1 − 1 ⎥
⎢ ⎥
3
n
4 0 1 0 -
⎣ 0 1 0 −⎦
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
19. Sosiomatriisin ominaisuuksia 19
• Sosiomatriisi on yleisesti asymmetrinen (asymmetric)
suuntaamattomille graafeille, mutta aina symmetrinen
(symmetric) suuntaamattomille graafeille
• Täydellisen Kg -graafin sosiomatriisin jokainen
diagonaalialkiosta poikkeava alkio on arvoltaan 1
• Vastaavasti tyhjää graafia vastaa sosiomatriisi, jossa jokainen
(diagonaalialkiosta poikkeava) alkio on arvoltaan 0
• Arvotetuille graafeille sosiomatriisin alkiot ovat reaalilukuja,
jotka vastaavat toimijoiden välisten yhteyksien arvoja vk
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
20. Insidenssimatriisi 20
• Insidenssimatriisissa (an incidence matrix) on esitetty tieto
siitä, mitkä graafin (verkoston) solmut ovat johtuvia (incident)
minkin graafin (verkoston) kaaren suhteen
• Insidenssimatriisissa kutakin solmua vastaa yksi matriisin rivi ja
kutakin kaarta yksi sarake
• Jos siis verkostossa on g solmua ja L kaarta, on
insidenssimatriisi I g x L matriisi
• Insidenssimatriisin alkiot Iij ovat binäärisiä se., jos solmu ni on
liittynyt kaareen lj, on Iij = 1, ja mikäli taas solmu ni ei ole
liittynyt kaareen lj, on Iij = 0
• Insidenssimatriisin jokaisessa sarakkeessa on täsmälleen
kaksi ykköstä niillä riveillä, jotka edustavat kyseisen kaaren
päätepisteitä
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
22. Kulku 22
• Sosiomatriisin X alkiot xij kertovat, onko solmujen ni ja nj
välillä kulku ninj
• Sosiomatriisin X neliön X2 alkio xij määritellään
xij2 ] = ∑k =1 xik xkj
[ g
• Tämän summan yksi termi xikxkj = 1 vain, jos molemmat
yhteydet (ni,nk) ja (nk,nj) ovat olemassa
Summa laskee siis kulkujen, joiden pituus on kaksi, lukumäärän
solmusta ni solmuun nj
• Sosiomatriisin X neliön X2 alkiot xij2 ] ilmoittavat verkostossa
[
olevien kulkujen, joiden pituus on kaksi, lukumäärän solmusta
ni solmuun nj
• Edelleen matriisin Xp alkiot ilmoittavat solmujen välisien
kulkujen, joiden pituus on p, lukumäärän
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
23. Saavutettavuus 23
• Saavutettavuudella (reachability) tarkoitetaan sitä, että onko
joidenkin verkoston kahden solmun välillä kulku
• Saavutettavuusmatriisissa (a reachability matrix) X [R ] alkio xijR ]
[
on yksi, jos solmujen ni ja nj välillä on kulku, nolla muulloin
• Verkostossa kulku voi olla pituudeltaan korkeintaan g-1
• Sosiomatriisin X potenssit X2, X3, …, Xg-1 ilmoittavat
solmujen välisten erimittaisten kulkujen lukumäärät
[Σ ]
• Näiden summamatriisi X
X [Σ ] = ∑i=1 X i = X + X 2 + X 3 + ... + X g −1
g −1
ilmoittaa kaikkien erimittaisten kulkujen lukumäärät
solmuparien välillä
[Σ ]
• Tästä summamatriisista X saadaan saavutettavuusmatriisi
X [R ] , kun matriisin X [Σ ] nollasta poikkeavat alkiot merkitään
ykkösiksi
• Saavutettavuusmatriisi on määritettävissä myös Warshallin
algoritmilla laskentatehokkaammin suurille verkostoille
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
24. Geodeesi ja etäisyys 24
• Geodeesit eli solmujen lyhimmät etäisyydet esitetään usein
etäisyysmatriisin (a distance matrix) avulla
• Etäisyysmatriisin alkiot d(i,j) ilmoittavat solmujen ni ja nj
välisen lyhimmän etäisyyden pituuden
• Lyhimmät etäisyydet löytyvät tarkastelemalla sosiomatriisia X
ja sen potenssimatriiseja X2, X3, …, Xg-1 se.,
d (i, j ) = min p xijp ] > 0
[
• Verkoston halkaisija on yhtä suuri kuin suurin verkostosta
löytyvä geodeettinen etäisyys, eli ts. halkaisijan arvo on yhtä
suuri kuin etäisyysmatriisin alkioiden maksimi (max [d(i,j)])
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
25. Solmujen asteluvut 25
• Suuntaamattomille verkostoille solmujen asteluvut ovat helposti
laskettavissa sosiomatriisin X tai insidenssimatriisin I avulla
• Insidenssimatriisissa rivillä on merkitty 1:llä, jos kaari on liittynyt
solmuun ja 0:lla, jos kaari ei ole liittynyt solmuun
• Nyt siis solmun ni asteluku d(ni) saadaan insidenssimatriisin
rivisummana, eli
L
d (ni ) = ∑ I ij
j =1
• Sosiomatriisissa rivillä on merkitty 1:llä, jos saraketta vastaava
solmu on liittynyt kaarella riviä vastaavaan solmuun
• Nyt siis solmun ni asteluku d(ni) saadaan sosiomatriisin
rivisummana tai sarakesummana, koska matriisi on
symmetrinen, eli ts.
g g
d (ni ) = ∑ xij =∑ xij = xi + = x+ j
j =1 i =1
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
26. Solmujen vienti- ja tuontiluvut 26
• Suunnatuille verkostoille solmujen vienti- ja tuontiluvut
(outdegree, indegree) ovat helposti laskettavissa sosiomatriisin
X avulla
• Sosiomatriisissa rivillä on merkitty 1:llä, jos riviä vastaavasta
solmusta lähtee nuoli saraketta vastaavaan solmuun
• Nyt siis solmun ni vientiluku dO(ni) saadaan sosiomatriisin
rivisummana, eli
g
d O (ni ) = ∑ xij = xi+
j =1
• Sosiomatriisissa sarakkeessa on merkitty 1:llä, jos saraketta
vastaavaan solmuun tulee nuoli riviä vastaavasta solmusta
• Nyt siis solmun ni tuontiluku dI(ni) saadaan sosiomatriisin
sarakesummana, eli
g
d I (ni ) = ∑ x ji = x+i
j =1
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
27. Tiheys 27
• Verkoston tiheys määriteltiin verkostossa olemassa olevien
solmujen välisten yhteyksien summan ja verkoston kaikkien
mahdollisten solmujen välisten yhteyksien summan välisenä
suhteena
• Verkostossa, jossa on g toimijaa, voi olla enintään g(g-1)
toimijaparien välistä suoraa yhteyttä
• Verkoston sosiomatriisissa on merkitty 1:llä, mikäli toimijaparin
välillä vallitsee yhteys ja 0:lla, jos toimiparin väliltä puuttuu
yhteys
• Nyt siis olemassa olevien yhteyksien summa saadaan
yksinkertaisesti sosiomatriisin kaikkien alkioiden summana, eli
tiheys ∆ määritellään
Σ ig=1Σ g=1 xij
Δ= j
g ( g − 1)
• Tämä tiheyden määritelmä pätee myös arvotetuille verkostoille
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
28. 28
SNA-tunnusluvut
Keskeisyys
Arvostus
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
29. Yleisesti keskeisyydestä ja arvostuksesta 29
• Suuntaamattomille verkostoille ja sen toimijoille voidaan
määrittää erilaisia keskeisyyden (centrality) tunnuslukuja
• Keskeisyys ei riipu verkoston yhteyksien suunnasta, vaan
ainoastaan tarkasteltavasta toimijasta ja siihen liittyneistä
yhteyksistä ja/tai koko verkostosta yleensä
• Suunnatuissa verkostoissa keskeisyyden tilalla käytetään
käsitettä arvostus (prestige), joka huomioi yhteyksien suunnan
• Erotetaan toisistaan käsitteet ”olla arvostettu” ja ”arvostaa”
• Arvostuksen tunnusluvuissa tarkastellaan nimenomaan yhteyksien
vastaanottamista eli arvostuksen kohteena olemista
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
30. Keskeisyys 30
• Keskeisyyden käsite määritellään suuntaamattomille verkostoille
• Keskeisyyttä voidaan kuvata seuraavilla tunnusluvuilla
• Keskeisyysaste (degree centrality)
• Läheisyys (closeness centrality)
• Välillisyys (betweenness centrality)
• Informaatiokeskeisyys (information centrality)
• Suuntaamattomissa verkostoissa keskeinen toimija on osallisena
monissa yhteyksissä
• Keskeisyyden kannalta ei ole väliä, onko toimija lähettänyt vai
vastaanottanut yhteyden
• Keskeisyys on verkoston toimijaa ni kuvaava tunnusluku, kun taas
koko verkostolle yhteisesti voidaan määrittää keskittyneisyys
(centralization), joka on verkostosta toiseen vertailtava tunnusluku
• Keskittyneisyyden avulla voidaan kuvata, missä määrin yksittäiset
toimijat hallitsevat muiden välistä kanssakäymistä yleisesti koko
verkoston tasolla
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
31. Keskeisyysaste 31
• Toimijan ni keskeisyysaste CD(ni) kertoo, kuinka monta suoraa
yhteyttä toimijalla on muihin toimijoihin (= asteluku d(ni))
• Toimijan aste ei itsessään ole kuitenkaan yleisesti vertailtava
tunnusluku
• Kun asteluku skaalataan verkoston tasolla, voidaan toimijoiden
keskeisyysasteita vertailla eri verkostojen välillä
• Normeerattu keskeisyysaste C´D(ni) määritellään
d(ni)
C´D(ni) = , missä g on verkoston toimijoiden lukumäärä
g–1
• Keskeisyysaste määritellään myös suunnatuille verkostoille,
jolloin käsitellään erikseen vientikeskeisyyttä (outdegree
centrality) ja tuontikeskeisyyttä (indegree centrality)
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
32. Läheisyys ja välillisyys 32
• Läheisyys on toimijan ni lyhyimpien polkujen (geodeesien)
summa ci kaikkiin verkoston muihin toimijoihin nj
• Itsessään summa ei ole vertailtava tunnusluku eri verkostojen
välillä
• Verkostojen kesken vertailukelpoinen normeerattu läheisyys
määritellään
g–1
C´C(ni) = , missä g on verkoston toimijoiden lukumäärä
ci
• Toimijan välillisyys puolestaan mittaa, kuinka monen
toimijaparin välisen lyhyimmän polun varrelle toimija sijoittuu
• Toimijan välillisyys on merkityksellinen tunnusluku mm.
tutkittaessa verkoston toiminnan tehokkuutta
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
33. Arvostus 33
• Kuten keskeisyyttä, niin myös arvostusta voidaan tarkastella eri
tavoin
• Verkoston toimijoille voidaan määrittää seuraavat arvostukset
• Arvostusaste (actor degree prestige)
• Arvostusläheisyys (actor proximity prestige)
• Arvoasema (actor status prestige, actor rank prestige)
• Koko verkoston tasolla voidaan määrittää verkostoa kuvaavia
arvostuksen tunnuslukuja arvioimalla kunkin arvostuksen
keskiarvoja ja variansseja
• Näistä keskiarvostusläheisyys ja arvostusläheisyyden varianssi
ovat mielekkäimpiä tarkasteltavia verkostoanalyysin kannalta
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
34. Arvostusaste 34
• Toimijan ni arvostusaste PD(ni) määritellään yksinkertaisesti
toimijaan kohdistuneiden yhteyksien summana
• Vertaa suuntaamattoman verkoston toimijan ni keskeisyysaste,
joka määritellään toimijaa kuvaavan solmun astelukuna d(ni)
• Arvostusaste määritellään formaalisti
PD(ni) = dI(ni) = Σj xij = x+i , missä dI(ni) on solmun ni tuontiluku
ja x+i on verkoston sosiomatriisin X
sarakesumma sarakkeesta i
• Jotta arvostusasteet eri verkostojen välillä olisivat verrattavissa
keskenään, määritellään normeerattu arvostusaste P´D(ni)
x+i
P´D(ni) = , missä g on verkoston toimijoiden lukumäärä
g–1
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
35. Arvostusläheisyys 35
• Toimijalle ni voidaan määrittää luku Ii, joka ilmoittaa, kuinka
moni toimija nj voi saavuttaa toimijan ni
• Tämän toimijan ni vaikutusjoukon toimijoiden lukumäärän Ii
avulla voidaan määrittää vaikutusjoukon toimijoiden
keskimääräinen etäisyys toimijasta ni
• Toimijan ni arvostusläheisyys PP(ni) määritellään
vaikutusjoukon osuuden koko verkoston toimijajoukosta
suhteena vaikutusjoukon toimijoiden keskimääräiseen
etäisyyteen toimijasta ni
• Arvostusläheisyys saa muiden normeerattujen tunnuslukujen
tavoin arvoja välillä [0,1]
• Jos toimijalla ni on suora yhteys jokaiseen verkoston muuhun
toimijaan, saa arvostusläheisyys arvon yksi
• Jos toimija ni on isolaatti (an isolate, isolates), vaikutusjoukon
toimijoiden lukumäärä Ii nolla, ja arvostusläheisyys määritellään
nollaksi
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
36. Arvoasema 36
• Edellä esitellyt arvostuksen tunnusluvut huomioivat vain toimijoita ja
niihin kohdistuvia yhteyksiä
• Toimijan ni arvoasema PR(ni) on riippuvainen häneen päin yhteydessä
olevien toimijoiden nj arvoasemista PR(nj)
• Edelleen taas toimijoiden nj arvoasemat ovat riippuvaisia näihin päin
yhteydessä olevien toimijoiden nk arvoasemista jne.
• Arvoaseman määrittelyn taustalla on ajatus siitä, että toimijan ni
arvoasema on häneen päin suoraan yhteydessä olevien toimijoiden
arvoasemien funktio
• Verkostossa, jossa on g toimijaa, toimijan ni arvoasema voidaan
esittää sosiomatriisin X toimijaa kuvaavan sarakkeen alkioiden ja niitä
vastaavien toimijoiden arvoasemien lineaarikombinaationa, ts.
PR(ni) = x1i PR(n1) + x2i PR(n2) + … + xgi PR(ng)
• Arvoaseman määrittäminen vaatii syvällisempää ymmärrystä mm.
matriisin ominaisarvoprobleeman ratkaisusta
• Myöhemmissä esityksissä perehdytään algoritmeihin, joilla verkoston toimijoiden
arvoasemat voidaan määrittää erilaisissa verkostoissa
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
37. Esimerkki – Valtioiden kauppaverkosto 37
• Seuraavassa on esitetty 24 valtion kauppaverkosto
(Wasserman & Faust 1994)
http://matriisi.ee.tut.fi/~miilumak/sna/
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
39. Huomioitavaa 39
• On selvää, että keskeisyyden ja arvostuksen tunnusluvut tuovat
verkostosta esiin seikkoja, joita ei tulisi huomanneeksi pelkästään
verkoston graafia, matriisia tai muunlaista mallia tarkastelemalla
• Keskeisyyden ja arvostuksen tunnusluvut tarjoavat monipuolista
tietoa verkoston toiminnasta ja antavat viitteitä siitä, kuinka
verkostoa tulisi kehittää, oli sitten kyse tehokkuuden lisäämisestä
tai esim. rakenteen parantamisesta
• Tunnuslukuja ei saa kuitenkaan pitää ainoina mittareina verkoston
toiminnasta
• Graafit visualisointeina tarjoavat paljon hyödyllistä tietoa verkoston
rakenteesta ja toiminnasta (aikasarjat, DNA – Dynamic Network
Analysis)
• Toimijoiden keskeisyydet ja arvostukset ovat vain osa suurempaa
kuvaa
• Muutosten jälkeen tulee tarkastella verkostoa uudelleen, tulkita
tunnusluvut uudelleen ja tarkastella oliko muutos hyvä vai huono
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
40. Lähteet 40
Johansson, J-E., Mattila, M. & Uusikylä, P. (1995). Johdatus verkostoanalyysiin. Helsinki:
Kuluttajatutkimuskeskus. http://www.valt.helsinki.fi/vol/kirja/ (Viitattu 10.3.2011)
Knoke, D. & Yang, S. 2008. Social Network Analysis. Second Edition. Los Angeles: Sage
Publications.
Miilumäki, T. (2008). Graphs in Social Network Analysis And Modeling. Graafit sosiaalisten
verkostojen mallintamisessa. Tampere: Tampereen teknillinen yliopisto, luentoesitys.
http://matriisi.ee.tut.fi/hmopetus/hmjatko-opintosemma/2008/Miilumaki_-
_Graafit_sosiaalisten_verkostojen_mallintamisessa.pdf (Viitattu 10.3.2011)
Miilumäki, T. (2009a). Matrices in Social Network Analysis And Modeling. Matriisit sosiaalisten
verkostojen mallintamisessa. Tampere: Tampereen teknillinen yliopisto, luentoesitys.
http://matriisi.ee.tut.fi/hmopetus/hmjatko-opintosemma/2008/Miilumaki_-
_Matriisit_sosiaalisten_verkostojen_mallintamisessa.pdf (Viitattu 10.3.2011)
Miilumäki, T. (2009b). Social Network Analysis – Centrality And Prestige. Sosiaalisten verkostojen
analyysi – Keskeisyys ja arvostus. Tampere: Tampereen teknillinen yliopisto, luentoesitys.
http://matriisi.ee.tut.fi/hmopetus/hmjatko-opintosemma/2008/Miilumaki_Keskeisyys-ja-
arvostus.pdf (Viitattu 10.3.2011)
Miilumäki, T. (2010). Web-pohjaisten sosiaalisten verkostojen analyysimenetelmät. Diplomityö.
Tampere: Tampereen teknillinen yliopisto.
http://dspace.cc.tut.fi/dpub/bitstream/handle/123456789/6635/miilumaki.pdf.
Moreno, J.L. (1953). Who Shall Survive? Beacon, New York: Beacon House Inc.
Ruohonen, K. (2006). Graafiteoria. Tampere: Tampereen teknillisen yliopiston opetusmoniste no. 5,
uusi sarja.
Scott, J. (2000). Social Network Analysis. A Handbook. Second Edition. London: Sage Publications.
Wasserman, S. & Faust, K. (1994). Social Network Analysis: Methods and Applications. New York:
Cambridge University Press.
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011