2. Verkkosivustojen määrä Internetissä
Maailman noin 1,2 miljardista verkkosivustosta aktiivisesti käytössä on vain 200 miljoonaa
sivustoa eli noin 17 %. Google löytää niistä noin 50 miljoonaa sivustoa.
Lähde: Nick Huss/Siteefy, 3.3.2022, https://siteefy.com/how-many-websites-are-there/ (kuvaaja: Harto Pönkä, 23.3.2022)
2
3. Suosituimmat verkkosivustot
Lähde: Visual Capitalist, 2021, https://www.visualcapitalist.com/the-50-most-visited-websites-in-the-world/
3
1. Google
2. YouTube
3. Facebook
4. Twitter
5. Wikipedia
6. Instagram
Kolme suosituinta sivustoa kerää
yhtä paljon kävijöitä kuukaudessa
kuin 47 seuraavaksi suosituinta.
5. Data
Verkkopalveluiden käytöstä syntyy dataa,
jonka perusteella voidaan koostaa mm.
TOP-listoja, tilastoja ja suosituksia.
Esimerkkejä:
1) suosituimmat sisällöt, esim. kuvat,
videot, linkit, tuotteet, aiheet, ryhmät jne.
2) suosituimmat yhdistelmät
3) eniten kommentoidut
4) seuratuimmat käyttäjät
5) aktiivisimmat käyttäjät
6) käyttäjien iät, sukupuolet, sijainnit jne.
5
Kuva: Pixabay
8. Google on
todennäköisesti räätälöinyt
hakutuloksesi,
mainoksesi ja
uutisehdotuksesi
kymmenillä eri datapisteillä.
Ikä, sukupuoli, perhetilanne, ammatti,
harrastukset, tuotteet, matkat, kiinnostuksen
kohteet, sijainti jne.
Täällä voit tarkistaa tietosi ja asetukset:
https://adssettings.google.com/
8
9. Googlen uutissuositukset
9
Lähde: Google, Discoverista löytyvien tietojen yksilöinti,
https://support.google.com/websearch/answer/2819496?co=GENIE.Platform%3DAndroid&hl=fi (21.9.2020)
Google personoi Android-puhelimen ja Chrome-
selaimen uutiset käyttäjän datan perusteella.
▪ Verkko- ja sovellustoiminta
▪ Haut ja muu toiminta Googlen palveluissa
▪ Tiedot käytetyistä sivustoista ja sovelluksista
▪ Audiotallenteet
▪ https://myactivity.google.com/
▪ Tallennetut yhteystiedot
▪ Gmail + laitteet (jos synkronoitu)
▪ Keneen olet ollut yhteydessä
▪ https://contacts.google.com/
▪ Sijaintidata
▪ Koti ja työpaikka
▪ Nykyinen sijainti ja sijaintihistoria
▪ https://maps.google.com/locationhistory/
10. Sijaintitiedot
Käyttäjien sijainti on yksi perustiedoista
sisältöjen ja mainosten kohdennuksessa.
”Jos käyt usein hiihtokeskuksissa, voit
nähdä suksimainoksen YouTube-videossa.”
Sijaintia seuraavat mm.
▪ Google/YouTube
▪ Facebook
▪ Instagram
▪ WhatsApp
▪ Twitter
▪ Snapchat
▪ Isot mediayhtiöt
10
Kuvakaappaukset: Google kartan sijaintihistoria, Snapchat: Cyber SafeTrick, 2019, http://cybersafetrick.com/snapchat-tracker/,
Secret service agent: New York Times, 20.12.2019, https://www.nytimes.com/interactive/2019/12/20/opinion/location-data-national-security.html
11. Google on netin isoin datankerääjä
Kuva: DuckDuckGo, 15.3.2021,
https://twitter.com/DuckDuckGo/status/1371509053613084679?ref_src=twsrc%5Etfw
11
12. Tykkääminen
Tykkäykset olivat ensimmäisiä sosiaalisen
median algoritmien hyödyntämiä tietoja.
Tykkäysten avulla tunnistetaan:
1) suositut sisällöt
2) mistä sinä pidät
3) mitä sinä tuotat
Vimeo 2005
FriendFeed 2007
Facebook 2008 / 2010
YouTube 2010
Twitter 2015
12
Kuva: Facebookin tykkäysikoni, Enoc vt @ Wikipedia,
https://en.wikipedia.org/wiki/Like_button#/media/File:Facebook_like_thumb.png (public domain)
13. Jokainen klikkaus ja
kommentti sosiaalisen
median uutisvirrassa on
kuin vastaus
psykologisessa testissä
– osa profilointia.
13
Kuva: Pixabay
“
14. YouTuben oppiva suosittelualgoritmi
YouTube ehdottaa seuraavaksi katsottavia
videoita käyttäjistä ja videoista kertyneen
datan perusteella.
Algoritmi käyttää apuna tekoälyä, joka
pyrkii oppimaan käytöksestäsi testaamalla
sinulle löydettyjä vaihtoehtoja.
Suosituksiin vaikuttaa mm.
1) videoiden laatutekijät (klikit ja ajat)
2) käyttäjän suosimat kanavat ja aiheet
3) käyttäjän haku- ja katseluhistoria
4) käyttäjän ikä, sukupuoli, sijainti jne.
14
Lähde: Covington, Adams, & Sargin, 2016, Deep Neural Networks for YouTube Recommendations,
https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/45530.pdf
15. Suosittelualgoritmit
▪ Samanlaisuus (kuin sinä tai joku muu)
▪ Suosio (paljon seuraajia)
▪ Aktiivisuus (viimeaikainen toiminta)
▪ Sosiaalinen läheisyys (kaverin kaverit)
▪ Vastavuoroisuus (koska toinen seurasi
ensin sinua)
▪ Aktiivisuus ja seuraajuus (esim. ne
käyttäjät, joiden twiittejä nykyiset
seurattavasi retwiittasivat äskettäin)
15
Kuvat: Twitterin suositteluja uusista seurattavista
17. Datankerääjät pyrkivät luomaan jokaisesta kuluttajasta ”digitaalisen kaksosen”
Data kerätään eri lähteistä ja yhdistetään tunnistetietojen avulla.
Mitä enemmän meistä on dataa, sitä paremmin meihin voidaan vaikuttaa.
Lähteet: Forbrukerrådet, Out of Control, 14.1.2020, https://fil.forbrukerradet.no/wp-content/uploads/2020/01/2020-01-14-out-of-control-final-version.pdf
17
18. Yhdellä verkkosivulla voi olla lukuisia yhteyksiä eri datankerääjille
Esimerkki vasemmalla: Suomiurheilu.com-sivuston request map –kuva, 13.10.2021
Oikealla: nettisivuilla eniten käytetyt sosiaaliset skriptit, https://w3techs.com/technologies/overview/social_widget
18
19. Facebook-pikseli
Miten evästeet toimivat? Esimerkkinä Facebook
2. Selain lähettää Facebookille:
evästeen + selaimen tiedot + sivun tiedot
Kuva: Harto Pönkä, 10.3.2020
19
Jaa/tykkää
-nappi
1
Upotettu FB-
tai IG-julkaisu
2
4
Facebook-sivun
upotus
3
Oy-yritys-ab.com
4. Facebook palauttaa selaimelle
upotetun toiminnon ja uuden evästeen
Tiedot käyttäjästä
ja toiminnasta
mainostajalle
3. Facebook
tunnistaa
käyttäjän ja
kerää tiedot
Tiedot toiminnasta
Facebookille
1
2
3
4
Käyttäjän ei tarvitse olla
kirjautuneena, jos Facebookin
eväste on jo laitteella.
1. Käyttäjä
avaa yrityksen
verkkosivun
20. YouTube-videoiden upotukset sisältävät Googlen markkinointievästeitä
▪ Oletuksena YouTube-videon upotuskoodi käyttää Googlen seuranta- ja
markkinointievästeitä, joita ei saisi ladata ilman käyttäjän suostumusta
▪ Upotus ilman evästeitä: muuta upotuskoodista youtube.com → youtube-nocookie.com
20
<iframe width="560" height="315"
src="https://www.youtube.com/embed/fZ4KR7OHXF0"
title="YouTube video player" frameborder="0"
allow="accelerometer; autoplay; clipboard-write;
encrypted-media; gyroscope; picture-in-picture"
allowfullscreen></iframe>
<iframe width="560" height="315" src="
https://www.youtube-nocookie.com/embed/
fZ4KR7OHXF0" title="YouTube video player"
frameborder="0" allow="accelerometer; autoplay;
clipboard-write; encrypted-media; gyroscope;
picture-in-picture" allowfullscreen></iframe>
22. Pimeä some (dark social)
Jopa 80 % linkkien jaoista tapahtuu ns. pimeässä
somessa: WhatsAppissa, Snapchatissa, Skypessä,
sähköpostilla, tekstiviestillä jne.
Pimeää somea seurataan linkkeihin liitetyillä
käyttäjäkohtaisilla seurantakoodeilla ja
linkkien lyhentäjillä. Esimerkkejä:
...?fbclid=IwAR1YMey9Pojq8...
…?gclid=Cj0KCQjw1Iv0BRDa…
....#gs.1s5zvw
https://t.co/4L9Mp0iTU3
https://mtvgo.fi/l/AmVeISLR
22
Kuvat/lähde: GetSocial/What’s new in publishing, 2019,
https://whatsnewinpublishing.com/77-5-of-shares-are-on-dark-social-only-7-5-on-facebook-and-other-trends-publishers-are-in-the-dark-about/
23. Muut seurantatekniikat: esimerkkinä TikTok
▪ TikTok-videopalvelu seuraa käyttäjiä mm. selainkohtaisten kuva- ja äänitunnisteiden avulla.
▪ TikTok välittää vierailijoiden tietoja suoraan Facebookille ja Appsflyer-markkinointiyritykselle.
▪ Kun käyttäjä jakaa videon linkillä, se sisältää tiedon tämän käyttäjätunnuksesta.
▪ TikTokin palvelimet ovat Yhdysvalloissa, mutta se on kiinalainen yritys.
Lähde: Matthias Eberl, 5.12.2019,
https://rufposten.de/blog/2019/12/05/privacy-analysis-of-tiktoks-app-and-website/
23
24. Eniten kolmansille osapuolille tietoja jakavat Instagram, Facebook ja LinkedIn
Lähde: pCloud, 5.3.2021, https://blog.pcloud.com/invasive-apps/
24
25. Kuvan lähde: Chiefmartec, 2020, https://chiefmartec.com/2020/04/marketing-technology-landscape-2020-martech-5000/ Kuvasta on näkyvissä alle 1/4 . Yhteensä 8000 databisneksen yritystä.
Databisneksen arvoksi arvioitiin v. 2021 noin 162 miljardia dollaria, https://www.marketsandmarkets.com/Market-Reports/big-data-market-1068.html
26. Tarkista, monenko eri markkinointiyrityksen rekistereissä olet
Toinen vastaava palvelu: http://www.networkadvertising.org/managing/opt_out.asp
Ohje evästeiden tarkistamiseen tietokoneelta: https://www.ghacks.net/2014/09/09/find-out-how-many-cookies-internet-sites-save-to-your-system/
26
http://www.aboutads.info/choices
29. Harhauttaminen alkaa jo rekisteröitymisestä: esimerkkinä TikTok
1. Ylikuormittaminen = käyttäjät kohtaavat
ison määrän pyyntöjä, tietoja,
vaihtoehtoja tai mahdollisuuksia.
2. Ohittaminen = käyttäjät eivät ajattele
kaikkia tai osaa tietosuojanäkökohdista.
3. Sekoittaminen = vedotaan käyttäjän
tunteisiin tai harhautetaan visuaalisesti.
4. Estäminen = käyttäjien tiedonsaantia tai
tietojen hallintaa estetään tekemällä
toiminnoista vaikeita.
5. Oikullinen = käyttöliittymän rakenne on
epäjohdonmukainen ja epäselvä, minkä
vuoksi käyttäjän on vaikea navigoida ja
ymmärtää toimintojen tarkoituksia.
6. Pimeyteen jättäminen = käyttöliittymä
on suunniteltu piilottamaan tiedot tai
jättämään käyttäjät epävarmoiksi.
Kuvakaappaukset: TikTokin Android-sovellus (23.3.2022). Dark patternit eli pimeät suunnittelumallit: EDPB Guidelines 3/2022, https://edpb.europa.eu/our-work-tools/documents/public-
consultations/2022/guidelines-32022-dark-patterns-social-media_en
29
30. Sovellukset pyrkivät saamaan kontaktitietosi
Kuvakaappaukset: Somepalvelut 2019-2020
30
Kontaktitietojen avulla palvelut pystyvät profiloimaan sinut entistä tehokkaammin.
Yhteystietojen antamisessa on aina riski, että ne päätyvät lopulta markkinointikäyttöön.
31. Kuinka moni suomalainen käyttää tai EI KÄYTÄ somepalvelujen tunnuksiaan?
Datalähde: AudienceProject, Insights 2020: Apps & social media usage (n. 2000 vastaajaa Suomessa, 15-75-vuotiaat),
SVT:n väestötiedot 31.12.2020 (stat.fi), kuva: Harto Pönkä, 12.4.2021 ja 23.3.2022.
WhatsApp Facebook YouTube Instagram LinkedIn Pinterest Twitter Snapchat TikTok
Päivässä 2 918 000 2 574 000 1 248 000 1 740 000 282 500 211 800 460 300 548 600 160 700
Viikossa 3 410 000 3 013 000 2 555 000 2 169 000 723 100 616 000 745 700 707 600 308 000
Kuukau-
dessa
3 480 000 3 107 000 2 882 000 2 237 000 1 028 000 875 900 856 200 771 300 324 700
Harvemmin/
ei käytä
35 150 31 390 89 140 22 600 101 700 86 630 64 450 23 850 10 040
Yhteensä 3 515 000 3 139 000 2 971 000 2 260 000 1 130 000 962 500 920 700 795 100 334 800
40. Osa trollitileistä on silmiinpistäviä – tarkoituksellako tökeröitä?
Lähde: Twitter, 2.5.2022 (saman tyyppisiä Twitter-tunnuksia on aiemmin jäädytetty, esim. @MEEMIKUNINGAS)
40
41. Manipuloivat botit
41
Lähde: NATO StratCom, 2020, Social media manipulation report 2020, https://www.stratcomcoe.org/social-media-manipulation-report-2020
42. Botit tehtailevat epäaitoja reaktioita: mitä saa 10 eurolla?
42
Lähde: NATO StratCom, 2022, Social media manipulation report 2021/2022,
https://stratcomcoe.org/publications/social-media-manipulation-20212022-assessing-the-ability-of-social-media-companies-to-combat-platform-manipulation/242
43. Twitter-botteja toimittamassa ”tilausta”
43
▪ Kymmenet bottitunnukset twiittasivat lähes
samanlaisia viestejä, joiden tarkoitus oli promota
tiettyä Twitter-tunnusta (liittyy kryptovaluuttaan)
▪ Tunnukset luotu jo 2010-2015
▪ Useilla tunnuksilla samat profiilikuvat
Kuvakaappaus ja lisätietoa: https://twitter.com/Tweeps_net/status/1523615561095200769 (9.5.2022)
44. Somepalvelujen kyky poistaa ostettuja tunnuksia/botteja ja reaktioita
Vasemmalla:
▪ Twitter on parantanut ostettujen
käyttäjätunnusten tunnistamista ja poistoa
▪ Instagramin bottien tunnistus on heikentynyt
▪ Facebookin tulos parani vuodesta 2020
▪ TikTok ja YouTube pärjäsivät heikoimmin
Lähde: NATO StratCom, 2022, Social media manipulation report 2021/2022,
https://stratcomcoe.org/publications/social-media-manipulation-20212022-assessing-the-ability-of-social-media-companies-to-combat-platform-manipulation/242
44
Oikealla:
▪ Neljä viikkoa reaktioiden oston jälkeen
valtaosa niistä oli edelleen näkyvissä
▪ Mm. Facebookin, Twitterin ja Instagramin
tulos heikkeni vuoteen 2020 verrattuna
46. Algoritmit ja #kaupallinenyhteistyö
▪ Algoritmit pyrkivät profiloimaan
käyttäjät ja näyttämään sen
perusteella kiinnostavaa sisältöä.
▪ Mainostajat tuottavat
”somevaikuttajien” tileille
mainosmateriaalia, joka muistuttaa
aitoa sisältöä.
▪ Algoritmia voidaan manipuloida
luulemaan sisältöä suosituksi.
▪ Seuraus: näemme somessa
kaupallista sisältöä, jolla pyritään
vaikuttamaan mm. mielikuviin
yrityksistä ja tuotteista.
Kuvakaappaus: Yle, 12.11.2020, Mainos vai ei?, https://yle.fi/uutiset/3-11609882
46
50. Jos haluat välttää digijätteen kertymistä…
1. Vaihda Google DuckDuckGohon ja asenna sen
selainlaajennus: https://duckduckgo.com/
2. Älä anna tarpeettomia käyttöoikeuksia tietoihisi
(esim. yhteystiedot, sijainti ja evästeet)
3. Poista turhat käyttäjätunnukset
50