1. Big Data ja liiketoiminnan etiikka
Jyrki J.J. Kasvi
@jyrkikasvi
#Aamuareena 10.2.2017
2. Tiedonmurusista leivottu datakakku
Big Data tarkoittaa suurten tietomassojen reaaliaikaista
kokoamista, hallintaa ja analyysiä
Big datan analyysin tuloksia voidaan hyödyntää toiminnan
reaaliaikaisessa automaattisessa ohjaamisessa ja tiedolla
johtamisessa
Big dataa voidaan hyödyntää tietointensiivisten palvelu-
tuotteiden tuottamiseen esimerkiksi terveydenhoidossa,
liikenteessä, markkinoinnissa tai asumisessa
Big data muuttaa investointituotteet tietointensiivisiksi palveluiksi,
esim. hissit, meridieselit, tuotantojärjestelmät, sähköverkot, …
Kuluttajista kerätään verkossa jatkuvasti tietoa, jota jalostetaan
esimerkiksi mainostajille myytäviksi tuotteiksi
10.2.2017 @jyrkikasvi @tiekery 2
3. Kun Hitachi korvasi logistiikan esimiehet Big Datalla koulutetulla
tekoälyllä, varastomiehet työskentelivät 8% tehokkaammin.
Ken Teegardin, CC BY-SA 2.0
4. 10.2.2017 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 4
Uusissa suihkumoottoreissa tuhansia sensoreita, jotka lähettävät jatkuvasti
dataa, jota analysoimalla valmistaja tietää, mitä huoltoa tarvitaan.
CC 2.0 BY Mark Kobayashi-Hillary
5. Dataa joka minuutti!
Ja kaikki tämä data kertoo
meistä Internetin käyttäjistä
CC 2.0 BY Erik Fitzpatrick
10.2.2017 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 5
6. Bitti löytyy Big Data -suovasta … reaaliajassa
Vanhentunut tieto on päätöksenteossa ja liiketoiminnassa arvotonta
10.2.2017 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 6
8. Dataa syntyy, entä tietoa?
Organisaatiot ja järjestelmät tuottavat yhä enemmän
(big) dataa
High VVV: High Volume, high Velocity & high Variety of sources
Tekniikka mahdollistaa hyvin suurten datamassojen
kokoamisen ja analysoinnin murto-osalla aiemmista
kustannuksista
Vanhoja järjestelmiä ja datavarantoja ei suunniteltu big datan tarpeisiin
Haasteena datavarojen pirstaloituminen ja heikko laatu (puutteelliset
määrittelyt, epäyhdenmukaiset datan esitysmuodot, puuttuva metadata)
Tiedolla johtaminen edellyttää ajantasaista tietoa
Liiketoiminnan reaaliaikainen ohjaus (RTE - real time economy)
@jyrkikasvi #eGovernment
9. Big Datan etiikkaa
Gartner ennustaa, että 2018 puolet liiketoiminnan etiikan rikkeistä
liittyy big datan analyysin sopimattomaan hyödyntämiseen
Vaikka lakia ei oltaisi rikottu, vahinko yrityksen maineelle voi olla merkittävä
http://www.gartner.com/newsroom/id/3144217
Esimerkiksi Target-kauppaketjun algoritmi päätteli 15-vuotiaan
asiakkaan olevan raskaana ja lähetti hänelle vauvanhoito-
tuotteiden mainoksia
Algoritmin ohjelmoijan tehtävänä oli ollut päätellä asiakkaasta kerättyjen tietojen
perusteella, onko tämä raskaana vaikka hän ei haluaisi kauppaketjun tietävän siitä
Tyttö oli raskaana, mutta hänen vanhempansa eivät sitä tienneet, ennen mainoksia.
“Datalla ei ole moraalia – ei hyvää eikä pahaa, data vain on.
Dataetiikassa on kyse siitä, millaisia valintoja me dataa
hyödyntävät ihmiset teemme.” – Alan Duncan, Gartner
10.2.2017 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 9
10. Big data, yksityisyys ja itsemääräämisoikeus
Suurin osa big datan eettisistä kysymyksistä liittyy yksityisyyteen
Esim. mitä sosiaalisen median yhtiöt tekevät meistä keräämillään tiedoilla
Rekistereitä yhdistämällä mahdollista luoda hyvin yksityiskohtaisia henkilöprofiileja
Kerättyjen henkilötietojen tietoturva
Vaikka käyttäisi keräämiään tietoja eettisesti, tietomurtajaa se ei pidättele
Kerättyjen henkilötietojen omistajuus ja hallinta
Esim terveystiedot omistaa potilas itse
Henkilötietoja saa käyttää vain tarkoituksiin, joihin niiden
luovuttajat ovat suostuneet
Tietojen yhdisteleminen eri rekistereistä?
Anonymisoitujen tietojen hyödyntäminen?
10.2.2017 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 10
12. Anonymisoitua tietoa hyödyntäviä palveluita
10.2.2017 12@jyrkikasvi #eGovernment
Analyysin pohjana oleva data on suojattava manipuoloinnilta.
13. Big data ja tiedon etiikka
Big datan analyysi ei välttämättä
läpinäkyvää
Oppivan algoritmin logiikan seuraaminen voi olla ihmiselle mahdotonta
Analyysiin käyttävän algoritmin manipulointia ei välttämättä pysty huomaamaan
Huonosta big datasta ei saa hyvää analyysiä
Laadukas data on tarkkaa, luotettavaa, yhtenäistä, kattavaa ja ajantasaista
Analysoitava data on suojattava manipuloinnilta
Hyväkin analyysi voidaan tulkita huonosti
Tuloksia ei saa kaunistella eikä käyttää muuhun kuin mitä analyysi koskee
Tulosten merkittävyyttä ei saa ali- eikä ylitulkita
Tulkinta edellyttää käytettyjen analyysimenetelmien
ymmärtämistä
Tilastoanalyysin ja algoritmien lisäksi on ymmärrettävä esim sosiaalitieteitä
10.2.2017 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 13
Lisäys yleisökommentin perusteella!
Myös huonolaatuista big dataa voi
analysoida, kunhan tiedostaa datan
laadun ongelmat, niiden edellyttämän
datan esikäsittelyn ja niistä seuraavat
rajoitteet tulosten hyödynnettävyydelle.
Jos vain laadukasta tietoa voisi analy-
soida, ei olisi paljon analysoitavaa!
14. Big datan eettisiä periaatteitä
Kerää, hallitse ja käytä henkilötietoja vain siten kuin hyväksyisit
oman lapsesi tietoja käytettävän
Informoi ja kysy lupa aina kun keräät henkilötietoja
Noudattamasi tiedon hallinnan, tietoturvan ja yksityisyyden suojan periaatteet
Mihin tarkoituksiin tietoa kerätään
Miten tiedon keruu hyödyttää sinua, asiakasta ja yhteiskuntaa
Arvioi tietojen keruuseen ja analyysiin liittyviä riskejä
Esim. mitä tapahtuu, jos tehdään tietomurto tai henkilöstö käyttää tietoja väärin?
Onko riskeihin varauduttu ja ehkäisty sekä käytännöt auditoitu?
Varmista kerättyjen tietojen tietoturva
Noudattavatko yhteistyökumppanit vastaavia eettisiä ja tietoturvakäytäntöjä
Huolehdi datan, analyysin ja tulkinnan laadusta
10.2.2017 TIEKE Tietoyhteiskunnan kehittämiskeskus ry 14