Peter Ylén: Voisiko tekoäly yksinkertaistaa monimutkaisen?
1. VTT TECHNICAL RESEARCH CENTRE OF FINLAND LTD
Voisiko tekoäly
yksinkertaistaa
monimutkaisen?
Peter Ylen, Johtava tutkija, VTT
Liiketoiminta, innovaatiot ja Ennakointi
peter.ylen@vtt.fi, 26.4.2018
2. 225/04/2018 2
Tekoäly (AI), Data-analytiikka ja
Massadata (Big Data)
Tekoäly eli keinoäly on tietokone tai sen ohjelma (algoritmi), joka
kykenee toimintoihin, jotka voidaan luokitella älykkäiksi. Älykkäiden
toimintojen määritelmä vuorostaan on tulkinnanvarainen, joten
tekoälynkin määritelmä jää avoimeksi.
Data-analytiikka kattaa erilaisia menetelmiä ja lähestymistapoja, joita
yhdistää tavoite jalostaa tiedosta (data) korkeamman tason informaatiota
ja malleja, jotka voidaan käyttää johtopäätösten tekemisen.
Massadata on tyypillisesti digitaalisten palvelujen ja järjestelmien
tuottamaa dataa, jolle on tyypillistä huomattavan suuri määrä, nopea
kertyminen, monimuotoisuus ja laadulliseen luotettavuuteen liittyvät
haasteet.
3. 325/04/2018 3
Data-analytiikka
Data-analytiikka jaetaan usein neljään eri kategoriaan
Kuvaileva
analytiikka
Deskriptiivinen
Tutkiva
analytiikka
Diagnostinen
Ennustava
analytiikka
Prediktiivinen
Ohjeellinen
analytiikka
Preskriptiivinen
Mikä
tilanne
on nyt?
Mitkä tekijät vaikuttivat
nykytilanteen
muodostumiseen?
Mitä tarkasteltavalle
kohteelle tapahtuu
seuraavaksi?
Mitä on tehtävä, jotta
saadaan haluttu
vaikutus?
Kvantitatiiviset datapohjaiset menetelmät Kvalitatiiviset narratiiviset menetelmät
4. 425/04/2018 4
Data-analytiikka
Kuvaileva analytiikka hyödyntää perinteisiä tilastollisia menetelmiä,
joiden avulla tarkasteltavasta aineistosta saadaan jalostettua ihmiselle
ymmärrettävissä olevia tunnuslukuja ja visualisointeja.
Tutkivan analytiikan tavoitteena on pureutua aineistoon vähän
syvemmälle, jotta saadaan käsitys taustalla olevista syistä ja
vuorovaikutussuhteista.
Ennustavassa analytiikassa on tyypillisesti tavoitteena ennustaa jonkin
kohteen tuleva tila tiedossa olevan tiedon perusteella, tai ryhmitellä
kohteet samankaltaisiksi ryhmistä. Koneoppimisen menetelmillä on
tässä tärkeä rooli.
Ohjeellinen analytiikka hyödyntää stokastista mallintamista ja
simulointi- ja optimointimalleja, joiden avulla pyritään löytämään
parhaat keinot saavuttaa asetetut tavoitteet ja vaikutukset.
5. 525/04/2018 5
VTT – Policy Brief 1/2017: Tuottoa ja tehokkuutta Suomeen tekoälyllä
6. 625/04/2018 6
Yksilödata, aggrekoitu data,
anonymisoitu data ja tietosuoja
Yksilötason henkilötieto on kyseessä, jos henkilöllisyys voidaan tunnistaa
datasta suorasti tai epäsuorasti ja sitä koskee kaikkein tiukimmat
rajoitukset. Aggrekoidussa datassa tietoja on summattu laajempien
havaintoyksiköiden tasolle
Anonyymistä datasta henkilöä ei voida tunnistaa kohtuullisin keinoin ja
pseudonyymistä datasta henkilöä ei voida tunnistaa ilman erillään
säilytettävää koodiavainta.
De-anonymisoinnissa anonyymi tieto muuttuu tunnisteelliseksi
yhdistämällä siihen muista lähteistä saatavaa tietoa.
Tiukimmat tietosuojavaatimukset on yksilötason henkilötiedolle.
7. 725/04/2018 7
Tavoitteet ja fokus
Menetelmät ja tarvittava data määräytyy tavoitteiden ja fokuksen kautta:
Mikäli tavoitteena on parantaa päätöksentekoa yksilötasolla, niin tavoite olisi
saada mahdollisimman paljon tietoa päätöksen kohteena olevasta yksilöstä
monista eri lähteistä, fuusioida data yhteen ja tukea päätöksentekoa
monimuuttujadata-analytiikan (kuten AI) avulla.
Eettiset ja lainsäädännölliset rajoitteet, yksityisyyden suoja, suostumus datan
käyttöön
Mikäli taas tavoitteena on parantaa päätöksentekoa aggrekoidulla tasolla, niin
tieto on aggrekoitua ja anonyymiä. Yksilötason monimuuttuja-analytiikkaa ei
voida käyttää, jos datafuusio tehdään anonymisoinnin jälkeen.
Soveltuu ylemmän tason päätöksentekoon
8. 825/04/2018 8
Nykyisin käytettävissä oleva data ja
rajoitettu analytiikan käyttö
Data-analytiikalla ja tekoälyllä on paljon annettavaa myös nykyisen
prosessin tehostamisessa ja laadun parantamisessa:
”Lähivuosina rutiininomaisten tiedonkäsittelytehtävien automaatio kasvaa
merkittävästi. Kattavien selvitysten mukaan 25–40 % työstä voitaisiin alasta
riippuen tehdä jo nyt automaattisesti tekoälyn avulla.”1
Tämä edellyttää
Nykydatan saattamista eri lähteistä semanttisesti yksikäsitteiseen ja
taustatekijöiltään yhdistettävään muotoon.
Käytettävien tietokantojen ja muuttujien valintaa (iteratiiviset kokeilut)
Käytettävien algoritmien valintaa ja kehitystä (iteratiiviset kokeilut)
Data-analytiikan ja tekoälyn ymmärtämisen lisäämistä julkisella sektorilla – kaikilla
organisaation tasoilla
1. VTT – Policy Brief 1/2017: Tuottoa ja tehokkuutta Suomeen tekoälyllä
12. 1225/04/2018 12
Nuorten mielenterveysongelmien ja
syrjäytymisen ehkäiseminen
Yhteistyö:
EU MIDAS (Meaningful Integration of Data Analytics and Services) – hanke
(http://www.midasproject.eu/about/)
VN TEAS VAATE Vaikutusten arvioinnin tehostaminen massadatan avulla
Lähteet:
• http://www.mesaatio.fi/suomessa-on-syrjassa-tanaan-69-000-nuorta/
• Hilli, P., Ståhl, T., Merikukka, M. & Ristika, T. (2017) Syrjäytymisen hinta – case investoinnin kannattavuuslaskemasta.
Yhteiskuntapolitiikka-lehti 6/2017.
Nuorten syrjäytyminen on kasvava yhteiskunnallinen ongelma:
• Nuorten syrjäytyneiden määrä on noin 69 000.
• Kymmenessä vuodessa määrä on kasvanut noin 15 000
nuorella.
• Nuorten syrjäytyminen maksaa yhteiskunnalle vuodessa
noin 1,4 miljardia euroa.
14. 1425/04/2018 14
Nuorten syrjäytymisen ja mielenterveyden indikaattoreita
Yksinäisyys
Etninen
tausta
Ulkonäkö
paineet
Diagnosoitu
erityisyys esim.
ADHD häiriötTerveysongelmat,
vammautuminen
Koulukius
aaminen
Kouluilmapiir
i, psygologi
Koulussa
poissaolot
Nuorten huono
Koulumenestys
Henkilöt jotka
hakeneet mutta
eivät saaneet
opiskelupaikkaa
Työttömyys Ylipaino, iho-
ongelmat
Kaverit,
Yhteisöt
Nuorten
Pelaaminen
Urheiluseura
osallistujat
Ostoskäyttä
ytyminen
Perheen
Työttömyys
Koulun
vaikutukset
Henkilökohtaisten
haasteiden
vaikutukset
Köyhyys,velat
Seksuaalinen
hyväksikäyttö,
Insesti tapaukset
Vanhempien
masennus
Vanhempien
välinpitämättöm
yys
Perheissä
kuolema / ero
Tukien varassa
eläminen
Masennus
Itsemurhayri-
tykset
Nuorison
päihteet
Virkavallan
puuttuminen
Hätäkeskus
puhelut
Psykiatrian
osastokäynnit
Karkaaminen
Mieliala
häiriöt
Huostaanotot
Nuorison
Varastelu
, ilkivalta
Heitteille jättö
Mieliala
lääkkeet
Kouluterveydenhuolto
Koulut
Poliisin aineistot
Julkiiset toimijat
Rekisterit
Mieliala
lääkkeet
Perhe
väkivalta Sosiaaliviranomaisten aineistot
Henkilödata, some
Nuorison
Ajanviettopaikka
Aluesuunnittelu,
urheiluseurat, kirkko,
kansalaisopistot
….
Perheessä
sairaus
Opinto-ohjaus
Ravintolat,
kuppilat
Konkurssit
Asuinpaikka
/ tyyppi
Kustannuksen
ja resurssit Päätöksentekijä
Krooninen
sairaus
Nuorten
liikkuminen
Perhekoti
käynnit
Asumispalvelut
Turvakoti
Pärjääminen
armeijassa
MatkusteluPäihdeko
keilut
Liikaa töitä
Kansalaisopistot,
kirkolliset yhteisöt
Päihteiden
käyttö
Pitkän aikavälin indikaattorit
Lyhyen aikavälin indikaattorit
Välittömät interventiot
Krooniset
sairaudet
Palvelutarjonta
Digitaaliset
tukipalvelut
Nuorten
Harrastukset
Ympäristön ja
palveluiden
vaikutukset
Päihdekokeiluiden
vaikutukset
Perheen ja
kaverien
vaikutukset
Pikkarainen et al. 2017
15. 15
Unemployment of
parents
Youth
unemployment
Students
Use of intoxicants
Police activity
Income level of
family School
performance
Use of intoxicants
by parents
School motivation
Social wellbeing
Psychological
wellbeing
Support and encouragement
provided by the family
Mental illness
prevalence
Problem behaviour
Non-organized free time
activity opportunities
Organized free time
activity opportunities
Physical wellbeing
Use of healthcare
resources
Wellbeing
School
Family
Studies and
employment
Intoxicants
Free time
Education level of
parents
Hobby activity
+
-
+
+
+
+
+
+
+
-
+
+
+
+
Parents' ability and resources
to take care and look after
+
-
+
+
+
+
-
+
+
+
+Availability of
intoxicants
++
-
Clubs are active
+
+
+
+
To the next
generation
-
-
+
-
Use of student wellbeing
services
+
+
-
+
Support for clubs+
Support for
families
+
Resource allocation
for healthcare
+
Unemployment of
parents
Youth
unemployment
Students
Use of intoxicants
Police activity
Income level of
family School
performance
Use of intoxicants
by parents
School motivation
Social wellbeing
Psychological
wellbeing
Support and encouragement
provided by the family
Mental illness
prevalence
Problem behaviour
Non-organized free time
activity opportunities
Organized free time
activity opportunities
Physical wellbeing
Use of healthcare
resources
Wellbeing
School
Family
Studies and
employment
Intoxicants
Free time
Education level of
parents
Hobby activity
+
-
+
+
+
+
+
+
+
-
+
+
+
+
Parents' ability and resources
to take care and look after
+
-
+
+
+
+
-
+
+
+
+Availability of
intoxicants
++
-
Clubs are active
+
+
+
+
To the next
generation
-
-
+
-
Use of student wellbeing
services
+
+
-
+
Unemployment of
parents
Use of intoxicants
Police activity
Income level of
family School
performance
Use of intoxicants
by parents
School motivation
Social wellbeing
Psychological
wellbeing
Support and encouragement
provided by the family
Mental illness
prevalence
Problem behaviour
Non-organized free time
activity opportunities
Organized free time
activity opportunities
Physical wellbeing
Use of healthcare
resources
Wellbeing
School
Family
Studies and
employment
Intoxicants
Free time
Education level of
parents
Hobby activity
+
-
+
+
+
+
+
+
+
-
+
+
+
+
Parents' ability and resources
to take care and look after
+
-
+
+
+
+
-
+
+Availability of
intoxicants
++
-
Clubs are active
+
+
+
+
-
-
Use of student wellbeing
services
+
+
-
+
Unemployment of
parents
Income level of
family School
performance
School motivation
Social wellbeing
Psychological
wellbeing
Support and encouragement
provided by the family
Mental illness
prevalence
Non-organized free time
activity opportunities
Organized free time
activity opportunities
Physical wellbeing
Use of healthcare
resources
Wellbeing
School
Family
Studies and
employment
Intoxicants
Free time
Education level of
parents
Hobby activity
+
-
+
+
+
+
+
+
+
-
+
Parents' ability and resources
to take care and look after
+
+
+
+
+
+
Clubs are active
+
+
+
+
-
Use of student wellbeing
services
+
-
+
Unemployment of
parents
Income level of
family School
performance
School motivation
Support and encouragement
provided by the family
Non-organized free time
activity opportunities
Organized free time
activity opportunities
Wellbeing
School
Family
Studies and
employment
Intoxicants
Free time
Education level of
parents
Hobby activity
+
+
+
+
+
-
+
Parents' ability and resources
to take care and look after
+
+
Clubs are active
+
+
+
+
Unemployment of
parents
Income level of
family School
performance
School motivation
Support and encouragement
provided by the family
Wellbeing
School
Family
Studies and
employment
Intoxicants
Free time
Education level of
parents
+
+
+
-
+
Parents' ability and resources
to take care and look after
+
+
Unemployment of
parents
Income level of
family
Support and encouragement
provided by the family
Wellbeing
School
Family
Studies and
employment
Intoxicants
Free time
Education level of
parents
-
+
Parents' ability and resources
to take care and look after
+
Unemployment of
parents
Income level of
family
Support and encouragement
provided by the family
Wellbeing
School
Family
Studies and
employment
Intoxicants
Free time
Education level of
parents
Parents' ability and resources
to take care and look after
Wellbeing
School
Family
Studies and
employment
Intoxicants
Free time
17. 1725/04/2018 17
Lopuksi
Data-analytiikalla ja tekoälyllä tulee olemaan lähitulevaisuudessa merkittävä
rooli päätöksenteossa sekä yksityisellä että julkisella sektorilla
Laskentakapasiteetti mahdollistaa suurten datamäärien prosessoinnin
päätöksenteon tueksi ja inhimillisten virheiden määrä pienenee
On kuitenkin useita rajoituksia ja riskejä, jotka on otettava huomioon
Datapohjaiset menetelmät edellyttävät kvantitatiivista dataa eivätkä ota huomioon
kvalitatiivisia riippuvuuksia eivätkä potentiaalisia muutoksia tulevaisuudesta (jos
niistä ei ole dataa). Menetelmät myös käsittelevät huonosti puolitotuuksia, valheita
ja värittynyttä tietoa.
Kuka kantaa vastuun mahdollisista virheistä, jotka tekoälyä käyttävä
diagnostiikkasovellus, hallinnollinen tai oikeudellinen ohjelmistorutiini tekee?
Onko vastuu ja korvausvelvollisuus tekoälyn toimittaneella yrityksellä, ohjelmoijalla
tai ratkaisua käyttävällä organisaatiolla tai sen työntekijällä?
Entä jos algoritmi oppii esimerkeistä ja toistaa huonoja käytäntöjä?