MITÄ
ON
BIG
DATA?
Yritysten
ja
organisaa.oiden
järjestelmät
sisältävät
tonnei4ain
.etoa
historiasta
sekä
nyky.lanteesta.
Tämä
.eto
on
palvellut
toimintaa
siiloperusteises.
jo
vuosikymmeniä.
Ajan
saatossa
teknologioiden,
prosessiosaamisen
sekä
.edolla
johtamisen
kyvykkyyksien
kehi4yminen
ovat
mahdollistaneet
tehokkaamman
informaa.on
käytön.
On
muodostunut
yhä
hienompia
.etovarastoja,
joita
on
kuitenkin
usein
käyte4y
suppeas.
ja
toimintokohtaises..
Esimerkiksi
taloussuunnitelma
kuluvan
vuoden
loppuun
on
ollut
talousyksikön
muodostama
kuva
ja
vastaavas.
myyn.ennuste
loppuosalle
vuo4a
taas
myynnin
näkemys.
On
yhä
tärkeämpää
ymmärtää
mitä
detaljitasoinen
talous-‐
ja
myyn.ennusteiden
synteesi
mahdollistaa
toiminnan
opera.ivisessa
ohjauksessa.
Ja
miten
suunni4elutarkkuu4a
voidaan
kehi4ää
eri
.etovirtojen
avulla,
joita
ovat
mm.
erilaiset
indeksit,
sosiaalisen
median
keskustelut,
kilpailija.eto,
360°-‐asiakaspalaute/keskustelu,
sijain..edot
sekä
laite-‐,
käy4ö-‐
ja
käy4äytymisdatan
jatkuva
virta.
Siiloutuneista
ja
suppeista
toimintaympäristöistä
siirrytään
kokonaisvaltaisempaan
dataan
hyödyntämiseen.
Uudet
usein
strukturoima4omat
datavirrat
tulevat
täydentämään
ja
samalla
monimutkaistamaan
.edolla
johtamista.
Big
Data
tuo
välineet
löytää
datavirrasta
olennainen
ja
tehdä
se
näkyväksi
ja
hyödynne4äväksi.
Big
Data
ei
ole
4etovarastohanke
-‐
infrastruktuuri
ja
välineet
ovat
vain
mahdollistajia.
Big
Data
on
palvelualusta
joka
mahdollistaa
dataan
sisältyvän
arvon
realisoinnin
käytännön
hyötyinä.
Big
Data
on
toimintakul?uuri,
jossa
uusin
keinon
haetaan
jatkuvas.
maksimaalista
.edollista
ymmärrystä.
Big
Data
on
parhaimmillaan
edullista
.edon
hallintaa,
uusien
sovellusalueiden
hyödyntämistä
eli
hyötynäkökulmasta
tärkeiden
asioiden
ratkomista.
Tämä
on
esimerkiksi
verkkokaupan
klikkivirran
keräämistä
yksityiskohtaisessa
muodossa
ja
tämän
.edon
jalostamista
muotoon,
jonka
pohjalta
asiakkaille
on
mahdollista
tarjota
op.moituja
ja
relevan4eja
sisältöjä.
Toiselle
toimijalle
tämä
tarkoi4aa
sensori.etovirtojen
analyysia
jo4a
tuotantolaitoksen
viat
ja
häiriöt
olisi
ennakoitavissa
ja
mahdollinen
tuotantoseisokki
este4ävissä.
Kolmannelle
toimijalle
Big
Data
taas
tarjoaa
keinon
integroida
toiminnan
siilot
yhteen
ja
tukea
pitkän
ketjun
(tuotanto,
asiakaskokemus,
kanna4avuus,
yhteistyö
ulkoisten
toimijoiden
kanssa)
rakentumista
sisäises.
sekä
toimialan
ketjuna.
“Primary
value
from
big
data
comes
not
from
the
data
in
its
raw
form,
but
from
the
processing
and
analysis
of
it
and
the
insights,
products,
and
services
that
emerge
from
analysis.”
Thomas
H.
Davenport
&
Jill
Dyché,
IIA
report/Big
Data
in
Big
Companies
BIG
DATASTA
SANOTTUA
“We
want
to
apply
data
to
every
decision.
We
want
to
be
a
very
data-‐driven
company.”
Mike
Cur.s,
AirBnB,
Vice
President
of
Engineering
”We
wanna
marry
big
data
with
some
of
GE's
biggest
businesses.”
Bill
Ruh,
GE,
Head
of
R&D
center
“Big
data
analyBcs
has
helped
to
boost
our
store
sales
by
10
percent.”
Karem
Tomak,
,
Macy’s,
VP
of
analy.cs
"Don't
have
enough
data?
Get
more.”
Spo.fy
"It
is
an
incredibly
fast
growing
area
for
us."
Ann
Cairns,
Mastercard
”The
data
informs
what
we
do,
it
doesn’t
rule
what
we
do.”
Lewis
D’Vorkin,
Forbes
POTILASTURVA
Potilasturvallisuuden vaarantumiset
aiheuttavat Suomen terveydenhuollossa yli
miljardin kustannukset vuodessa. Jopa 30
prosenttia terveydenhoidon menoista liittyy
komplikaatioihin, virheisiin ja epätäy-
dellisiin diagnooseihin. Pirkanmaan
sairaanhoitopiirissä on aktiivisesti
puututtu potilasturvaan uusin keinon.
Vapaamuotoisissa potilaskertomuksissa
hajallaan olevaa tärkeää tietoa ei voitu
hyödyntää tehokkaasti. Aluksi koottiin eri
maista viitelistaus potilasturvaa
vaarantaneista tekijöistä kuten infektioista,
haavaongelmista ja ylimääräisistä
tutkimustarpeista. Tällä hetkellä teksti-
massaa seulotaan SAS Instituten ja CGI:n
avulla koneellisesti jotta potilasturvan
vaarantumisesta kertovat tekijät ja niiden
yhdistelmät löytyisivät ajoissa. Löydökset
parantavat henkilökunnan valmiuksia sekä
lyhentävät hoitojaksoja.
POISTUMAHALLINTA
Teleoperaattori T-Mobilella oli yli 30
miljoonaa asiakasta, joten dataa kertyi
valtavasti. Samaan aikaan yksi
operaattoreiden suurimmista haasteista oli
myös T-Mobilen murheena, poistuman
halllinta. T-Mobile yhdisti big data-
teknologialla monia eri massiivisia
datalähteitä, laskutusdataa, sentimentti-
dataa, puheludataa, verkkodataa jne.
Rakennettiin uusi Customer Lifetime Value
–mallinnus sekä luotiin järjestelmä, jossa
big datan löydökset olivat asiakaspalvelun
ja myyjien käytössä suoraan ja erilaisten
hälytysmekanismien kautta. Tämän
järjestelmän käyttöönoton myötä T-Mobile
onnistui pienentämään asiakaspoistu-
maansa 50% yhden kvartaalin aikana.
VERKKOKAUPPA
Ebayllä on 100 miljoonaa asiakasta ja 30 000
tuotekategoriaa. Se taltioi verkkosivuillaan
kuukaudessa 100 miljoonaa tuntia
tapahtumia sivustollaan. Noin valtavilla
volyymeillä jo peruskysymyksiin vastauksen
löytäminen vaatii big data-työkaluja.
Työkalut antavat vastauksia mm.
käytettävyyden ja löydettävyyden
parantamiseen. Ja myös siihen minkälaiset
kuvat, mitä palautusvaihtoehdot ja mitkä
lisätuote-ehdotukset toimivat parhaiten
missäkin tilanteessa. Ebay käyttää big dataa
myös perustellakseen kauppiaille miksi tulla
Ebayhin mukaan. Kauppiaille tehdään datan
perusteella ennuste tulevasta myynnistä ja
ennusteen toimivuutta seurataan. Ennusteen
vahva toteutumisaste tuo kauppiaita Ebayhin
ja pitää heitä siellä.
VEROTUS
–
BIG
DATAA
TYÖKALUPAKKIIN?
Verotuksessakaan
asiat
eivät
etene
kuin
Strömsössä.
Väärinkäytökset
ja
harmaa
talous
syövät
yhteisestä
kuormasta.
Usein
manuaaliset
valvontaprosessit
eivät
tunnista
ja
tavoita
tehokkaas.
väärinkäytöksiä.
Suomella
julkinen
sektori
on
Euroopan
toiseksi
suurin.
Big
Data
-‐ratkaisut
tarjoavat
julkisen
sektorin
kustannus-‐
ja
tehokkuusvaa4muksiin
ratkaisuja
hopeatarjoXmella
kaikille
sektoreille.
“You
get
elected
with
Big
Data,
but
you
govern
without
it.
How
much
sense
does
that
make?”
Reed
Hunt,
Federal
Trade
Commission
(sitaa]
keskustelusta
jota
käy.in
USA:ssa
Obaman
eri4äin
datavetoisen
kampanjoinnin
jälkeen)
BELGIA
-‐
Vero4ajan
tavoi4eena
on
tehostaa
arvonlisäveron
kantoa
ja
puhdistaa
markkina
keino4elijoista.
Keino4elijat
myyvät
ilman
arvonlisäveroa
tavaraa
ulkomaille
verovapaisiin
maihin.
Tuo4eet
myydään
verollisena,
mu4a
verot
jätetään
.li4ämä4ä
val.olle.
Viimeisin
toimija
myy
tuo4eet
edelleen
verovapaaseen
maahan.
Keino4elijat
pyrkivät
olemaan
nopealiikkeisiä
ja
toimimaan
siten
e4ä
tapahtumaketju
on
vaikeas.
tunniste4ava.
Problema.ikkaa
lähde]in
lähestymään
verkostojen
analysoinnilla
sekä
teks.analy.ikalla.
Avuksi
ote]in
SAS
Ins.tuten
big
data
–
sovellukset.
Niiden
avulla
alv-‐verokeino4elu
on
pysty4y
supistamaan
2
%:iin
sen
alkuperäisestä
tasosta.
Käytännössä
tuo4o
on
ollut
noin
1
miljardi
euroa
takaisin
belgialaisten
hyvinvoin.in.
RUOTSI
-‐
Vero4aja
on
myös
Ruotsissa
lähtenyt
big
datan
.elle
varmistaakseen
verosaatavien
tehokkaan
ko.u4amisen.
Veronkierron
valvontaa
on
hankaloi4anut
valvo4avien
.etomassojen
valtava
määrä
ja
vaikeus
tunnistaa
datavirrasta
väärinkäytöksien
tunnusmerkkien
yhdistelmiä.
Ruotsissa
on
nyt
ote4u
käy4öön
SAS
Ins.tuten
järjestelmä,
joka
tunnistaa
.edonlouhinnan
sekä
.lastollisien
menetelmien
avulla
kohteita,
joissa
on
korkea
riski
vero-‐järjestelmän
väärinkäytölle.
Mallit
on
automa.soitu
etsimään
väärinkäytöksen
tunnusmerkkejä
massiivista
.etoaineistoa
vasten.
Viranomaiset
saavat
itselleen
järjestelmän
avulla
tarkan
ja
nopean
listauksen
korkean
väärinkäytösriskin
kohteista
sekä
tapahtumaketjuista,
joita
selvitetään
tarkemmin
kohdennetuin
valvontatoimenpitein.
MAINOSRAHOITTEINEN
Big Data mahdollistaa uutta liiketoimintaa.
Eurooppalainen (Belgia, Hollanti, Ranska, Italia,
Saksa, UK, Luxenburg) Zapfi tarjoaa
asiakkailleen käyttöön maksuttoman
langattoman verkkoyhteyden tukiasemiensa
avulla. Tukiasemia on asennettu yleisiin tiloihin
mm. myymälöihin, kauppakeskuksiin ja
henkilöliikenteen solmukohtiin (mm. lentokentät).
Zapfi mahdollistaa maksuttoman langattoman
verkon käytön mainosrahoituksella. Asiakkaat
ovat kirjautuneita eli tunnistettuja. Näin ollen
Zapfi voi tarkasti analysoida asiakkaiden
internet-käyttäytymistä sekä sijaintitietojen virtaa
ja muita tietoparametreja. Hyödyntäen Big Data
-aineistoja Zapfi optimoi rajallista mainostilaansa
detaljitasoisen personoinnin avulla. Zapfin
käyttäjä saa paikkaan sekä asiointiinsa tarkasti
peilattuja relevantteja sisältöjä ja vastaavasti
Zapfi saa optimoinnin avulla mainostilastaan
merkittävästi enemmän hyötyä.
NEW EBIZ - AIRBNB
AirBnB tarjoaa kuluttajien asuntoihin
perustuvia majoituspalveluita 192 maassa,
34 000 kaupungissa. Verkkosivuilla on 10
miljoonaa hakua päivässä. AirBnB hakee
massiivisesta datavirrasta tuloksellisia
korrelaatioita. Mitkä listauksen parametrit,
minkälaiset kuvat yms. aikaansaavat
minkäkinlaisia tuloksia hauissa.
Jo ensimmäinen pienimuotoinen data-
analyysi oli aikoinaan käänteentekevä: sen
tuloksena AirBnB alkoi tarjota asuntojen
haltijoille ammattikuvaajia. Ja myynti
räjähti. Yritys tekee myös prediktiivistä
analytiikkaa ennustaakseen alueellisia
kehitystrendejä. Tekemiseen on
monipuolisen infran lisäksi investoitu
henkilötasolla. 50 henkilöä optimoi
AirBnB:ssä päivittäin palvelualustaa big
datan avulla.
ASIAKASKOKEMUS
Monikanavainen Macy’s keskittyy
asiakaskokemuksen parantamiseen. Se on
yksi USA:n suurimmista kauppaketjuista:
70% amerikkalaisista vierailee sen liikkeissä
vuosittain. Macy’s kerää valtavan määrän
tietoa mm. tuotteiden menekistä, kierrosta,
läpimenoajoista, promootioista, erilaisia
aktiviteettitietoja ja yhdistää nämä
monikanavaiseen ja monipuoliseen
asiakasdataan sekä aika- ja paikkatietoon
luoden valtavan määrän vertailtavia
yhdistelmiä ja tarjoaa tämän avulla yhä
personoidumpaa asiakaskokemusta ja
viestintää. Yhdestä postituksesta voi olla
jopa yli 500 000 erilaista variaatiota. Data-
analyysin myötä parantuneen sähköposti-
markkinoinnin poistumaluku on pienentynyt
20%.
CASE
VOLVO
–
TEHOT,
PALVELU
JA
TURVALLISUUS
YLÖS!
Auton
sensori.etoa
voidaan
hyödyntää
auton
eri
osien
tarkkailussa
tarkkailussa
ja
kehityksessä.
Mikäli
automalliin
vaihdetaan
esimerkiksi
sähköjärjestelmän
osa,
voidaan
seurata
minkälaisen
vaikutuksen
se
aiheu4aa
auton
moo4orille,
pol4oaineen
kulutukselle
tai
huoltotarpeille.
Tämä
au4aa
suunni4elemaan
auton
tulevat
huollot
paremmin
ja
tuo4aa
myös
tärkeää
.etoa
tuotekehitykselle
esimerkiksi
energiatehokkuuden
parantamiseksi.
Myös
varaosien
saatavuus
ja
varastoin.
on
tarkas.
op.moitavissa,
enää
ei
tarvitse
summamu.kassa
arvioida
osien
menekkiä
globaalilla
tasolla.
Volvo
hyödyntää
yli
100
.etoparametria
analysoivaa
ennakoivaa
huollon
järjestelmää
vähentääkseen
huoltoaikoja
ja
op.moidakseen
auton
kokonaistoimintaa.
Järjestelmää
hyödyntää
päivi4äin
työssään
jo
yli
500
asiantun.jaa
Volvolla.
“In
cases
of
proacIve
prevenIon
acIons,
QRAFT
allows
us
to
quickly
target
the
vehicles
concerned.
It
opImizes
the
cost
for
us
and
for
our
customers.”
Eric
Bélot,
Volvo,
Head
of
StaBsBcal
Analysis
of
Product
Quality
Data
for
EMEA
Volvo
on
analy.ikan
avulla
mukana
myös
liikenneturvallisuuden
parantamisessa.
EU-‐hankkeessa
80
Volvon
rekkaa,
jotka
ovat
käytössä
40-‐50
tun.a
viikossa,
keräävät
tonnei4ain
dataa.
Tes.jakson
aikana
nuo
80
rekkaa
keräävät
yli
70
000
000
mb
dataa,
jota
käytetään
liikenneturvallisuuden
parantamiseen.
IOT
(Internet
of
Things)
tuo
mukanaan
valtavat
datavirrat
erilaista
käy?ö-‐,
4lanne-‐
ja
poikkeama4etoa.
Raaka-‐aine?a
Big
Data
–sovelluksille.
Autoteollisuus
hyödyntää
jo
tänä
päivänä
IOT-‐kehityksen
ensimmäisiä
aaltoja.
Nykyisellä
kehitysvauhdilla
kaikki
uudet
henkilöautot
suoltavat
tehtaalle
ja
tuotekehitykselle
jatkuvaa,
hyödyllistä
datavirtaa
jo
parin
vuoden
kuluessa.
Autoteollisuudelle
tämä
mahdollistaa
täysin
uusia
palvelumahdollisuuksia
ja
kykyä
ymmärtää
käy4äjien
asiakaskokemusta.
Kanta-asiakkuus
SM Marketing Convergence tehostaa
asiakashankintaa, ehkäisee
asiakaspoistumaa, lisää
myyntimahdollisuuksia ja auttaa
ymmärtämään asiakkaita entistäkin
paremmin suurien tietoaineistojen
visualisoinnin avulla. Yrityksellä on
hallittavana noin 800 miljoonaa transaktiota
ja 10 miljoonaa kanta-asiakaskorttia
analysoitavana – kuin etsisi neulaa
heinäsuovasta. Big Data -tiedon
visualisointi auttaa ymmärtämään
asiakasryhmiä nopeammin ja paremmin.
Analyytikot toimivat tehostetusti, sillä heillä
on laadullisesti tehokkaampi keino lähestyä
isoa data aineistoa. Tämä auttaa heitä
ymmärtämään vaikuttavia tekijöitä eri
toimenpiteiden suunnittelussa ja
mittaamisessa. Kokonaisuudessaan
loppuasiakkaan kokemus on parempi ja
näin ollen auttaa toimimaan paremmin
kilpaillulla markkina-alueella.
Finanssi
Pitkän tiedolla johtamisen kulttuurin jatkumona finanssiala hyödyntää tehokkaasti eri
sovellusalueita Big Data -palvelualustoilla. Ne tekevät erilaisia riskiluokituksia ja ennusteita
lainasopimuksista sekä asiakkaistaan.. Toimialalla hyödynnetään myös väärinkäytösten (fraud)
sekä rahanpesun ehkäisyyn liittyviä sovelluksia, joissa analysoidaan lähes reaaliajassa valtavia
määriä yksityiskohtaista tapahtumatieto. Big Data -palvelualustoilla toimii myös sovelluksia
joissa muunnetaan esim. asiakaspalautteiden sekä sosiaalisen median tekstejä
rakenteettomasta tiedosta rakenteelliseksi tiedoksi, jota hyödynnetään tehokkaasti mm.
asiakaspoistuman hallinnassa.
Terveydenhuolto
Terveydenhuoltosektori on yksi suurimpia Big datan
hyödyntämisen alueita. Kymmenien miljoonien
tutkimusartikkeleiden ja potilaskertomusten
strukturoimatonta sisältöä analysoidaan erilaisten
hoitotoimenpiteiden ja resurssien optimoimiseksi ja
uusien hoitokeinojen löytämiseksi. Australiassa
tutkitaan parhaillaan löytyisikö big datan avulla
henkilökohtaisia hoitomalleja mm. lasten leukemiaan.
Maatalous
Maatalous on isojen datamäärien maisema. Samaan aikaan globaalit haasteet ruuan
riittävyydessä ovat valtavat. Big Data -analytiikalla on jo nyt saatu selkeitä hyötyjä: soijaviljelijät
saivat nopeasti 15%:n säästön siemenissä ja lannoiteaineissa. Muissa kasvilajeissa on saatu
esimerkiksi 16:n% sadon kasvu ja vähennetty veden käyttöä yli 50%. Analytiikan avulla on
hehtaarilta saatu lähes 500$:n lisätuotto.
Kaikille sektoreille
Big Datan hyödyntäminen on vasta alussa. Jokainen sektori tai toimiala voi löytää sen avulla
merkittäviä hyötyjä. Big Datasta ei pidä humaltua. Hyödyntäminen ja käyttö vaatii monenlaisia
kyvykkyyksiä. Oikeita työkaluja ja kumppanuuksia. Ja pitkäjänteisyyttä. Yksityisyyden suojaan
liittyvät turvamekanismit tulee olla kunnossa. Löydösten laatua tulee validoida jatkuvasti.
87
PROFESSORIA
VS.
BIG
DATA
Yksi
datan
hyödyntämiseen
merki?ävimmistä
osa-‐alueista
on
erilaiset
ennustemallit,
joita
voidaan
hyödyntää
kaikilla
sektoreilla.
Kevin
Quinn,
Harvardin
professori
kokosi
87
lakiprofessorin
ryhmän
ennustamaan
korkeimman
oikeuden
(Supreme
Court)
päätöksiä.
Professorit
olivat
alansa
huippuja,
tunsivat
pykälät,
tulkinnat,
argumen.t,
case-‐tradi.on
ja
historian.
Professorit
ryhtyivät
tuumasta
toimeen,
käy]vät
kaiken
asiantuntemuksensa
ja
laa.vat
ennusteet
eri
tapausten
lopputuloksista.
Toiseen
.imiin
Quinn
kokosi
Andrew
Mar.nin
kanssa
dataa
aikaisemmista
caseista
ja
he
loivat
ennustemallin.
He
keski4yivät
kuuteen
erilaiseen
muu4ujan.
Mallin
avulla
he
synny]vät
jokaiseen
caseen
lopputulosennusteen.
Aikanaan
kokoonnu]in
vertaleimaan
ennusteita
päätöksiä
vasten.
Lopputulos
oli
selvä.
Professorit
poistuvat
häntä
koipien
välissä
yliopiston
kuppilaan
poh.maan
tapahtunu4a.
Andrew
Mar.n
.ivis.
tapahtuneen:
”Whenever
sufficient
informaIon
can
be
quanIfied,
modern
staIsIcal
methods
will
outperform
an
individual
or
small
group
of
people
every
Ime.
Big
data
ei
kuitenkaan
ole
mikään
automaaXnen
ratkaisuja
suoltava
kone
vaan
taito-‐
ja
ymmärryslaji,
jossa
laaja-‐
alainen
ymmärrys
on
tarpeen
tulosten
tulkinnassa:
”1
out
of
20
instances
you
will
get
results
that
are
staIsIcally
significant
purely
by
chance.
So
you
have
to
remember
that.”
Willy
Zik,
Professor
of
management
prac.ce,
Harvard
Business
School
PS.
Lainvalvonnan
puolella
ennustavat
menetelmät
ovat
jo
tehokkaassa
käytössä:
Los
Angelesin
ja
Santa
Cruzin
poliisivoimat
käy4ävät
niitä
menestyksellä.
Käytön
tuloksena
alueilla,
jossa
ennustavaa
menetelmää
on
hyödynne4y
on
tapahtunut
murroissa
33%:n
vähentyminen,
21%
vähentyminen
väkivaltarikoksissa
ja
omaisuusrikokset
ovat
laskeneet
12%.
Ennustemallin
luomisessa
hyödynne]in
13
miljoonan
rikoksen
.etoja
80
vuoden
ajalta.
“A
li?le
knowledge
is
a
dangerous
thing.”
Albert
Einstein
Tekijät
Lähteet:
forbes.com,
cnbc.com,
sas.com,
bigdata-‐startups.com,
atkearney.com,
ny.mes.com,
techrepublic.com,
harvardmagazine.com,
Kuvat:
Pixhill
Jari
Perko,
tj,
ASML
jari@asml.fi
@asiakkuus
Jaakko
Virkki,
SAS
Ins.tute
Myyn.johtaja
jaakko.virkki@sas.com
@JaskaV