Talent Base: Tiedon standardisoinnin merkitys MDM hankkeelle
1. Tiedon standardisoinnin merkitys MDM
hankkeelle
Heimo Hänninen
Senior Consultant, Data modeling
Talent Base Oy, Finland
http://www.talentbase.fi
2. Sisältö
• AIHE: Standardointi pohjana älykkäälle päätöksenteolle
• MOTIVOINTI: Datan standardoinnin merkitys
• MITEN semantiikka liittyy datan standardointiin?
• CASET: Huonot ja Hyvät
• MITÄ on datan standardointi (MDM kontekstissa)?
• MITEN yhteinen kieli otetaan käyttöön
• YHTEENVETO
3. Eckerson, (2002) Mizuho Securities (2005)
Huonosta tiedon • Myyjä halusi myydä 1 osakkeen
laadusta aiheutuu USA:n 600,000 jenillä
yrityksille 600 miljardin • Myi 600,000 osaketta 1 jenillä
kulut vuodessa. • $347 miljoonan tappio
IBM (2005)
Dama Finland (2012)
30% of people’s time
Suomessa kulut tiedon is spent searching for
huonosta laadusta relevant information
arvioidaan olevan yli
10 miljardia vuodessa. 40% of IT budgets
may be spent on integration
7. Kuinka tehdään laadukasta dataa
• Virhetarkastus syötettäessä
• Syöte suoraan tietotokantaan – ei excel suhmurointia
• Tiedon luokitus käyttöön, joka määrittää:
– Validoinnin ja luotettavuustason
– Arvo/kustannus –indeksin
– Semanttisen jaottelun (mistä data kertoo, relevanssi)
• Käyttäjille suora kanava antaa palautetta:
– Hyödyllisyys
– Virheiden korjaus
• “Siivouspalvelu” osaksi prosesseja (hyödytön, vähän käytetty
sivummalle ja huono data pois)
8. Miten arvioida tiedon laatu?
Laadun mittaaminen ja arviointi perustuu aina sovittuun tietostandardiin
• Ajantasaisuus - Onko tieto ajan tasalla ja saatavissa oikeaan aikaan?
• Tietueiden yksilöllisyys- Kuinka monta tarpeetonta esiintymää
samasta tietueesta on?
• Täyttöaste - Kuinka suuri osa halutuista tiedoista on olemassa?
• Paikkansapitävyys - Kuinka oikeaa tietosisältö on? Kuinka hyvin se
vastaa todellisuutta?
• Muodon oikeellisuus - Onko tieto oikeassa muodossa?
• Yhdenmukaisuus - Onko tieto yhdenmukaista eri järjestelmissä
• Eheys - Ovatko viittaukset tietojen välillä oikein kaikissa
järjestelmissä?
• Kattavuus - Kuinka hyvin olemassa oleva tieto kattaa valitun alueen?
9. Informaationhallinta haastaa sinut
More than 60% of CEOs Only one-third of CFOs
believe their business needs to believe that the information is
access and understand information easy to use, tailored, cost-
faster to make swift decisions effective or integrated
Transactions
Employees
Customers
85% of information 30–50% of design time is
is unstructured Products Partners copy management
Databases
Organizations
17% of IT budgets E-mails
Financials
Web 30% of people’s time is
for storage hardware content
spent searching for
and storage management Documents relevant information
software and people
Reports Media
40% of IT budgets 37% growth of disk storage in
may be spent on integration 2005
Source: IBM
10. Faktapohjainen päätöksenteko
Päätöksenteko
Tietämys
Konseptuaalinen
Tietoarkkitehtuurin
tasot
Looginen
Konkreettinen
Data
Opiskele lisää TalentBase.fi Blogi: Binding Information Layers to Strategy
11. Olio - Data - Informaatio - Tietämys
• Todellinen olio/asia
– Fyysinen tai abstrakti olio, olemassa vaikka siitä kertova data tuhotaan
– Oliolla on ominaisuuksia (faktat, piirteet)
• Data
– Tallennetut faktat maailmasta
– On olemassa, vaikka siitä tehty informaatio tuhotaan
• Informaatio
– Tallennettua ja usein prosessoitua Dataa
– Tehty datan välittämiseksi jossakin kontekstissa johonkin tarpeeseen
• Tietämys
– Kaikki mitä me tiedämme, tulkinta maailmasta kaikilla aisteilla
– Muodostuu datan, Informaation ja vanhan tietämyksen pohjalta
– Jonka avulla teemme päätöksiä
– Aina henkilökohtaista (kokemukset, odotukset, pelot, uskomusjärjestelmä, tilanne)
12. Älykäs organisaatio – tiedon tasot
Ihminen Organisaatio
Päätökset Isoin alennus
• Tietämys, oppiminen
Ostan sopivat
parhaimmalle
• Bisnes konteksti varusteet Pekalle asiakkaalle
Tietämys-integraatio
sää
Kommunikointi- varuste tarve
pelaaja asiakas
kyvykkyys myynti
• Konseptit peli
kanava T&K
• Entiteetti, relaatio, attr. kenttä sijainti
tuote
Teot tuotanto materiaalit
Informaatio Pelaajat
Data-integraatio
FC Honka:
• Kooste tarpeeseen
Pekka: 140 cm
• Yhteiset termit, data CRM
40kg, puolustaja CMS
Kenkä: 39
ERP
Olen PDM ERP intra
Tosimaailma
• Aidot oliot Pekka 140 cm
• Faktat
13. Standardoinnin tasot
Abstraktiotaso &
Semantiikan määrä
• Liiketoiminnan ontologia Ymmärrämme
• Domain-malli käyttötarkoituksen.
• Objekti-malli Miksi tämä data?
• IA & bisnes entiteetit
Ymmärrämme
• MDM avaintiedot sisällön ja hallinnan.
• Tietomallit (rakenne)
Mitä , kuka jne.?
• Taksonomiat
• Referenssisanastot
Määritämme
• Tietotyyppi (formaatti) sisällön tarkasti.
• Tallennusmuoto,-paikka Missä,miten jne.?
Datan määrä
14. Maailma – maailmankuva - tietomalli
Ihminen
@nimi
@pituus
Pelaaja
@paino
@sukupuoli
Aito olio Konseptuaalinen Datamalli (looginen)
@pelinumero
-kaikki piirteet kuvaus -luokka
-kaikki ominaisuudet -olennaiset piirteet -keskeiset attribuutit
-ympäristössä -valitut ominaisuudet -tietotyypit @rooli
-rajattu konteksti
15. Miten data standardoidaan
Ihminen
@Pituus
Henkilön pituus
X 140 cm • Yksikkö: cm (SI)
• Formaatti: INT [000]
• Omistajuus: kouluterveydenhoitaja
• Sääntö:
– Mitataan vuosittain kantapäästä
päälakeen, siten että seistään seinää
vasten kasvot/katse sunnattuna
suoraa eteenpäin (horisontaalisesti)
16. Haasteita – konseptien (termien)
tulkinta eri kontekstissa
• Heimo sanoi Eerolle: “osta kahvi ja viineri”
•...Mitä Kalev olisi ostanut?
Diagrammi: Conceptual Spaces: The Geometry of Thought by Peter Gärdenfors
17. Mitä on semantiikka?
• Pitäisi vastata kohteesta:
– Mitä ovat tarkoitukset (ontologiset kysymykset)
– Mikä on kielellisten ilmaisujen ja niiden tarkoitusten suhde
(semantiikan kysymykset)
– Kuinka em. suhteiden kytkennät voi oppia (oppimisen kysymykset)
– Kuinka kommunikoimme tarkoituksia (kommunikoinnin kysymykset)
• Konseptuaalinen (alias kognitiivinen) lähestymistapa:
– Kielellisten ilmaisujen tarkoitukset ovat mielikuva entiteettejä –
kognitiivisia rakenteita kielen käyttäjän päässä.
– Kieli itsessään on osa kognitiivista rakennetta – ei irrallinen tai
riippumaton itse maailman kuvausta Lähde: Conceptual Spaces: The Geometry of
Thought by Peter Gärdenfors
• Kieli edustaa konseptia, ei maailmaa!
19. Eteneminen
tarve
asiakas
huolto myynti
kanava T&K
sijainti
tuote
materiaalit
tuotanto
20. Yhteinen kieli organisaatiolle
Talous-
hallinto
Myynti /
Tuotanto Asiakas-
palvelu
ASIAKAS
(B2B tai
B2C)
Markki-
Huolto
nointi
Logistiikka
21. Muistilista 1/2:
Kuinka päästä liikkeelle standardoinnissa
1. Valitse aihealue (esim. asiakastieto) jonka datan
standardointi tuottaa eniten arvoa tai on houkuttelevin (ei
välttämättä monimutkaisin)
2. Identifioi avainhenkilöt eri prosessialueilta, sitouta ja myy
idea standardoinnin tärkeydestä. Perusta hallintafoorumi
(tehtävä on luoda standardi!)
3. Käy lävitse per prosessialue (myös avain IT järjestelmät)
1. mitkä ovat tärkeimmät informaatiot,
2. mikä on datan nykytila (ui datassa!)
4. Vedä yhteen tulokset, muodosta yhteinen käsitys mitä
esim. tuote tarkoittaa yritykselle (ontologia, looginen malli &
yhteinen kieli) ja mitkä ovat sen avaintiedot (attribuutit)
22. Muistilista 2/2:
Kuinka päästä liikkeelle standardoinnissa
5. Määrittele tarkemman tason metatiedot per attribuutti
– (esim. yhteinen nimi, merkitys, mittayksiköt, omistajuudet,
lähteet, luottamuksellisuusasteikko jne.) ja
– dokumentoi riittävällä tarkkuudella.
– Hyödynnä parhaat käytännöt ja olemassa olevat standardit
(esim. toimialakohtaiset, ulkoiset lähteet)
6. Hyväksytä hallintafoorumissa ja aloita jalkautus
(Kommunikaatio! Mandaatti!)
7. Ylläpidä standardia tarvittessa & laadi mittaristot laadun
mittaamiseksi
23. Datan standardointi
• Liiketoimintalähtöistä (termit, synonyymit, tarpeet)
• Tietotyypit ihmisille ymmärrettäviä ja yksikäsitteisiä
• Tasot: Konseptuaalinen Looginen Konkreettinen
• Huomioi liiketoiminnan ja datan elinkaari
• Hallinta:
– luotaessa, jalkautettaessa, muutostilanteissa
– Vaatii tiedon omistajuutta organisaatiossa
24. Haluatko tietää lisää?
http://www.talentbase.fi
heimohanninen, heimo.hanninen@talentbase.fi