3. Valmisaineisto-konsepti
• Valmisaineistot ovat jatkuvasti ylläpidettäviä,
valmiiksi kuvattuja teemoittaisia kokonaisuuksia
yksikkötason kokonaisaineistoista.
• Keskeistä tietojen yhdisteltävyys. Aineistot
yhdistyvät yhdenmukaisesti suojatuilla tunnuksilla,
esim. yritys-, henkilö-, rakennus- tai asuntotunnus.
• Valmisaineistot saa käyttöön nopeasti. Tiedot
saadaan päivitettyä kaikille käyttäjille
yhtäaikaisesti.
• Käsittely tietoturvallisessa etäkäyttöympäristössä.
• Tulosten vertailtavuus ja toistettavuus on parempaa.
Pitkät aikasarjat säilyvät tallessa.
• Hinnoittelu on edullista ja ennalta määriteltyä.
20.9.2023 Tilastokeskus | satu.nurmi@stat.fi
3
FOLK
EDUC
INFRA
TAX
FIRM
5. Mikroaineistojen tutkimuskäytön alkuajat
• Yhteistyö tutkijoiden kanssa ollut keskeisessä roolissa alusta lähtien
• Tilastokeskuksen asiantuntijoiden rooli tärkeä aineistojen tuottamisessa, dokumentoinnissa ja tulkinnassa
• Henkilöaineistojen luovutuksia jo 1990-luvulla käyttötarkoitukseen räätälöityinä otoksina
• Yritysaineistot saatiin käyttöön 2000-luvun alussa tutkimuslaboratorion myötä Tilastokeskuksen tiloissa
• Ensimmäiset valmiiksi muodostetut tutkimusaineistot:
- EKSY-aineisto väestölaskennasta ja kuolemansyytiedoista
- Palapeli-aineisto (pariskunnat, lapset, perheet ja elinolot)
- Työssäkäyntitilaston ja väestölaskennan pitkittäistiedostot
- Työvoimapoliittisten toimenpiteiden vaikuttavuusaineisto
- FLEED yhdistetty työntekijä-työnantaja-aineisto
- Tilinpäätös- ja T&K-paneeliaineistot, yritystukitietokanta
• 2008−2010 Etäkäyttöjärjestelmän pystyttäminen ja tutkijapalveluiden keskittäminen
20.9.2023 Tilastokeskus | satu.nurmi@stat.fi
5
6. Kehitystä uudistusten ja yhteistyön kautta
Laki-
uudistukset
• 2013 Tilastolain
muutos
• 2023 uusittu laki
Tilastokeskuksesta
Organisaatio-
uudistukset
• Hyvä tutkijapalvelu
toimintastrategiaan
• Yhden luukun
periaate
• Uusi tiimirakenne
Projektityö
• Suomen Akatemian
tutkimusinfran
tiekartalle (FIRI)
• FMAS-kansallinen
tutkijapalvelu
• SITRA:n ISAACUS
• NORDMAN-hanke
Asiakasyhteistyö
• Yliopistot ja verkostot
• Rekisteriviranomais-
yhteistyö
• Lainatutkijat ja
tutkimusyhteistyö
20.9.2023 Tilastokeskus | satu.nurmi@stat.fi
6
7. Keskeiset lakimuutokset
• Tilastolain muutos 2013
• Lain tarkoitusta laajennettiin tilastotarkoituksen lisäksi koskemaan myös tietojen tutkimuskäyttö.
• Uutena tarkoituksena on edistää tilastotarkoituksia varten kerättyjen tietojen käyttöä tieteellisissä tutkimuksissa
ja yhteiskuntaoloja koskevissa tilastollisissa selvityksissä.
• Käyttölupamenettelyllä voidaan antaa käyttöoikeus tieteelliseen tutkimukseen ja tilastollisiin selvityksiin siten,
että suora tunnistaminen ei ole mahdollista. -> Siirtyminen anonymisoinnista pseudonymisointiin.
• Käyttöoikeus annetaan vain tutkimuksen kannalta tarpeellisiin tietoihin (tilastolaki, henkilötietolaki).
• EU:n tietosuoja-asetus GDPR 2018
• Tietojen minimointiperiaate vaikutti aineistomoduulien pilkkomiseen.
• Muutokset lakiin tilastokeskuksesta 1.3.2023
- Tutkija- ja aineistopalvelu Tilastokeskuksen tehtäväksi tilastotuotannon rinnalle. Muutos selkiyttää Tilastokeskuksen
tietosuojaoikeudellista roolia rekisterinpitäjänä ja henkilötietojen käsittelijänä tutkijapalvelun tarjoamisen eri
vaiheissa.
- Oikeus ottaa vastaan, käsitellä ja säilyttää aineistoja valmisaineistojen muodostamista varten.
- Tietoja tilastotarkoituksiin vastaanotetuista hallinnollista rekistereistä voidaan toimittaa perusteltuun tarpeeseen jo
ennen kuin tilasto on julkaistu.
20.9.2023 Tilastokeskus | satu.nurmi@stat.fi
7
8. Valmisaineistovalikoima laajenee
• FOLK-henkilömoduulit syntyvät projektityönä: perustietomoduuli ja ilmiöaluemoduulit käyttötarpeen mukaan
• Harmonisoitu palkkarakenneaineisto, josta on tehty selvityksiä ministeriöille
• Koulutustietoja saadaan käyttöön lainatutkijan avulla
• Yritysten kansainvälistymisestä ja omistajista tietoa tutkijoille
• Muiden organisaatioiden kanssa käydään valmisaineistoneuvotteluja: TEM, KEHA, TRAFICOM, TULLI, OPH,
YTL, LUKE
• TAIKA-tutkimusaineistokatalogin kehittäminen (taika.stat.fi)
20.9.2023 Tilastokeskus | satu.nurmi@stat.fi
8
FOLK Väestö
•Tulot
•Koulutus
•Perhe
•Tutkinnot
•Asuinliitot
•Työssäkäynti
•Jaksotiedot
EDUC Koulutus
•Oppilasvalinnat
•Opiskelijat
•Tutkinnot
FIRM Yritystoiminta
•Liikevaihto
•Talouden tunnusluvut
•Konkurssit
•Teollisuus-tuotanto
•Tutkimus ja
kehittäminen
•Kansainväliset
arvoketjut
FLOWN Omistajuus
•Osakkaiden tiedot
•Yhtiömiestiedot
•Osinkotiedot
SES Palkkarakenne
•Palkkarakennetiedot
•Harmonisoidut
palkkarakennetiedot
TAX Tulorekisteri
•Palkat ja muut tulot
•Eläkkeet ja muut
etuudet
INFRA Sijaintitiedot
• Asukkaat
rakennuksittain
Muiden organisaatioiden
tiedot
• Työnvälityspalvelutiedot
• Ulkomaankauppa
• Ajoneuvotiedot
• Ylioppilastutkintotiedot
12. Rekisterit käyttöön Datahuoneessa
• Datahuone
- Tehtävänä tuottaa valtioneuvostolle ja eri ministeriöille rekisteritietoja hyödyntäen nopeatempoista analyysiä
tietopohjaista päätöksentekoa varten.
- VATT:n yksikkönä toimiva Datahuone syntyi yhteistyössä Helsinki GSE:n ja Tilastokeskuksen kanssa aiempien korona-
ajan Talouden tilannehuone -kokemusten pohjalta.
- Datahuonepilotti kestää vuoden 2025 loppuun.
• Aineistot
- Tilannehuoneen avulla tutkimuskäyttöön saatiin mm. laaja tulorekisteriaineisto ja Datahuoneessa työtä kattavien
rekisteriaineistojen käyttöön saamiseksi jatketaan.
- Uusia ajantasaisempia aineistolähteitä on jo otettu käyttöön ml. väestön muutostiedot, sähkönkäyttötiedot, lomautus-,
ulosotto- ja kiinteistöverotustietoja. Tulossa mm. Koski-koulutustiedot ja rakentamisen tietoja.
- Aineistoja on tarkoitus koota valmisaineistoiksi valmisaineistokirjaston kehittämisen yhteydessä (VALMA-projekti).
• Infrastruktuuri
- Datahuoneen tarpeisiin tehdään rahoituksen puitteissa infrastruktuurikehittämistä, joka tulee hyödyttämään myös
muita tutkijoita mm. sujuvampien käyttölupa- ja aineistoprosessien kehittämisen kautta.
- Aineistotarpeiden erilaisuus ja erirytmisyys haastavat Datahuoneen aineistohankintaa suhteessa tilastotuotantoon.
20.9.2023 Tilastokeskus | satu.nurmi@stat.fi
12
14. Mahdollisia uusia valmisaineistoja
20.9.2023
14
Väestö
•Tulo- ja etuustiedot
•Rikos- ja oikeustiedot
•Velkatiedot
•Ulosottotiedot
•Vaalitiedot
•Väestön ennakkotiedot
Koulutus
•Arvosanatiedot
•Opiskelijavalinnat
•Varhaiskasvatus
•Korkeakoulujen hakurekisteri
Yritystoiminta
•Arvo-osuusrekisteri
•Micro Data Linking -yritystietokanta
(Pohjoismaat)
•Yritysjärjestelyt
•Arvonlisäpohjainen ulkomaankauppa
•Maatilarekisteri
Energia ja ympäristö
•Sähkön käyttö
•Kasvihuonekaasujen inventaario
•Teollisuuden energiankäyttö
Sijainti- ja rakennustiedot
•Rakennusluvat
•Kiinteistövero
•Kiinteistöjen kaupparekisteri
•Kiinteistörekisteri
•Osakehuoneistorekisteri
Muiden organisaatioiden tietoja
•Migrin oleskelulupatiedot
•Verohallinnon tiedot
•Puolustusvoimien PK-testit
•Suomen Pankin aineistot
•ORK:n aineistot
•KELA:n aineistot
Tilastokeskus | satu.nurmi@stat.fi
15. Tyytyväisyys aineistoihin
20.9.2023 Tilastokeskus | satu.nurmi@stat.fi
15
0 % 20 % 40 % 60 % 80 % 100 %
2022
Aineistojen hyödyllisyys 2023
2022
Valmisaineistojen kuvaukset 2023
2022
Valmisaineistovalikoiman laajuus ja sisältö 2023
erittäin hyvä melko hyvä kohtuullinen melko huono erittäin huono
2023: N = 303
2022: N = 311
EOS-vastaukset poistettu graafeilta