Innofactorin Blogi

Tiedon näkyvyyden hallinta

Kirjoittanut Sakari Pitkäsalo | 23.9.2022

Pseudonymisointi ja anonymisointi kuulostavat varsin puisevilta käsitteiltä, mutta kyse on IT:n ja liiketoiminnan yhdestä tärkeimmästä kulmakivestä.

Niin kauan kuin on ollut tiedon tallennusmenetelmiä – esimerkkinä normaali kirjoitus – on tarvittu tiedon suojaamista. Kaikkea teksti-informaatiota ei ole haluttu pitää kaikille avoimena, eikä se voi sitä olla. Ennen riitti, kun piti tärkeät dokumentit firman kassakaapissa ja käytti tuloslaskelmakaavassa outoja termejä. Digitalisoituneessa maailmassa tieto on kultaa, eikä omaan poteroon linnoittautuminen ei enää valitettavasti toimi.

Keväällä 2018 Euroopan Unionissa määrättiin yhteinen GDPR-tietosuoja-asetus, jonka tavoitteena oli yhtenäistää tietosuojaa koskeva lainsäädäntö EU:ssa. Asetus velvoittaa kaikkia rekisterinpitäjiä. Asetuksen voimaan astumisen jälkeen ammattitaitomme informaation hallinnan alalla on osoittautunut arvokkaaksi voimavaraksi useissa eri tilanteissa.

Pseudonymisoinnin ja anonymisoinnin avulla voidaan hallinta tiedon näkyvyyttä

Organisaatioiden tietokannoista vastaavien DBA-henkilöiden tai tietojärjestelmien kehittäjien ja testaajien pitää pystyä työskentelemään tietokantojen ja tietokantataulujen kanssa niin, että tietokannan tai rekisterin henkilötunnustieto (HETU) tai mikään muukaan tieto ei johda oikeaan luonnolliseen henkilöön.

Samalla esimerkiksi rekisterissä tai kannassa olevan HETUn pitää kuitenkin täyttää sille asetettu muodollinen vaatimus. Sama koskee myös esimerkiksi pankkitilinumeroa tai laskun viitenumeroa. Henkilön tunnistamisen tai maksatuksen tarkistuslaskentojen pitää tietojärjestelmissä mennä oikein, mutta yhtiön sisällä tiedot pitää pystyä pseudonomisoimaan tai suojaamaan muilla keinoin. Näissä tapauksissa minkään tunnisteen kautta ei siis saa löytyä yksilöityä henkilöä, mutta samalla on kuitenkin huolehdittava, että yhteys voidaan palauttaa tarkasti määritellyille tahoille.

Jos henkilötiedon tai muun vastaavan tiedon salaus pitää pystyä purkamaan, puhutaan pseudonymisoinnista. Jos taas pakittamisen tarvetta ei ole, kyseessä on anonymisointi. Se on puolestaan mahdollista tapauksesta riippuen toteuttaa pseudonymisoidusta datasta suoraan hävittämällä tietojen yhteydessä säilytettävät pseudonymisointiin liittyvät aputaulut ja algoritmit. Anonymisoituja tietoja käytetään pääasiassa yleisiin tilastoihin, mistä jo ennen GDPR:ää on Suomessa määrännyt henkilörekisterilaki.

Kun mukaan otetaan ajallinen ulottuvuus, puhutaan tiedon elinkaaren hallinsta. Vielä noin kymmenen vuotta sitten, kun palvelinten ja tietojärjestelmien kapasiteetti oli kortilla, tietojen passivoinnille oli tarvetta suorituskyvyn takia. Tätä nykyä tarve tietojen säilytykselle ja passivoinnille kumpuaa pääasiassa lakien ja asetusten velvoittavuudesta.

GDPR-maailmassa organisaatioiden olisi kuitenkin syytä miettiä, kauanko järjestelmissä olevia tietoja voidaan säilyttää ja miten suojauksesta huolehditaan. Kun henkilötietoja jossain vaiheessa poistetaan, niin poistettavasta informaatiosta ei saa edes putsausvaiheessakaan löytyä suoraan henkilöön viittaavaa tietoa. On hyvä miettiä, ovatko myös ennen GDPR-aikaa hankitut tiedot lainmukaisia.

Minkälaista tekniikkaa tarvitaan?

Tietokantateknologiat mahdollistava pseudonymisoinnin tai anonymisoinnin kryptausfunktioiden muodossa. Datan kryptaus voidaan tehdä siten, että suojattu tieto on avattavissa dekryptauksella (suojattu sertifikaatilla). Dekryptauksella käyttäjät (esim. datan analysoija) saavat käyttöönsä oikeaa dataa.  Samassa yhteydessä huolehditaan myös käyttäjien normaalista sisäänkirjautumisen pääsynhallinnasta (kuka pääsee tietokantaan) sekä tietojen luottamuksellisuudesta (NDA).

Kun tekniikka on kunnossa, on turvallista käyttää ja hyödyntää myös ulkopuolisia toimijoita. Esimerkiksi kuka tahansa tietokantaan pääsevä voi tehdä ”temppunsa”, mutta ei näe datasisältöä. Datan maskaus on tässä yhteydessä usein käytetty termi, joka tarkoittaa käytännössä samaa asiaa eli esimerkiksi kryptausfunktion läpi menevää dataa.

Haasteita aiheuttaa tilanne, jossa kryptattavan kentän arvoa käytetään vierasavaimena tietokannan taulujen välillä. Tässä yhteydessä pitää huolehtia siitä, että datan oikeellisuus säilyy, kun lähdetaulun kentän arvoa käytetään jonkun järjestelmän toimesta. Esimerkkeinä voidaan mainita tilinumero, sen tarkistussummat, postinumero, paikkakunta, maakunta tai sähköpostiosoite. Tässä tarvitaan hyvää järjestelmän ja myös käytettävän teknologian tuntemusta.

Innofactorilla on kattavaa kokemusta informaation hallinnasta

Innofactorilla on pitkä kokemus informaation hallinnasta sekä monista eri tietokantatuotteista ja ETL-prosessien hallinnasta. Olemme toteuttaneet pseudonymisoinnin ja anonymisoinnin hankkeita.  Tiedämme käytännön kautta monia tietosuojaan liittyvä ongelmia ja tunnistamme hankaluudet, jotka voivat aiheuttaa laajojakin muutoksia datan hallinnassa.

Tässä pätee sama kuin kaikissa auditoinneissa tai vaikkapa yrityksen verotarkastuksessa. On parempi olla proaktiivisesti tietoinen mahdollisista omista puutteista tietoturvassa ja valmiudessa toimimaan oikein. Sääntö ”On helpompi pyytää anteeksi kuin lupa”, ei toimi henkilötietojen käsittelyn yhteydessä.

Kaikkea ei tarvitse eikä pystykään tekemään kerralla. Tämänkin alueen tehtävät voidaan palastella ja laitetaan porras kerrallaan rekisterisi kuntoon.


Voit tutustua dataan ja tiedon hallintaan liittyviin palveluihin tarkemmin verkkosivuillamme ja tarvittaessa ottaa yhteyttä asiantuntijaamme!