Kaido Paabusk: andmete taaskasutus ei toimi piisavalt hästi

Andmete taaskasutus era- ja avaliku sektori vahel ei toimi Eestis piisavalt hästi. Seda pärsib turvaliste lahenduste puudumine andmete jagamiseks ja tühimik ühiskondlikus debatis, et leida lahendusi. Me vajame arutelu selle üle, milliseid kompromisse on ettevõtted ja inimesed valmis enda andmete jagamisel tegema, kirjutab Kaido Paabusk.
Eelmise aasta lõpus tuli IT-ettevõtja Taavi Kotka Õhtulehele antud usutluses välja mõttega, et ettevõtete halduskoormuse vähendamiseks aruannete esitamisel võiks Eesti riik kasutada palju ulatuslikumalt kommertspankadel olevaid andmeid. Tema hinnangul pole tegu kaugeltki uue mõttega, sest maksu- ja tolliamet kasutab juba aastaid seda tüüpi andmeid ning maksumaksjad on andmete automaatse liikumisega sedavõrd harjunud, et ei pane seda enam tähelegi.
Midagi uut pole selles üleskutses ka statistikaameti jaoks. Sageli ja õigustatult küsivad ettevõtjad, miks me ikka veel saadame neile koormavaid küsimustikke ja miks me ei võta ettevõtete majandustegevust puudutavaid andmeid ettevõtete pangakontodelt. On ju pankadel need andmed kõik olemas.
Tehnoloogilises ja metodoloogilises võtmes oleks vastus ettevõtjatele lihtne: statistikaamet võtaks sellised andmed avasüli vastu ja nii vähendaksime väga suurel määral andmete kogumisel ettevõtjatele tekkivat halduskoormust. Küll aga pole küsimus üksnes tehnoloogias või statistikaameti vananenud metoodikates.
Kuivõrd oleme valmis eraandmeid jagama?
Probleemi tuum peitub seadusandluses ja selle lahendamine vajab ühiskonna panust ja nõusolekut. Praegu kehtiv seadusandlus peegeldab Eesti inimeste valmisolekut riigiga andmete jagamiseks ja see peegeldus ütleb, et valmisolek ei ole kuigi suur.
Ehkki riikliku statistika seadus annab statistikaametile üsna laiad volitused erinevat tüüpi andmete kasutamiseks ning paneb ettevõtetele isegi kohustuse vajalikud andmed ametile esitada, on olukord märksa mitmetahulisem.
Näiteks "trumpavad" mitmed majandusvaldkonda reguleerivad eriseadused statistikaseaduse lihtsalt üle. See tähendab muu hulgas, et näiteks elektroonilise side seadus piirab statistikaametil kasutamast sideandmeid ja krediidiasutuste seadus keelab ligipääsu pangaandmetele.
Statistikaamet tegi paar aastat tagasi ettepaneku krediidiasutuste seaduse muutmiseks nii, et amet saaks ligipääsu pangasaladusega kaetud andmetele. Me soovisime neile andmetele pääseda ligi selleks, et eeltäita leibkonna eelarve uuringuvormi pankadel oleva infoga. Meie soov oli, et inimesed ei peaks enda pangakaardiga tehtud ostude infot käsitsi sisestama, kuna see oleks vägagi aeganõudev ja tõenäoliselt ka ebatäpne. Leibkonna uuringu ebatäpsed tulemused võivad omakorda tähendada moonutusi tarbijahinnaindeksi ja sisemajanduse koguprodukti arvutamises.
Meie taotlusele seisid vastu mitmed avaliku sektori asutused ning ka pangaliit. Peamine tõke oli pangasaladus, millele ligipääs ongi arusaadavatel põhjustel väga piiratud. Nägime, et vastuseis on põhimõtteline. Seetõttu oleme olnud ettevaatlikud ka neis valdkondades, kus andmetele ligipääsu piiravaid eriseadusi pole ning kus me justkui võiks eravalduses olevaid ehk eraandmeid ettevõtetelt statistikaseaduse aluse välja nõuda, otsustanud seda teed mitte minna. See on põhimõtteline usalduse küsimus.
Kuivõrd on inimesed ja ettevõtted nõus andma ligipääsu eraandmetele, et ülejäänud ühiskonda ja ettevõtteid vähem koormata? See tuleb selgeks vaielda.
Statistikaamet inimeste eraandmeid välja ei anna
Erinevalt teistest riigiasutustest kehtib statistikaametile üheselt mõistetav andmete konfidentsiaalsuse nõue, mis lubab andmeid ametist välja anda ainult nii, et üksikisikud pole tuvastatavad. Avaliku sektori asutuste seas on statistikaametil seega väga eriline positsioon: me kasutame ise ligi 500 andmekogu andmeid, aga anname neid välja (sh teistele riigiasutustele) vaid agregeeritud kujul, kus pole võimalik viia kokku üksikisikut ja tema andmeid.
Nii me teame näiteks oma andmebaase ja metoodikaid kasutades, et rahvastikuregistris märgitud elukohad ei vasta alati neile, kus inimesed tegelikult elavad, aga me ei saa rahvastikuregistri pidajale öelda, kelle andmed täpselt valed on. Parimal juhul saame välja anda suhtarve, mis näitavad, millistes omavalitsustes ja millisel määral registri andmed meie omadega ei klapi.
Vaatamata meie väga rangetele konfidentsiaalsusnõuetele on eraandmete valdajad väga ettevaatlikud oma andmete jagamisega. Ja me oleme pidanud selle ettevaatlikkusega seni leppima, ehkki sellel on olnud kõrge hind nii ühiskonnale kui ka statistika kvaliteedi tagamisele.
Peame otsima võimalusi inimeste andmete turvaliseks kasutamiseks
Me ei taha me leppida liigse halduskoormuse tekitamisega Eesti ettevõtjatele, kelle andmete najal avaldame ühiskonna toimimiseks hädavajalikke näitajaid, seal hulgas juba mainitud sisemajanduse koguprodukti.
Õnneks võib eraandmete puhul hakata olukorda muutma tehnoloogiline areng ja seda mitte ainult statistikaameti jaoks. Üha enam räägitakse privaatsust tagavatest tehnoloogiatest (inglise keeles privacy enhancing technologies ehk PET). Need võimaldavad tundlikke andmeid erinevate osapoolte vahel töödelda sel viisil, et teine teise poole andmeid ei näe.
Sarnasel kujul töötab meie e-valimiste süsteem, mille puhul teame küll erinevates lõigetes, milliste kandidaatide poolt hääletati, aga pole võimalik kokku viia, kes kelle poolt hääletas. PET-i kasutades ei näe statistikud, kelle andmetega tegu on, ja seda ei olegi vaja isikustatud kujul teada.
Olgu öeldud, et praegugi ei näe statistikaameti analüütikud, kelle andmeid nad analüüsivad, kuna andmed jõuavad analüütikuni pseudonümiseeritud kujul. PET-ide abil saaks erinevate osapoolte andmeid jagada aga veelgi turvalisemalt.
Privaatsust tagava tehnoloogia katsetamiseks taotles statistikaamet hiljuti rahastust riigikantselei innovatsioonimeetmest ja taotlus sai otsustajate tugeva toetuse. Projekti raames hakkame katsetama, kuidas aitaksid eraandmed tagada paremat teehoidu ja täpsemat ning mugavamat ühistransporti.
Otsime avaliku ja erasektori koostöös lahendusi, kuidas erinevat liiki andmeid kasutusele võtta, privaatsust sealjuures riivatama. Aga otsida tuleb veelgi enam, sest andmevahetuse juriidiliste takistustega puutuvad iga päev kokku ilmselt pea kõik avaliku sektori asutused ja kardetavasti ka paljud eraettevõtted.
Eesti avaandmete ehk kõigile tasuta kättesaadavate avalike andmete valdkonna majanduslikuks mõjuks on hinnatud ligikaudu 400 miljonit eurot aastas. Peagi valmiva digiühiskonna arengukava järgi oleks senisest parema andmete taaskasutamise kaudu võimalik selle valdkonna väärtust mitmekordistada. See on raha, mis on hinnanguliselt võimalik teenida andmete targa ja turvalise taaskasutamise kaudu. Maksumaksjad ja riik tervikuna kaotavad sellest potentsiaalsest rahahulgast suure osa, kui andmejagamisega seotud probleemidele lahendust ei leita. See kaotus oleks meile liiga kallis.
Statistikaameti huvi on kasutada rohkem erasektori ja eraisikute andmeid, et pakkuda parimat võimalikku statistikat ja hoida sealjuures kokku Eesti ettevõtjate ja elanike aega ning raha. Me vajame tõhusamat andmemajandust, mis eeldab märksa tihedamat era- ja avaliku sektori andmete taaskasutamist.
Seetõttu kutsun ühiskonda arutama, milliseid kompromisse oleme valmis enda andmete jagamisel tegema, et ühiskondlik kasu andmete taaskasutamisest oleks suurim. Me ei oska ega ei saa neile küsimustele üksi vastata.
Toimetaja: Kaupo Meiel