Urmet Lee: millist andme-Eestit me tahame?
Eesti e-riigi järgmiseks arenguhüppeks on vaja andmelaod üle vaadata ja kus vaja, seal korrastada. See on võtmeküsimus, et statistika tegemine saaks olla võimalikult kiire ja turvaline, kirjutab Urmet Lee Euroopa statistikapäeva puhul.
Et vastata küsimustele, kust otsida ning kuidas näha suuri asju, vaatame enne midagi väiksemat: andmeid. Andmed on imetillukesed, sageli silmale nähtamatud elektriimpulsid infosüsteemis või tähised paberil. Andmed on nii väikesed, et eesti keeles ei ole sel sõnal isegi ainsuse vormi. Kuid ometi on nad üheskoos võimsad, eriti siis, kui neid mõista ja valitseda.
Levinud ütluse kohaselt on andmed meie aja uus must kuld. Mida see tähendab? Seda "kulda" ei saa sulatada, sellest ei saa valmistada kütust, et tuba soojendada või elektrit toota.
92,4 protsenti Eesti leibkondadest, kel on kodune internetiühendus, võib andmeid lademetes olla. Kodus on kõvakettad täis faile ning ka sahtlid on täis pabereid, mis kõik sisaldavad andmeid, aga enamikku neist ei ole võimalik toidupoolise või puhkusereisi vastu vahetada. Sageli ei ole taolisel infol väärtust isegi andmete omaniku jaoks, sest kehtetu leping või aastatetagune tabel ei tähenda enam midagi.
Sel kujul on andmetega tegu pigem prahi või infomüraga, mis reostab meie keskkonda ning kui me ei tegele just mõne ajaloolise uuringuga, siis ka meie aju. Seega tuleb andmetega enne tööd teha, kui neist saab midagi väärtuslikku.
Statistikaametis on hoiul ca 130 miljardit andmeühikut (1 ühik = 1 lahter tabelis). See on aga kübe võrreldes andmehulgaga, mida Eesti e-riik on oma 30 aasta jooksul loonud. On see vara praht või väärtuslik tooraine?
Viimasel rahvaloendusel kogus statistikaamet lõviosa andmetest otse erinevatest registritest. Nii saime andmeteadust kasutades mitmed olulised näitajad välja arvutada, sidudes eri registritest pärit andmeid. Tänu registripõhisele rahvaloendusele ja kallile ukselt-uksele küsitluse ära jäämisele säästis riik miljoneid eurosid, mida saab nüüd suunata õpetajate palkadesse, kaitsekuludesse või toetustesse.
Registrite ning ligi 30 000 ettevõtte esitatud andmete abil saame statistika vahendusel aimu, kuidas kasvab või kahaneb Eesti majandus ning väliskaubandus. See on vaid põgus pilguheit statistikale ehk ühele andmete väärindamise võimalusele, kuid Eestis oleme harjunud suuremalt mõtlema. Nii peaksime käituma ka nüüd ja küsima, mis kõik võiks võimalik olla, kui oskaksime ning saaksime riigi andmevara veel targemalt kasutada?
Praegu on riigi andmemajapidamine kui laod, mille riiulid on täis purke ja pudeleid, kuid sildid on osaliselt jäänud neile panemata või pole sildilt võimalik välja lugeda, millised andmed on hoiule pandud.
Eesti e-riigi järgmiseks arenguhüppeks on seega vaja andmelaod üle vaadata ja kus vaja, seal korrastada. See on võtmeküsimus, et statistika tegemine saaks olla võimalikult kiire, samas turvaline. Seda tegemata ei jõua me ka tõhusate krattide ega tulemusliku masinõppeni, mis omakorda viiks kasuliku tehisintellektini.
Ka statistika tegemisel võib takerduda, kui tundub, et on lihtsam andmeid uuesti inimeselt või ettevõttelt küsida, selle asemel, et need juba olemasolevatest registritest üles otsida. Seetõttu plaanib statistikaamet kogu praeguse kümnendi pühendada andmete korrastamisele ning statistika tegemisele, kasutades peamiselt riigi, aga ka eraandmeomanike andmeid.
Uudne on just eraandmeomanike ja nende andmete mainimine. Esmapilgul võiks arvata, et selliste andmete osas ei tohiks riigil olla mingit huvi ega õigust nende kasutamisele. Tegelikult on siin peidus aga ainulaadne võimalus vastastikku andmeid lõimides luua väärtust nii avalike teenuste kujundamisel kui ka kõikvõimalike andmemajanduse teenuste loomiseks erasektoris.
Enne, kui hakata artikli autorit süüdistama "suure venna" loomise ambitsioonides, tuleb rõhutada, et Euroopa Liidus kuuluvad andmed eelkõige igale konkreetsele subjektile ja andmete kasutuseks peab olema äärmiselt mõjuv põhjus, mis tuleb kirja panna seadusesse.
Nii peame ka tulevases andme-Eestis leidma sobiva tasakaalupunkti eraisiku, ettevõtja ning ühiskonna huvide vahel. Selle tasakaalupunkti otsimine ei saa olla teisejärguline tegevus ka praegusel äreval ajal, pigem vastupidi.
Ümberringi toimuv peaks meid panema mõtlema, kas suudame kõigist olemasolevatest ja kasutatavatest andmetest võtta maksimumi selleks, et mõista muutusi meie ümber.
Mind ajendabki sõna võtma just vastutustunne kõigi eestimaalaste ees ja mure meie andmevaranduse kasutuse pärast. Tehes iga päev statistikat, saame statistikaametis suurepäraselt hakkama nii, et me ei näe ühegi inimese ega ettevõtte individuaalseid andmeid.
Suudame ka mitmest erinevast allikast pärit andmeid töödelda selliselt, et hiljem mõista, mis toimub meie rahvastiku, hindade, kaubanduse ja keskkonnaga. Me teame, et meie partneritel ministeeriumides on rohkelt ideid, kuidas andmeid kasutada, et luua uued kaasaegsed avalikud teenused, mis jõuaksid täpselt nendeni, kes neid vajavad.
Nii vähenevad kulud teenuste osutamiseks ning mis pikas perspektiivis eriti oluline, nende osutamiseks on vaja vähem tööjõudu, mida rahvastiku vähenedes meil kusagilt võtta ei oleks.
Pulbitseva andmemaailma keskel olles julgen kindlalt väita üht: nii nagu praktiline meel nõuab seda, et oleksime ühiselt läbi mõelnud, kuidas kindlustada meie toasoe ning toidujulgeolek, nõnda vajame ka ühist arusaama ja konkreetseid tegusid, et hoida ning kasvatada Eesti andmevara ja muuta see meie kõigi jaoks päriselt mustaks kullaks. Andmetele tuleb väärtus anda ning väärtuse loomisesse tuleb ka investeerida. Nüüd tulebki mõelda, kuidas seda teha.
Toimetaja: Kaupo Meiel