"Pealtnägija" vahendusel jõudis avalikkuse ette lugu ehitisregistris kättesaadavatest andmetest , mis kohati ulatusid kodude sisevaadete ja tundlike asutuste tehnovõrkude joonisteni. Probleem on laiem ja ulatub julgeolekusfääri, kirjutab Sten Tikerpe.

Eesti ametkonnad on aastaid teinud tööd selle nimel, et avaliku sektori käsutuses olevate andmete avalikustamise hulga ja kvaliteedi poolest Euroopa tippu jõuda ja seal püsida. See pingutus on ka tulemusi toonud, Eesti on 2024. aasta raporti "Open Data Maturity Report" andmete kohaselt avaandmete poliitika poolest Euroopa tipus. Praeguse seisuga on avaandmete portaalis avaldatud tervelt 5697 andmestikku.

Mis on avaandmed?

Laiemale avalikkusele ei ole ilmselt hoobilt selge, millega on tegemist, kui jutt käib avaandmetest. Need on andmed, mis on avaliku sektori tegevuse käigus ehk avalikke ülesandeid täites tekkinud ja dokumenteeritud ning millel puudub juurdepääsupiirang. Seadus näeb ette, et avaandmed tuleb teha kogu üldsusele kättesaadavaks, üldjuhul tingimusteta ning kui võimalik, siis ka masinloetaval kujul.

Regulatsiooni eesmärk on üllas, soodustada innovatsiooni kasvu ja levikut nii avalikus kui ka erasektoris, iseäranis ettevõtluses ja teadustöös. Avaandmete abil on tõepoolest võimalik arendada nutikaid rakendusi, nende abil saavad sündida uued ärimudelid ja rakendused, erinevad statistilised ja analüütilised tööriistad. Need andmed sisaldavad kõikvõimalikku statistikat ja ülevaateid: alates liiklusinfost kuni äriregistri andmete ja tiheasustusalade ülevaadeteni.

Kui kehtib ütlus, et andmed on "uus nafta", siis on ühelt poolelt ka avaandmete majanduslik potentsiaal ja väärtus ühiskonnale vaieldamatu, seda nii äriliselt kui ka avaliku sektori läbipaistvuse tagamiseks. Teiselt poolelt tõusetub andmete hulgiavalikustamise kontekstis aga küsimus, kas rahvusvahelistes edetabelites kõrgeid kohti jahtides suudavad asutused piisavalt hinnata riske, mis masinloetavate andmestike avalikustamisega kaasnevad, eriti kui võimalused tohutute andmehulkade töötlemiseks ja kombineerimiseks on kättesaadavad igaühele.

Avaandmed ja julgeolek

"Pealtnägijas" näidati ilmekalt, et praktiliselt kogu riigi käsutuses oleva teabe üldsusele kättesaadavaks tegemisel on oma varjuküljed. Kui suvaline isik võib mingist riiklikust infosüsteemist näha infot sellise üksikasjalikkuseni, et millist hambapastat mõni valitsuse liige kasutab, siis ilmselt ei pea väga pikalt diskuteerima, et see on probleem.

Tähelepanu väärib seegi, et kui hiljuti "tule alla" sattunud ehitisregister nõuab teatud dokumentide allalaadimiseks vähemasti autentimist, siis suurt osa avaandmetest on võimalik alla laadida ilma igasugust isikutuvastust läbimata ja konkreetse isikuga kokkuviidavat infotehnoloogilist jälge jätmata.

Eelnevast ei järeldu veel siiski, et avaandmete avalikustamise puhul oleks tegemist täiesti kontrollimatu julgeolekuauguga. Nii Euroopa Liidu seadusandja, kelle sulest avaandmete avalikustamise kohustus pärineb, kui ka Eesti õiguslooja on avalikustamisele näinud ette teatud erandid, mis peaksid tagama, et üllal eesmärgil loodud nõudest rohkem kurja ei sünniks kui kasu.

Nii näeb ka meie seadus selgelt ette, et avaandmete avalikustamisel tuleb tagada "isiku eraelu puutumatus, autoriõiguste kaitse, riigi julgeoleku kaitse, ärisaladuse ja muu juurdepääsupiiranguga teabe kaitse".

Igal asutusel tuleb enne andmete avalikustamist hinnata teabe kasutamisele piirangute kehtestamise vajadust. Küsitav on aga see, kas ja kui süsteemselt seda nõuet praktikas tegelikult suudetakse rakendada ning kas need riskihinnangud arvestavad tänapäevase andmetöötluse võimekusega.

Andmete kombineerimine loob uue konteksti

Tehisintellekti ajastul võib mõni konkreetne andmestik, mis üksi vaadates tundub julgeoleku seisukohalt tõepoolest mittemidagiütlev, koos mõne teise andmestikuga kombineerituna asetuda hoopis teise konteksti.

Näiteks ei ole ilmselt üksi vaadates eriti murettekitav see, et avalikkusele on kättesaadav ülevaade kõigist tuletõrje veevõtukohtadest ja hüdrantidest (sh nende paiknemine, tüüp, number ja seisukord). Kui aga arvestada, et samal ajal on kättesaadav ka andmestik "suurõnnetuse ohuga ja ohtlikud ettevõtted", mis annab ülevaate vastavate ettevõtete paiknemisest, ohualadest (sh ohtliku ala suurus, ohuallika koordinaadid, doominoefekti võimalikkus, peamine ohu tüüp jms), võib sellise kombineeritud andmestiku riskihinnang olla juba hoopis midagi muud.

Samasuguseid mõttekäike võib arendada teistegi andmestike puhul, mille kõigist detailides avalikult rääkida ei oleks ilmselt hea mõte. Kombineerides omavahel juba kahte või veelgi enam, viit–kuut andmestikku ning liites neile omakorda muud, näiteks ehitisregistrist vabalt kättesaadavad, tehnosüsteeme puudutavad andmed, tõuseb küsimus iga üksiku andmestiku kohta (loodetavasti) koostatud riskipildi adekvaatsusest vägagi teravalt esile.

Jättes kõrvale kõikvõimalikud üksikisiku või ettevõtja vastu suunatud pettusekatsed, on kombineeritud teave halvimal juhul kasutatav erinevate sabotaaži- ja ründestsenaariumite läbimängimiseks ning maksimaalse kahjuliku mõju modelleerimiseks.

Kas avaandmete ajastu on läbi?

Avaandmete ajastu ei ole ilmselt läbi, kuna avaliku sektori läbipaistvus on üks meie ühiskonnakorralduse alustalasid. Samuti võib üsna julgelt öelda, et suurem osa avalikustatud andmetest ei ole mitte kuidagi ohtlikud.

"Küsimus ei ole ainult andmete kättesaadavuses kui sellises, vaid selles, kui lihtsalt ja kiirelt ning millisel viisil me seda ligipääsu riigina võimaldame."

Siiski peab vähemalt igaühele ja masinloetavalt andmestike avalikustamine praeguses julgeolekureaalsuses kindlasti läbima praegusega võrreldes täiendava, mõtestatud kontrollifiltri. Me ei saa endale lubada naiivsust või argumenti, et "pahategijale oleks see info ju niikuinii kättesaadav", kui tal ainult oleks viitsimist teatud kohad ise läbi käia. Küsimus ei ole ainult andmete kättesaadavuses kui sellises, vaid selles, kui lihtsalt ja kiirelt ning millisel viisil me seda ligipääsu riigina võimaldame.

"Pealtnägija" saates küsiti kapo peadirektori asetäitjalt Mari-Liis Torilt, kui tõenäoliseks ta peab, et pahatahtlikud eriteenistused on avalike registrite kaudu endale huvipakkuvat teavet kogunud. Vastuseks kõlas, et kuna see on kõige odavam viis teabe kogumiseks, on selline tõenäosus väga suur. Ilmselt peab julgeolekuasutuse kõrge ametnik alati hoolikalt sõnu valima, kuid ma oleksin üllatunud, kui suletud uste taga ei räägitaks tegelikult mitte tõenäosusest, vaid pigem praktiliselt tõsikindlusest.

Kokkuvõtvalt peaks andmete avalikustamisel Eesti järgmine väljakutse seisnema selles, kuidas hinnata süsteemselt erinevate andmestike avalikustamise tegelikku mõju olulistele väärtustele, mida tuleb kaitsta, nende seas juba kõlapinda saanud eraelu puutumatusele, kuid ka laiemalt julgeolekule.

Seda ei saa teha andmestikke üksnes eraldi hinnates, vaid tervikvaates, arvestades andmete ristkasutatavust ja nende kombineerimise võimalikke tulemusi. See eeldab praegusest oluliselt tihedamat riigiasutuste andmetiimide koostööd ja strateegilist mõtlemist. Küllap on võimalik, et mõni rahvusvaheline andmetubliduse edetabelikoht Eesti jaoks selle võrra tõepoolest langeb, aga neist kohtadest vahendeid valimata kinni hoidmine ei peaks ilmselt ka järgmise viie–kümne aasta jooksul prioriteet number üks olema.