Urmet Lee: et andmetest ei saaks müra
Praegu pakuvad statistika jaoks endiselt suuri võimalusi riigi registrid ja andmekogud. Tulevikku vaadates peame aga küsima, mida saaks olemasolevate registritega siduda, et veelgi kiiremini ja tõhusamalt informatsiooni pakkuda, kirjutab Urmet Lee.
Hiljuti toimunud avaandmete foorumil märgiti, et väärindamata andmed on prügi. Väärtuse loob andmetele nendega oskuslik ümberkäimine, vastasel juhul saab andmetest müra. (Andme)vara väärtus kasvab läbi andmete korduvkasutuse, mille peamiseks eelduseks ja väljakutseks on kõigi osapooltega arvestava andmemajanduse loomine. Selleks, et andmeid saaks korduvalt kasutada, tuleb neid kvaliteetselt koguda ja talletada, järgides hoolikalt turvalisuse ja õiguspärasuse põhimõtteid.
Digiriigina peame endalt küsima, kas kasutame olemasolevat andmevara nii hästi kui võimalik. Kas oleme teadlikud, milliseid andmeid on erinevatel asutustel, kui tõhusalt teeme koostööd andmete kaitsmisel ja vahetamisel ning mida inimesed riigilt seoses andmete kasutamisega ootavad? Andmeesitajate koormuse vähendamiseks ja uute andmete pakkumiseks peame otsima uusi lahendusi nii andmeallikate kui ka andmete töötlemise osas.
Kvaliteetse statistika tegemise retsept on lihtne: vali sobiv metoodika ja koosta andmete kogumise plaan, kogu andmed, töötle need analüüsiks sobivasse vormi, vii läbi analüüs ja tee tulemused kõigile kättesaadavaks.
Vahel võib kõrvalseisjale jääda mulje, et riiklik statistika on riigiaparaadi statistika, sest statistikaks kasutatakse suurel määral teiste riigiasutuste kogutud informatsiooni.
Teaduslikust või ametkondlikust andmeanalüüsist eristab riiklikku statistikat eraldi õiguslik regulatsioon ning sõltumatus poliitilisest ja administratiivsest juhtimisest. Nii ei saa Eestis mitte keegi statistikaametilt andmeid varem kui avaldamise tähtajal ning ametit ei saa mõjutada ka metoodika valimisel.
Eelnev ei tähenda, et hea statistika asuks väljaspool riigiaparaati või mis veel olulisem, väljaspool ühiskonda. Andmete väärindamine, neist teadmuse loomine on paljude osapoolte koostöö tulemus, mis nõuab äärmiselt tihedat suhtlust andmete kasutajate ja andjatega.
Praegu pakuvad statistika jaoks endiselt suuri võimalusi riigi registrid ja andmekogud. Tulevikku vaadates peame aga küsima, mida saaks olemasolevate registritega siduda, et veelgi kiiremini ja tõhusamalt informatsiooni pakkuda. Näiteks eraandmed (st mõne teenuse osutamise käigus tekkivate andmete või nutimõõdikute info näol) või automatiseeritud aruandlus, mis lihtsustaks ja kiirendaks andmevahetust.
Uue põlvkonna andmekasutus vajab hakatuseks aga omamoodi ühiskondlikku kokkulepet, sest mitte alati ei ole see, mis tehniliselt võimalik, ka inimestele vastuvõetav. Sellele järeldusele jõudsime Arvamusfestivalil toimunud arutelul "Sinu andmed riigi käes – mida sa sellest kasu saad?".
Peame jälgima, et andmete rikastamine läbi korduvkasutamise ei ohustaks inimeste privaatsust ning tekkiv lisandväärtus jõuaks kõigini, et ühiskonda ei tekiks andmerikkaid või -vaeseid rühmi või et automaatsed lahendused ei diskrimineeriks olemasolevate andmemustrite alusel teatud ühiskonnagruppe. Seepärast peame erilise hoolega silmas pidama õiguslikke ja eetilisi küsimusi ning olema oma tegevustes läbipaistvad ja avatud. Selles aitab meid üldise andmekirjaoskuse arendamine.
Nagu öeldud, ei saa andmete laialdane korduvkasutamine olla üksnes tehnilise tõhususe küsimus. Samal ajal on just kulude kokkuhoid ja avalike teenuste kvaliteet üks keskne argument, miks selle teemaga intensiivselt tegeleda. Korraldades nutikalt andmevahetust teiste riigiasutuste või ettevõtjatega vähendame samade andmete mitmekordset kogumist, teeme paremaid ja kiiremaid otsuseid ning suudame andmete vastu rohkem informatsiooni tagasi anda. Eestis on selleks rohkelt võimalusi, aga me ei kasuta neist kaugeltki kõiki.
Ametnike ehk riigi esindajatena on meil tavainimesega võrreldes de facto rohkem infot ja võimalusi teha otsuseid andmete kasutamise kohta, seega peame näitama inimestele ja ettevõtetele andmete kogumise eesmärki ja kasu, mida andmete eest riigilt vastu saab.
Usalduse teenimiseks peame andma ka kindlustunde, et andmete kogu elutsükkel on kindla kontrolli all. Näiteks statistikaameti tegevust reguleerib hulk Eesti ja Euroopa Liidu õigusakte ning aastas viiakse läbi mitmeid kontrolle ja auditeid. Seda selleks, et veenduda metoodika sobivuses, statistika tegemise korrektsuses ning andmete töötlemise turvalisuses. Ilma selleta ei ole võimalik tagada meie töö usaldusväärsust praegu ega tulevikus.
Riiklik statistika on päriselt oluline ja vahetu mõjuga, kuid siiski vaid üks paljudest avalikest teenustest, mis andmete korduvkasutusest võidab. Näeme korduvkasutuses suuri võimalusi ka andmete kiiremaks avaldamiseks ning näitajate kvaliteedi parandamiseks.
Viimane rahva- ja eluruumide loendus näitas, et andmete nutikas korduvkasutamine aitab säästa nii raha kui ka aega. Järgmiste arengusammude pikkus andmete kasutuse ja korduvkasutuse osas sõltub aga meie partneritest, Eesti inimestest ning ettevõtetest ja nende valmisolekust neid astuda.
Toimetaja: Kaupo Meiel