Eneli Kindsiko ja Andres Kütt: kuidas 360 euroga hariduslõhe avastati

Riik võiks märkimisväärselt raha säästa, kui kallite ja korduvate uuringute tellimise asemel keskendutaks esmalt olemasolevate andmete kasutamisele, kirjutavad Eneli Kindsiko ja Andres Kütt.
Eesti e-riiki peetakse maailmas eeskujuks, kuid tõde on karm: avaliku sektori nõrk institutsionaalne mälu ja oskamatus olemasolevaid andmeid kasutada pärsivad meie arengut. Selle asemel, et tugineda juba kogutud infole, asutakse tihti nullist uuringuid tellima, raisates aega, ressursse ja raha.
Kõige teravamalt tuleb see ilmsiks hariduses, kus registrite ühendamine võiks anda väärtuslikku ülevaadet hariduslõhest ja aidata leida lahendusi, ent paraku jääb e-riigi potentsiaal kasutamata. Kui kaua saame endale lubada andmete alakasutust ja uuringutele tehtavaid dubleerivaid kulutusi?
Avalikku sektorit pidurdab nõrk institutsionaalne mälu
Me oleme andmekorilased. Kogume kõike ja võimalikult palju, ent paraku ei oska me neid piisavalt rakendada. Me alarakendame oma riigi suurimat eelist ja kui tekib küsimus, mis seis mingis valdkonnas on, asutakse pigem puhtalt lehelt uuringuid tellima.
Tõenäoliselt on põhjuseks ka avaliku sektori asutuste nõrk institutsionaalne mälu. Kui lahkub inimene, kaob ka ülevaade, mida on juba valdkonnas tehtud, ja uus inimene asub ametisse astudes kohe uuringuid tellima. Seeläbi satume olukorda, kus samast teemast on juba neli uuringut tehtud, lahendusteni pole jõutud.
Pole haruldane, et uurimisprotsessi käigus ilmneb, kuidas sama valdkonda käsitlevad uuringud on samal ajal käimas veel kolmes erinevas avaliku sektori asutuses. Veelgi markantsemad on juhtumid, kus sama teemat uuritakse paralleelselt isegi sama asutuse sees.
Uuringute, eriti küsitluste ja intervjuude põhjal tehtavate uuringute tellimine pole iseenesest halb, kuid riigi jaoks oleks märkimisväärne aja- ja rahasääst, kui esmalt kasutada registriandmeid olukorra kaardistamiseks ning seejärel järgmiste sammudena uurida tuvastatud valupunkte sihipärasemalt süvitsi juba näiteks küsitluste, intervjuude või muude meetodite abil.
Nagu ka EBS-i professor ja haridusökonomist Kaire Põder on viidanud, registripõhised andmed on usaldusväärsete tulemuste saamiseks töökindlamad kui küsitlusuuringute kaudu korjatavad andmed.
Kuidas leiti üles Eesti hariduslõhe?
Kõige ilmekam näide sellest, kui suure kahju oleme juba teinud registrite mitte ühendamise tõttu, on PISA pimedus. 2023. aastal küsis üks käesoleva kirjatüki autoritest statistikaametist, kas meil oleks võimalik liita kõikidele Eesti üldhariduskoolide õpilastele juurde nende vanemate sissetulekud. Tähtis on, et tegemist ei olnud isikupõhiste andmete avaldamisega, sest välja antud andmed kajastasid vanemate sissetulekuid kooli keskmise tasandil (eristades emade ja isade sissetulekuid).
Kuna selline andmete ühendamine oli Eestis uudne, võttis see ühe kuu, et kokku leppida andmekaitsenõuete täitmise osas, eeskätt üliväikeste maakoolide korral. Piiriks sai nõue, et koolis peab olema vähemalt 20 õpilase isa või ema, mistõttu alla 20 õpilasega koolid jäid analüüsist välja.
Saadud infokihile lisandusid haridus- ja teadusministeeriumist saadud üldhariduskoolide matemaatika põhikoolieksami tulemuste keskmised (EHIS-e andmed). Selgus, et emade (ja ka perede) mediaansissetulek on positiivselt korreleerunud matemaatika lõpueksami tulemusega.
Hariduslõhe ei ole vaikselt meie õuele hiilinud. Kui PISA Eesti pressiteated on aastate jooksul pigem kinnitanud, et Eestis ei sõltu laste õpitulemused kodu sotsiaalmajanduslikust taustast, siis Eesti enda andmed räägivad vastupidist. Viimastel aastatel on pea neljandik põhikooliõpilastest matemaatika põhikoolieksamilt läbi kukkunud, mõnes koolis kukuvad koguni pooled.
Omaette paradoksaalne on see, et PISA testi teevad 15-aastased õpilased ning sama vanusegrupp peaks tegema Eestis põhikooli matemaatikaeksamit. Globaalselt on need ca 6000 Eesti õpilast matemaatikas maailma tipus, ent Eestis kukub samaealistest neljandik matemaatikas läbi.
Kokkuvõttes, olgugi et välismaine küsitlus tundub igati positiivse tulemusena ja näitab Eestis kahtlemata heas valguses, peaks siiski meie kohalik (registripõhine) andmestik olema see, millest lähtuda põhjapanevate järelduste tegemisel ka hariduslõhe suunal.
PISA katab ca 6000 õpilast, Eesti registrite najal on võimalik saada üle 100 000 õpilase ülevaade.
Selle asemel, et tellida ka Eestiski küsitluste või intervjuude põhiseid uuringuid olukorra esmaseks kaardistamiseks, maksumusega 20 000–50 000 eurot, oodates uuringu valmimist näiteks kuus või üheksa kuud, oleks võimalik registrite ühendamise teel vastused saada terve populatsiooni kohta ühe päeva jooksul.
Lapsevanemate sissetulekute kaasuse korral kulus meil ca üks kuu andmekaitse jmt detailide paika seadmisele, ent andmed lingiti ühe tööpäeva jooksul. Seega, kui ministeeriumid oskavad küsida, on neil võimalik päeva-kahe jooksul saada registrite ühendamise teel vastused. See on e-riigi potentsiaal, mida peaksime palju julgemini kasutama.
Hind: 360 eurot (umbes kuus töötundi), mis kulus statistikaametil eri registrite andmestike ühendamisele.
Andmeanalüütika peab muutuma
Registrite ülene andmeanalüütika peab muutuma tehniliselt, organisatsiooniliselt ja juriidiliselt lihtsamaks. Olulistele küsimustele, mis puudutavad kogu riiki, mitte ainult üksikuid asutusi, peab saama vastuseid olemasolevaid registriandmeid kasutades.
Muudatused on hädavajalikud kõigis kolmes aspektis (tehniline, organisatsiooniline, juriidiline), sest isegi parim tehnoloogiline lahendus jääb kasutamata, kui selle rakendamiseks puudub harjumuspärane töökorraldus või tuleb läbida keeruline juriidiliste nõuete rägastik.
Meie praegusel olukorral on selge põhjus: oleme oma riigi üles ehitanud, keskendudes riigi ja tema infosüsteemi ühtsusele ja andmekaitsele. Neist esimene tähendab, et andmed ei asu mitte ühes suures purgis, vaid on antud konkreetsete asutuste vastutada ja hallata. Ja teine, et nende asutuste ümber on ehitatud suhteliselt kõrged andmekaitse müürid.
Mõlemad lahendused on meid hästi teeninud, kuid kuidas siis edasi minna? Kuidas kohandada oma praegust süsteemi, et andmete turvalisus ja õiguskindlus säiliksid, aga võimaldaksime samal ajal tõhusamat registrite ülest koostööd?
Tehniliste lahenduste osas ei ole tarvis midagi täiesti uut leiutada, piisab sellest, kui olemasolevad lahendused tõhusalt kasutusele võtta. Miks seda ei ole tehtud? Sest puudub see, kes teeks. Asutused vastutavad igaüks oma andmehulga eest ja ka statistikaamet määratleb oma rolli, kui "andmete usaldusväärset kodu". Igaüks keskendub nende käes olevatele andmetele, kuid puudub vastutus registreid ühendava analüütikataristu eest.
Lisaks vastutuse selgele määratlemisele saaks kindlasti anda institutsionaalsele mälule selgemat vormi: koolitada, luua standardprotsesse ja dokumente, jagada parimat praktikat jne.
Juriidilisest vaatenurgast on see tõenäoliselt kõige keerulisem, kuna lisaks muudele aspektidele tuleb tagada vastavus GDPR-i nõuetele. Samal ajal peame küsima, kas andmekaitse osas ei ole me mõnikord ka igaks juhuks "müüri ehitanud", sest nagu viitab andmekaitse ebakõladele tabavalt ka Kaire Põder: "kui PISA uuringu puhul saame õpilase tasemel andmeid OECD kodulehelt alla laadida, siis miks peaks andmekaitselised probleemid Eestis olema suuremad?"
Siiski on võimalik ka siin palju saavutada, näiteks kehtestades asutuste ülesed reeglid, mis võimaldavad kogutud andmete anonüümset teisest kasutamist teenuste pakkumise eesmärgil, sest hetkel tundub, et ka asutuste lõikes tõlgendatakse vahel andmekaitsereegleid üsna erineva rangusega.
Kokkuvõtteks
Riik võiks märkimisväärselt raha säästa, kui kallite ja korduvate uuringute tellimise asemel keskendutaks esmalt olemasolevate andmete kasutamisele. Tõenäoliselt oleks potentsiaalne kasu veelgi suurem.
Euroopa Komisjoni hiljutine raport tõenduspõhise poliitikakujundamise osas markeerib, et peaksime senisest hoopis süsteemsemalt tegelema ka teadusnõustamisega. Ühest küljest on raportis ülaltooduga palju ühisjooni: valdkondade ülesest koostööst keskselt juhitud ökosüsteemini, aga parem võimekus hallata tõsikindlat teadmist riigi kui terviku kohta võiks juba iseenesest kaasa tuua märkimisväärse arenguhüppe. Kasvõi selle osas, kuidas e-riik praktikas tööle saada. Selline areng oleks Eestile kahtlemata väga kasulik.
PS 2026. aastal valmivas Eesti inimarengu aruandes võetakse luubi alla haridus ja selle laiapindne mõju ühiskonna arengule.
Toimetaja: Kaupo Meiel