"AK. Nädal": kes kontrollib tehisaru ja millised on seejuures inimeste õigused?
Tehisaru mängib maailmas aina olulisemat rolli ja suudab täita üha enam ja üha keerukamaid ülesandeid. Kes tehisintellekti kontrollib, kuidas talle eesti keel selgeks õpetada ja millised on seejuures inimeste õigused, neile küsimustele otsis "Aktuaalne kaamera. Nädal" vastuseid.
Viimaseid nädalaid võiks kutsuda veebruaruks. Kõigepealt suutis justiits- ja digiminister Liisa Pakosta ärritada meediaorganisatsioone plaaniga pakkuda tehisaruhiidudele nende tekste. Seejärel tekkis skandaal Kultuurkapitali esseekonkursi võitja Nora Maria Londoni ümber, keda esitletud kujul ei eksisteeri.
Viimasel ajal on tehisaru aina rohkem inimeste teadvusse jõudnud, kuid tegelikult on see olemas olnud tükk aega. Põhimõtteliselt võib igasugust arvuti algoritmilist protseduuri nimetada tehisaruks. Selle üks alamliike on masinõpe, millest veel väiksem osa on keelemudelid nagu ChatGPT või DeepSeek.
"Me oleme nagu puhtalt matemaatika pealt jõudnud mingil määral, kas ta on nüüd elusorganism, aga ta on midagi natukene rohkem kui lihtsalt numbrid," sõnas Tallinna Tehnikaülikooli informaatika ja tehisintellekti õppekava programmijuht Ago Luberg.
Lubergi sõnul saab tänu tehisarule aina rohkem tegevusi automatiseerida, luua kiiremini ja tõhusamalt. Koos võimalustega tekivad aga ka hirmud. Isegi Tallinna Tehnikaülikoolis, kus tehisaru võimalusi on näha lausa füüsilisel kujul, pelgab osa õppejõududest, et see pärsib tudengite mõtlemisvõimet.
Palju on räägitud töökohtade kadumisest. Nüüd tundub, et jääme ilma ka oma andmetest. Eesti Keele Instituudi (EKI) juhi Arvi Tavasti arvates peaksime tehisaruhiidudega koostööd tegema, sealhulgas jagama keelekorpuse materjale. Ta lisas, et eestlased on end defineerinud keele kaudu. Igasuguste masinatega muus keeles suhtlemine vähendaks eesti keele kasutusvõimalusi, mis viiks lõpuks selleni, et meie liim ei hoiaks meid enam koos.
"Magama minnes hõikame, et kustuta tuled ära. Me tahaks seda teha eesti keeles ja tahaksime, et see vastus, mis seal tuleks, oleks ilusas, selges, korrektses eesti keeles ja et see järgiks ka Eesti kombeid," ütles Tavast.
Üks asi on andmine, teine asi lihtsalt võtmine. Eesti Autorite Ühingu juhi Mati Kaalepi kinnitusel töötavad andmekaeverobotid juba praegu erinevatel platvormidel, kogudes põhimõtteliselt kõike alates tekstist ja lõpetades videoga. Seda on märganud Eesti meediaväljaanded ja ka autorite ühingul on kahtlus, et Eesti autorite muusikat on tehisaru teoste loomiseks kasutatud.
"Autorid, kellel on mingi omand, autoriõigus, nende teoseid kasutatakse ilma selleta, et keegi nende käest selleks luba küsiks või tasu maksaks," sõnas Kaalep, kelle sõnul pole ka kellelegi kurta, sest tehishiiud lihtsalt ei vasta.
"Isegi kui pöördutakse suurte platvormide poole, on need siis Suno või OpenAI, siis tegelikult vastuseid ei saada. Ja litsentsilepinguid ei ole võimalik ka tagantjärele sõlmida, olenemata sellest, et tegelikult on need andmekaeve tegevused juba toimunud," selgitas ta.
Lihtsustatult öeldes lubatakse Euroopa Liidus vabalt andmekaevet teha teaduseks.
"Selle eeldus on see, et nad saavad teatud materjalidele ligi ja nendel on mingi avalik hüve, mida nad tagasi annavad. Nüüd keeruliseks läheb see olukord juhul, kui ei ole võimalik selgelt eristada, kas seda teadus-arendustööd tehakse avaliku hüve andmise eesmärgil või mingi toote arenduse eesmärgil," rääkis Kaalep.
"Ka nende teaduserandite mõte on olnud, et teadustulemusi ju ükskord ikka kasutatakse äris. Kui leiutame mingi uue materjali või uue tehnoloogia, siis varem või hiljem see jõuab ju inimeste kätte ja meetod, kuidas ta jõuab inimeste kätte, on paraku alati läbi äri. Ega ta tasuta sinna ei jõua," ütles Tavast.
"Meie ei ole andmete jagamise vastu, aga me soovime, et oleks võimalik läbi rääkida tingimustes, kuidas neid andmeid jagatakse, ja võib-olla läbirääkimiste käigus tekib kahepoolne mõistmine, et võib-olla tasuta jagamine ongi mõistlik, aga senimaani pole neid läbirääkimisi ka olnud," märkis Kaalep.
Seadused ja direktiivid on loodud ajal, kui tehisaru ei olnud veel nii kaugele arenenud. Nüüd on selle piiri tõmbamine jäetud suuresti kohtutele, aga peamiselt kombatakse ringi pimeduses.
"Meil ei ole oma riigis ka paika pandud, kes saab otsustada, kas neid andmeid tohib jagada või mitte," tõdes Luberg.
"Me oleme väga reipalt olnud infoühiskonna liikmed ja selle sisutäitjad, et meil ei tasu üldse mängida seda, kas anname või ei anna (sisu). See on juba ära antud, aga kui me teadvustame seda, siis võib-olla see on üks samm, mis tuleks ära teha," kommenteeris tehnoloogiaekspert Kristjan Port.
Pordi sõnul tuleks paika panna, kuidas suhtuda tehisaru kasumisse ja kes üleüldse tulevikus vastutab. Lihtsam oleks neid asju ajada Euroopa Liidus ühiselt. Samas on Euroopa jäänud tehisaru arendamisega USA-st ja Hiinast maha, mille taga nähakse just karmimaid regulatsioone tehnoloogiavallas.
Port leiab, et edasisi samme mõjutab hoopis ettevõtete omavaheline konkurents. Palju sõltub ka sellest, milline tehisaruettevõte haarab lõpuks liidrirolli. Näiteks Hiina DeepSeeki on süüdistatud nuhkimises ja ajaloo ümberkirjutamises.
"IT-sektor on niivõrd tugev ülepiiriline ja riigivõimust üle käiv. /.../ Isegi DeepSeeki juht natukene oma käitumiselt ja sõnavõtult paistab, et ei ole väga joondumas Hiina riigi vähemalt meile arusaadavate eesmärkidega, nii et siin saab olema huvitavaid vastuolusid kindlasti," rääkis Port.
Eesti arutelu puhul on samuti tekkinud huvitav paradoks. Me ei tahaks oma andmeid tasuta anda, aga keele- ja tehnoloogiainimesed ütlevad, et ega keegi neist tegelikult ka väga huvitu. Isegi mitte tasuta.
Toimetaja: Merili Nael
Allikas: "Aktuaalne kaamera. Nädal"