"Pealtnägija": kui lihtsalt saab inimesi petta AI abil genereeritud kõnega?
Hoolimata kõigist hoiatustest langevad eestimaalased ikka kõnepetiste ohvriks ja sel nädalal ilmnes, et kunstnike liit kaotas kelmidele 700 000 eurot. Kui seni kaitses meid peamiselt meie eksootiline keel, siis asjatundjad hoiatavad, et asi läheb hullemaks, kui tehisintellekt hakkab aktsendivabalt eesti keelt rääkima. "Pealtnägija" katsetas, kui edukalt saab AI abil inimesi petta.
Pealtnägija" AI-eksperimendi juured ulatuvad eelmisesse aastasse. Aasta tagasi, kui inimesed olid hakanud massiliselt eestikeelseid petukõnesid saama, mille käigus neilt PIN-koode välja üritati meelitada, tekkis küsimus, kas rahvusvahelise kelmivõrgustikuga on liitunud eestlased või võivad välismaised petised kasutada eestikeelse kõne genereerimiseks muu hulgas tehisaru abi.
"Kõnesünteesi jaoks ei ole vaja grammatikat osata. Piisab sellest, kui tekst muundada kõneks. Mina arvan, et see on paari aasta perspektiiv, kui inimene puhtalt enam hääle põhjal eristada ei suuda, kas on tegemist sünteesitud või loomuliku häälega," lausus TTÜ tarkvarateaduse instituudi keeletehnoloogia labori juhataja Tanel Alumäe.
Just sellest aastatagusest intervjuust tõukus Alumäe huvi välja selgitada, kas eestikeelne kõnesüntees, mis siiani kõlanud pigem tugeva soome aktsendiga ja äratuntavalt tehislikult, võib olla juba nii heaks muutunud, et kõrv seda inimhäälest eristada ei suuda.
Teadlased mõistavad, et AI-ga usutavalt genereeritud hääl on paratamatult oodatud tööriist kurjategijate käes, ent teaduse seisukohast on sel ka palju positiivseid väljundeid. Näiteks saab tehishääl teadustada ühistranspordis peatuseid või panustada abivahendina meditsiini.
"Inimesed, kes on kaotanud oma hääle, nende jaoks need arengusuunad on väga olulised. Neile saaks anda võimalused, et nad saaks kommunikeerida näiteks häälekloonimise abil, et nad kirjutavad ja nende häält on ikkagi kuulda," ütles TTÜ IT-tudeng Annabel Kukk.
Sügisel andiski professor Alumäe teema uurida oma juhendatavale Annabel Kukele, kes sellest mitut häälemuunduse programmi kasutades ohtrate katsetuste toel tänavu kevadel oma bakalaureusetöö vormistas.
"Mina uurisin eestikeelsel kõnel põhinevat häälemuundust. See on konkreetne meetod, kuidas saab luua tehishäält ja seda eesti keele kontekstis väga ei olegi uuritud," ütles Kukk.
Uurimistöö jaoks oli vaja tekitada palju eestikeelseid tehishäälenäidiseid, et neid testgrupi peal katsetada. Kukk andis mitmele arvutiprogrammile lühikesed heliklipid inimhäältega, seejärel tippis arvutisse teksti, mida masin vastava inimese häälega esitama pidi.
Katsealused pidid iga häälenäidise pealt hindama, kas see kõlab nende kõrvale pigem inim- või tehishäälena. Et aga robotid ehk arvutiprogrammid inimhäälte pealt õppida saaks, oli katsetele vabatahtlikke annetajaid vaja. Lisaks tavaliste inimeste häältele tahtis Annabel eksperimenti kaasata ka tuntud hääli, sest nende matkimise õnnestumist hinnates on inimkõrv tuttavlikkuse tõttu kriitilisem. Nii andsidki teadusele oma hääle kolm ERR-i ajakirjanikku – Anu Välba, Taavi Eilat ja Merilin Pärli.
Teadustöö tuules ja koostöös Annabeliga korraldas väikese eksperimendi ka "Pealtnägija". Annabel pani tehis-Anu, tehis-Taavi ja tehis-Merilini rääkima üht ja sama teksti, mida me seejärel oma teistele telekolleegidele ette mängisime.
"Minu meelest kaks kõige konkreetsemat näidet ongi petukõned ja identiteedivargused petukõnedega. Isegi kui me tunneme inimeste hääli, oma lähedaste hääli, siis see ei ole mingi imevits, et kui ma väga hästi kuulan ja tunnen oma tuttavate hääli. Tehishääle võimalused on piisavalt heaks läinud juba," lausus Kukk.
"Järeldused on, et seda saab teha suhteliselt usutavalt, võib-olla mitte nii usutavalt veel kui inglise keele puhul, aga siiski. Ma usun, et lähima aja jooksul tekib reaalne olukord, kus sellised pettused saavad reaalsuseks," ütles Alumäe.
Kuigi jutud AI-ga genereeritud lähedaste häältest, mis telefonis hüsteeriliselt nutavad ja raha küsivad, levivad visalt, pole politsei lõpuni kindel, kas need hääled ikka on AI abiga matkitud. Kuid ka ei kahtle, et suund sinnapoole paratamatult on.
"Kui inimene väidab, et see on tema lapse või lähedase hääl olnud, meil on ka raske seda ümber lükata. Seega tõesti täna ei saa tõsikindlalt öelda, kas ja kui palju (AI genereeritud häält) kasutatakse, aga me näeme, et tehnoloogia areng iga päevaga ja iga nädalaga aina edeneb ja loomulikult kelmid hoiavad ennast kursis ja püüavad neid võimalusi kasutusele võtta," lausus PPA raskete kuritegude talituse juht Elari Haugas.
Paraku tekib AI-abimehi, millega häält kloonida või sünteesida, järjest juurde, nii on sisuliselt juba igaühel võimalik häälegenereerimisega katsetada. Seega tuleb ka häälsõnumeid saates või kelmidega telefonis vesteldes arvestada, et häälenäidist on võimalik salvestada ja pärast AI abil teksti muuta.
"Üks asi, mida kindlasti me soovitame inimestele, on leppida oma lähedastega kokku koodsõna. Kui mulle helistab mu lähedane, kolleeg, ülemus ja soovib mu käest mingeid ülekandeid või mis iganes andmeid, siis lepime koodsõna kokku, küsime korra üle ja kui seda koodsõna ei osata öelda, siis ongi kõige lihtsam viis see kõne katkestada," lausus Haugas.
Teadus aga areneb. Kui Annabel Kuke tehtud häälekloonid olid kõigis testitud programmides veel mõnevõrra kohmakad ja veidrad hääldused andsid aimu tehislikkusest, siis vaid paar nädalat tagasi ilmus areenile uus läbimurdeline tehnoloogia, mida Kuke katsetuste ajal lihtsalt veel olemas ei olnud.
Toimetaja: Marko Tooming










