Oliver Laas: ChatGPT ja tehisintellekti plagiaat
Võib-olla on õigus neil, kes leiavad, et juturoboti ChatGPT tõttu on essee akadeemilise hindelise ülesandena oma aja ära elanud, sest isegi kirjaliku eneseväljendusoskuse arendamiseks ei ole see enam hädavajalik, arutleb Oliver Laas Vikerraadio päevakommentaaris.
Eelmise aasta 30. novembril avalikustas OpenAI juturoboti ChatGPT. Tegemist on erakordselt võimsa tekste genereeriva masinõppe rakendusega, mis on juba tõstatanud mitmeid küsimusi autoriõiguste ja kirjatöö automatiseerimise kohta. Selliste puuduste tõttu nagu faktide või allikaviidete väljamõtlemine ChatGPT tõenäoliselt ajakirjanikke veel ei asenda. Küll aga hõlbustab see senisest enam plagieerimist, mis võib haridussektori jaoks tähendada seniste ülesannete ja plagieerimisega seotud normide ümbervaatamist.
ChatGPT aluseks on 2020. aastal avalikkust hämmastanud keelemudel GPT-3. Keelemudelid on masinõppesüsteemid, mis on treenitud ennustama mingisuguse tähe, sõna või märgijada esinemise tõenäosust sellele eelnevate või seda ümbritsevate märgijadade põhjal. Seda tehnoloogiat kasutatakse loomuliku keele töötlemise vallas juba aastakümneid. Argielust tuntuimaks näiteks on vast Gmaili soovitused e-kirjas lausete jätkamiseks.
Viimaste aastate edusammud koherentsena näivate pikemate tekstide, aga ka tekstisisendite põhjal piltide, genereerimisel tulenevad transformeriteks nimetatavate mudelite kasutuselevõtmisest. Selliste masinõppe mudelite sooritused paranevad koos nende treenimiseks kasutatavate andmete suurusega. Kõnealused "internetisuurused" andmemahud hõlmavad endas tervet Vikipeediat ja enamgi veel.
Ingliskeelse päringu peale suudab ChatGPT küsimustele vastata, erinevates keeltes programmeerida, tekstide lühikokkuvõtteid koostada, tekstide võrdlemisel nende ühiseid teemasid välja tuua, etteantud teemadel esseid kirjutada ja vajadusel ka juba loodut parandada.
ChatGPT väljundid ei kopeeri selle treeningandmetes leiduvaid tekstilõike, vaid loovad nende põhjal uusi. Sama päringu kordamine – näiteks "kirjuta essee sellest, kuidas tehisintellekt on ühiskonnale kasulik" – annab üldiselt eelmisest korrast erineva tulemuse.
Seetõttu ei suuda ka olemasolevad plagiaadituvastussüsteemid ChatGPT või GPT-3 abil loodud tekste tuvastada. Juba on juhtumeid, kus tudengid on tehisintellekti genereeritud esseede esitamisega vahele jäänud. Neid reetsid juba mainitud väljamõeldud faktid ja ekslikud viited, mitte kirjaviis või väljenduslaad. Need puudused on aga tehnoloogia arendamise käigus tõenäoliselt kõrvaldatavad. Mitmed õppejõud on tunnistanud, et kui need sisulised vead välja jätta, siis ei suuda nad eristada tehisintellekti poolt genereeritud esseid inimeste poolt kirjutatutest.
ChatGPT poolt tekitatud tehnilisele probleemile on juba olemas ka tehnilised lahendused. 22-aastane tudeng Edward Tian on loonud rakendused GPTZero, mis peaks tuvastama, kas teksti on kirjutanud inimene või ChatGPT. OpenAI on välja töötamas tehnoloogiat ChatGPT loodud tekstidele unikaalse "sõrmejälje" loomiseks, mis võimaldaks neid inimeste loodud tekstidest eristada. See aga ei välista, et tulevikus saaksid ebaeetilisemad ettevõtted edukalt esseede genereerimise teenuseid pakkuda.
Etümoloogiliselt pärineb tuleneb "plagiaat" ladinakeelsest sõnast plagiarius, millega poeet Martialis tähistas 1. sajandil pKr enda värsside omastamist kellegi teise poolt. Uus-Meremaal tehisintellekti abil genereeritud essee esitamisega vahele jäänud tudeng ei arvanud, et ta plagieeris, sest see eeldaks kellegi teise töö enda omana esitamist, aga tehisintellekt ei ole isik, kellel oleks omandiõigusi.
Selline suhtumine näib kinnitavat nende uurijate seisukohti, kes leiavad, et ChatGPT ja teised sarnased keelemudelid on loonud olukorra, kus tuleb kiiremas korras üle vaadata nii plagiaadi mõiste kui ka meie senised arusaamad akadeemilisest eetikast.
Aga võib-olla on õigus neil, kes leiavad, et ChatGPT tõttu on essee akadeemilise hindelise ülesandena oma aja ära elanud, sest isegi kirjaliku eneseväljendusoskuse arendamiseks ei ole see enam hädavajalik. Elegantsete kirjade kirjutamise saab edaspidi delegeerida tehisintellekti kasutavatele rakendustele.
Me laiendame tehnoloogiate abil oma võimeid: näiteks kalkulaator on arvutusvõime laiendus. Nende tehnoloogiate internaliseerimise tulemusel muutume ise ja muutuvad ka meie võimed, näiteks halveneb peast arvutamise võime. Kas ChatGPT aluseks oleva tehnoloogia internaliseerimine viiks millegi inimeseks olemise seisukohalt olulise kadumiseni? Sellele küsimusele vastuse otsimine viib juba sügavama vaidluseni selle üle, kas inimene on ennekõike (keelelisi) sümboleid kasutav ja tähendusi loov loom või tööriistu valmistav tehnoloogiline loom.
Kõiki Vikerraadio päevakommentaare on võimalik kuulata Vikerraadio päevakommentaaride lehelt.
ERR.ee võtab arvamusartikleid ja lugejakirju vastu aadressil [email protected]. Õigus otsustada artikli või lugejakirja avaldamise üle on toimetusel.
Toimetaja: Kaupo Meiel