Oliver Laas: alusmudelite turvariskid
Alusmudelid kasutavad sügavaid (ehk mitmekihilisi) tehisnärvivõrke ja iseõppimist ehk inimeste poolt liigitamata treeningandmetes seoste tuvastamist. Uurijad on tuvastanud mitmeid viise alusmudelite ründamiseks, vahendab Oliver Laas Vikerraadio päevakommentaaris.
Aasta alguses integreeris Microsoft suure keelemudeli GPT-4 oma otsingumootoriga Bing, tarkvaraarendust toetava rakendusega GitHub Copilot ja oma kontoritarkvaraga. Teised tehnoloogiahiiud järgivad Microsofti eeskuju ning mitmed idufirmad pakuvad suurtest keelemudelitest sõltuvaid rakendusi. Lisaks produktiivsuse kasvatamisele võib see trend kaasa tuua ka uusi turvariske.
Alusmudel (foundation model) on masinõppe mudel, nagu GPT või BERT, mis on iseõppimise teel treenitud suurtel andmehulkadel ja mida saab kasutada suure hulga spetsiifiliste ülesannete täitmiseks. Nimetust "alusmudel" kasutatakse ühiskondliku mõju poolest eriliste mudelite tähistamiseks. Nende mõjul võivad muutuda nii tehisintellekti uurimine kui ka rakendamine.
Alusmudelid kasutavad sügavaid (ehk mitmekihilisi) tehisnärvivõrke ja iseõppimist ehk inimeste poolt liigitamata treeningandmetes seoste tuvastamist. Need tehnoloogiad on võrdlemisi vanad. Uudne on alusmudelite suurus. Näiteks GPT-3 hõlmab 175 miljardit parameetrit. GPT-4 on veel suurem.
Suurusega on kaasnenud uute omaduste ja võimete esilekerkimine. Näiteks juba mainitud GPT-3 oli treenitud keeleliste andmete peal, aga suutis ka erinevates programmeerimiskeeltes koodi genereerida. Sellised esilekerkivad võimed on pannud aluse suurele hulgale rakendustele, mis kasutavad alusmudeleid mingisuguse kitsamalt piiritletud ülesande täitmiseks. Näiteks ChatGPT kasutab alusmudelit GPT-4 juturoboti funktsioonide täitmiseks. Jasper kasutab sama mudelit tekstiloomeks, Dall-E 3 aga piltide loomiseks.
Lihtsustatult on ühe alusmudeli ja seda kasutavate rakenduste loomise protsess järgmine. Treenimise faasis alusmudel treenitakse (siiani veel valdavalt inimeste poolt loodud) treeningandmete peal, mille moodustavad internetis leiduvad tekstid, pildid ja muu sisu.
Kohaldamise faasis luuakse alusmudelil põhinevad süsteemid, mis lahendavad kitsamaid ülesandeid nagu e-kirjade koostamine, tekstide resümeerimine või piltide loomine. Rakendamise faasis jõuavad neid süsteeme kasutavad rakendused, nagu ChatGPT, Dall-E 3 või Jasper, lõppkasutajateni.
Uurijad on tuvastanud mitmeid viise alusmudelite ründamiseks. Pahatahtlikud näited sisestavad alusmudeli treeningandmetesse väikeseid muutusi, mis muudavad selle funktsionaalsust, jäädes inimvaatlejale sageli nähtamatuks. Näiteks saaks edukas rünnak suurendada tõenäosust, et alusmudel ja sellele toetuvad rakendused levitavad ründajatele kasulikku desinformatsiooni.
Andmete mürgitamise rünnakute puhul sisestab ründaja treeningandmetesse näiteid, mille eesmärk on mõjutada mudeli ning sellest sõltuvate rakenduste käitumist. Uurijad on näidanud, et GPT-2-l põhinevat tarkvaraarendus toetavat rakendust saab andmete mürgitamisega panna arendajatele ebaturvalist koodi soovitama. Halvimal juhul võiksid seda tüüpi rünnakutest tingitud turvaaugud sattuda alusmudelitest sõltumatutesse rakendustesse.
Alusmudelite vastu saab sooritada ka teenusetõkestusrünnakuid, mis suurendavad nende treenimise energiakulu või aeglustavad nende väljundite loomist. Viimasel juhul halvendaks edukas rünnak ka kõigi rünnatavast alusmudelist sõltuvate rakenduste kättesaadavust. See pidurdaks neid rakendusi kasutavate organisatsioonide tööd.
Ühe eelmisel aastal ilmunud raporti hinnangul on tulevikus alusmudelite roll küberturbes sarnane operatsioonsüsteemide (näiteks macOS, Linux või Windows) omale. Tänu oma laialdastele funktsioonidele ja ulatuslikule kasutusele muutuvad alusmudelid raporti autorite hinnangul rünnakute peamisteks sihtmärkideks. Edukad rünnakud operatsioonsüsteemide vastu seavad ohtu neile toetuvad rakendused. Kuna alusmudelid on seotud neile toetuvate rakendustega, siis edukas rünnak mudeli vastu seab samamoodi ohtu ka seda kasutavad rakendused.
Kõiki Vikerraadio päevakommentaare on võimalik kuulata Vikerraadio päevakommentaaride lehelt.
ERR.ee võtab arvamusartikleid ja lugejakirju vastu aadressil [email protected]. Õigus otsustada artikli või lugejakirja avaldamise üle on toimetusel.
Toimetaja: Kaupo Meiel