Juhan-Madis Pukk: kas tehisaru haip ongi läbi?
Tehisaru rakendamine on jõudnud punkti, kus ettevõtete ootused ei vasta sellele, mida tehisintellekt IT-arenduse valdkonnas tegelikult teha suudab, kirjutab Juhan-Madis Pukk.
Ülemaailmne tehisaru ehk AI hullus sai alguse pea kaks aastat tagasi, kui Chat GPT lansseerimisega jõudis esimene keelemudel laiade masside kasutusse. Kahe aasta vältel on ootusi AI osas aina ülespoole kruvitud. Ka Eesti ettevõtted pöörduvad IT-arendajate poole sageli ootusega, mis eeldab AI rakendamist oluliste funktsioonide teostamisse nii, et tööd peaks tegema vähem, seda saaks teha kiiremini ja vähema arvu inimestega ning vigu ei esineks.
AI-st rääkides tuleb lisaks juturobotitele vaadelda erinevaid masinõppe funktsioone, mida paljud ettevõtted kasutavad, näiteks prediktiivne analüütika kliendikäitumise ennustamiseks, pildituvastus kvaliteedikontrolliks, kliendihalduse automatiseerimine juturobotitega, suure hulga dokumentide seast relevantse informatsiooni kogumine ja dokumentide klasterdamine. Kõikide nende tegevuste ja kogu digimaailma alustalaks on andmed.
Probleem saab alguse vigastest andmetest
Andmete kvaliteedist ja struktureeritusest sõltub digilahenduste kvaliteet. Kui võrrelda tootmisega, siis andmed on nagu tooraine, millest toode tehakse – kui tooraine on ebakvaliteetne, siis ei saa ka lõppproduktil kõrget kvaliteeti olla. Andmetest tulenebki AI rakendamise suurim probleem. ühelgi ettevõttel ei ole andmed ideaalses olukorras. Et need oleksid kasutatavad, tuleb andmeid pidevalt korrastada, välja otsida ja vahel ka lisaks luua.
Kuni andmed pole ideaalsed, ei saa ka keelemudel või muud masinõppe funktsioonid täiuslikult töötada. IT-arenduse valdkonnas klientide ja partneritega suheldes näen, et ettevõtjate ootused AI-le on palju kõrgemad sellest, mida tehisaru tegelikult teha suudab.
Lihtsustatult öeldes loodavad ettevõtjad, et AI leiab ärilist kasvu takistavad probleemid üles, lahendab ära ja teeb seda tasuta keelemudelile tuginedes ilma rahata. Tegelikkuses see nii lihtne kahjuks ei ole. Arvuti saab teha otsuseid, aga nende taga on andmed, mida genereerivad inimesed. Kui andmed on kehva kvaliteediga, siis langetab robot ka nigelaid otsuseid.
Kasutaja peab olema järjest targem
Palju on räägitud sellest, kuidas keelemudelid ajavad kohati täielikku jama. Primitiivse näitena: olen ka ise juturobotilt enda üllatuseks teada saanud, et Juhan-Madis Pukk on Vanemuise teatri näitleja. Kui selliseid andmeid usaldaks minu potentsiaalne klient või tööandja, poleks ilmselt lootustki tehnoloogiasektoris tööd saada.
Vilunud vestlejal õnnestub saada tehisarult siiski üsna korrektseid vasteid ja paljude tööülesannete täitmine – näiteks ideekorje või tõlked – on tänu keelemudelite kasutamisele muutunud oluliselt lihtsamaks. AI-d kasutades tuleb alati arvestada, et keelemudel võib eksida, sest tema kasutada on vigaseid andmeid, mida inimesed massiliselt internetti sisestavad. Iga otsing vajab seega nutika inimese topeltkontrolli ja vigade esinemist ei saa sellest hoolimata vältida.
Lisaks faktiontrollile takistavad avalike keelemudelite laialdast kasutuselevõttu autoriõiguste ja andmelekke probleemid. Kuidas saaks ettevõtja olla kindel, et tehisaru geneeritud andmetes ei sisaldu autoriõigustega kaitstud teoseid? Üsna veendunud saab olla aga selles, et iga vestlus treenib keelemudelit. Kuna järgmisele kasutajale vastates kasutab tehisaru sisendina tõenäoliselt ka sinu ettevõtte inimeste esitatud materjale, tuleb elimineerida võimalus, et keegi töötajatest sisestab keelemudelisse konfidentsiaalseid andmeid.
Toimiv keelemudel ei ole tasuta
Lahenduseks, mis võimaldaks ettevõtjatel tehisarust suuremat kasu lõigata, on ettevõttesisene privaatne keelemudel, mille puhul kombineeritakse firma kontrollitud andmed välistest kanalites tulenevate valideeritud andmetega. Näiteks liidestatakse keskpanga valuutakursid, ennustused ja analüüs ettevõttes kasutusel oleva keskse tarkvaraga.
Privaatne keelemudel lahendab nii juriidika, andmete kontrolli kui ka turvalisuse probleemi. Majasiseseks kasutamiseks mõeldud keelemudeli arendamine on aga hoopis kulukam kui need investeeringud, mida planeerisid Eesti ettevõtjad AI revolutsiooni tuules oma eelarvesse. See ongi koht, mille osas ettevõtjate ootus ja AI tegelikkus kõige enam lahkneb.
Tehisintellektist oleks kasu küll, aga see on liiga kallis. Ettevõtja, kes julgeb privaatse keelemudeli arendamisse investeerida, peab lisaks kulukale juurutamisele arvestama riskiga, et investeering ei tasu end ära, kui selgub, et AI pole piisavalt täpne, usaldusväärne või kasulik.
Sama probleem valitseb ka teistes riikides. Gartneri haibitsükli teooria järgi pole keelemudelite aluseks oleva generatiivse AI ümber toimunud haip veel läbi, aga ülespuhutud ootuste piik on ületatud. 2024. aastal toodavad suuremat väärtust projektid, mis põhinevad mitte keelemudelitel, vaid teistel tehisintellekti funktsioonidel, mille rakendamist hõlbustavad standardiseeritud protsessid, mida keelemudelite jaoks seni veel ei ole.
Ka inimesed peavad kohanema, võttes arvesse, et AI ei lahenda kõiki probleeme, ent aitab siiski paljusid tööülesandeid lihtsamaks muuta. Robotitest on palju kasu igapäevatöö hõlbustamisel ja näiteks dokumenditöötluse tegemisel, aga inimese kriitiline meel peab säilima ja masina pakutud andmeid kinnisilmi usaldada ei saa.
Ettevõtetes tasub alustada auditist, mis aitab leida üles need kohad, kuhu saaks ja tasuks investeerida, et korduvaid ülesandeid AI abil kiirendada ja inimeste tööd tõhusamaks muuta. Gartneri kõver näitab aga selgelt, et tasuta imede lootmise aeg on kahjuks läbi.
Toimetaja: Kaupo Meiel