Priit Lätt ja Enelin Terav: tehisintellekt sööb loojate leiba

Ühiskond, mis väärtustab loovust, ei tohi lubada, et loojad peavad konkureerima süsteemiga, mis õpib nende tööde põhjal, kuid ei anna neile midagi tagasi, kirjutavad Priit Lätt ja Enelin Terav.
Tehisintellekt on muutnud meie igapäevaelu. Me küsime temalt retsepte, laseme tal tõlkida dokumente või luua pilte ja laule. Kuid kui need "nutikad" süsteemid õpivad kirjanike, kunstnike, näitlejat ja muusikute loomingu põhjal, siis kas see pole mitte loometöö vargus moodsas kuues?
Kui inimeste loomingust saab tehisintellekti õppematerjal, tekib küsimus: kas loojale jääb oma töö eest ainult tänu või ka õiglane tasu?
Kas tehisintellekti treenimine tähendab loometöö ärakasutamist?
Tehisintellekti treenimiseks kasutatakse teksti- ja andmekaeve meetodit. See tähendab, et masinad analüüsivad suurel hulgal tekste, pilte ja muud sisu, et õppida, mõista ja lõpuks luua midagi uut ja originaalset. Sageli saadakse need andmed loojate teostest ja esitustest ilma nende teadmise ja nõusolekuta ning ilma selle eest tasu maksmata.
Kuigi Euroopa Liidu ja Eesti seadusandlus lubab teksti- ja andmekaeve meetodi kasutamist teadusuuringutes ilma autori või esitaja loata või ärieesmärkidel juhul, kui autor või esitaja pole kasutust selgesõnaliselt ja masinloetaval viisil keelanud, ei ole seadusandluses otsesõnu selgitatud, kas need nn vaba kasutuse erandid kehtivad ka tehisintellekti treenimise puhul. Kuni see on tõlgendamise küsimus, kannatavad autorid ja esitajad.
Berni kirjandus- ja kunstiteoste kaitse konventsioon, mis on rahvusvaheline miinimumstandard autoriõiguse valdkonnas, sätestab, et autoriõiguse kaitse tekib automaatselt ning see ei tohiks olla seotud formaalsustega. Seega ei tohiks autoriõiguse kaitse sõltuda sellest, kas autor või esitaja on esitanud selgesõnalise ja masinloetava välistuse. Praktika, kus esitusi või teoseid võib kasutada seni, kuni looja pole seda keelanud, võib olla seega vastuolus rahvusvahelise õigusega.
Lisaks on paljusid tehisintellekti mudeleid treenitud ilma esitaja või autori teadmiseta, mis tähendab, et loojal puudus võimalus anda teadlik nõusolek. Euroopa Kohus on varasemalt Marc Soulier jt kohtuasjas rõhutanud, et juhul kui autor ei tea, et tema loomingut kasutatakse, ei saa temalt eeldada ka teadliku seisukoha võtmist. Seega ei saa loojate vaikimist üldreeglina käsitleda kui nõusolekut.
Selleks, et tagada ebaselges olukorras loojate õiguste kaitse, on mitmed Eesti kollektiivse esindamise organisatsioonid – autorite ühing, näitlejate liit ja audiovisuaalautorite liit – juba avaldanud sõnaselged välistused, millega keelatakse nende liikmete esituste ja teoste kasutamine tehisintellekti treenimisel väljaspool teadusuuringuid ilma nõusolekuta ja õiglase tasuta.
Kuidas kohtud on otsustanud?
Euroopa Kohus ei ole veel võtnud seisukohta, kas ja mil määral kohaldub teksti- ja andmekaeve erand tehisintellekti treenimisele. Meile teadaolevalt on Euroopas kõnealuses küsimuses algatatud kohtuasju praegu kuus (neist Saksamaal kolm ning Inglismaal, Hollandis ja Prantsusmaal üks), mida on võrreldes USA-ga (praegu kokku 40) vähe.
Näiteks esitas Saksamaa kollektiivse esindamise organisatsioon GEMA 2024. aasta novembris hagi OpenAI vastu, kuna GEMA hinnangul kasutati ChatGPT õpetamiseks nende liikmete loodud muusikat ja laulusõnu ilma GEMA liikmete teadmise, nõusoleku ja tasuta. 2025. aastal esitati samalaadne hagi ka muusikaplatvormi Suno vastu.
Ehkki kummaski kohtuasjas pole veel kohtuotsuseid tehtud, võivad need oluliselt mõjutada autoriõiguse kaitse ja innovatsiooni vahelise tasakaalu kujunemist Euroopas.
Seoses masinloetava ja selgesõnalise välistuse esitamisega leidis Hollandi esimese astme kohus 30. oktoobril 2024 otsuses kohtuasjas DPG Media ja Mediahuis vs HowardsHome, et kui tehtud välistus kehtib vaid teatud tehisintellekti süsteemide osas, ei ole see piisav.
Looja loob, masin õpib, kes saab tasu?
Eesti autoriõiguse seaduse kohaselt on autoril ja esitajal õigus saada õiglast tasu. Kui aga teosed ja esitused rändavad anonüümselt läbi andmebaaside, mille abil õpetatakse tehisintellekti, siis kes ja millal selle tasu maksab?
Autorid ja esitajad ei tea, kes ja millal nende loomingut kasutab. Seetõttu jäävad nad lihtsalt tasust ilma, aga nende loomingul põhinevad masinad pakuvad teenuseid, mis neid turul asendavad. Selline olukord ei ole õiglane ega ka jätkusuutlik.
Ühiskond, mis väärtustab loovust, ei tohi lubada, et loojad peavad konkureerima süsteemiga, mis õpib nende tööde põhjal, kuid ei anna neile midagi tagasi. Seetõttu tuleb välja töötada õiglane ja toimiv tasumudel, mis tagab autorite ja esitajate õiglase tasustamise, kuid ei takista liigeselt innovatsiooni.
Välja on pakutud järgmisi tasumudeleid:
- Opt-out-litsents. Juhul kui looja on välistanud teose või esituse kasutuse, siis tähendab see, et a) teose või esituse kasutamine ei ole lubatud või b) teose või esituse kasutamine on lubatud, kui selle eest makstakse mõistlikku tasu. See mudel põhineb Euroopa Liidus kehtival üldisel andmekaeve erandil, kuid mudeli rakendamine eeldab, et õiguste omajad ja tehisintellekti süsteemide arendajad suudavad saavutada kokkuleppe. Praegune olukord ei süsti kahjuks optimismi.
- Seadusjärgne litsents. Teoste ja esituste kasutamine on lubatud, kuid see eeldab tasu maksmist loojatele. See mudel sarnaneb Euroopa Liidus kehtiva erakopeerimise tasuga, kuid selle mudeli rakendamiseks tuleks muuta Euroopa Liidu õigust (ühtse digituru direktiivi).
- Tasu tehisintellekti poolt loodud sisu eest. Erinevalt eelnevatest mudelitest ei keskendu see tasumudel mitte tehisintellekti treenimiseks kasutatavatele andmetele, vaid loodud väljundile, mille kasutamiselt kogutakse tasu. Tasu peaksid maksma tehisintellekti süsteemide arendajad. Ka selle mudeli rakendamine eeldab muudatuste tegemist Euroopa Liidu tasandil.
- Kaheastmeline litsents (GEMA mudel). Esimeses astmes nn esmane tasu, mille puhul tehisintellektiplatvormid maksaksid kindlaksmääratud protsendi oma netotulust loojatele, ja teises astmes nn lisatasu, mida peab maksma, kui tehisintellekti loodut kasutatakse ärilisel eesmärgil. See litsentsitasu peab olema võrdväärne tasuga, mida makstaks inimese loodud teose või esituse kasutamisel.
Mida oleks vaja muuta?
Esiteks tuleks välja töötada selged reeglid, mis määratlevad, millal ja kuidas võib teoseid ja esitusi kasutada tehisintellekti treenimiseks. Euroopa Liidus on väljatöötamisel üldotstarbelise tehisintellekti tegevusjuhend, mis reguleerib loomingu õiguspärast kasutust ning tagab autorite ja esitajate õiguste kaitse. Kahjuks on selle tegevusjuhendi viimane versioon saanud tugevat kriitikat nii loomesektorist kui ka tehisintellekti arendajatelt.
Õnneks on otsustajatel veel aega kriitikat arvesse võtta. Samuti on viimane aeg tunnistada, et ühtse digituru direktiiviga loodud teksti- ja andmekaeve üldine erand on juriidiline praak, ning asuda selle kiirele muutmisele vältimaks "kaevikusõda" kohtutes.
Teiseks tuleb nii autoritele kui ka esitajatele tagada õiglane tasu, kui nende loomingut kasutatakse tehisintellekti treenimisel. Selleks tuleks kasutusele võtta üks eeltoodud tasumudelitest või töötada välja uus tasumudel, mis reaalselt tagab autorite ja esitajate õiguse ja innovatsiooni vahelise tasakaalu.
Kolmandaks peavad autorid ja esitajad saama ise otsustada, kas nad lubavad oma loomingut kasutada tehisintellekti treenimiseks. Selleks, et loojatel oleks kontroll teoste või esituste kasutamise üle, peavad nii autorid kui ka esitajad olema teadlikud asjaolust, et nende loomingut kasutatakse tehisintellekti treenimiseks.
Kokkuvõtteks võib öelda, et me ei saa peatada tehisintellekti arengut, kuid me saame ja peame tagama, et autorid ja esitajad ei ole selle arengu tagajärjel kannatajateks. Kui me laseme tehisintellektil vabalt kasutada autorite ja esitajate loomingut ilma loata ja tasuta, siis anname nende töö lihtsalt masinatele. See ei ole innovatsioon, vaid pretsedenditu ärakasutamine.
Toimetaja: Kaupo Meiel