Koorberg: tehisarule peaks kehtestama eestikeelse sisu kasutamise reeglid

Eesti Meediaettevõtete Liidu tegevjuhi Väino Koorbergi sõnul peaks riik kehtestama tehisaru ettevõtetele eestikeelsete andmete kasutamiseks selged reeglid. Eestikeelse sisu tehisaru platvormidele tasuta andmine ei ole Koorbergi sõnul eesti keele ja kultuuri huvides.
Justiits- ja digiminister Liisa Pakosta (Eesti 200) ütles neljapäeval ERR-ile antud intervjuus, et pooldab eestikeelsete andmete, sealhulgas ERR-ile kuuluva eestikeelse meediasisu tasuta andmist suurtele tehisaru ettevõtetele. Tema sõnul aitab see kaasa põhiseadusest tulenevale eesmärgile tagada eesti keele kestmine. Neljapäeva hommikul teatas justiits- ja digiministeerium pressiteates, et Eesti andis sotsiaalmeediaplatvormi Meta kasutusse ligi neli miljardit sõna. Milline võiks olla Eesti erameedia seisukoht selles küsimuses?
Ma väga suure üllatusega kuulsin Vikerraadio uudistest, et minister on meile teinud ettepaneku juba meie vanema sisu kasutamiseks tehisaru treenimiseks.
Suure üllatusega kuulsin ja ma arvan, et sama suure üllatusega kuulis seda ka ERR, et ka nende sisu üle juba nendega peetakse läbirääkimisi. Meie seisukoht on selline, et tegelikult igasuguse sisu kasutamisel kommertseesmärgil tuleb sisu autoriõiguste omajate käest küsida luba ja maksta selle eest õiglane tasu.
Seesama jutt, kuidas need suured platvormid tegelikult püüavad leida neid kiireid tagauksi, kuidas saada kõike kätte tasuta ja ilma läbirääkimisi pidamata, tulles riigi juurde ja öeldes, et seda kõike on vaja teile ja meile seda vaja ei ole, see tekitab minus teatavat iroonilist pilku. Minu küsimus on, miks riik peaks nii selgelt tegema teeneid või tasuta kingitusi äriettevõttele, kes Eesti turult viib välja sadades miljonites raha ilma siia maksuraha jätmata.
Minu isiklik hüpotees on, et nendel tehisaru treenijatel on väga sageli see sisu,
mille kohta nad hakkavad ütlema, et ilma selleta ei ole võimalik midagi treenida, juba olemas. Maailmas on olnud palju näiteid selle kohta, kuidas meediaettevõtted, muud ettevõtted ja autorite esindajad on hagenud neid tehisaru treenivaid ettevõtteid ja nende protsesside käigus on välja tulnud igasuguseid "toredaid" asju, kuidas tegelikult needsamad robotid on koorinud seda meediaettevõtete sisu juba ammu. Ja nüüd üritatakse seda kuidagi õiguslikult rea peale panna või üritatakse seda kõike seadustada. Meiegi meediaettevõtted on märganud, et mis meie serverites aeg-ajalt toimub. Me ei saa seda kinni keerata täiesti lõpuni, sest iga päev ilmub kusagilt uue nime alt jälle mõni robot, kes tahab sisu koorida.
Meie seisukoht on ikkagi see, et läbi rääkida tuleks nende õiguste omajatega. Õiguste omajaid esindab Eestis Balti Uudismeedia Väljaandjate Ühing. See on kirjastajate kollektiivne esindusorganisatsioon. Ma arvan, et needsamad suured platvormid peaksid pöörduma sinnapoole selle nõusoleku saamiseks. Riigi roll võiks siin olla kehtestada selged reeglid, võib-olla ka survestada ja kohustada neid suuri platvorme läbirääkimisi pidama, sellepärast et eesti keele ja eesti kultuuri huvides võiks olla eestikeelsete loojate huvide eest seismine. Riik võiks kehtestada platvormidele väga selged reeglid selles osas, mida nad teha võivad ja mida nad teha ei või.
Me kirjastajate osas oleme seda teemat isekeskis põgusalt arutanud. Ka Euroopa kultuuriruum teab selliseid näiteid, kus kirjastajad ühiselt koos akadeemiliste organisatsioonide ja riigiga moodustavad ühise keelevaramu, mida raha eest litsenseeritakse. Ma rõhutan – raha eest litsenseeritakse nendele, kes soovivad kasutada neid andmeid kommertseesmärgil. Ma rõhutan ka seda, et Meta on äriettevõte, kes meie tähelepanu pealt teenib väga korraliku raha ja talle teha kingitusi Eesti riigi poolt minu meelest on ebakohane.
Öelda niimoodi, et need ettevõtted on justkui varastanud sisu, kasutanud juba seda oma platvormidel ja nüüd tagantjärele tahetakse seda legitimeerida, ei ole nende suhtes ülekohtune?
See on hüpotees, ma ei julge näidata näpuga ühelegi konkreetsele ettevõttele. Ma ei julge näidata näpuga ka konkreetselt Metale. Aga väga sageli see muster on selline, et tegelikult selle läbirääkimisprotsessi ja selle kohtumisprotsessi
eesmärk ei ole mitte mure eesti kultuuri ja keele pärast, mida Meta on kaugel, eemal tundnud, vaid see on mure sellepärast, et ühel hetkel koputab jurist uksele ja siis võib-olla tuleb anda seletusi.
Kõik need suured platvormid on alati püüdnud leida igasuguseid vahendeid, kuidas võimalikult lihtsalt asju saada. Ma möönan seda, et teatav innovatsioon selle läbi ka toimub. Näiteks, kuidas töötas Google Books. Samamoodi ühel hetkel otsiti võimalusi, kuidas saaks skannida kõik maailma raamatud.
Lähinädalad on toonud ka uudise selle kohta, kuidas tehisaru treenimiseks on
sisestatud sinna masinatesse, ma küll ei täpsusta, millise firma masinatesse, ka maailma kõige suurem piraatraamatute kogu jne.
Ma ikkagi arvan, et Eesti riik peaks seisma autorite huvide eest ja Eesti riik peaks seisma seaduslikkuse eest. Ma oletan, et jutud selle kohta, et me kohe anname üle oma keelevaramu ilma selles keelevaramus peituvate andmete õiguste
omanike käest küsimata ja nendega kompensatsiooni üle rääkimata, on lihtsalt praegu värske ja roheline mõte.
Digimaailmas rohkem toimetavad inimesed teavad osundada ka sellele, et tehisaru mudelite areng on aeglustunud, sest internetist on treeninginfo otsa saamas ja täiendav info väga suure hinnaga nende jaoks. Kuidas selles valguses tundub teile ministri põhjendus selle kohta, et tehisarule eestikeelse sisu andmist ajendab põhiseaduslik eesmärk tagada eesti keele püsimine?
Eesti keele püsimist ja eesti kultuuri püsimist kõige selgemini aitaks innustada see, kui me toetaksime kodumaist ajakirjandust. Siiamaani Eesti ajakirjandus
on olnud ja on jätkuvalt eestikeelse sisu, eestikeelsete mõtestatud tekstide kõige laiaulatuslikum looja. See sisu, mida meediaettevõtted loovad, on tõepoolest kulla hinnaga ka nendele tehisaru treenijatele just sellepärast, et ei ole palju institutsioone, kes kirjutaksid sellist tänapäeva olustiku kroonikat, mis oleks tehtud väga selgete meetodite järgi. See on faktipõhine, objektiivne, tasakaalustatud. Sotsiaalmeedia hüüatused seda ei asenda. Selles mõttes ma saan aru, et see sisu on oluline. Ka uuringud maailmas on näidanud, et meedia sisu osakaal tehisaru tarkuses on ikkagi 30 kuni 40 protsenti. Seda pole sugugi vähe.
Minu palve ministrile, minu palve Eesti riigile on, et me klaaspärlite eest ei annaks ära seda, mis on meile oluline. Me niigi näeme seda, et needsamad suured platvormid on tulnud meie inforuumi, andnud häid teenuseid, aga tekitanud ka omajagu segadust. Tekitanud väga palju infomüra, tekitanud väga palju desinformatsiooni, tekitanud viha ja lõhenemist ja siis läinud minema, viinud siit ära ka kõik selle reklaamiraha, mille eest saanuks teha näiteks head ajakirjandust, head kultuuri. Nad ei ole jätnud siia maha mingit maksuraha ja on hoopis jätnud koristamise meie enda hooleks. Me ei taha ju olla suurtele platvormidele mingisugune karjäär, kus midagi toodetakse ja siis jäetakse see pärismaalastele, et las nad ise koristavad. Siin peab olema ikkagi väga-väga ettevaatlik ja kaaluma neid asju kõigekülgselt. Me väga ootaksime justiitsministeeriumi poolt seda koostööettepanekut, millest minister rääkis ja mis meile suure üllatusena tuli.
Aga need Liisa Pakosta argumendid eesti keele kestmise kohta ei ole veenvad teie jaoks?
Ma saan rääkida tunnetuslikult. Kui me näeksime seda, et tehisaru eesti keelt üldse ei kõnele, aga me näeme, et tegelikult ta kõneleb ikka täitsa hästi. Tõlgib täitsa normaalselt. Kui seda ei arenda Meta, siis tuleb kindlasti keegi teine, kes seda arendab. Mina ei näe seda nii traagilisena. Seda praegu üritatakse näidata, et masin ei tunne eesti keelt üldse. Ma pole selle valdkonna spetsialist, ma saan rääkida tavakasutajana. Aga see, et see masin räägib eesti keelt enam-vähem juba, tõlgib enam-vähem juba, see näitab mulle seda, et neid andmeid on juba olemas. Ta suudab isegi lähiminevikust viidata asju, mille päritolu võiks olla meedia sisust.
Mulle tundub lihtsalt, et ministrile on müüdud head lugu. Ja mitte üksnes ministrile. Ma tean, et ka valitsuskabinet on seda teemat arutanud ja just selle ühe külje pealt. Kuigi mulle jäi mulje, et seal räägiti ikkagi ka dialoogist autoriõiguste omanikega ja õiglasest tasust. Ministri intervjuus olnud sõnum, et me kohe anname üle, ja anname üle tasuta, panid mul mõned lambikesed põlema. Need lambikesed ütlesid mulle seda, et kui see on Eesti riik, kes annab kellegi teise omandi tasuta üle, siis järelikult tekib Eesti riigil kohustus autoriõiguste omanikele see kahju või saamata jäänud kasum ka hüvitada. Ka selle mehhanismi üle tuleks siis sellisel juhul rääkida ja läbi rääkida.
Meil selliseid mehhanisme on olemas. Eesti riik näiteks hüvitab erakopeerimise
teemal autoriõiguste omanikele või vähemalt osale autoriõiguste omanikele selle,
et meist igaüks võib oma CD-plaadi pealt kassetile üht-teist kopeerida või omaenda tarbeks teha. Selle eest Eesti riik maksab autoriõiguste omajatele igal
aastal täitsa märkimisväärse summa.
Ma arvan, et me oleme lihtsalt praegu sellesse teemasse ukse lahti teinud. Eks me peame siis nüüd sealt uksest sisse minema ja loodame, et selle ukse taga on ka laud, mille taga saaks neid teemasid arutada.
Kas teie hinnangul on põhimõtteline vahe ka näiteks EKI keelekorpuse sisu tehisarule jagamisel ja ERR-i meediasisu jagamise vahel?
Vahe ei ole mitte selles, mis selles keelekorpuses on, vaid see keelekorpus
on loodud mitteärilisel otstarbel. See on loodud teaduse eesmärgil, selleks et teadlased saaksid uurida ja arendada eesti keelt. Niipea, kui sinna sisse tuleb äriline eesmärk, oleme me ju sootuks teisel pinnal. Sest teadusotstarbeks,
hariduslikuks otstarbeks näeb ka autoriõiguse seadus ette teatavaid erandeid. Aga me praegu ei räägi ju sellest. Me räägime sellest, et me anname sisu väga suurele ärilisel eesmärgil tegutsevale ettevõttele, võõrriigi kontrolli all olevale ettevõttele, kes on just äsja deklareerinud, et tema loobub faktikontrollist.
Aga kui näiteks minister Pakosta ütleks selle kohta oma argumendi, et aga me teeme seda kõike eesti keele püsimise nimel ja et see on põhiseadusliku eesmärgiga ajendatud ning et seda ei tehta ärilistel eesmärkidel, vaid ikkagi Eesti rahva hüvanguks?
Meie ei teegi seda ärilistel huvidel, aga Meta teeb seda ärilistel huvidel. See andmebaas on loodud mitteärilistel huvidel, aga selle üleandmine Metale on selgelt ärilistel huvidel.
Ma küsin ka ERR-i sisu jagamise kohta. Liisa Pakosta ütles, et juba loodud asju ei ole mõtet ka ilmaasjata oma kõhu all kinni hoida ja tuleks teha selgeks, mis on need tingimused, kuidas tehisaru arendajad saavad Eesti Rahvusringhäälingule loodud asju, mis on juba Eesti maksumaksja raha eest tehtud, Eesti inimesi veel paremini aitama panna.
Minu meelest autoriõiguse seadus ei tee siin vahet. Meil on olemas autoriõigused eraettevõtetele ja autoriõigused avalik-õiguslikele ettevõtetele. Mõlemal juhul tuleb austada autorite õigusi, mõlemal juhul tuleb austada õiguste omajate õigusi, nii varalisi kui ka mittevaralisi õigusi. Kui riik ütleb, et nüüd me võtame selle ERR-i käest ära, sest me oleme selle juba kinni maksnud, siis see on minu meelest ebaõiglane ja lausa vägivaldne. Selle üle otsustamise õigus peaks olema ERR-i juhtkonnal.
Eks see on ministri vastutuse küsimus. Kas ta ütleb, et me võtame midagi, mis on meie ühine rikkus ja anname selle tasuta välismaisele kommertsorganisatsioonile? Saades vastu ilusaid lubadusi. Mina ei julgeks nii suurt poliitilist riski võtta, aga võib-olla on minister selles osas tarmukam.
Te väljendasite siin väga põhjalikult ja selgelt oma seisukohti, skeptitsismi ja
ja hirme, aga kas jäid veel võib-olla nimetamata mingisugused ohud, mis selle kõigega kaasneda võivad?
Ma natuke adun taustal sedasama, et Euroopal on hirm jääda tehisaru treenimises natukene tagumisele istmele. Me näeme, et põhiline võitlus on käimas Ameerika Ühendriikide ja Hiina vahel. Meil on hirm jääda selles osas tagaplaanile. See tähendabki seda, et me kõigepealt võiksime rääkida isekeskis siin Eestis, mida meie saame teha ja leida lahendus, mis kõiki rahuldaks. Praegu on meil kergelt tunne, et meist on üle sõidetud ja ma arvan sama tunnet tunneb ka rahvusringhääling.
Ma ma arvan, et sama tunnet tunneb isegi ilma, et see oleks teoks saanud, ka BBC. Ja tegelikult tunnevad seda kõik loojad, kogu loomevaldkond Suurbritannias, kus praegu samamoodi käib diskussioon autoriõiguste üle, et kas innovatsioon võiks olla ülevam eesmärk kui autorite ja loojate õigus.
Me võiks siis mõelda, kas see süsteem on selline, et sure sina täna, las mina suren homme, ehk et me selle hetkekasu nimel tegelikult kahjustame omaenda sedasama keelt ja kultuuri, kõige otsesemalt loovat loomevaldkonda. Me kahjustame tema elujõudu, ärivõimalusi, tema raha teenimise võimalusi. Me läheme kõigepealt tema leivakoti kallale, aga me ei julge minna suurte platvormide kallale. See on suurem Euroopa probleem. Me oleme selle koha pealt olnud väga passiivsed. Euroopa Liit on olnud siin aastaid passiivne.
See on natuke seotud ka sellega, et ajakirjanduse sooduskäibemaks kehtestati just sellepärast, et sellel suurel konkurentsirohkel turul Euroopa Liit ei suutnud suuri platvorme maksustada. Selleks, et seda ebaõiglust natukenegi tasakaalustada, kuna me konkureerime nendesamade Metade ja Google'i emafirmadega samal turul, aga meie peame maksma makse. Meie peame teenima ühiskonda, nemad ei pea. Selle tasakaalustamiseks on antud õigus, et ajakirjandus võiks saada sooduskäibemaksu. Samas Eestis me näeme seda, et me just praegu oleme ajakirjanduse käibemaksu tõstnud, aga me ei ole ikkagi neid suuri platvorme maksustada soovinud. Vastupidi, me tahame sinise äärega taldrikul neile viia kingitusi.
Toimetaja: Aleksander Krjukov