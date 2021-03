Nelson Mandelale on omistatud mõte, et kui rääkida inimesega talle arusaadavas keeles, siis jõuab mõte kohale, aga kui rääkida temaga emakeeles, siis leiab see mõte tee südamesse.

Maailmas on ligi 7000 keelt, kuid mitte kõik neist pole internetis võrdselt esindatud. Veebisaitide sisust on 98 protsenti kaheteistkümnes suurimas keeles ning inglise keele käes on selged juhtohjad.

Suuremad arvutiprogrammid on algselt olnud inglise keeles, kuid näiteks eestikeelne Microsoft Word tähistab tänavu augustis juba 20. sünnipäeva. Vaatamata maailma mastaabis väikesele kasutajate arvule jõudis see bürootarkvara eesti keelde suhteliselt kiiresti, kuigi tänase päevani on eestikeelsed programmid ja rakendused suhteliselt haruldased, kui jätta kõrvale Eestis välja töötatud lahendused.

Tehnoloogiavallas toimub suur võidujooks uute toodete ja teenuste nimel, mis ideaalis peavad olema skaleeritavad ehk kasutatavad üle ilma. Mandariini-, hispaania- või isegi saksakeelsed tarkvaraversioonid täiendavad keelte valikut, kuid kas selles üüratus tehnoloogiamaailmas on eesti ja teistel väikerahvaste keeltel üldse mingit šanssi?

Seetõttu ongi oluline, et väiksemad ja keerulised keeled ei jääks "hääletuks". Suur soov kasutada kaasaegset tehnoloogia dikteerib uued mängureeglid ning paljud inimesed ja ettevõtted on nõus leppima sellega, et nendel tehnoloogiatel pole eestikeelset tuge. Kuid see pole õige tee, sest väiksemate keelte koha säilitamine tehnoloogiamaailmas on hädavajalik.

"Mõnikord on isegi raske mõista, kas lobised päris inimese või robotiga. Masinad õpivad keelt täpselt nagu inimesed, kuigi areng võiks olla kiirem."

Keerukad NLP (natural language processing ehk loomuliku keele töötlemine) algoritmid võimaldavad robotitel pidada sisukaid mitmekeelseid vestlusi igal ajal või igas kohas ja mis tahes nutiseadmes. Mõnikord on isegi raske mõista, kas lobised päris inimese või robotiga. Masinad õpivad keelt täpselt nagu inimesed, kuigi areng võiks olla kiirem.

Tulevikku vaadates on selge, et keel eksisteerib seni, kuni sellel on tehnoloogiline tugi. Viimase aja edusammud keeletehnoloogias pakuvad mitmekeelseid lahendusi, mis suudavad kaitsta enam kui 20 Euroopa keelt, mida kunagi võib ähvardab digitaalne hääbumine. See oht ei puuduta mitte ainult Eesti, Läti ja Leedu keelt, vaid ka paljusid teisi, mis ei kuulu Euroopa suurimate hulka.

Visionäärid mõistavad, et rikas on tuleviku maailm, kus inimesed saavad piiranguteta kasutada valitud keelt. Tehisintellekt, nagu inimese meel, areneb ja muutub pidevalt. Keeletehnoloogid töötavad aktiivselt tehisintellekti mitmekeelse kujundamise nimel, pöörates erilist tähelepanu väiksematele, sageli morfoloogiliselt keerukatele keeltele, nagu soome-ugri või balti keeled.

Eesti avalik sektor on viimastel aastatel osutanud tuge eestikeelsete tehnoloogiliste lahenduste väljatöötamisele. Näitena võib tuua riigikogu ja kohtute automatiseeritud kõnetuvastussüsteeme ning masintõlkesüsteeme mitmetele registritele ja dokumendikogudele, nagu näiteks ametlikud teadaanded.

Eesti valitsuse huvi ja toetus on ülioluline, eriti arenduse ning andmete kogumise ja töötlemise varases staadiumis. Kättesaadavad eestikeelsed andmed on arendusprotsessi üks olulisemaid aspekte. Sama oluline on Tallinna Tehnikaülikoolis, Tartu Ülikoolis ja kõigis erasektori ettevõtetes tehtud töö tipptasemel keeletehnoloogiliste lahenduste pakkumiseks eesti keelele.

Inglise keele pealetungi näeme nii akadeemilises hariduses kui ka rahvusvahelises äris ning seda trendi on raske peatada. Kuid kompensatsiooniks peab eesti keel jõudma võimalikult laialt tehnoloogiasse.

Erinevate rakenduste ja seadmete kasutamiseks soovitan väga eelistada võõrkeeltele emakeelt, kui see võimalus on olemas. See suurendab digimaailmas eesti keele kasutajate arvu ning aitab tugevdada väikeste keelte positsiooni.

Pealegi muudab tehisintellekt lihtsamaks keelte valiku laiendamise. Seda kvaliteedis, mis ei pane seda emakeelena kõnelevaid inimesi kas vihast või häbist punastama.