Riik hakkab tehisintellekti masintõlkes rakendama ({{contentCtrl.commentsTotal}})

Riik soovib rohkem masintõlget kasutama hakata.
Riik soovib rohkem masintõlget kasutama hakata. Autor/allikas: Priit Mürk/ERR

Eesti riik plaanib eesti keeletehnoloogia arenguhüpet tehisintellekti rakendamisega masintõlkes ja anda selleks miljon eurot.

Avaliku sektori tõlkekulu on praegu hinnanguliselt üle kahe miljoni euro aastas. Samas täna ei koguta, kasutata ega hallata tõlkemälusid asutuseüleselt üheski asutuses. Puuduvad masintõlkelahendused, mis võimaldaksid ametlikke dokumente tõlkida.

Justiitsministeerium koos haridus- ja teadusministeeriumi ning majandus- ja kommunikatsiooniministeeriumiga on esitanud taotluse keskse tõlkekeskkonna lähteanalüüsi ja prototüübi loomiseks, mille tulemusi saab kasutada keeletehnoloogia vahendite arendustööks keskses tõlkekeskkonnas.

Uuringute põhjal on masintõlkega tõlkimine keskmiselt 15–20 protsenti kiirem ja hinnanguliselt 40 protsenti soodsam. Plaani järgi tuleb avaliku sektori masintõlge arendada võimalikult mitmekeelseks, näiteks eesti-inglise-eesti, eesti-vene-eesti, eesti-saksa-eesti.

Lisaks tuleb masintõlkele arendada juurde kõnetehnoloogiline võimekus (reaalajaline kõne masintõlge, audiofailide transkribeerimine ja tõlkimine).

Tõlkekeskkonna jaoks loodavad vahendid peaksid saama kasutatavaks kõigile. Kuna eesti keel on väikese kõnelejaskonnaga keel, ei ole eraettevõtete jaoks investeeringud eesti keele suunal tasuvad, mistõttu on Eesti riigi ülesanne tagada masintõlke jaoks põhifunktsioonid ning -ressursid.

Tõlkekeskkonna arendusprojekti realiseerumisel peaks vähenema tehnoloogiliste abivahenditeta tehtud tõlketööde maht ning tõlkimisele ning dubleerivate tõlkevahendite loomisele kulutatav raha ja aeg vähemalt 20 protsenti kolme aasta jooksul kasutuselevõtmisest.

Paranema peaks tõlgete ühis- ja taaskasutus era- ja avaliku sektori osapoolte vahel; avaliku teabe juurdepääsetavus tänu teabe kiiremale tõlkimisele; tõlgete kvaliteet tänu ühtsele terminikasutusele, sh paraneb kõne masintõlke kvaliteet; ettevõtete ligipääs Euroopa Liidu turule tänu keskse kvaliteetse eestikeelse masintõlke avalikule kättesaadavusele.

Tegevused ja täpsem eelarve:

· Masintõlke arendamine eri valdkondade ja tekstiliikide jaoks, 200 000 eurot.

· Masintõlke liidestamine tõlkemäludega, 50 000 eurot.

· Automaatse tekstiliigi (nt õigus, sport, tervishoid) tuvastamise keeletehnoloogilise komponendi arendamine, 80 000 eurot.

· Valdkondlike ja eri tekstiliikide (paralleel)korpuse loomine, 50 000 eurot. Keelepaaride treenimine lisamine masintõlkesüsteemi (5 tk), 180 000 eurot. Tõlkemälude kogumine, kohandamine ja masintõlke treenimine, 100 000 eurot.

· Kõne masintõlke tehnoloogia treenimine ja liidestamine, 40 000 eurot.

· Kõne masintõlke jaoks keelepaaride lisamine, 100 000 eurot.

· Grammatikakontrolli mooduli arendamine 80 000 eurot.

· Liidestamised väliste süsteemidega (terminibaasid) 120 000 eurot.

Toimetaja: Urmet Kook

Hea lugeja, näeme et kasutate vanemat brauseri versiooni või vähelevinud brauserit.

Parema ja terviklikuma kasutajakogemuse tagamiseks soovitame alla laadida uusim versioon mõnest meie toetatud brauserist: