Viimasel ajal on avaldatud palju arvamusartikleid keelekorralduse ja õigekeelsussõnaraamatu (ÕS) ja Eesti Keele Instituudi kohta. Kajastus on sageli olnud väga ühekülgne ja jääb mulje, nagu kõik keeleinimesed on EKI vastu ja justkui tegemist oleks EKI direktori Arvi Tavasti personaalküsimusega.

Ilmselt jääb teemaga vähem kursis olevale lugejale probleemi olemus segaseks, sest ajakirjandusest jääb mulje, nagu oleks EKI Tavasti juhtimisel üle võtnud mingi avangardistlik-anarhistlik jõuk, kes tahab eesti keele kallal hävitustööd läbi viia (vt nt "Eesti keelt ähvardab miski venestamisest hullem. Õiguskantsler sööstis võitlusse", Eesti Ekspress ja "Keeleinstituudi jakobiinid tühistavad eesti kirjakeelt", Postimees).

Sellised EKI keelekorralduse samastamised venestamise või jakobiinlusega on demagoogilised ja sama kohatud nagu võrrelda vaktsineerimist holokaustiga. Leebema käsitluse järgi ei saa Tavast teadlasena aru, mida keelekorralduses tegelikult vaja on (vt "Suure keelepeavalu keskmes seisab mees, kelles kehastub lahendamatu vastuolu", aga seda mõtet oleme kohanud ka mujal).

Keeleteadlastena on kurb näha, kuidas teadust demoniseeritakse või siis lihtsalt vastandatakse päriselule. Tõenduspõhine teadus üldiselt toetub päris maailma empiirilistele vaatlustele.

Seda, et süstemaatiliselt läbi viidud korduvate empiiriliste vaatluste põhjal tehtud järeldusi kiputakse oma ärihuvist või maailmavaatest lähtuva kõhutunde või talupojatarkuse põhjal tühistama, oleme näinud kahjuks paljudes valdkondades. Teadust ei peaks vastandama päriselule, me just peaksime pidama loomulikuks, et poliitika, majandus ja muud rakendusvaldkonnad toetuvad teaduspõhistele otsustele.

See kurikuulus korpus

Palju on tehtud kriitikat kasutuspõhise keeleteaduse ja korpuslingvistika suhtes, neist ilmselt eriti midagi teadmata. Kasutuspõhine teooria on üks suund keeleteaduse sees (vt Liina Lindström, Lydia Risberg, "Sõnaraamat on oma aja ja koostajate nägu", Postimees), aga keeleteadus üldiselt on empiiriline teadus ja saab vajaliku info keelekasutuse uurimise kaudu.

Eestiski on seda kasutuspõhiselt tehtud oluliselt kauem kui tänapäevases mõttes korpuseid on koostatud. Koos Eesti Vabariigiga loodi 1920. aastal Emakeele Selts, mis algselt tegutses Tartu Ülikooli juures ning mille peamine eesmärk oli koguda eesti keele murdeid. Seda tehti nii, et kirjutati üles (hilisemal ajal salvestati) inimeste juttu, sealt kirjutati välja sõnad, mis läksid kartoteeki ja mille põhjal antakse tänapäevani välja murdesõnaraamatuid.

Mingi sõna olemasolu keeles on tõendatud sellega, et keegi on selle kasutuses üles tähendanud, lisanud kogumisaja ja -koha. Ka 1869. aastal ilmunud Ferdinand Johann Wiedemanni sõnastik, mis on üks varasemaid põhjalikke eesti keele sõnastikke, on oma olemuselt kasutuspõhine: Wiedemann ei mõelnud ise välja, mis sõnad mis tähenduses eesti keeles olema peaksid, vaid registreeris seda, mida ta kasutuses nägi ja kuulis.

Tänapäeva keeleteaduse ja -tehnoloogia aluseks on korpused, mida eesti keele jaoks on loodud alates 1990. aastate algusest. Korpus on süstemaatiliselt kogutud tekstide või kõnesalvestiste kollektsioon, mis tihti sisaldab ka mingit lingvistilist analüüsi (näiteks igal sõnal on määratud sõnaliik ja käändevorm).

Eesti keeleteadlased on teinud head tööd: meil on palju erinevaid korpuseid, mis võimaldavad meil eesti keelt mitmekülgselt ja põhjalikult kirjeldada ja uurida. Korpused on oluline lähtematerjal ka keelemudelite ja keeletehnoloogia loomiseks, mis samuti annavad eesti keelele vajaliku elujõu.

Korpused ja tegelik keelekasutus on muuhulgas aluseks eestikeelsetele tehisaru mudelitele, mis mõjutavad tuleviku eesti keelt ilmselt rohkem, kui me praegu arvatagi oskame.

On enam kui mõistlik, et korpused on aluseks ka sõnaraamatute, s.h ÕS-i koostamisel, sest need sisaldavad külluslikult tänapäevast keelematerjali, annavad infot sõnade kasutusviiside (tähenduse), kasutussageduse ja leviku üle eri registrites.

Korpuste põhjal on võimalik otsustada, millised sõnad peaksid kindlasti sõnaraamatus olema ja mis pole nii olulised, kui maht on piiratud. Korpus võimaldab kasutusjuhtumite võrdlemise teel üldistada infot sõnade tähenduse ja konstruktsioonilise käitumise kohta.

"Sellel meetodil on oht, et teadlane laseb oma tunnetust liialt mõjutada teooriast, mida ta soovib tõestada."

Mis on alternatiiv? Empiirilise teaduse kõrval on eksisteerinud ka nn tugitoolilingvistika, mis tähendab seda, et keeleteadlane teeb järeldused isikliku keeletunnetuse põhjal. Sellel meetodil on oht, et teadlane laseb oma tunnetust liialt mõjutada teooriast, mida ta soovib tõestada. Ka enesereflektsioonist tuletatud teooriat tuleks testida teiste keelekasutajate peal.

Nii ka sõnaraamatu puhul: kui sõnaraamatu koostaja pakub sõnadele vaid neid tähendusi, mis talle meeldivad, siis tulemuseks on, et sõnaraamat ei kajasta üldiselt kasutatavat eesti keelt, vaid kellegi isiklikke maitse-eelistusi.

Igal juhul mõte, et keelt saab kasutajatest kuidagi lahus hoida ja kasutajad võiks keelele ohtlikud olla (vt "Õiguskantsler: uus ÕS peaks lähtuma keeleseaduse nõuetest", ERR), on keeleteaduse seisukohast absurdne.

Mis on eesti keelele omane?

ÕS-i pärast südant valutajate jutust jääb mulje, et võitlus käib selle nimel, mis on eesti keelele omane. Eesti keel ajalooliselt ja ka Eesti keelekorraldus läbi oma 150-aastase ajaloo on olnud suhteliselt avatud võõrmõjudele.

Kultuurkeelena on oldud väga altid kasutama võõrsõnu ja nende ortograafia on pigem lähtunud lähtekeelest. Vastuoluliselt on keelekorraldus olnud pigem konservatiivne kord kasutusele võetud sõnade muutmise suhtes ja säilitanud võõrmõjusid ka siis, kui kasutuses sõnad muganema on hakanud. Toome selle kohta mõned näited.

Eesti keelele ja laiemalt läänemeresoome keeleareaalile on omane, et sõnadel on rõhk esimesel silbil ning korrapäraselt vahelduvad rõhulised ja rõhutud silbid. Eesti omasõnades üldiselt on rõhk esisilbil, võõrsõnades tihti mitte. Esisilbirõhu reeglit järgivad näiteks soome ja läti keel palju rangemalt.

Meil on pigem kombeks võõrsõnu lähtekeelepäraselt üle võtta ja see kajastub ka ortograafianormingutes: võõrsõnades on sageli pikk vokaal järgsilbis, mida eesti omasõnades olla ei saa, nt sõnad foneetika, mandariin, režissöör.

Sageli kasutuse käigus rõhk nihkub siiski esisilbile ja seda on mingite sõnade ortograafianormingutes ka kajastatud, näiteks sõnad kefiir ja kotlett muudeti millalgi 20. sajandi teises pooles keefir ja kotlet. On teisi sõnu, kus rõhk on nihkunud esisilbile, aga ortograafiat muudetud ei ole, nt sõnas mandariin.

Teine rõhuga seotud muutus eesti keeles, mis ka morfoloogiat mõjutab ja aastakümneid segadust on tekitanud, on kaasrõhu paiknemine kolmandavältelistes sõnades. Eesti keeles tekkis teise ja kolmanda välte eristus 13.-16. sajandi jooksul toimunud häälikukadude tagajärjel. Paljud sõnad kaotasid teise silbi vokaali nt *laulamahan > laulma, *jalka > jalg, ja algselt kahesilbiline kõnetakt muutus ühesilbiliseks kolmandavälteliseks kõnetaktiks.

Kui varasemalt ei olnud eesti keeles võimalik, et kaks rõhulist silpi on kõrvuti, siis tänapäeval kehtib see piirang ainult esimese ja teise välte puhul. Kolmandas vältes võib olla kaks rõhulist silpi järjest, nt laulmine, mõtlik, kontsert. Aga viimase sajandi jooksul on see jälle muutuma hakanud ja oleme uuesti teel selles suunas, et eelistatud on korrapärane rõhuliste ja rõhutute silpide vaheldumine. Seda tendentsi on märganud ja kirjeldanud teiste hulgas Mati Hint, Ilse Lehiste ja Arvo Eek juba 1970.-1980. aastatel.

Vähemalt nii kaua teame, et kontsert-tüüpi sõnad on "veaohtlikud", aga millegi pärast ei ole seda "vabaks lastud". Milles viga seisneb? Mitmuse omastava vormi moodustamises: normi järgi on õige kontsertide, mis eeldab, et teine silp on kaasrõhuline, aga kui teine silp on rõhutu, on loomulikum kontserdite.

Häälduse ja võõrsõnadega on seotud veel kolmas vastuolu: klusiilide (g, b, d) ja postalveolaarsete frikatiivide (z, ž) helilisus. Klassikalise eesti fonoloogia kirjelduse järgi ei ole eesti keeles need häälikud helilised, mis tähendab, et näiteks sõnad garaaž, banaan, zaporoožlane tuleks hääldada nii, nagu nad oleks kirjutatud karaaš, panaan, saporoošlane. Varasemas kirjelduses öeldakse ka, et š ei ole eesti keele süsteemis omaks võetud ja šokolaad hääldatakse kui sokolaad.

Meil tegelikult puuduvad empiirilised uurimused sellest, kui levinud on nende häälikute heliline hääldamine eesti keeles, aga võiks oletada, et umbes sajand ortograafiadrilli ilma ortoeepiata tavakoolis on need häälikud ka eesti keelde toonud ja vähemalt formaalsetes registrites hääldatakse banaani helilise alguskonsonandiga, kuigi see ei ole eesti keele pärane.

Me oleme harjunud mõtlema, et eesti keele kirjaviis on häälduspärane, aga mitmetes aspektides see seda ei ole ja nii-öelda ortograafiavead tekivad sageli häälduse ja kirjaviisi lahknevustest.

Me võiksime palju enam oma kirjaviisi korrastada ja süstematiseerida, et veaohtu vähendada. Eri aegadel on üksikuid katseid tehtud, aga viimasel ajal eriti mitte ja seda suuresti halva retseptsiooni tõttu. Näiteks on keelekorraldajatel valusasti meeles katse pensionär-tüüpi sõnade j-ga kirjutamisega lubamisest 1999. aasta ÕS-is.

Suuremaid kirjaviisimuutusi hoiabki tagasi see, et need, kes on kord kirjutama õppinud, ei soovi muudatusi ja mingil määral on see ka täiesti mõistetav.

Õiguskantsleri tõlgendus eesti keele säilitamise kohustuse elluviimisele keelekorralduses näeb ühe punktina omasõnade eelistamist võõrsõnadele. See on risti vastu sellele, mida on eestikeelne kooliharidus teinud viimase saja aasta jooksul, kus harituse märgiks on see, et oskad võõrsõnu õigesti kasutada ja kirjutada. Keeleteadlastena tervitame ortograafiareeglite jõulisemat eestikeelepärastamist, aga ilmselt üldsusele see üldse ei meeldiks.

ÕS-i lahendamist vajavad probleemid

ÕS-ile omistatakse omadusi, mida tal ei ole kunagi olnud. Näiteks üks levinud mure ÕS-i tuleviku osas on see, et sõnad kaotavad oma kokkulepitud tähenduse, kui me ei saa neid ÕS-ist järele vaadata.

Kes aga ÕS-i ise on sirvinud, on ehk märganud, et väga suur hulk sõnu (üle 15 000 märksõna) on seal defineerimata, on toodud ainult näiteid kinnisväljenditest (vt nt sagedaste mitmetähenduslike verbide tulema ja saama nappi kirjeldust ÕS-is).

Sõnad, mille tähendust on defineeritud, on juhuslikud ja tihti on määratud ainult tähendus, mida taunitakse või antakse muid hinnanguid registrisobivuse kohta. Näiteks sõna pasta on märgitud argikeelseks ja seega ebasoovitavaks. Mille poolest selle asemel soovitatud makarontoode parem on, jääb segaseks; ilmselgelt on tänapäeva keelekasutuses sõna makaron nõukaaegse maiguga ja selle kasutus väheneb järjest, seda asendanud pasta on aga üldlevinud.

Suur probleem on, et ÕS-i on läbi aegade koostatud nii, et vanadele ÕS-i sõnadele lisatakse uusi ja mõnevõrra ajakohastatakse olemasolevaid. See on toonud kaasa olukorra, et terve rida ÕS-is leiduvaid sõnu on tegelikust keelekasutusest väljas või lausa tundmatud (nt aiduraidutama, eetsi, häil).

Kuidas need peaksid kirjakeele normi selgitama, jääb arusaamatuks, küll aga võiks nende asemel vabastada mahtu vajalikumate sõnade jaoks: ÕS-ist terve rida tänapäeva maailmas olulisi sõnu puudu.

Kui ÕS-i kasutada päriselt kirjakeele normi alusena, ei vasta meie seadused praegu kuidagi kirjakeele normile. Näiteks keeleseaduse teksti vaadates on täiesti puudu sõnad põhiõigus, õigekirjutuslik, elamisõigus, käskluskeel, raamdokument; terve rida sõnu on küll ÕS-is olemas, ent tähendust pole selgitatud.

Ilmselgelt ei saa siin ÕS täita ülesannet tähendusi kuidagi defineerida või paigas hoida, nagu talle on omistatud. Osa neist sõnadest võib esindada ka pigem erialakeelt, mille koht polegi ÕS-is, vaid terminoloogiasõnastikus; ÕS peaks esindama ennekõike üldkeelt.

Sageli omistatakse ÕS-ile ka sõnavara kaardistamise funktsiooni, st seda, et sõna on päriselt eesti keeles olemas juhul, kui see on ÕS-is ja kui ÕS-is sees pole, siis pole õige sõna. Sõna olemasolu ei sõltu sellest, kas seda on sõnaraamatus kirjeldatud ja kindlasti ei pretendeerigi ÕS kogu eesti keele sõnavara esindama.

"Praegune ÕS 2018 sisaldab umbes 54 000 märksõna, ent see ei ole tänapäevase keeruka maailma kirjeldamiseks kuidagi piisav."

ÕS-i maht on paratamatult piiratud, eriti kui seda soovitakse edaspidigi näha trükitud sõnaraamatuna. Praegune ÕS 2018 sisaldab umbes 54 000 märksõna, ent see ei ole tänapäevase keeruka maailma kirjeldamiseks kuidagi piisav, mistõttu ei toimi see praegusel kujul ka kirjakeele normi adekvaatse alusena. Kui ÕS peab ka edaspidi raamatuna ilmuma, on väga vajalik selle sisu kriitilise pilguga ja korpusest lähtudes üle vaadata.

Aga kuidas seda ÕS-i siis tegema peaks?

Kriitika EKI sõnastikutöö ja ÕS-i saatuse osas on mitmeti vastuoluline. Ühelt poolt peaks ÕS olema tööriist, mis reguleerib ametliku keelekasutuse sõnavara. Teiselt poolt kritiseeritakse, et kui sõnastikku koostatakse korpuspõhiselt, siis see ei sisalda piisavalt palju ilukirjandust ja seetõttu pole piisavalt esinduslik. Oleks päris lõbus, kui ametnikud meile luulevormis dokumente väljastaksid, aga see pole vist päris see, mida me tahame.

Korpuspõhise sõnastikutöö kriitikud kirjeldavad seda sageli nii, et justkui korpusest jooksevad automaatselt kõik sõnad sõnastikku ja normiks saavad valed ja vigased sõnad (eeldusel, et korpus sisaldab valet keelt või on vigane kasutus korrektsest sagedasem).

Samas on EKI leksikoloogid korduvalt selgitanud, et nad teadlasena analüüsivad korpusest leitut ja hindavad seda muude sõnastike ja allikate valguses. Aga mis siis õieti on alternatiivne "hea" viis sõnastikku koostada? Kust tulevad sõnad sõnastikku, kui mitte kasutusest?

ÕS-i puhul, nii nagu seda seni on koostatud, on pigem probleemiks, et seda ei ole koostatud teaduslikel alustel, vaid alati on täiendatud vana versiooni: uue ÕS-i jaoks tuleks eesti keele avalike ja ametlike tekstide jaoks vajalik sõnavara süstemaatiliselt korpuspõhiselt läbi vaadata, jälgides nii kasutussagedust kui levikut registrites.

Kokkuvõttes stigmatiseeritakse praeguses EKI ja ÕS-i kriitikas keeleteadust ja üldisemalt tõenduspõhist empiirilist teadust, kuulamata ära teadlaste põhjendusi ja selgitusi. Keelekorraldus peab põhinema süstemaatilisel empiirilisel teadustööl, mitte keelekorraldaja keeletunnetusel või maitse-eelistustel. Keelekorraldus ei peaks lähtuma ka vaid üksikute huvirühmade, näiteks keeletoimetajate agendast, vaid arvestama eeskätt tavakasutaja vajadusi.