Päevatoimetaja:
Georgi Beltadze
+372 666 2180
Saada vihje

Teadlased: eesti keele digitaalne olukord on parem kui uuringust selgub

Juhime tähelepanu, et artikkel on rohkem kui viis aastat vana ning kuulub meie arhiivi. Ajakirjandusväljaanne ei uuenda arhiivide sisu, seega võib olla vajalik tutvuda ka uuemate allikatega.
Toimetaja: Heidi Ojamaa
Copy
Tartu Ülikooli peahoone.
Tartu Ülikooli peahoone. Foto: Margus Ansu

Eesti keele digitaalne olukord on parem kui Euroopa keeletehnoloogide uuringust selgub, leiavad uuringus osalenud Tartu Ülikooli teadlased.

Euroopa keeletehnoloogide tehtud uuringus viis eesti keele hinde alla tekstianalüütika valdkond, kus semantilise analüüsiga ei ole palju tegeletud.

Tartu Ülikooli matemaatika-informaatikateaduskonna arvutiteaduse instituudi keeletehnoloogia vanemteadur Kaili Müürisep märkis, et keeletehnoloogia olukord Eestis ei ole halb, valdkonnaga tegeletakse pidevalt ning riiklik tugi on suur.

Uuringus on eesti keel Müürisepa sõnul puuduliku tulemusega vaid semantilise analüüsi valdkonnas, morfoloogia ja süntaksi analüüs on ka võrreldes teiste riikidega heas seisus.

«Kuna semantiline analüüs on alles lapsekingades, sai ta ka puuduliku toe alla pandud.» Ta märkis, et enamik programme aga ei vaja semantilist tuge, küll aga on enamikul programmidel vaja morfoloogia ja süntaksi tuge. 

Ta lisas, et riik on palju toetanud keeletehnoloogia arengut ja selle seis on parem, kui näib uuringust.

Tartu Ülikooli arvutiteaduse instituudi keeletehnoloogia õppetooli keeletehnoloogia vanemteadur Kadri Muischnek oli seisukohal, et eesti keeletehnoloogiline olukord ei ole nii halb ning raport ei peegelda olukorda päris adekvaatselt. «Tõsi ta on, et meil on palju teha. Aga meil ei ole selliseid võimalusi nagu suurtel keeltel, mille vastu on suur kommertshuvi.»

Ta lisas, et kommertshuvi puudumine on väikeste keelte puhul paratamatu.

Euroopa keeletehnoloogide tehtud uuringus keskenduti 80st Euroopas kõneldavast keelest 30-le ning leiti, et 21 neist ähvardab digitaalne hääbumine, kuna nende digitaalne tugi on olematu või kehv, mistõttu ei suuda need digiajastul ellu jääda.

Muu hulgas hinnati iga keele keeletehnoloogilist tuge neljas valdkonnas: masintõlge, kõnetöötlus, tekstianalüüs ja keeleressursside olemasolu.  

Kuigi eesti keele olukorda peeti võrreldes läti ja leedu keelega paremaks, paigutati ka eesti keel ohustatud keelte hulka koos näiteks ungari, poola, kreeka ja bulgaaria keelega. Kõige probleemsemaks peeti eesti keele puhul masintõlke valdkonda ja tekstianalüüsi, kahes teises uuritavas valdkonnas peeti eesti keele olukorda mõnevõrra paremaks.  

Eestist osalesid uurimuses Krista Liin, Kadri Muischnek, Kaili Müürisep ja Kadri Vider Tartu Ülikoolist.

Tagasi üles