SIA „TILDE” sadarbībā ar Latvijas Universitāti veiksmīgi īsteno ERAF projektu „Lielapjoma statistisko modeļu optimizācijas metodes inovatīvām mašīntulkošanas tehnoloģijām” (id. nr. 2DP/2.1.1.1/13/APIA/VIAA/029).
Noslēdzies pirmais projekta īstenošanas gads. Projekta īstenošanas 4. ceturksnī (no š.g. 1. oktobra līdz 31. decembrim):
- Aktivitātes nr.1 ietvaros veikti pētījumi, meklējot jaunas metodes statistisko modeļu parametru optimizēšanai, īpaši pievēršot uzmanību (1) tulkošanas modeļu izmēru optimizācijai, filtrējot no tiem zemas uzticamības datus, (2) efektīvām metodēm netulkojamu vienumu (skaitļi, datumi, tīmekļa adreses u.tml.) marķēšanai lielos valodas datos, (3) efektīvām metodēm lielo/mazo burtu lietojuma modelēšanai, (4) efektīvai liela apjoma valodas datu apmaiņai ar valodas resursu krātuvi, un (5) mašīntulkošanas risinājumu kvalitātes analīzes rīkiem. Aktivitāti īsteno projekta sadarbības partneris Latvijas Universitāte;
- Aktivitātes nr.2 ietvaros turpināts pētīt metodes statistisko modeļu paralēlai aprēķināšanai, īpaši pievēršot uzmanību vārdu sastatīšanas procesu veiktspējas novērtēšanai un lēnākajiem algoritmiem, kurus var būtiski uzlabot, ieviešot jaunāko pētījumu rezultātus un paralēlās skaitļošanas metodes.
- Aktivitātes nr.3 ietvaros analizēta valodspecifisko SMT metožu lietojamība plašam valodu lokam. Turpināts analizēt vārdu sastatījuma metožu ietekmi uz kopējo mašīntulkošanas kvalitāti. Pētīti vārdus raksturojošās morfoloģiskās informācijas iekļaušanas scenāriji un veidi statistiskajos valodas modeļos. Turpināta šo modeļu aprēķināšana un to kvalitātes novērtēšana. Veikta paša apjoma valodu (20 valodas) un nozarei specifisku (3 nozares) MT sistēmu trenēšana un vērtēšana ar automātiskajām novērtēšanas metodēm (BLEU, NIST, METEOR un TER).
- Aktivitātes nr.4 ietvaros - turpināta testēšanai nepieciešamo testa datu sagatavošana, t.sk., statistisko modeļu trenēšanai nepieciešamo valodas korpusu izveide, MT sistēmu pielāgošanas un testēšanas korpusu izveide visiem aktivitātē A3 apskatītajiem valodu pāriem. Uzsākta, rūpniecisko pētījumu ietvaros izstrādāto rīku testēšana (gan funkcionalitātes, gan ātrdarbības, gan kvalitātes), definēto testēšanas uzdevumu (valodas modeļu aprēķināšana, MT sistēmu trenēšana u.tml.) darbināšana ārējā testēšanas infrastruktūrā un rezultātu dokumentēšana.
Projekta īstenošanas vieta – Vienības gatve 75a, Rīga, Latvija un Raiņa bulvāris 19, Rīga, Latvija, LV-1586.
Projekts pilnībā tiks īstenots līdz 2015.gada 31.augustam.
2013.gada 13. decembrī starp Valsts izglītības attīstības aģentūru un SIA TILDI kā finansējuma saņēmēju tika noslēgts Līgums par ERAF projekta īstenošanu nr. 2013/0038/2DP/2.1.1.1.0/13/APIA/VIAA/029. Projekta kopējās attiecināmās izmaksas apstiprinātas EUR 616’325 apjomā un tās plānots finansēt ar ERAF finansējumu EUR 384’894 apmērā, kas sastāda 62,45% no projekta kopējām attiecināmajām izmaksām un ar privāto finansējumu EUR 231’431 apmērā jeb 37,55% no projekta kopējām attiecināmajām izmaksām.
PROEJKTU LĪDZFINANSĒ EIROPAS REĢIONĀLĀS ATTĪSTĪBAS FONDS