Noslēdzies pirmais projekta īstenošanas gads. Projekta īstenošanas 4. ceturksnī (no š.g. 1. oktobra līdz 31. decembrim):
- Aktivitātes nr.1 ietvaros veikti pētījumi, meklējot jaunas metodes statistisko modeļu parametru optimizēšanai, īpaši pievēršot uzmanību (1) tulkošanas modeļu izmēru optimizācijai, filtrējot no tiem zemas uzticamības datus, (2) efektīvām metodēm netulkojamu vienumu (skaitļi, datumi, tīmekļa adreses u.tml.) marķēšanai lielos valodas datos, (3) efektīvām metodēm lielo/mazo burtu lietojuma modelēšanai, (4) efektīvai liela apjoma valodas datu apmaiņai ar valodas resursu krātuvi, un (5) mašīntulkošanas risinājumu kvalitātes analīzes rīkiem. Aktivitāti īsteno projekta sadarbības partneris Latvijas Universitāte;
- Aktivitātes nr.2 ietvaros turpināts pētīt metodes statistisko modeļu paralēlai aprēķināšanai, īpaši pievēršot uzmanību vārdu sastatīšanas procesu veiktspējas novērtēšanai un lēnākajiem algoritmiem, kurus var būtiski uzlabot, ieviešot jaunāko pētījumu rezultātus un paralēlās skaitļošanas metodes.
- Aktivitātes nr.3 ietvaros analizēta valodspecifisko SMT metožu lietojamība plašam valodu lokam. Turpināts analizēt vārdu sastatījuma metožu ietekmi uz kopējo mašīntulkošanas kvalitāti. Pētīti vārdus raksturojošās morfoloģiskās informācijas iekļaušanas scenāriji un veidi statistiskajos valodas modeļos. Turpināta šo modeļu aprēķināšana un to kvalitātes novērtēšana. Veikta paša apjoma valodu (20 valodas) un nozarei specifisku (3 nozares) MT sistēmu trenēšana un vērtēšana ar automātiskajām novērtēšanas metodēm (BLEU, NIST, METEOR un TER).
- Aktivitātes nr.4 ietvaros - turpināta testēšanai nepieciešamo testa datu sagatavošana, t.sk., statistisko modeļu trenēšanai nepieciešamo valodas korpusu izveide, MT sistēmu pielāgošanas un testēšanas korpusu izveide visiem aktivitātē A3 apskatītajiem valodu pāriem. Uzsākta, rūpniecisko pētījumu ietvaros izstrādāto rīku testēšana (gan funkcionalitātes, gan ātrdarbības, gan kvalitātes), definēto testēšanas uzdevumu (valodas modeļu aprēķināšana, MT sistēmu trenēšana u.tml.) darbināšana ārējā testēšanas infrastruktūrā un rezultātu dokumentēšana.