SIA „TILDE” sadarbībā ar Latvijas Universitāti veiksmīgi īsteno ERAF projektu „Lielapjoma statistisko modeļu optimizācijas metodes inovatīvām mašīntulkošanas tehnoloģijām” (id. nr. 2DP/2.1.1.1/13/APIA/VIAA/029).

Projekta īstenošanas 5. ceturksnī (no š.g. 1. janvāra līdz 31. martam) turpināts aktīvs pētnieciskais darbs iesāktajās aktivitātēs, kā arī uzsākta jauna aktivitāte, kuras ietvaros tiek izstrādāts prototips (rīkkopa), kas ietvers programmatūras moduļus efektīvai liela apjoma statistisko modeļu trenēšanai, un to parametru optimizēšanai. Sīkāk par veiktajiem darbiem:          I.            Aktivitātes nr.1 ietvaros turpināti pētījumi, meklējot jaunas metodes statistisko modeļu parametru optimizēšanai, īpaši pievēršot uzmanību (1) tulkošanas un valodas modeļu izmēru optimizācijai, filtrējot no tiem zemas uzticamības datus, (2) efektīvām metodēm netulkojamu vienumu marķēšanai un pareizai apstrādei lielos valodas datos, (3) efektīvām metodēm lielo/mazo burtu lietojuma modelēšanai, (4) efektīvai liela apjoma valodas datu apmaiņai ar valodas resursu krātuvi, un (5) mašīntulkošanas risinājumu kvalitātes analīzes rīkiem. Aktivitātes ietvaros veikto korpusu kvalitātes novērtēšanas un tīrīšanas pētījuma rezultāti apkopoti publikācijā. Aktivitāti īsteno projekta sadarbības partneris Latvijas Universitāte, projekta vadošā pētnieka, Dr.habil.dat. Jura Borzova vadībā;      II.            Aktivitātes nr.2 ietvaros tika pētītas metodes statistisko modeļu paralēlai aprēķināšanai, izmantojot GPGPU (general-purpose computing on graphics processing units), īpaši pievēršot uzmanību datu kārtošanas, filtrēšanas un meklēšanas komponentiem, kurus var būtiski uzlabot, ieviešot jaunāko pētījumu rezultātus un GPGPU paralēlās skaitļošanas metodes.    III.            Aktivitātes nr.3 ietvaros analizēta valodspecifisko SMT metožu lietojamība plašam valodu lokam. Pārskata periodā izveidota eksperimentu infrastruktūra paralēlai transformāciju automatizētai pārbaudei, veikta dažādu faktoru transformāciju ietekmes uz MT kvalitāti analīze un faktormodeļu ietekmes analīze. Aktivitātē veikta risinājuma vispārināmības analīze un izstrādāti uzlaboti faktormodeļi, kā arī īstenota dažādu MT sistēmu un to valodspecifisko modeļu vērtēšana pēcrediģēšanas (post-editing) scenārijā;      IV.            Aktivitātes nr.4 ietvaros turpināta testēšanai nepieciešamo testa datu sagatavošana, t.sk., statistisko modeļu trenēšanai nepieciešamo valodas korpusu izveide, MT sistēmu pielāgošanas un testēšanas korpusu izveide visiem aktivitātē nr.3 apskatītajiem valodu pāriem. Pārskata periodā veikta rūpniecisko pētījumu ietvaros izstrādāto rīku testēšana (gan funkcionalitātes, gan ātrdarbības, gan kvalitātes), definēto testēšanas uzdevumu (valodas modeļu aprēķināšana, MT sistēmu trenēšana u.tml.) darbināšana ārējā testēšanas infrastruktūrā un rezultātu dokumentēšana;        V.            Uzsāktās aktivitātes nr.5 ietvaros iepriekšējo pētniecisko aktivitāšu rezultāti tiek pārbaudīti praksē, tiek veidota rīkkopa MT statistisko modeļu aprēķināšanai un optimizēšanai, kas ļaus praksē pārbaudīt izpētītās metodes. Pārskata periodā veikta prototipa prasību apzināšana, arhitektūras izveide, rūpniecisko pētījumu rezultātā pabeigto rīku apzināšana un analīze, to iekļaušanas prototipā plānošana, kā arī citi protatipa izstrtas un citi pētnieciskie darbi. Projekta īstenošanas vieta – Vienības gatve 75a, Rīga, Latvija un Raiņa bulvāris 19, Rīga, Latvija, LV-1586. Projekts pilnībā tiks īstenots līdz 2015. gada 31. augustam. 2013. gada 13. decembrī starp Valsts izglītības attīstības aģentūru un SIA TILDI kā finansējuma saņēmēju tika noslēgts Līgums par ERAF projekta īstenošanu nr. 2013/0038/2DP/2.1.1.1.0/13/APIA/VIAA/029. Projekta kopējās attiecināmās faktoru izmaksas apstiprinātas EUR 616’325 apjomā un tās plānots finansēt ar ERAF finansējumu EUR 384’894 apmērā, kas sastāda 62,45% no projekta kopējām attiecināmajām izmaksām un ar privāto finansējumu EUR 231’431 apmērā jeb 37,55% no projekta kopējām attiecināmajām izmaksām. PROEJKTU LĪDZFINANSĒ EIROPAS REĢIONĀLĀS ATTĪSTĪBAS FONDS

Dalīties