Pārskats par projektā "Neironu tīkli fleksīvo dabisko valodu apstrādei" paveikto līdz 2017. gada 31. jūlijam.

Turpināta literatūras un metožu izpēte par neironu tīklu modeļu izmantošanu statistiskās mašīntulkošanas risinājumos, vārdu jēdzientelpu analīzei, lai gūtu priekšstatu un zināšanas par esošiem risinājumiem vārdu jēdzientelpu vizualizācijai un to potenciālos lietojumus. Pārskata periodā pabeigta datu sagatavošana statistiskās mašīntulkošanas un neironu tīklu modeļu bāzlīnijas versiju izstrādei. Pārskata periodā pabeigta metožu apzināšana pilna cikla neironu tīklu mašīntulkošanas modeļu izstrādei. Uzsākta bāzlīnijas pilna cikla neironu tīklu mašīntulkošanas modeļu izstrāde. Tika veikta jaunu (vārdnīcās neiekļautu) vārdu tulkojumu izvilkšana no tulkošanas modeļiem, kas iegūti no liela paralēlā datu korpusa. Veikta Latviešu valodas gramatikas kļūdu tipoloģija ir salīdzināta ar kļūdu tipiem, kurus piedāvā labot angļu valodas gramatikas pārbaudes rīki. Ir identificētas kļūdu grupas, kuras būtu izmantojamas gramatiskuma vērtēšanas testos. Ir apzināti ar kļūdu tipiem  marķēti korpusi, kuru piemērus varētu izmantot gramatiskuma vērtēšanas testos. Veikti eksperimenti ar telefonsakaru kvalitātes (8KHz) trenēšanas datu automātisku izveidi no parastiem augstas kvalitātes datiem. Implementēti pirmie uz neironu tīkliem balstīti modeļi skaitļu konvertēšanai no cipariskas formas uz rakstītiem vārdiem, kas ir vajadzīgs valodas modeļu trenēšanas datu apstrādei. Veikta novērtēšana un salīdzinājums ar klasisko uz likumiem bāzēto risinājumu. Projekta īstenošanas 3. posmā (no 2017. gada 1. maija līdz 2017. gada 31. jūlijam) notika darbības: I. Neironu tīklu lietojuma matemātiskie un kognitīvie aspekti valodu tehnoloģijās II. Neironu tīklu lietojamība rakstītā teksta analīzē III. Neironu tīklu lietojamība automatizētas tulkošanas uzdevumā IV. Neironu tīklu lietojamība runas tehnoloģijās (LV, LT) V. Neironu tīklu lietojamība cilvēka-datora saziņas modelēšanā  

Share