2017. gada 8. decembrī LU Datorzinātņu promocijas padomē promocijas darbu "Rīku kopa latviešu valodas semantikas analīzei" veiksmīgi aizstāvēja un doktora zinātnisko grādu ieguva Pēteris Paikens. Darba vadītājs - prof. Guntis Bārzdiņš.
Recenzenti: prof.
Dr.sc.comp. K.Čerāns (LU), prof.
Dr.sc.comp. T.Krilavičius (Kauņas Vitauta Dižā Universitāte, Lietuva)
, pētnieks.
Dr. E.Barbu (Tartu Universitāte, Igaunija).
Balsošanas rezultāti: piešķirt – 12, nepiešķirt – nav, nederīgu biļetenu nav.
Darba anotācija
Promocijas darba pētījuma priekšmets ir automātiskas teksta analīzes metodes, apskatot visus dabiskās valodas apstrādes līmeņus, kas nepieciešami teksta semantiskai analīzei, īpaši pievēršoties risinājumiem, kuri trūka latviešu valodas teksta analīzei. Darbs ir izstrādāts 5 gadu laikā LU MII 4 pētījumu projektu un 2 valsts pētījumu programmu ietvaros.
Darbā tiek apskatītas autora realizētās metodes latviešu valodas nosaukto entitāšu atpazīšanai un piesaistei reālijām. Zināšanu formālās reprezentācijas vajadzībām ir izveidota FrameNet ontoloģija personu un organizāciju datu un attiecību modelēšanai.
Darbā ir piedāvāts un realizēts latviešu valodas morfoloģiskās struktūras formāls modelis ar plašu pārklājumu, kas ir piemērots patvaļīga teksta analīzei. Darbā ir apskatītas autora realizētās metodes latviešu valodas morfosintaktiskai analīzei un realizēts neironu tīklu risinājums daudznozīmības novēršanai. Izstrādātais modelis ir aprobēts praksē vairākos projektos un dabiskās valodas rīku izstrādē.
Tāpat darbā ir piedāvāta un realizēta arhitektūra informācijas izguves rīku kopai. Pētīto metožu praktiskai aprobācijai darba gaitā ir izveidots informācijas izguves un zināšanu bāzes aizpildes sistēmas prototips faktu izguvei no latviešu valodas ziņu tekstiem. Šis prototips ir aprobēts ziņu aģentūrā LETA latviešu valodai, kā arī rezultāti ir novērtēti kontekstā ar labākajiem angļu valodas teksta analīzes rezultātiem.