Show simple item record

dc.contributor.authorLaukaitis, Algirdas
dc.contributor.authorVasilecas, Olegas
dc.date.accessioned2023-09-18T17:22:37Z
dc.date.available2023-09-18T17:22:37Z
dc.date.issued2008
dc.identifier.issn0868-4952
dc.identifier.other(BIS)VGT02-000018379
dc.identifier.urihttps://etalpykla.vilniustech.lt/handle/123456789/122551
dc.description.abstractThis paper examins approaches for translation between English and morphology-rich languages. Experiment with English-Russian and English-Lithuanian revels that ``pure'' statistical approaches on 10 million word corpus gives unsatisfactory translation. Then, several Web-available linguistic resources are suggested for translation. Syntax parsers, bilingual and semantic dictionaries, bilingual parallel corpus and monolingualWeb-based corpus are integrated in one comprehensive statistical model. Multi-abstraction language representation is used for statistical induction of syntactic and semantic transformation rules called multi-alignment templates. The decodingmodel is described using the feature functions, a log-linear modeling approach and A^* search algorithm. An evaluation of this approach is performed on the English-Lithuanian language pair. Presented experimental results demonstrates that the multi-abstraction approach and hybridization of learning methods can improve quality of translation.eng
dc.description.abstractDidesnė dalis pasaulio kalbų kol kas nenaudojamos automatinio vertimo sistemose. Siekiant paspartinti nauj u kalb u panaudojim a automatinėse vertimo sistemose pastaruosius dešimt metų daug tyrimų buvo atlikta tam, kad būtų galima automatizuoti vertimo sistemų kūrimą panaudojant turimus išverstus tekstinius informacijos resursus. Tačiau tokie tyrimai buvo atlikti tik su taip vadinamomis aukšto dažnumo kalbomis, kuriose imanoma gauti didelius kiekius išverstos informacijos. Lietuvių kalboje kaip ir daugelyje kitų kalbų kol kas nėra sukaupta pakankami kiekiai išverstos informacijos tam, kad būtų galima apmokyti egzistuojančias vertimo sistemas arba panaudoti sukurtas metodikas. Šiame darbe pasiūlytas ir realizuotas hibridinis metodas, kuris leidžia apmokinti vertimo sistemas iš mažesnio kiekio turimos vertimo medžiagos. Tačiau metodas reikalauja, kad sistema turėtų vertimo žodyną, pilną anglų kalbos ontologiją ir kad galėtų atlikti anglų kalbos pilną gramatinę analizę. Gauti rezultatai parodė, kad šio metodo pagalba galima sukurti vertimo sistemas, kurios pagal savo kokybę nenusileidžia pasaulyje esantiems analogams, kurie buvo sukurti statistinio modeliavimo pagalba. Esamas metodas ir sukurta programinė įranga gali būti pritaikyti ne tik lietuvių bet ir kitoms kalboms, kuriose sunku surasti didelius kiekius išverstos informacijos ir kuriose nėra resursų rankiniam vertimo sistemos kalibravimui suvedant vertimo gramatines taisykles.lit
dc.formatPDF
dc.format.mediumtekstas / txt
dc.language.isoeng
dc.relation.isreferencedbyScience Citation Index Expanded (Web of Science)
dc.source.urihttps://doi.org/10.15388/Informatica.2008.229
dc.titleMulti-alignment templates induction
dc.title.alternativeAutomatinio vertimo taisyklių indukcija
dc.typeStraipsnis Web of Science DB / Article in Web of Science DB
dcterms.references21
dc.type.pubtypeS1 - Straipsnis Web of Science DB / Web of Science DB article
dc.contributor.institutionVilniaus Gedimino technikos universitetas
dc.contributor.facultyFundamentinių mokslų fakultetas / Faculty of Fundamental Sciences
dc.subject.researchfieldT 007 - Informatikos inžinerija / Informatics engineering
dc.subject.enMachine translation
dc.subject.enNatural language processing
dc.subject.enStatistical induction
dc.subject.enEM algorithm
dc.subject.enA^* search
dcterms.sourcetitleInformatica
dc.description.issueno. 4
dc.description.volumeVol. 19
dc.publisher.nameMatematikos ir informatikos institutas
dc.publisher.cityVilnius
dc.identifier.doi000262127700005
dc.identifier.doi10.15388/Informatica.2008.229
dc.identifier.elaba3856848


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record