Show simple item record

dc.contributor.authorŠveikauskienė, Daiva
dc.contributor.authorRibikauskas, Arūnas
dc.contributor.authorŠveikauskas, Vytautas
dc.date.accessioned2023-09-18T20:31:03Z
dc.date.available2023-09-18T20:31:03Z
dc.date.issued2019
dc.identifier.issn1407-4737
dc.identifier.urihttps://etalpykla.vilniustech.lt/handle/123456789/150630
dc.description.abstractLietuvių kalbos gramatikos informacinėje sistemoje (LIGIS) kaupiami dviejų tipų duomenys: a) plačiajai visuomenei skirta informacija iš morfologijos, morfemikos ir žodžių darybos sričių ir b) kompiuteriniam kalbos apdorojimui tinkanti koduotė, aprašanti kiekvieną sistemoje esantį žodį. Kuriant šią koduotę buvo domėtasi jau sukurtomis ir lietuvių kalbai naudojamomis – tai Vytauto Didžiojo universitete naudojami du kodavimo varinatai: čekiškasis PML (Prague Markup Language) ir PAULA bei bendra latvių ir lietuvių kalboms koduotė Salos Glossing Rules (SGR). Analizuotos galimybės galimybės šiuos kodavimo variantus pritaikyti LIGIS. Paaiškėjo, kad naudojant čekiškąjį PML, žodis vaizduojamas kaip simbolių seka, kur kiekvienas simbolis žymi tam tikrą morfologinę kategoriją ir jo reikšmė priklauso nuo pozicijos toje sekoje. Tai apsunkina paiešką, nes reikia įvertinti ne tik patį simbolį, bet ir jo vietą sekoje. Šio trūkumo neturi variantas PAULA, sukurtas remiantis LGR (Leipzig Glossing Rules) pagrindu, kai kiekvienai morfologinei kategorijai aprašyti naudojama simbolių grupė, atskirta iš abiejų pusių taškais. SGR taip pat remiasi LGR principais, bet nemažai skiriasi nuo varianto PAULA. Todėl nėra prasmės kurti dar ir trečią angliškais terminais besiremiančią koduotę, nes nė viena iš sukurtų netenkina LIGIS reikmių. Todėl nuspręsta kurti naują koduotę, panaudojant PAULA principą, bet pasirenkant sutrumpintus lietuvių kalbos žodžius gramatinėms kategorijoms aprašyti. Pvz., žodis „bėgiodama“sistemoje LIGIS koduojamas taip: .PUSD.MOTG.VNS. (pusdalyvis, moteriškoji giminė, vienaskaita).lit
dc.description.abstractIm Informationssystem für Grammatik der litauischen Sprache (LIGIS) werden zwei Arten der Daten gespeichert: a) für die breite Öffentlichkeit bestimmte Information auf dem Gebiet der Morphologie, Morphemik und Derivation, und b) die Angaben über jedes im System vorhandene Wort im Computer-freundlichem Format. Zu diesem Zweck wurden die Möglichkeiten analysiert, die an der Vytautas Magnus Universität (VDU) benutzten Kodierungen sowie die Salos Glossing Rules (SGR) auch für LIGIS zu gebrauchen. VDU benutzt zwei Varianten der Kodierung: die tschechische PML (Prague Markup Language) und PAULA. In PML wird das Wort als eine Reihe von Symbolen dargestellt. Jedes Symbol bezeichnet eine bestimmte morphologische Kategorie. Die Bedeutung des Symbols hängt aber von der Stelle in der Reihe ab, d. h. dasselbe Symbol in verschiedenen Positionen kann unterschiedliche Bedeutungen haben. Das ist ein Nachteil bei der Suche der Wörter. Die PAULA Kodierung, die auf Grundlage der LGR geschaffen wurde, hat dieses Problem nicht mehr: für die Kodierung einer morphologischen Kategorie benutzt man einige Buchstaben mit von beiden Seiten getrennten Punkt-Zeichen. Die SGR benutzt auch LGR, und zum Ziel hatte einen Standard für die Kodierung der baltischen Sprachen zu schaffen. Leider unterscheiden sich PAULA und SGR sehr stark voneinander. Es hat keinen Zweck die dritte Kodierung aufgrund der englischen Terminologie zu schaffen, weil keine von den zurzeit vorhandenen Kodierungen dem Bedarf von LIGIS entspricht. Deshalb wurde beschlossen eine neue, eigene Kodierung nach dem Muster von PAULA zu schaffen, in der nur die litauischen Benennungen der grammatischen Merkmale der Wörter für Abkürzungen benutzt werden, z. B. das Wort bėgiodama wird als .PUSD.MOTG.VNS. (Partizip I, Femininum, Singular) kodiert.ger
dc.format.extentp. 440-449
dc.format.mediumtekstas / txt
dc.language.isolit
dc.relation.isreferencedbyAcademic Search Research and Developement (EBSCO)
dc.source.urihttps://dom.lndb.lv/data/obj/836813.html
dc.subject• Computerlinguistik
dc.subjectComputerisierung der Grammatik
dc.subjectKodierung der Wörter
dc.subjectmorphologische Kategorien
dc.subjectInformationssystem für Grammatik
dc.titleLietuvių kalbos žodžių kompiuterinis kodavimas
dc.title.alternativeComputerkodierung der Wörter von litauischen Sprache
dc.typeStraipsnis konferencijos darbų leidinyje kitoje DB / Paper in conference publication in other DB
dcterms.references31
dc.type.pubtypeP1c - Straipsnis konferencijos darbų leidinyje kitoje DB / Article in conference proceedings in other DB
dc.contributor.institutionLietuvių kalbos institutas
dc.contributor.institutionVilniaus Gedimino technikos universitetas
dc.contributor.facultyFundamentinių mokslų fakultetas / Faculty of Fundamental Sciences
dc.subject.researchfieldH 004 - Filologija / Philology
dc.subject.ltkompiuterinė lingvistika
dc.subject.ltgramatikos kompiuterizavimas
dc.subject.ltžodžių koduotė
dc.subject.ltmorfologinės kategorijos
dc.subject.ltgramatikos informacinė sistema.
dcterms.sourcetitleVārds un tā pētīšanas aspekti : rakstu krājums
dc.description.volumet. 23(1/2)
dc.publisher.nameLiePA
dc.publisher.cityLiepāja
dc.identifier.elaba65975712


Files in this item

FilesSizeFormatView

There are no files associated with this item.

This item appears in the following Collection(s)

Show simple item record