dc.contributor.author | Šveikauskienė, Daiva | |
dc.contributor.author | Ribikauskas, Arūnas | |
dc.contributor.author | Šveikauskas, Vytautas | |
dc.date.accessioned | 2023-09-18T20:31:03Z | |
dc.date.available | 2023-09-18T20:31:03Z | |
dc.date.issued | 2019 | |
dc.identifier.issn | 1407-4737 | |
dc.identifier.uri | https://etalpykla.vilniustech.lt/handle/123456789/150630 | |
dc.description.abstract | Lietuvių kalbos gramatikos informacinėje sistemoje (LIGIS) kaupiami dviejų tipų duomenys: a) plačiajai visuomenei skirta informacija iš morfologijos, morfemikos ir žodžių darybos sričių ir b) kompiuteriniam kalbos apdorojimui tinkanti koduotė, aprašanti kiekvieną sistemoje esantį žodį. Kuriant šią koduotę buvo domėtasi jau sukurtomis ir lietuvių kalbai naudojamomis – tai Vytauto Didžiojo universitete naudojami du kodavimo varinatai: čekiškasis PML (Prague Markup Language) ir PAULA bei bendra latvių ir lietuvių kalboms koduotė Salos Glossing Rules (SGR). Analizuotos galimybės galimybės šiuos kodavimo variantus pritaikyti LIGIS. Paaiškėjo, kad naudojant čekiškąjį PML, žodis vaizduojamas kaip simbolių seka, kur kiekvienas simbolis žymi tam tikrą morfologinę kategoriją ir jo reikšmė priklauso nuo pozicijos toje sekoje. Tai apsunkina paiešką, nes reikia įvertinti ne tik patį simbolį, bet ir jo vietą sekoje. Šio trūkumo neturi variantas PAULA, sukurtas remiantis LGR (Leipzig Glossing Rules) pagrindu, kai kiekvienai morfologinei kategorijai aprašyti naudojama simbolių grupė, atskirta iš abiejų pusių taškais. SGR taip pat remiasi LGR principais, bet nemažai skiriasi nuo varianto PAULA. Todėl nėra prasmės kurti dar ir trečią angliškais terminais besiremiančią koduotę, nes nė viena iš sukurtų netenkina LIGIS reikmių. Todėl nuspręsta kurti naują koduotę, panaudojant PAULA principą, bet pasirenkant sutrumpintus lietuvių kalbos žodžius gramatinėms kategorijoms aprašyti. Pvz., žodis „bėgiodama“sistemoje LIGIS koduojamas taip: .PUSD.MOTG.VNS. (pusdalyvis, moteriškoji giminė, vienaskaita). | lit |
dc.description.abstract | Im Informationssystem für Grammatik der litauischen Sprache (LIGIS) werden zwei Arten der Daten gespeichert: a) für die breite Öffentlichkeit bestimmte Information auf dem Gebiet der Morphologie, Morphemik und Derivation, und b) die Angaben über jedes im System vorhandene Wort im Computer-freundlichem Format. Zu diesem Zweck wurden die Möglichkeiten analysiert, die an der Vytautas Magnus Universität (VDU) benutzten Kodierungen sowie die Salos Glossing Rules (SGR) auch für LIGIS zu gebrauchen. VDU benutzt zwei Varianten der Kodierung: die tschechische PML (Prague Markup Language) und PAULA. In PML wird das Wort als eine Reihe von Symbolen dargestellt. Jedes Symbol bezeichnet eine bestimmte morphologische Kategorie. Die Bedeutung des Symbols hängt aber von der Stelle in der Reihe ab, d. h. dasselbe Symbol in verschiedenen Positionen kann unterschiedliche Bedeutungen haben. Das ist ein Nachteil bei der Suche der Wörter. Die PAULA Kodierung, die auf Grundlage der LGR geschaffen wurde, hat dieses Problem nicht mehr: für die Kodierung einer morphologischen Kategorie benutzt man einige Buchstaben mit von beiden Seiten getrennten Punkt-Zeichen. Die SGR benutzt auch LGR, und zum Ziel hatte einen Standard für die Kodierung der baltischen Sprachen zu schaffen. Leider unterscheiden sich PAULA und SGR sehr stark voneinander. Es hat keinen Zweck die dritte Kodierung aufgrund der englischen Terminologie zu schaffen, weil keine von den zurzeit vorhandenen Kodierungen dem Bedarf von LIGIS entspricht. Deshalb wurde beschlossen eine neue, eigene Kodierung nach dem Muster von PAULA zu schaffen, in der nur die litauischen Benennungen der grammatischen Merkmale der Wörter für Abkürzungen benutzt werden, z. B. das Wort bėgiodama wird als .PUSD.MOTG.VNS. (Partizip I, Femininum, Singular) kodiert. | ger |
dc.format.extent | p. 440-449 | |
dc.format.medium | tekstas / txt | |
dc.language.iso | lit | |
dc.relation.isreferencedby | Academic Search Research and Developement (EBSCO) | |
dc.source.uri | https://dom.lndb.lv/data/obj/836813.html | |
dc.subject | • Computerlinguistik | |
dc.subject | Computerisierung der Grammatik | |
dc.subject | Kodierung der Wörter | |
dc.subject | morphologische Kategorien | |
dc.subject | Informationssystem für Grammatik | |
dc.title | Lietuvių kalbos žodžių kompiuterinis kodavimas | |
dc.title.alternative | Computerkodierung der Wörter von litauischen Sprache | |
dc.type | Straipsnis konferencijos darbų leidinyje kitoje DB / Paper in conference publication in other DB | |
dcterms.references | 31 | |
dc.type.pubtype | P1c - Straipsnis konferencijos darbų leidinyje kitoje DB / Article in conference proceedings in other DB | |
dc.contributor.institution | Lietuvių kalbos institutas | |
dc.contributor.institution | Vilniaus Gedimino technikos universitetas | |
dc.contributor.faculty | Fundamentinių mokslų fakultetas / Faculty of Fundamental Sciences | |
dc.subject.researchfield | H 004 - Filologija / Philology | |
dc.subject.lt | kompiuterinė lingvistika | |
dc.subject.lt | gramatikos kompiuterizavimas | |
dc.subject.lt | žodžių koduotė | |
dc.subject.lt | morfologinės kategorijos | |
dc.subject.lt | gramatikos informacinė sistema. | |
dcterms.sourcetitle | Vārds un tā pētīšanas aspekti : rakstu krājums | |
dc.description.volume | t. 23(1/2) | |
dc.publisher.name | LiePA | |
dc.publisher.city | Liepāja | |
dc.identifier.elaba | 65975712 | |