Kalbos dalių pasiskirstymo lietuviškuose tekstuose analizė ir prognozė

Lapėnaitė-Gedvilė, Monika

dc.contributor.author	Lapėnaitė-Gedvilė, Monika
dc.date.accessioned	2023-09-18T09:01:47Z
dc.date.available	2023-09-18T09:01:47Z
dc.date.issued	2014
dc.identifier.uri	https://etalpykla.vilniustech.lt/handle/123456789/109546
dc.description.abstract	Baigiamajame magistro darbe yra nagrinėjami tokie klausimai: ar naudojantis statistine informacija apie dažnas žodžio formas galima prognozuoti žodžio formų su tam tikromis savybėmis pasitaikymo (lietuviškame) tekste dažnius, kokiu tikslumu, kaip tai priklauso nuo teksto autoriaus? Darbe apžvelgti ankstesnių mokslinių tyrimų rezultatai. Siekiant išsiaiškinti atrinktų žymeklių tinkamumą linksniuojamų kalbos dalių prognozavimui bei jų ryšį su autoriais, atlikta pirminė statistinė ir koreliacinė analizė bei remtasi apibendrintų tiesinių modelių teorija. Sudaryti logistinės ir Puasono regresijų modeliai ir įvertintas jų tinkamumas trims reprezentatyviausioms kalbos dalių grupėms. Išnagrinėjus teorinius ir praktinius baigiamojo darbo aspektus, pateikiamos išvados ir rekomendacijos. Tyrime naudojami mokykloms skirti suskaitmeninti lietuvių grožinės literatūros kūriniai. Skaičiavimai atlikti su paketu R. Darbą sudaro 6 dalys: įvadas, ankstesnių mokslinių tyrimų apžvalga, analitinė – metodinė dalis, eksperimentinė – tiriamoji dalis, išvados ir rekomendacijos, literatūros sąrašas. Darbo apimtis – 71 p. teksto be priedų, 9 pav., 33 lent., 27 bibliografiniai šaltiniai. Atskirai pridedami darbo priedai.	lit
dc.description.abstract	In the master thesis the following problems are considered: if it is possible to predict the frequency of occurrences of word forms with specific properties in Lithuanian texts using statistical information about frequent word forms, to what accuracy and how it depends on authors? Results of previous studies are outlined. In order to ascertain the suitability of the selected markers for prediction of inflective parts of speech and relations of the markers with authors, primary statistical analysis and correlation analysis have been performed and generalized linear models have been applied. Logistic and Poisson regressions models are composed for three the most representative groups of parts of speech and suitability of these models are assessed. After the examination of the practical and theoretical aspects, the conclusions and recommendations have been presented. Lithuanian digitized literary works for schools are used in the study. Calculations are performed with R. Thesis consists of 6 parts: introduction, review of previous studies, analytical - methodical part, experimental - research part, conclusions and suggestions, references. Thesis consists of: 71 p. text without appendixes, 9 pictures, 33 tables, 27 bibliographical entries. Appendixes included.	eng
dc.format	PDF
dc.format.extent	84 p.
dc.format.medium	tekstas / txt
dc.language.iso	lit
dc.rights	Neprieinamas
dc.source.uri	https://talpykla.elaba.lt/elaba-fedora/objects/elaba:2140169/datastreams/MAIN/content
dc.title	Kalbos dalių pasiskirstymo lietuviškuose tekstuose analizė ir prognozė
dc.title.alternative	The analysis and prediction of the part of speech distributions in Lithuanian texts
dc.type	Magistro darbas / Master thesis
dc.type.pubtype	ETD_MGR - Magistro darbas / Master thesis
dc.contributor.institution	Vilniaus Gedimino technikos universitetas
dc.subject.researchfield	N 001 - Matematika / Mathematics
dc.subject.lt	apibendrintasis tiesinis modelis
dc.subject.lt	funkciniai žodžiai
dc.subject.lt	logistinė regresija
dc.subject.lt	prognozė
dc.subject.lt	Puasono regresija
dc.subject.en	generalized linear model
dc.subject.en	functional words
dc.subject.en	logistic regression
dc.subject.en	prediction
dc.subject.en	Poisson regression
dc.publisher.name	Lithuanian Academic Libraries Network (LABT)
dc.publisher.city	Kaunas
dc.identifier.elaba	2140169

Files in this item

Name:: Kalbos dalių pasiskirstymo ...
Size:: 1.483Mb
Format:: PDF

View/Open

This item appears in the following Collection(s)

Magistrų darbai / Master theses [2734]

Show simple item record