Show simple item record

dc.contributor.authorLapėnaitė-Gedvilė, Monika
dc.date.accessioned2023-09-18T09:01:47Z
dc.date.available2023-09-18T09:01:47Z
dc.date.issued2014
dc.identifier.urihttps://etalpykla.vilniustech.lt/handle/123456789/109546
dc.description.abstractBaigiamajame magistro darbe yra nagrinėjami tokie klausimai: ar naudojantis statistine informacija apie dažnas žodžio formas galima prognozuoti žodžio formų su tam tikromis savybėmis pasitaikymo (lietuviškame) tekste dažnius, kokiu tikslumu, kaip tai priklauso nuo teksto autoriaus? Darbe apžvelgti ankstesnių mokslinių tyrimų rezultatai. Siekiant išsiaiškinti atrinktų žymeklių tinkamumą linksniuojamų kalbos dalių prognozavimui bei jų ryšį su autoriais, atlikta pirminė statistinė ir koreliacinė analizė bei remtasi apibendrintų tiesinių modelių teorija. Sudaryti logistinės ir Puasono regresijų modeliai ir įvertintas jų tinkamumas trims reprezentatyviausioms kalbos dalių grupėms. Išnagrinėjus teorinius ir praktinius baigiamojo darbo aspektus, pateikiamos išvados ir rekomendacijos. Tyrime naudojami mokykloms skirti suskaitmeninti lietuvių grožinės literatūros kūriniai. Skaičiavimai atlikti su paketu R. Darbą sudaro 6 dalys: įvadas, ankstesnių mokslinių tyrimų apžvalga, analitinė – metodinė dalis, eksperimentinė – tiriamoji dalis, išvados ir rekomendacijos, literatūros sąrašas. Darbo apimtis – 71 p. teksto be priedų, 9 pav., 33 lent., 27 bibliografiniai šaltiniai. Atskirai pridedami darbo priedai.lit
dc.description.abstractIn the master thesis the following problems are considered: if it is possible to predict the frequency of occurrences of word forms with specific properties in Lithuanian texts using statistical information about frequent word forms, to what accuracy and how it depends on authors? Results of previous studies are outlined. In order to ascertain the suitability of the selected markers for prediction of inflective parts of speech and relations of the markers with authors, primary statistical analysis and correlation analysis have been performed and generalized linear models have been applied. Logistic and Poisson regressions models are composed for three the most representative groups of parts of speech and suitability of these models are assessed. After the examination of the practical and theoretical aspects, the conclusions and recommendations have been presented. Lithuanian digitized literary works for schools are used in the study. Calculations are performed with R. Thesis consists of 6 parts: introduction, review of previous studies, analytical - methodical part, experimental - research part, conclusions and suggestions, references. Thesis consists of: 71 p. text without appendixes, 9 pictures, 33 tables, 27 bibliographical entries. Appendixes included.eng
dc.formatPDF
dc.format.extent84 p.
dc.format.mediumtekstas / txt
dc.language.isolit
dc.rightsNeprieinamas
dc.source.urihttps://talpykla.elaba.lt/elaba-fedora/objects/elaba:2140169/datastreams/MAIN/content
dc.titleKalbos dalių pasiskirstymo lietuviškuose tekstuose analizė ir prognozė
dc.title.alternativeThe analysis and prediction of the part of speech distributions in Lithuanian texts
dc.typeMagistro darbas / Master thesis
dc.type.pubtypeETD_MGR - Magistro darbas / Master thesis
dc.contributor.institutionVilniaus Gedimino technikos universitetas
dc.subject.researchfieldN 001 - Matematika / Mathematics
dc.subject.ltapibendrintasis tiesinis modelis
dc.subject.ltfunkciniai žodžiai
dc.subject.ltlogistinė regresija
dc.subject.ltprognozė
dc.subject.ltPuasono regresija
dc.subject.engeneralized linear model
dc.subject.enfunctional words
dc.subject.enlogistic regression
dc.subject.enprediction
dc.subject.enPoisson regression
dc.publisher.nameLithuanian Academic Libraries Network (LABT)
dc.publisher.cityKaunas
dc.identifier.elaba2140169


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record