dc.contributor.author | Lapėnaitė-Gedvilė, Monika | |
dc.contributor.author | Kanišauskienė, Karolina | |
dc.contributor.author | Radavičius, Marijus | |
dc.date.accessioned | 2023-09-18T16:25:30Z | |
dc.date.available | 2023-09-18T16:25:30Z | |
dc.date.issued | 2015 | |
dc.identifier.issn | 1392-642X | |
dc.identifier.uri | https://etalpykla.vilniustech.lt/handle/123456789/113767 | |
dc.description.abstract | Straipsnio tikslas – įvertinti tekstų statistinį nehomogeniškumą pagal funkcinių žodžiųir kitų lingvistinių elementų vartoseną. Atliktas empirinis tyrimas remiasi mokykloms rekomenduojamų suskaitmenintų grožinės literatūros kūrinių biblioteka http://ebiblioteka.mkp.emokykla.lt. Apskaičiuojami sudarytųdažnųžodžiųformųar kitųkalbiniųstruktūrų rinkinių, juos vadinsime žymekliais, dažnumai tekstųblokuose, jungiančiuose 50 iš eilės einančiųsakinių. Pastebėta, kad žymekliųdažnumai blokuose turi ženkliąperteklinęsklaidą, palyginti su lingvistikoje įprastu homogeniškumo modeliu. Pasirinktoms žymekliųgrupėms parinkti keliųtipųhierarchiniai binominės logistinės regresijos modeliai, naudojantys autoriaus identifikatorių, bloko ilgįir likusių žymeklių dažnius blokuose kaip aiškinančiuosius kintamuosius, leido paaiškinti didelę dalį pasirinktųjų žymeklių perteklinės sklaidos. | lit |
dc.description.abstract | The aim of the paper is to assess the distributional non-homogeneity of texts in the usage of functional words and other linguistic units. Our empirical study is based on recommended school fiction works taken from a digital library at http://ebiblioteka.mkp.emokykla.lt. Sets of frequent word forms, called markers, are made, and their frequency counts in blocks of 50 successive sentences are calculated. The frequency counts of the markers show significant excess variability (overdispersion) with respect to a text homogeneity model usually assumed in linguistics. For chosen markers, different kinds of hierarchical binomial logistic regression models with the author's identifier, the block length and the frequency counts of the remaining markers as explanatory variables are fitted to the block data in order to explain the observed overdispersion of the markers chosen. | eng |
dc.format | PDF | |
dc.format.extent | p. 92-100 | |
dc.format.medium | tekstas / txt | |
dc.language.iso | lit | |
dc.relation.isreferencedby | Index Copernicus | |
dc.rights | Laisvai prieinamas internete | |
dc.source.uri | https://doi.org/10.15388/LJS.2015.13884 | |
dc.source.uri | https://talpykla.elaba.lt/elaba-fedora/objects/elaba:14266795/datastreams/MAIN/content | |
dc.subject | FM03 - Fizinių, technologinių ir ekonominių procesų matematiniai modeliai ir metodai / Mathematical models and methods of physical, technological and economic processes | |
dc.title | Tekstų nehomogeniškumo tyrimas naudojant žymeklius | |
dc.title.alternative | Analysis of text non-homogeneity using markers | |
dc.type | Straipsnis kitoje DB / Article in other DB | |
dcterms.license | Creative Commons – Attribution – 4.0 International | |
dcterms.references | 28 | |
dc.type.pubtype | S3 - Straipsnis kitoje DB / Article in other DB | |
dc.contributor.institution | Vilniaus universitetas Vilniaus Gedimino technikos universitetas | |
dc.contributor.institution | Šiaulių universitetas | |
dc.contributor.institution | Vilniaus universitetas | |
dc.contributor.faculty | Fundamentinių mokslų fakultetas / Faculty of Fundamental Sciences | |
dc.subject.researchfield | S 003 - Vadyba / Management | |
dc.subject.researchfield | S 004 - Ekonomika / Economics | |
dc.subject.researchfield | N 001 - Matematika / Mathematics | |
dc.subject.ltspecializations | L106 - Transportas, logistika ir informacinės ir ryšių technologijos (IRT) / Transport, logistic and information and communication technologies | |
dc.subject.lt | statistinė lingvistika | |
dc.subject.lt | perteklinė sklaida | |
dc.subject.lt | tikėtinumo nuokrypis | |
dc.subject.lt | binominė logistinė regresija | |
dc.subject.lt | funkciniai žodžiai. | |
dc.subject.en | statistical linguistics | |
dc.subject.en | over-dispersion | |
dc.subject.en | deviance | |
dc.subject.en | binomial logistic regression | |
dc.subject.en | functional words | |
dcterms.sourcetitle | Lithuanian journal of statistics = Lietuvos statistikos darbai | |
dc.description.issue | Nr. 1 | |
dc.description.volume | t. 54 | |
dc.publisher.name | Lietuvos statistikos departamentas | |
dc.publisher.city | Vilnius | |
dc.identifier.doi | 10.15388/LJS.2015.13884 | |
dc.identifier.elaba | 14266795 | |