Show simple item record

dc.contributor.authorBaltušninkaitė, Indrė
dc.contributor.authorBratčikovienė, Nomeda
dc.date.accessioned2023-09-18T19:44:29Z
dc.date.available2023-09-18T19:44:29Z
dc.date.issued2018
dc.identifier.issn1392-642X
dc.identifier.urihttps://etalpykla.vilniustech.lt/handle/123456789/142895
dc.description.abstractŠiame straipsnyje nagrinėjamos didžiųjų duomenų regresinės analizės galimybės ir galimi sunkumai. Straipsnyje išskirtos ir paaiškintos pagrindinės juos nusakančios charakteristikos, nustatyti galimi iššūkiai, kylantys didžiųjų duomenų analitikoje. Atsižvelgiant į tai, pasiūlyta keletas didžiųjų duomenų regresinėje analizėje naudojamų metodų, kurie leidžia sumažinti skaičiavimų naštą ir atrinkti nepriklausomus kintamuosius, geriausiai nusakančius priklausomą kintamąjį, bei pasiekti didesnį modelio tikslumą. Vienas iš darbo tikslų – metodų pritaikymas realiems didiesiems duomenims, todėl didelis dėmesys skiriamas tiriamajai daliai. Realių duomenų regresijos modelių sudarymui ir parametrų vertinimui naudojami išskaidytos ir stebinių įtakos indeksu paremtos regresijos metodai, o geriausiai priklausomąjį kintamąjį nusakančių nepriklausomų kintamųjų atrinkimui naudojama LASSO ir LARS regresija. Straipsnyje taip pat pateikiami atlikti modelių tinkamumo ir tikslumo vertinimai, jų tarpusavio rezultatų palyginimai.lit
dc.description.abstractOpportunities and challenges of regression analysis for big data are investigated in the present article. Firstly, the main characteristics describing big data are identified and explained, and then potential challenges that arise in big data analytics are identified. According to the identified challenges, some methods used in the regression analysis for big data are proposed. These methods reduce the calculation burden and select variables that best describe the response variable, thus achieving sufficient statistical accuracy and reducing costs and time of calculations. One of the main purposes of this article is to apply the methods for real data set. Simulation and real data regression models are formed and parameters are estimated using divided regression and regression based on leverage techniques. The LASSO and LARS regressions are used to select the best subset of variables. Finally, model diagnostics, accuracy estimation and comparisons of results are performed.eng
dc.formatPDF
dc.format.extentp. 56-69
dc.format.mediumtekstas / txt
dc.language.isolit
dc.relation.isreferencedbyBusiness Source Complete
dc.relation.isreferencedbyDOAJ
dc.relation.isreferencedbyIndex Copernicus
dc.source.urihttp://www.journals.vu.lt/statisticsjournal/article/view/12836/11642
dc.titleRegresinės analizės taikymas didiesiems duomenims
dc.title.alternativeApplication of regression analysis to big data
dc.typeStraipsnis kitoje DB / Article in other DB
dcterms.references10
dc.type.pubtypeS3 - Straipsnis kitoje DB / Article in other DB
dc.contributor.institutionVilniaus Gedimino technikos universitetas
dc.contributor.facultyFundamentinių mokslų fakultetas / Faculty of Fundamental Sciences
dc.subject.researchfieldN 001 - Matematika / Mathematics
dc.subject.vgtuprioritizedfieldsFM0101 - Fizinių, technologinių ir ekonominių procesų matematiniai modeliai / Mathematical models of physical, technological and economic processes
dc.subject.ltspecializationsL103 - Įtrauki ir kūrybinga visuomenė / Inclusive and creative society
dc.subject.ltdidieji duomenys
dc.subject.ltregresinė analizė
dc.subject.ltstebinių įtakos indeksu pagrįsta regresija
dc.subject.ltLASSO
dc.subject.ltLARS
dc.subject.ltRMSLE
dc.subject.enbig data
dc.subject.enregression analysis
dc.subject.enleveraging
dc.subject.enLASSO
dc.subject.enLARS
dc.subject.enRMSLE
dcterms.sourcetitleLietuvos statistikos darbai = Lithuanian journal of statistics
dc.description.issueNr. 1
dc.description.volumet. 57
dc.publisher.nameVilnius University Press; Lietuvos statistikų sąjunga; Lietuvos Statistikos departamentas
dc.publisher.cityVilnius
dc.identifier.elaba37684953


Files in this item

FilesSizeFormatView

There are no files associated with this item.

This item appears in the following Collection(s)

Show simple item record