Daugiamačių kryptinių duomenų modeliavimas
Abstract
Baigiamajame magistro darbe yra nagrinėjami daugiamačių kryptinių duomenų modeliavimo metodai. Cilindriniams ir sferiniams duomenims yra pritaikomi k-vidurkių bei EM klasterizavimo metodų kryptiniai analogai. Kryptiniai klasterizavimo metodai yra lyginami tarpusavyje bei su klasikiniu tiesiniu klasterizavimo algoritmu. Taip pat, cilindrinių bei sferinių duomenų klasifikavimui yra pritaikomi kryptiniai diskriminantinės analizės ir logistinės regresijos metodų analogai. Jie yra lyginami tarpusavyje ir su klasikiniu tiesiniu klasifikavimo algoritmu. Be to, darbe cilindriniams duomenims yra pritaikomas kryptinių sprendimų medžių algoritmas. Analizei yra naudojami sugeneruoti sferiniai bei cilindriniai duomenis, taip pat ir realūs duomenų rinkiniai: žvaigždžių duomenys ir meteorologiniai duomenys. Skaičiavimai atlikti naudojant programavimo kalbą R, versija 3.6.3. Darbą sudaro 6 dalys: įvadas, teorinė dalis, praktinė dalis, išvados, literatūros sąrašas. Darbo apimtis -- 108 p. teksto be priedų, 46 lentelės, 60 iliustracijų, 23 bibliografiniai šaltiniai. Atskirai pridedami darbo priedai. The final master thesis applies various modeling methods to multidimensional directional data. Directional analogues of k-means and EM clustering algorithms are applied to cylindrical and spherical data. Then directional clustering methods are compared with each other and with the classical linear clustering algorithm. Also, directional analogues of discriminant analysis and logistic regression methods are used to classify cylindrical and spherical data into groups. They are compared with each other and with the classical linear classification algorithm. In addition, directional decision tree method is applied to cylindrical data. All analyses are made using generated spherical and cylindrical data, and also the real data sets: star data and meteorological data. Calculations were made using statistical software R, version 3.6.3. Structure: introduction, theoretical part, practical part, conclusions, references. Thesis consist of: 108 p. text without appendixes, 46 tables, 60 pictures, 23 bibliographical entries. Appendixes included.