Mašininio mokymosi metodų taikymas finansų rinkoms modeliuoti
Abstract
Šiame darbe yra nagrinėjami atraminių vektorių ir atsitiktinio miško metodai. Pirmiausia yra apžvelgiama mokslinė literatūra, išanalizuojami metodai. Tyrimo metu yra sudaromi modeliai OMX „Baltic“, DAX akcijų indeksų bei bendrovės „Apple“ akcijų kainoms prognozuoti. Atraminių vektorių regresija taikoma naudojant 4 skirtingas branduolio funkcijas. Taip pat taikoma atsitiktinio miško regresija. Randami optimaliausi hiperparametrai, su kuriais modelio prognozavimo vidutinė kvadratinė paklaida yra mažiausia. Gauti modeliai yra tarpusavyje palyginami. Tyrimo rezultatai rodo, kad nagrinėjamiems duomenims atraminių vektorių regresija yra tinkamesnė nei atsitiktinio miško regresija. Visiems 3 akcijų kainų indeksams prognozuoti geriausi gauti modeliai yra atraminių vektorių regresija su radialiniu branduoliu. Tiksliausias gautas modelis yra DAX akcijų indekso vertei prognozuoti. Darbą sudaro 6 dalys: įvadas, literatūros apžvalga, teorinė dalis, praktinė dalis, išvados, literatūros sąrašas. Darbo apimtis – 41 p. teksto be priedų, 27 iliustr., 3 lent., 22 bibliografiniai šaltiniai. Atskirai pridedami darbo priedai. This work centers on support vector and random forest methods. First, the literature is reviewed and the methods are analyzed. Models are created to forecast OMX Baltic Index, DAX Index and Apple stock prices. Support vector regression is applied by using 4 different kernel functions. Random forest regression is also applied. The most optimal hyperparameters are found, with which the models have the lowest mean squared error. Final models are compared amongst themselves. The analysis shows that support vector regression is more fitting for the sample data than random forest regression. Support vector regression with radial kernel is the best for forecasting all three stock index. The most precise model that is found is for forecasting the DAX Index. Structure: introduction, literature review, theoretical part, practical part, conclusions, references. Thesis consist of: 41 p. text without appendixes, 3 tables, 27 pictures, 22 bibliographical entries. Appendixes included.