dc.contributor.author | Cvilikaitė, Laura | |
dc.date.accessioned | 2023-09-18T09:09:44Z | |
dc.date.available | 2023-09-18T09:09:44Z | |
dc.identifier.uri | https://etalpykla.vilniustech.lt/handle/123456789/110706 | |
dc.description.abstract | Baigiamajame magistro darbe nagrinėjamas duomenų gavybos technologijų taikymas klientų kredito rizikai įvertinti. Darbo tikslas yra sukurti modelį, tiksliau prognozuojantį įsipareigojimų įvykdymo ir neįvykdymo atvejus, palyginus su dažnai bankuose naudojamu logistinės regresijos modeliu. Modelis skirtas fiziniams asmenims vartojimo paskolų išdavimo atveju. Siekiama išsiaiškinti, kurios kliento charakteristikos turi daugiausiai įtakos įsipareigojimų neįvykdymui. Darbas susideda iš trijų pagrindinių dalių – analitinės, teorinės ir praktinės. Analitinėje dalyje analizuojami moksliniai straipsniai kredito rizikos ir modeliavimo temomis. Teorinėje dalyje apibrėžiama duomenų gavybos sąvoka, procesas, modeliavimo tipai, aptariami pagrindiniai septyni duomenų gavybos metodai. Analizuojami aštuoni klasifikavimo algoritmai, tokie kaip logistinė regresija, sprendimų medžiai ar atraminių vektorių mašinos. Pateikiami modelių įvertinimo būdai. Praktinėje dalyje sprendžiama klasifikavimo problema. Modeliui kurti naudojamas RapidMiner (versija 9.6.) duomenų gavybos įrankis. Modeliavimui panaudota nuasmeninta, šifruota komercinio banko istorinių duomenų imtis apie fizinius asmenis, kurie turėjo vartojimo paskolas. Galiausiai, sukurtas patobulintas modelis, aptartas ir pristatytas banko įmonės kredito rizikos vertinimo departamente. Darbo apimtis – 71 puslapis be priedų, 56 iliustracijos, 9 lentelės, 37 bibliografiniai šaltiniai. | lit |
dc.description.abstract | The master thesis examines the application of data mining technologies for customer credit risk assessment. The aim of the study is to create a model that predicts the fulfillment of obligations and default cases more accurately, compared to the logistic regression model, which is often used by banking institutions. The model is intended for private individuals in the case of issuing consumer loans. It is intended to find out which customer characteristics have the greatest impact on default. The work consists of three main parts - analytical, theoretical and practical. The analytical part analyzes scientific articles on credit risk and modelling topics. The theoretical part defines the concept and process of data mining, discusses modelling types and seven main methods of data mining. Eight classification algorithms, such as logistic regression, decision trees and support vector machines, are analyzed. Methods of model evaluation are presented. The practical part solves a classification problem. RapidMiner (version 9.6) data mining tool is used to create the model. The model is built using scrambled bank’s historical data sample of individuals who had consumer loans. Finally, an improved model is developed, discussed and presented in the bank’s credit risk quantification department. Thesis consists of 71 pages without appendixes, 56 pictures, 9 tables, 37 bibliographical entries. | eng |
dc.format | PDF | |
dc.format.extent | 72 p. | |
dc.format.medium | tekstas / txt | |
dc.language.iso | lit | |
dc.rights | Neprieinamas | |
dc.title | Duomenų Gavybos Technologijų Taikymas Klientų Kredito Rizikai Įvertinti | |
dc.title.alternative | Application of Data Mining Technologies for Customer Credit Risk Assessment | |
dc.type | Magistro darbas / Master thesis | |
dcterms.references | 0 | |
dc.type.pubtype | ETD_MGR - Magistro darbas / Master thesis | |
dc.contributor.institution | Vilniaus Gedimino technikos universitetas | |
dc.subject.researchfield | T 007 - Informatikos inžinerija / Informatics engineering | |
dc.subject.studydirection | B04 - Informatikos inžinerija / Informatics engineering | |
dc.subject.lt | Kredito rizika | |
dc.subject.lt | duomenų gavyba | |
dc.subject.lt | logistinė regresija | |
dc.subject.lt | klasifikavimas | |
dc.subject.lt | RapidMiner. | |
dc.subject.en | Credit risk | |
dc.subject.en | data mining | |
dc.subject.en | logistic regression | |
dc.subject.en | classification | |
dc.subject.en | RapidMiner. | |
dc.identifier.elaba | 62393013 | |