Žmogaus balso atpažinimo sistemų, pagrįstų paslėptais Markovo modeliais ir dirbtinių neuronų tinklais, tyrimas
Santrauka
Magistro darbo metu yra analizuojami žmogaus balso atpažinimo metodai, problemos ir jų sprendimo būdai bei atliekamas jau egzistuojančių sistemų įvertinimas. Pagal literatūros analizę iš apžvelgtų algoritmų išrinkti PMM ir DNT balso identifikavimo metodai, realizuoti Python programavimo kalba. Sukurti du žmogaus balso atpažinimo programos Spider aplinkoje, kurie naudoja pasirinktus klasifikatorius ir MSKK požymius. Programoms atliekamas eksperimentinis įvertinimas ir palyginimas tarpusavyje, siekiant sužinoti, kuris iš metodų yra geriausias. Darbą sudaro vienuolika dalių: paveikslų, lentelių, schemų ir grafikų sąrašai, terminų žodynas, įvadas, literatūros analizė, žmogaus balso atpažinimo sistemų analizė, kuriamų žmogaus balso atpažinimo sistemų realizavimo eiga, eksperimentinis įvertinimas, išvados ir literatūros sąrašas. Darbo apimtis 79 p. teksto be sąrašų ir terminų žodyno, 28 paveikslai, 11 lentelių, 2 grafikai, 11 schemos ir 55 literatūros šaltiniai. This Master thesis deals with voice recognition methods, problems, their solutions and the evaluation of existing systems. According to literature, from reviewed algorithms HMM and DNN voice identification systems were selected and implemented with a Python programming language. Two voice recognition programs were created in Spyder environment, which uses selected classifiers and MFCC features. Experimental evaluation of the programs and assimilation with each other was performed to find out which method is better. Thesis consists of 11 chapters: lists of pictures, tables, charts and graphs, vocabulary, introduction, analysis of literature, analyze of human voice recognition systems, realization process of human voice recognition systems, experimental evaluation, conclusions and references. Work coverage – 79 p. text without lists and vocabulary, 28 images, 11 tables, 2 graphs, 11 schemes and 55 references.