Koduoto balso kokybės tyrimas
Abstract
Disertacijoje nagrinėjama koduoto balso kokybės vertinimo problematika. Pagrindinis dėmesys skiriamas balso kokybės tyrimams, kai perduodama koduota šneka ir prarandami balso paketai. Darbo tikslas yra patobulinti koduoto balso kokybės vertinimo algoritmus. Darbo uždaviniai yra šie: sukurti matavimo priemonę trumpų balso signalo atkarpų kokybei vertinti; apibrėžti koduoto balso segmentų vertės sampratą ir parinkti vertės metrikas; išmatuoti bendrinės šnekos balso segmentų verčių skirstinius; nustatyti skirtingų koderių sukuriamų iškraipymų ribas; ištirti paplitusių koderių inertiškumą, nustatyti kiek laiko pastebima prarastų paketų įtaka sekantiems segmentams. Disertaciją sudaro įvadas, keturi tiriamieji skyriai ir bendrosios išvados. Įvade pristatomas darbo naujumas, aktualumas, aptariamas autoriaus indėlis, formuluojami darbo tikslai. Pirmas skyrius yra apžvalginis – analizuojami balso kokybės vertinimo metodai, jų privalumai ir trūkumai. Kaip savarankiška dalis čia pristatyti autoriaus sudaryti sąrašai lietuviškų žodžių, skirtų šnekos suprantamumo tyrimams. Antrame skyriuje parodoma, kaip galima išplėsti kokybės vertinimo PESQ (angl. Perceptual Evaluation of Speech Quality) algoritmo taikymo ribas. Čia įvedama koduoto balso paketo vertės sąvoka, nustatomi statistiniai paketų vertės skirstiniai. Trečiame skyriuje nagrinėjami specifiniai koduotos šnekos iškraipymai ir kodavimo parametrų įtaka balso kokybei. Parodoma, kad kodavimo iškraipymų dydis priklauso nuo šnekos signalo ir kinta plačiose ribose. Skyriuje visapusiškai ištirta prarastų paketų įtaka. Ketvirtame skyriuje nagrinėjamas paketo vertės nustatymo realiu laiku uždavinys. Pasiūlyti metodai viršutiniams paketo vertės nustatymo metodų tikslumo rėžiams nustatyti, sudaryti skaičiavimų atžvilgiu efektyvūs algoritmai, paketo vertei prognozuoti. Disertacijos tema perskaityti 8 pranešimai mokslinėse konferencijose ir paskelbti 7 straipsniai: 4 – recenzuojamuose žurnaluose, 3 – kituose leidiniuose. The dissertation investigates the problem of quality of coded voice. The main attention is paid to voice quality evaluation under packet loss conditions. The aim of the work is to improve voice quality evaluation algorithms. The tasks of the work are: construction of the means for measurement of voice quality of short voice signals; to define the concept of value of coded voice segment and to choose corresponding value metrics; to measure distributions of frame values in standard voice; to establish limits of distortions created by different codecs; to investigate inertia of wide spread codecs and establish the length of impact of one lost frame. The dissertation consists of the introduction, 4 chapters, conclusions, list of literature. Introduction presents the novelty and topicality of the work, tasks and aims of the work are formulated. The first chapter is overview of voice quality evaluation methods, pros and cons of these methods are analyzed. PESQ algorithm and limits of its applicability are introduced in this chapter too. The lists of Lithuanian words for word intelligibility testing are created. Chapter two presents the method of signal construction that allows to extend PESQ applicability to short signals. This chapter introduces the concept of frame value. Distributions of frame values are calculated. Third chapter analyses distortions created by coding. It is shown that coding distortions depends highly on the signal used and limits of distortion variability are calculated. The impact of lost frames is analyzed in this chapter too. Fourth chapter analyses the problem of frame value calculation in real time. Effective algorithms for this purpose are presented. Approximate upper limits of frame value prognosis precision are calculated. The results of the thesis were presented in 8 conferences, 7 scientific articles were published on the subject.