Show simple item record

dc.contributor.authorItani, Mohamad
dc.date.accessioned2023-09-18T09:34:35Z
dc.date.available2023-09-18T09:34:35Z
dc.date.issued2011
dc.identifier.urihttps://etalpykla.vilniustech.lt/handle/123456789/111339
dc.description.abstractPastaruoju metu skaitmeninio signalų apdorojimo metodai ir priemonės yra plačiai taikomos visose žmogaus veiklos sferose. Ypatingai reikšmingi adaptyvieji skaitmeninio signalų apdorojimo metodai ir priemonės, nes jie įvertina ir tinkamai reaguoja į aplinkos, sistemos būsenos, signalų charakteristikų kitimą. Vienas iš tokių nestacionarių signalų pavyzdžių yra kalbinis signalas. Kalba nuo seno yra viena pagrindinių žmonių bendravimo, tautiškumo išlaikymo bei informacijos apsikeitimo priemonė, kuri neprarado savo svarbos ir šiuolaikiniame informaciniame pasaulyje. Moderniose elektroninėse telekomunikacinėse sistemose iki šiol viena pagrindinė perduodama informacija yra kalba. Siekiant taupyti kanalo plotį, kalbos signalas yra apdorojamas ir koduojamas balso kodekais. Pastarųjų veikimas yra pagrįstas žmogaus kalbos trakto ir garso susidarymo juose modeliais. Tačiau žmonės pasaulyje šneka įvairiomis kalbomis, kurios skiriasi viena nuo kitos tariamais garsais. Elektroninių telekomunikacinių sistemų raidoje didžiausią įtaką turėjo anglų kalba, nes pagrindiniai kalbos signalų apdorojimo algoritmai bei jų patobulinimai daugiausiai buvo sukurti angliškai kalbančiose šalyse. Tokių patobulinimų lingvistinis patikimumas kelia tam tikras abejones: ar visi sukurti patobulinimai vienodai gerai tinka įvairioms kalbom? Yra tiesiog nuostabu, kad iki šiol nebuvo atlikta nei viena išsami studija apie kalbos vaidmenį kalbos signalo apdorojime. Jau yra pastebėta, kad prie skirtingų kalbų kalbos signalų balso kodekai pasižymi skirtingais kalbos kokybės įverčiais. Pavyzdžiui, japonų kalbai kodekų kokybės įverčiai yra apie pusę balo žemesni negu anglų kalbai. Tačiau išsamesni kodekų vertinimo tyrimai tėra atlikti tik su keliomis kalbomis: anglų, vokiečių, prancūzų, suomių, švedų ir japonų. Tuo tarpu arbų bei kitų mažesnių tautų, pvz. lietuvių, kalbos kodavimo balso kodekais ypatumai nėra tyrinėti. Lietuvoje tyrimai susieti su lietuvių kabos apdorojimu vyksta gana seniai. Nemažą įdirbį šioje srityje turi sukaupę mokslininkai iš Matematikos informatikos instituto, Vytauto didžiojo universiteto bei Kauno technologijos universiteto. Tačiau pastarųjų institucijų mokslininkų darbai šioje tematikoje daugiausiai yra siejami su lietuvių kalbos atpažinimu. Tačiau šiam procesui reikalingi kalbos signalo požymiai yra randami naudojant tradicinius kalbos signalo apdorojimo metodus, kurie buvo sukurti ir ištirti su anglų kalba. Tuo tarpu pasaulyje, ypač elektroninių telekomunikacijų srityje, stengiamasi įvertinti skirtingų kalbų aspektus. Atliekant balso kodekų testavimus yra rekomenduojama naudotis garsynu iš ITU-T P.50 rekomendacijos priedo. Šiame priede yra surinkti 20 kalbų (dauguma Europos šalių) garso įrašai. Deja lietuvių kalbos garso įrašų čia nėra. Taip pat, net nuo 1995 metų yra dvi Europos sąjungos programos, skirtos kurti telefoniniams pokalbiams orientuotus garsynus: CEC-DGXII programa LRE-RELATOR ir LE-MLAP programa, kurios pagrindu vykdomas SPEECHDAT garsynų projektas. Be to nuo 1995 metų nepelno organizacija ELRA (European Language Resources Association), kuri rūpinasi Europos kalbų išteklių ir įrankių standartizavimu, taip pat vykdo garsyno AURORA kūrimo projektus. Deja, Lietuva nėra dalyvavusi nė viename iš šių projektų. Taigi yra poreikis sukurti lietuvių kalbos įrašų duomenų bazę tinkančią balso telekomunikacinių sistemų našumo vertinimui. Taip pat yra svarbu ištirti balso kodekų tinkamumą kuoduoti ne anglų kalbos signalams tuo siekiant išsiaiškinti šių kalbų įtaką balso kodekų atkurtos kalbos kokybei. Čia iškyla problema surasti būdus, kurie pagerintų balso kodekų kokybę koduojant skirtingų kalbų signalus. Tai įgalintų balso telekomunikacinių sistemų vartotojams gauti geresnės kokybės paslaugas.lit
dc.description.abstractTechnologies of telecommunication networks in these days migrate to multidimetional heterogeneity as they are widely used for multimedia applications. Until now communication by speech remains the most widely used for exchange of information among humans. The QoS of speech communication strongly depends on in electronic telecommunication system employed voice codec and its parameters (Kajackas and Anskaitis, 2009). QoS in telecommunications networks and systems is analyzed by many authors in various aspects. However, human speeches (sounds) differ from one language to another. For example, with comparison to the English language, the Lithuanian language uses many vowels, while the Arabic language uses only three. The English language has had a dominating influence in the advance of telecommunications. With many of the major developments coming from primarily English speaking areas there is the risk that these advances may not be linguistically robust. Former researches show that coders interact with individual voices so that speech is degraded differentially for different talkers. In modern electronic communication systems in the design of low-bit-rate speech coding algorithms, language variability is often considered to be of secondary importance. It is surprising to find that no comprehensive studies have ever been carried out on the role of language in speech coding. It was found that quantization distortion is not uniform across languages and it influences codecs codebook performance and overall quality of decoded speech. Today in electronic telecommunications sector a lot of companies that design voice communication products and regulatory institutions admit importance of language on performance of voice communication systems. For example, over 20 languages (mostly from European countries) that are listed in ITU-T Rec. P.50 Appendix I were extensively used in tests of AMR codec that were chosen by 3GPP as default voice codec in 3G mobile communications (3GPP TR 26.975 V5.0.0. 2002). It is important to normalize the voice codecs performance over different non-English languages in modern electronic voice communication systems to give possibilities for users to obtain better QoS of voice communication services.eng
dc.formatPDF
dc.format.extent24 p.
dc.format.mediumtekstas / txt
dc.language.isolit
dc.rightsPrieinamas tik institucijos intranete
dc.source.urihttps://talpykla.elaba.lt/elaba-fedora/objects/elaba:1852360/datastreams/ATTACHMENT_1852371/content
dc.source.urihttps://talpykla.elaba.lt/elaba-fedora/objects/elaba:1852360/datastreams/MAIN/content
dc.titleĮvairių kalbų kalbos signalų kodavimo analizė ir gerinimas
dc.title.alternativeAnalysis and improvement of multilingual speech coding
dc.typeDaktaro disertacijos santrauka / Doctoral dissertation summary
dc.type.pubtypeETD_DR_S - Daktaro disertacijos santrauka / Doctoral dissertation abstract
dc.contributor.institutionVilniaus Gedimino technikos universitetas
dc.subject.researchfieldT 001 - Elektros ir elektronikos inžinerija / Electrical and electronic engineering
dc.subject.ltKalbos signalo apdorojimas
dc.subject.ltbalso kodekai
dc.subject.ltkalbos kokybė
dc.subject.enSpeech signal processing
dc.subject.envoice codec
dc.subject.enspeech quality
dc.publisher.nameLithuanian Academic Libraries Network (LABT)
dc.publisher.cityKaunas
dc.identifier.elaba1852360


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record