Show simple item record

dc.contributor.authorSakavičius, Saulius
dc.date.accessioned2023-09-18T20:19:46Z
dc.date.available2023-09-18T20:19:46Z
dc.date.issued2020
dc.identifier.issn2029-2341
dc.identifier.urihttps://etalpykla.vilniustech.lt/handle/123456789/148897
dc.description.abstractFor the development and evaluation of a sound source localization and separation methods, a concise audio dataset with complete geometrical information about the room, the positions of the sound sources, and the array of microphones is needed. Computer simulation of such audio and geometrical data often relies on simplifications and are sufficiently accurate only for a specific set of conditions. It is generally desired to evaluate algorithms on real-world data. For a three-dimensional sound source localization or direction of arrival estimation, a non-coplanar microphone array is needed.Simplest and most general type of non-coplanar array is a tetrahedral array. There is a lack of openly accessible realworld audio datasets obtained using such arrays. We present an audio dataset for the evaluation of sound source localization algorithms, which involve tetrahedral microphone arrays. The dataset is complete with the geometrical information of the room, the positions of the sound sources and the microphone array. Array audio data was captured for two tetrahedral microphone arrays with different distances between microphones and one or two active sound sources. The dataset is suitable for speech recognition and direction-of-arrival estimation, as the signals used for sound sources were speech signals.eng
dc.description.abstractGarso šaltinio lokalizavimo ir išskyrimo algoritmams kurti ir charakteristikoms tirti reikalingas nuosekliai sudarytas garso duomenų rinkinys, papildytas informacija apie akustines patalpos savybes, garso šaltinių ir mikrofonų gardelės padėtis. Dažnai tokie garso ir geometriniai duomenys gaunami atliekant kompiuterinę emuliaciją, tačiau dauguma emuliacijos metodų grindžiami supaprastinimais ir yra tikslūs tik tam tikromis sąlygomis. Todėl garso šaltinio lokalizavimo ir išskyrimo algoritmų veikimą išsamiai įvertinti galima tik taikant realius garso duomenis. Siekiant nustatyti garso šaltinio padėtį ar sklidimo kryptį erdvėje, reikalinga mikrofonų gardelė, kurios elementai yra nekomplanarūs. Paprasčiausias ir bendriausias nekomplanarios gardelės tipas yra tetraedrinė gardelė. Šiuo metu nėra laisvai prieinamo garso ir geometrinių duomenų rinkinio, surinkto naudojant tokio tipo mikrofonų gardeles. Šiame straipsnyje pristatomas duomenų rinkinys, skirtas garso šaltinio lokalizavimo ir išskyrimo algoritmams tirti naudojant tetraedrines mikrofonų gardeles. Duomenų rinkinį sudaro garso duomenys ir juos atitinkanti geometrinė informacija: patalpos matmenys, garso šaltinių ir mikrofonų gardelės padėtys patalpos atžvilgiu. Garso duomenys buvo surinkti naudojant dvi tetraedrines mikrofonų gardeles su skirtingais atstumais tarp mikrofonų, esant vienam arba dviem vienu metu aktyviems garso šaltiniams. Garso šaltiniais buvo atkuriamas žmogaus kalbos signalas, todėl pristatomas duomenų rinkinys yra tinkamas kalbos atpažinimo ir sklidimo krypties nustatymo algoritmams tirti.lit
dc.formatPDF
dc.format.extentp. 1-8
dc.format.mediumtekstas / txt
dc.language.isoeng
dc.relation.isreferencedbyDimensions
dc.relation.isreferencedbyDOAJ
dc.relation.isreferencedbyGale's Academic OneFile
dc.relation.isreferencedbyTOC Premier
dc.relation.isreferencedbyAcademic Search Complete
dc.source.urihttps://doi.org/10.3846/mla.2020.11462
dc.source.urihttps://journals.vgtu.lt/index.php/MLA/article/view/11462
dc.titleDataset for evaluation of the performance of the methods of sound source localization algorithms using tetrahedral microphone arrays
dc.title.alternativeDuomenų rinkinys garso šaltinio lokalizavimo, taikant tetraedrines mikrofonų gardeles, metodų charakteristikoms tirti
dc.typeStraipsnis kitoje DB / Article in other DB
dcterms.accessRightsŠis straipsnis yra atvirosios prieigos straipsnis, turintis Kūrybinių bendrijų (Creative Commons) licenciją (https://creativecommons.org/licenses/by/4.0/), kuri leidžia neribotą straipsnio ar jo dalių panaudą su privaloma sąlyga nurodyti autorių ir pirminį šaltinį.
dcterms.licenseCreative Commons – Attribution – 4.0 International
dcterms.references23
dc.type.pubtypeS3 - Straipsnis kitoje DB / Article in other DB
dc.contributor.institutionVilniaus Gedimino technikos universitetas
dc.contributor.facultyElektronikos fakultetas / Faculty of Electronics
dc.subject.researchfieldT 001 - Elektros ir elektronikos inžinerija / Electrical and electronic engineering
dc.subject.vgtuprioritizedfieldsIK0202 - Išmaniosios signalų apdorojimo ir ryšių technologijos / Smart Signal Processing and Telecommunication Technologies
dc.subject.ltspecializationsL106 - Transportas, logistika ir informacinės ir ryšių technologijos (IRT) / Transport, logistic and information and communication technologies
dc.subject.ltgarso duomenų rinkinys
dc.subject.ltgarso šaltinio lokalizavimas
dc.subject.ltpatalpos akustika
dc.subject.lttetraedrinė mikrofonų gardelė
dc.subject.ltkalbos atpažinimas
dc.subject.ltgarso šaltinio išskyrimas
dc.subject.enaudio dataset
dc.subject.ensound source localization
dc.subject.enroom acoustics
dc.subject.entetrahedral microphone array
dc.subject.enspeech recognition
dc.subject.ensource separation
dcterms.sourcetitleMokslas – Lietuvos ateitis. Elektronika ir elektros inžinerija = Science – Future of Lithuania. Electronics and electrical engineering
dc.description.volumevol. 12
dc.publisher.nameVGTU leidykla Technika
dc.publisher.cityVilnius
dc.identifier.doi10.3846/mla.2020.11462
dc.identifier.elaba52412935


Files in this item

FilesSizeFormatView

There are no files associated with this item.

This item appears in the following Collection(s)

Show simple item record