dc.contributor.author | Sakavičius, Saulius | |
dc.date.accessioned | 2023-09-18T20:19:46Z | |
dc.date.available | 2023-09-18T20:19:46Z | |
dc.date.issued | 2020 | |
dc.identifier.issn | 2029-2341 | |
dc.identifier.uri | https://etalpykla.vilniustech.lt/handle/123456789/148897 | |
dc.description.abstract | For the development and evaluation of a sound source localization and separation methods, a concise audio dataset with complete geometrical information about the room, the positions of the sound sources, and the array of microphones is needed. Computer simulation of such audio and geometrical data often relies on simplifications and are sufficiently accurate only for a specific set of conditions. It is generally desired to evaluate algorithms on real-world data. For a three-dimensional sound source localization or direction of arrival estimation, a non-coplanar microphone array is needed.Simplest and most general type of non-coplanar array is a tetrahedral array. There is a lack of openly accessible realworld audio datasets obtained using such arrays. We present an audio dataset for the evaluation of sound source localization algorithms, which involve tetrahedral microphone arrays. The dataset is complete with the geometrical information of the room, the positions of the sound sources and the microphone array. Array audio data was captured for two tetrahedral microphone arrays with different distances between microphones and one or two active sound sources. The dataset is suitable for speech recognition and direction-of-arrival estimation, as the signals used for sound sources were speech signals. | eng |
dc.description.abstract | Garso šaltinio lokalizavimo ir išskyrimo algoritmams kurti ir charakteristikoms tirti reikalingas nuosekliai sudarytas garso duomenų rinkinys, papildytas informacija apie akustines patalpos savybes, garso šaltinių ir mikrofonų gardelės padėtis. Dažnai tokie garso ir geometriniai duomenys gaunami atliekant kompiuterinę emuliaciją, tačiau dauguma emuliacijos metodų grindžiami supaprastinimais ir yra tikslūs tik tam tikromis sąlygomis. Todėl garso šaltinio lokalizavimo ir išskyrimo algoritmų veikimą išsamiai įvertinti galima tik taikant realius garso duomenis. Siekiant nustatyti garso šaltinio padėtį ar sklidimo kryptį erdvėje, reikalinga mikrofonų gardelė, kurios elementai yra nekomplanarūs. Paprasčiausias ir bendriausias nekomplanarios gardelės tipas yra tetraedrinė gardelė. Šiuo metu nėra laisvai prieinamo garso ir geometrinių duomenų rinkinio, surinkto naudojant tokio tipo mikrofonų gardeles. Šiame straipsnyje pristatomas duomenų rinkinys, skirtas garso šaltinio lokalizavimo ir išskyrimo algoritmams tirti naudojant tetraedrines mikrofonų gardeles. Duomenų rinkinį sudaro garso duomenys ir juos atitinkanti geometrinė informacija: patalpos matmenys, garso šaltinių ir mikrofonų gardelės padėtys patalpos atžvilgiu. Garso duomenys buvo surinkti naudojant dvi tetraedrines mikrofonų gardeles su skirtingais atstumais tarp mikrofonų, esant vienam arba dviem vienu metu aktyviems garso šaltiniams. Garso šaltiniais buvo atkuriamas žmogaus kalbos signalas, todėl pristatomas duomenų rinkinys yra tinkamas kalbos atpažinimo ir sklidimo krypties nustatymo algoritmams tirti. | lit |
dc.format | PDF | |
dc.format.extent | p. 1-8 | |
dc.format.medium | tekstas / txt | |
dc.language.iso | eng | |
dc.relation.isreferencedby | Dimensions | |
dc.relation.isreferencedby | DOAJ | |
dc.relation.isreferencedby | Gale's Academic OneFile | |
dc.relation.isreferencedby | TOC Premier | |
dc.relation.isreferencedby | Academic Search Complete | |
dc.source.uri | https://doi.org/10.3846/mla.2020.11462 | |
dc.source.uri | https://journals.vgtu.lt/index.php/MLA/article/view/11462 | |
dc.title | Dataset for evaluation of the performance of the methods of sound source localization algorithms using tetrahedral microphone arrays | |
dc.title.alternative | Duomenų rinkinys garso šaltinio lokalizavimo, taikant tetraedrines mikrofonų gardeles, metodų charakteristikoms tirti | |
dc.type | Straipsnis kitoje DB / Article in other DB | |
dcterms.accessRights | Šis straipsnis yra atvirosios prieigos straipsnis, turintis Kūrybinių bendrijų (Creative Commons) licenciją (https://creativecommons.org/licenses/by/4.0/), kuri leidžia neribotą straipsnio ar jo dalių panaudą su privaloma sąlyga nurodyti autorių ir pirminį šaltinį. | |
dcterms.license | Creative Commons – Attribution – 4.0 International | |
dcterms.references | 23 | |
dc.type.pubtype | S3 - Straipsnis kitoje DB / Article in other DB | |
dc.contributor.institution | Vilniaus Gedimino technikos universitetas | |
dc.contributor.faculty | Elektronikos fakultetas / Faculty of Electronics | |
dc.subject.researchfield | T 001 - Elektros ir elektronikos inžinerija / Electrical and electronic engineering | |
dc.subject.vgtuprioritizedfields | IK0202 - Išmaniosios signalų apdorojimo ir ryšių technologijos / Smart Signal Processing and Telecommunication Technologies | |
dc.subject.ltspecializations | L106 - Transportas, logistika ir informacinės ir ryšių technologijos (IRT) / Transport, logistic and information and communication technologies | |
dc.subject.lt | garso duomenų rinkinys | |
dc.subject.lt | garso šaltinio lokalizavimas | |
dc.subject.lt | patalpos akustika | |
dc.subject.lt | tetraedrinė mikrofonų gardelė | |
dc.subject.lt | kalbos atpažinimas | |
dc.subject.lt | garso šaltinio išskyrimas | |
dc.subject.en | audio dataset | |
dc.subject.en | sound source localization | |
dc.subject.en | room acoustics | |
dc.subject.en | tetrahedral microphone array | |
dc.subject.en | speech recognition | |
dc.subject.en | source separation | |
dcterms.sourcetitle | Mokslas – Lietuvos ateitis. Elektronika ir elektros inžinerija = Science – Future of Lithuania. Electronics and electrical engineering | |
dc.description.volume | vol. 12 | |
dc.publisher.name | VGTU leidykla Technika | |
dc.publisher.city | Vilnius | |
dc.identifier.doi | 10.3846/mla.2020.11462 | |
dc.identifier.elaba | 52412935 | |