KWDOA: Adapted dataset for detection of the direction of arrival of the keyword

Abstract

This paper describes a simulated audio dataset of spoken words which accommodate microphone array design for training and evaluating keywords spotting systems. With this dataset you could train a neural network for the detection direction of the speaker.Which is an advanced version of the original, with added noises during a speech in random locations and different rooms with different reverb. Hence it should be closer to r eal-world long-range applications. This task could be a new challenge for the direction of arrivalactivated by keyword spotting systems. Let’s call this task KWDOA. This dataset could serve as the intro level for microphone array designs.
Tento článek popisuje simulovanou zvukovou datovou sadu mluvených slov, která se přizpůsobí návrhu mikrofonního pole pro trénování a vyhodnocování systémů rozpoznávání klíčových slov. Pomocí této datové sady můžete trénovat neuronovou síť pro směr detekce reproduktoru.Což je pokročilá verze originálu s přidanými zvuky během řeči na náhodných místech a v různých místnostech s různým dozvukem. Proto by měl být blíže skutečným aplikacím na dlouhé vzdálenosti. Tento úkol by mohl být novou výzvou pro směr příjezduaktivované systémy vyhledávání klíčových slov. Nazvěme tento úkol KWDOA. Tato datová sada by mohla sloužit jako úvodní úroveň pro návrhy mikrofonních polí.

Description

Subject(s)

keyword spotting, speech dataset, KWDOA, detekce klíčových slov, řečový dataset, KWDOA

Citation