Detekce hudby a řeči v rozhlasových nahrávkách

Date issued

2022

Journal Title

Journal ISSN

Volume Title

Publisher

Západočeská univerzita v Plzni

Abstract

Cílem této práce je navrhnout a experimentálně odzkoušet novou metodu detekce řečových a neřečových částí rozhlasového vysílání, jež by měla přispět k úspěšnému vyřešení úlohy automatického určení začátků a konců rozhlasových pořadů za účelem jejich bezproblémového vystavování na internetovém portále mujRozhlas.cz. Je prezentováno stávající řešení, které je v současné době používané. Dále jsou v práci popsány nejvíce slibné metody založené na konvolučních neurono vých sítích a state-of-the-art metodách využívajících transformery a wav2vec framework. Výsledkem práce je pak kromě vytvoření sady datasetů a skriptů pro po rovnání jednotlivých metod především navržení a realizace nového detektoru splňujícího podmínky kladené na jeho implementaci pro řešení úlohy automa tické detekce začátků a konců pořadů v Českém rozhlase

Description

Subject(s)

wav2vec, transformer, inaspeechsegmenter, cnn, reciver operating charakteristic

Citation

Collections