Detekce hudby a řeči v rozhlasových nahrávkách
Date issued
2022
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Západočeská univerzita v Plzni
Abstract
Cílem této práce je navrhnout a experimentálně odzkoušet novou metodu
detekce řečových a neřečových částí rozhlasového vysílání, jež by měla přispět k
úspěšnému vyřešení úlohy automatického určení začátků a konců rozhlasových
pořadů za účelem jejich bezproblémového vystavování na internetovém portále
mujRozhlas.cz.
Je prezentováno stávající řešení, které je v současné době používané. Dále
jsou v práci popsány nejvíce slibné metody založené na konvolučních neurono vých sítích a state-of-the-art metodách využívajících transformery a wav2vec
framework.
Výsledkem práce je pak kromě vytvoření sady datasetů a skriptů pro po rovnání jednotlivých metod především navržení a realizace nového detektoru
splňujícího podmínky kladené na jeho implementaci pro řešení úlohy automa tické detekce začátků a konců pořadů v Českém rozhlase
Description
Subject(s)
wav2vec, transformer, inaspeechsegmenter, cnn, reciver operating charakteristic