Neuronové sítě pro klasifikaci audio signálu
Date issued
2022
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Západočeská univerzita v Plzni
Abstract
Tématem bakalářské práce je seznámení se a následná aplikace neuronových sítí v oblasti
audiosignálů. Jejím obsahem je problematika využití dostupných architektur neuronových
sítí ve spojitosti s audiosignály a jejich popis. Následně je popsána úloha, jejímž cílem
bylo zjistit dopad využití různých druhů textové reprezentace anotace (ortografické versus
normované) trénovacích audionahrávek pro dotrénování předtrénovaného modelu. Model
je následně otestován na testovacím balíku dat a jsou vyhodnoceny důsledky zvoleného
trénovacího postupu na jeho výslednou přesnost, diskutován je i dopad dodatečné úpravy
výstupu modelu na celkový výsledek. Bylo provedeno několik experimentů, jejichž výsledky
jsou následně okomentovány a vyhodnoceny. Na získaných výsledcích je zformulována
hypotéza o možnostech využití různých forem dat v závislosti na jejich dostupnosti.
Description
Subject(s)
wav2vec2.0, transformer, automatické rozpoznávání řeči, neuronové
sítě, transkripce textu, transfer learning.