Rozpoznávání fónů pomocí neuronové sítě
Date issued
2018
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Západočeská univerzita v Plzni
Abstract
Tato práce se zabývá klasifikací fonémů pomocí různých architektur neuronových sítí. V první části práce je představena obecná teorie dopředných a rekurentních neuronových sítí a následně metoda CTC (connectionist temporal classification). Ve druhé části je pak vyhodnocena přesnost rozpoznání šesti navržených architektur nad čtyřmi parametrizacemi pro dvě datové sady o různé velikosti. Ukázalo se, že rekurentní neuronová síť využívající dvě obousměrné LSTM vrstvy a metodu CTC dosahuje velmi vysoké přesnosti, ale pouze díky využití informace z celé nahrávky. Proto byla testována i její varianta s omezenou délkou vstupní sekvence, která pro tuto úlohu rovněž ukázala velký potenciál a mohla by být využita pro rozpoznávání v reálném čase.
Description
Subject(s)
rozpoznání fonémů, dopředná neuronová síť, rekurentní neuronová síť, long short-term memory, gated recurrent unit, connectionist temporal classification