Rozpoznávání fónů pomocí neuronové sítě

Date issued

2018

Journal Title

Journal ISSN

Volume Title

Publisher

Západočeská univerzita v Plzni

Abstract

Tato práce se zabývá klasifikací fonémů pomocí různých architektur neuronových sítí. V první části práce je představena obecná teorie dopředných a rekurentních neuronových sítí a následně metoda CTC (connectionist temporal classification). Ve druhé části je pak vyhodnocena přesnost rozpoznání šesti navržených architektur nad čtyřmi parametrizacemi pro dvě datové sady o různé velikosti. Ukázalo se, že rekurentní neuronová síť využívající dvě obousměrné LSTM vrstvy a metodu CTC dosahuje velmi vysoké přesnosti, ale pouze díky využití informace z celé nahrávky. Proto byla testována i její varianta s omezenou délkou vstupní sekvence, která pro tuto úlohu rovněž ukázala velký potenciál a mohla by být využita pro rozpoznávání v reálném čase.

Description

Subject(s)

rozpoznání fonémů, dopředná neuronová síť, rekurentní neuronová síť, long short-term memory, gated recurrent unit, connectionist temporal classification

Citation

Collections