Rozpoznávání fónů pomocí neuronové sítě

dc.contributor.advisorŠmídl Luboš, Ing. Ph.D.
dc.contributor.authorMajer, Martin
dc.contributor.refereeŠvec Jan, Ing. Ph.D.
dc.date.accepted2018-6-19
dc.date.accessioned2019-03-15T10:14:09Z
dc.date.available2017-10-2
dc.date.available2019-03-15T10:14:09Z
dc.date.issued2018
dc.date.submitted2018-5-18
dc.description.abstractTato práce se zabývá klasifikací fonémů pomocí různých architektur neuronových sítí. V první části práce je představena obecná teorie dopředných a rekurentních neuronových sítí a následně metoda CTC (connectionist temporal classification). Ve druhé části je pak vyhodnocena přesnost rozpoznání šesti navržených architektur nad čtyřmi parametrizacemi pro dvě datové sady o různé velikosti. Ukázalo se, že rekurentní neuronová síť využívající dvě obousměrné LSTM vrstvy a metodu CTC dosahuje velmi vysoké přesnosti, ale pouze díky využití informace z celé nahrávky. Proto byla testována i její varianta s omezenou délkou vstupní sekvence, která pro tuto úlohu rovněž ukázala velký potenciál a mohla by být využita pro rozpoznávání v reálném čase.cs
dc.description.abstract-translatedThis thesis focuses on the phoneme recognition using various architectures of neural networks. The first part introduces theory of feedforward and recurrent neural networks followed by the introduction of the method CTC (connectionist temporal classification). The second part presents comparison of accuracy of recognition between six architectures on four parametrizations generated from two datasets of various size. It was shown that the recurrent neural network using two bidirectional LSTM layers combined with CTC achieved high accuracy although only due to using information from the whole recording. Therefore its alternative version which used a limited length of the input sequence was tested and also showed large potential and could be possibly used for recognition in real-time.en
dc.description.resultObhájenocs
dc.format51 s. (15 000 znaků)cs
dc.format.mimetypeapplication/pdf
dc.identifier75989
dc.identifier.urihttp://hdl.handle.net/11025/31769
dc.language.isocscs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.rights.accessopenAccessen
dc.subjectrozpoznání fonémůcs
dc.subjectdopředná neuronová síťcs
dc.subjectrekurentní neuronová síťcs
dc.subjectlong short-term memorycs
dc.subjectgated recurrent unitcs
dc.subjectconnectionist temporal classificationcs
dc.subject.translatedphoneme recognitionen
dc.subject.translatedfeedforward neural networken
dc.subject.translatedrecurrent neural networken
dc.subject.translatedlong short-term memoryen
dc.subject.translatedgated recurrent uniten
dc.subject.translatedconnectionist temporal classificationen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-levelNavazujícícs
dc.thesis.degree-nameIng.cs
dc.thesis.degree-programInženýrská informatikacs
dc.titleRozpoznávání fónů pomocí neuronové sítěcs
dc.title.alternativePhoneme recognition using a neural networken
dc.typediplomová prácecs
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=75989

Files

Original bundle
Showing 1 - 4 out of 4 results
No Thumbnail Available
Name:
dp_mmajer.pdf
Size:
945.43 KB
Format:
Adobe Portable Document Format
Description:
Plný text práce
No Thumbnail Available
Name:
majer-v.pdf
Size:
541.81 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího práce
No Thumbnail Available
Name:
majer-o.pdf
Size:
663.73 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta práce
No Thumbnail Available
Name:
majer-p.pdf
Size:
349.18 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby práce

Collections