Rozpoznávání řeči pomocí neuronových sítí s navazujícím sequence-to-sequence modelem

Šulc, Matěj

Rozpoznávání řeči pomocí neuronových sítí s navazujícím sequence-to-sequence modelem

Files

BP_Sulc.pdf (2.1 MB)

PosudekOponentaSTAG-SmidlL-53843.pdf (63.67 KB)

PosudekVedoucihoSTAG-LeheckaJ-241985.pdf (61.5 KB)

ProtokolSPrubehemObhajobySTAG.pdf (39.37 KB)

Date issued

2024

Authors

Šulc, Matěj

Publisher

Západočeská univerzita v Plzni

Abstract

Tato bakalářská práce se zaměřuje na vývoj a optimalizaci systému rozpoznávání řeči využívající kombinaci dvou hlavních technologických nástrojů z domén zpracování akustických signálů a přirozeného jazyka, a to neuronové sítě Wav2Vec2.0, která je doplněna o sequence-to-sequence model T5. Cílem je zvýšit přesnost převodu mluveného slova na textový formát. V první části práce je proveden rozbor metody Wav2Vec2.0, která slouží k extrakci významných akustických informací z audio nahrávek a vytvoření textové reprezentace. Následně je popsán sequence-to-sequence model T5, jenž slouží k úpravě získaného přepisu řeči, jelikož na rozdíl od Wa2Vec2.0 modelu vychází ze znalostí o přirozeném jazyce. Tyto dva klíčové prvky jsou následně integrovány do funkčního systému pro rozpoznávání řeči.

Subject(s)

automatické rozpoznání řeči, asr, stt, transformers, wav2vec2.0, seq2seq, t5

Item identifier

http://hdl.handle.net/11025/57080

Collections

Bachelor´s works (KKY)

Show full item record

Rozpoznávání řeči pomocí neuronových sítí s navazujícím sequence-to-sequence modelem

Files

Date issued

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Description

Subject(s)

Citation

Item identifier

Collections