Metody odstranění šumu pro úlohu rozpoznávání řeči

dc.contributor.advisorŠmídl Luboš, Ing. Ph.D.cs
dc.contributor.authorKokoška, Samuelcs
dc.contributor.refereeLehečka Jan, Ing. Ph.D.cs
dc.date.accepted2025-06-18
dc.date.accessioned2026-02-20T23:21:23Z
dc.date.available2024-10-15
dc.date.available2026-02-20T23:21:23Z
dc.date.issued2025-05-19
dc.date.submitted2025-05-19
dc.description.abstractTato práce se zabývá problematikou odstraňování šumu z řečových signálů s cílem zlepšit přesnost systémů automatického rozpoznávání řeči (ASR). Zkoumány jsou jak statistické metody, jako je spektrální odečítání, tak odšumování pomocí hlubokých neuronových sítí, konkrétně pomocí modelů 'Denoiser' od společnosti Meta. K hodnocení kvality odšumění jsou využity objektivní metody pro hodnocení srozumitelnosti řeči (STOI), predikce subjektivního skóre kvality (MOS) pomocí neuronové sítě UTMOSv2 a také samotná přesnost rozpoznávání řeči pomocí modelu Whisper. Experimenty byly provedeny na datech z korpusů LibriSpeech a Common Voice, které byly uměle zašuměny různými typy hluku. Výsledky naznačují, že odšumování pomocí neuronových sítí může výrazně zlepšit výkon menších ASR modelů, zatímco u větších modelů může být přínos omezený nebo dokonce negativní. Práce rovněž navrhuje nový přístup k hodnocení odšumovacích technik pomocí praktického využití ASR systémů.cs
dc.description.abstract-translatedThis thesis addresses the problem of speech denoising and speech enhancement with the goal of improving the accuracy of automatic speech recognition (ASR) systems. It explores both statistical methods, like spectral subtraction, and modern approaches based on deep neural networks, specifically the 'Denoiser' models developed by Meta. The quality of denoising is evaluated using objective speech intelligibility metrics (STOI), predicted subjective quality scores (MOS) obtained via the UTMOSv2 neural network, and ASR accuracy using the Whisper model. Experiments were conducted on the data from the LibriSpeech and the Common Voice datasets, artificially corrupted with various types of noise. The results suggest that neural network-based denoising can significantly improve the performance of smaller ASR models, whereas for larger models the benefits may be limited or even detrimental. The thesis also proposes a novel approach to evaluating denoising methods through their practical impact on ASR system performance.en
dc.description.departmentKatedra kybernetikycs
dc.description.resultObhájenocs
dc.format76
dc.identifier100370
dc.identifier.urihttp://hdl.handle.net/11025/66328
dc.language.isocs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezenícs
dc.rights.accessopenAccesscs
dc.subjectšumcs
dc.subjectodšuměnícs
dc.subjectřečcs
dc.subjectautomatické rozpoznávání řečics
dc.subjectASRcs
dc.subjectneuronové sítěcs
dc.subject.translatednoiseen
dc.subject.translatedspeech denoisingen
dc.subject.translatedspeech enhancementen
dc.subject.translatedautomatic speech recognitionen
dc.subject.translatedASRen
dc.subject.translatedneural networksen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-levelBakalářskýcs
dc.thesis.degree-nameBc.cs
dc.thesis.degree-programKybernetika a řídicí technikacs
dc.titleMetody odstranění šumu pro úlohu rozpoznávání řečics
dc.title.alternativeDenoising methods for speech recognitionen
dc.typebakalářská prácecs
local.files.count4*
local.files.size3585557*
local.has.filesyes*
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=100370

Files

Original bundle
Showing 1 - 4 out of 4 results
No Thumbnail Available
Name:
BP_Kokoska_A22B0089P.pdf
Size:
3.26 MB
Format:
Adobe Portable Document Format
Description:
VŠKP
No Thumbnail Available
Name:
PV_Kokoska_A22B0089P.pdf
Size:
63.74 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího VŠKP
No Thumbnail Available
Name:
PO_Kokoska_A22B0089P.pdf
Size:
60.82 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta VŠKP
No Thumbnail Available
Name:
PB_Kokoska_A22B0089P.pdf
Size:
39.44 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby VŠKP