Metody odstranění šumu pro úlohu rozpoznávání řeči
| dc.contributor.advisor | Šmídl Luboš, Ing. Ph.D. | cs |
| dc.contributor.author | Kokoška, Samuel | cs |
| dc.contributor.referee | Lehečka Jan, Ing. Ph.D. | cs |
| dc.date.accepted | 2025-06-18 | |
| dc.date.accessioned | 2026-02-20T23:21:23Z | |
| dc.date.available | 2024-10-15 | |
| dc.date.available | 2026-02-20T23:21:23Z | |
| dc.date.issued | 2025-05-19 | |
| dc.date.submitted | 2025-05-19 | |
| dc.description.abstract | Tato práce se zabývá problematikou odstraňování šumu z řečových signálů s cílem zlepšit přesnost systémů automatického rozpoznávání řeči (ASR). Zkoumány jsou jak statistické metody, jako je spektrální odečítání, tak odšumování pomocí hlubokých neuronových sítí, konkrétně pomocí modelů 'Denoiser' od společnosti Meta. K hodnocení kvality odšumění jsou využity objektivní metody pro hodnocení srozumitelnosti řeči (STOI), predikce subjektivního skóre kvality (MOS) pomocí neuronové sítě UTMOSv2 a také samotná přesnost rozpoznávání řeči pomocí modelu Whisper. Experimenty byly provedeny na datech z korpusů LibriSpeech a Common Voice, které byly uměle zašuměny různými typy hluku. Výsledky naznačují, že odšumování pomocí neuronových sítí může výrazně zlepšit výkon menších ASR modelů, zatímco u větších modelů může být přínos omezený nebo dokonce negativní. Práce rovněž navrhuje nový přístup k hodnocení odšumovacích technik pomocí praktického využití ASR systémů. | cs |
| dc.description.abstract-translated | This thesis addresses the problem of speech denoising and speech enhancement with the goal of improving the accuracy of automatic speech recognition (ASR) systems. It explores both statistical methods, like spectral subtraction, and modern approaches based on deep neural networks, specifically the 'Denoiser' models developed by Meta. The quality of denoising is evaluated using objective speech intelligibility metrics (STOI), predicted subjective quality scores (MOS) obtained via the UTMOSv2 neural network, and ASR accuracy using the Whisper model. Experiments were conducted on the data from the LibriSpeech and the Common Voice datasets, artificially corrupted with various types of noise. The results suggest that neural network-based denoising can significantly improve the performance of smaller ASR models, whereas for larger models the benefits may be limited or even detrimental. The thesis also proposes a novel approach to evaluating denoising methods through their practical impact on ASR system performance. | en |
| dc.description.department | Katedra kybernetiky | cs |
| dc.description.result | Obhájeno | cs |
| dc.format | 76 | |
| dc.identifier | 100370 | |
| dc.identifier.uri | http://hdl.handle.net/11025/66328 | |
| dc.language.iso | cs | |
| dc.publisher | Západočeská univerzita v Plzni | cs |
| dc.rights | Plný text práce je přístupný bez omezení | cs |
| dc.rights.access | openAccess | cs |
| dc.subject | šum | cs |
| dc.subject | odšumění | cs |
| dc.subject | řeč | cs |
| dc.subject | automatické rozpoznávání řeči | cs |
| dc.subject | ASR | cs |
| dc.subject | neuronové sítě | cs |
| dc.subject.translated | noise | en |
| dc.subject.translated | speech denoising | en |
| dc.subject.translated | speech enhancement | en |
| dc.subject.translated | automatic speech recognition | en |
| dc.subject.translated | ASR | en |
| dc.subject.translated | neural networks | en |
| dc.thesis.degree-grantor | Západočeská univerzita v Plzni. Fakulta aplikovaných věd | cs |
| dc.thesis.degree-level | Bakalářský | cs |
| dc.thesis.degree-name | Bc. | cs |
| dc.thesis.degree-program | Kybernetika a řídicí technika | cs |
| dc.title | Metody odstranění šumu pro úlohu rozpoznávání řeči | cs |
| dc.title.alternative | Denoising methods for speech recognition | en |
| dc.type | bakalářská práce | cs |
| local.files.count | 4 | * |
| local.files.size | 3585557 | * |
| local.has.files | yes | * |
| local.relation.IS | https://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=100370 |
Files
Original bundle
1 - 4 out of 4 results
No Thumbnail Available
- Name:
- BP_Kokoska_A22B0089P.pdf
- Size:
- 3.26 MB
- Format:
- Adobe Portable Document Format
- Description:
- VŠKP
No Thumbnail Available
- Name:
- PV_Kokoska_A22B0089P.pdf
- Size:
- 63.74 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek vedoucího VŠKP
No Thumbnail Available
- Name:
- PO_Kokoska_A22B0089P.pdf
- Size:
- 60.82 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek oponenta VŠKP
No Thumbnail Available
- Name:
- PB_Kokoska_A22B0089P.pdf
- Size:
- 39.44 KB
- Format:
- Adobe Portable Document Format
- Description:
- Průběh obhajoby VŠKP