Metody odstranění šumu pro úlohu rozpoznávání řeči
Date issued
2025-05-19
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Západočeská univerzita v Plzni
Abstract
Tato práce se zabývá problematikou odstraňování šumu z řečových signálů s cílem zlepšit přesnost systémů automatického rozpoznávání řeči (ASR). Zkoumány jsou jak statistické metody, jako je spektrální odečítání, tak odšumování pomocí hlubokých neuronových sítí, konkrétně pomocí modelů 'Denoiser' od společnosti Meta. K hodnocení kvality odšumění jsou využity objektivní metody pro hodnocení srozumitelnosti řeči (STOI), predikce subjektivního skóre kvality (MOS) pomocí neuronové sítě UTMOSv2 a také samotná přesnost rozpoznávání řeči pomocí modelu Whisper. Experimenty byly provedeny na datech z korpusů LibriSpeech a Common Voice, které byly uměle zašuměny různými typy hluku. Výsledky naznačují, že odšumování pomocí neuronových sítí může výrazně zlepšit výkon menších ASR modelů, zatímco u větších modelů může být přínos omezený nebo dokonce negativní. Práce rovněž navrhuje nový přístup k hodnocení odšumovacích technik pomocí praktického využití ASR systémů.
Description
Subject(s)
šum, odšumění, řeč, automatické rozpoznávání řeči, ASR, neuronové sítě