Metody odstranění šumu pro úlohu rozpoznávání řeči

Date issued

2025-05-19

Journal Title

Journal ISSN

Volume Title

Publisher

Západočeská univerzita v Plzni

Abstract

Tato práce se zabývá problematikou odstraňování šumu z řečových signálů s cílem zlepšit přesnost systémů automatického rozpoznávání řeči (ASR). Zkoumány jsou jak statistické metody, jako je spektrální odečítání, tak odšumování pomocí hlubokých neuronových sítí, konkrétně pomocí modelů 'Denoiser' od společnosti Meta. K hodnocení kvality odšumění jsou využity objektivní metody pro hodnocení srozumitelnosti řeči (STOI), predikce subjektivního skóre kvality (MOS) pomocí neuronové sítě UTMOSv2 a také samotná přesnost rozpoznávání řeči pomocí modelu Whisper. Experimenty byly provedeny na datech z korpusů LibriSpeech a Common Voice, které byly uměle zašuměny různými typy hluku. Výsledky naznačují, že odšumování pomocí neuronových sítí může výrazně zlepšit výkon menších ASR modelů, zatímco u větších modelů může být přínos omezený nebo dokonce negativní. Práce rovněž navrhuje nový přístup k hodnocení odšumovacích technik pomocí praktického využití ASR systémů.

Description

Subject(s)

šum, odšumění, řeč, automatické rozpoznávání řeči, ASR, neuronové sítě

Citation