Various DNN-HMM architectures used in acoustic modeling with single-speaker and single-channel
Date issued
2021
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Springer
Abstract
V tomto článku diskutujeme některé zajímavé rysy trénování speciálního akustického modelu pouze pro jednoho řečníka s konstantním akustickým pozadím (akustický kanál). V současné době metoda LF-MMI dosahuje nejlepších výsledků v mnoha úlohách rozpoznávání řeči. Typický tréninkový postup LF-MMI používá speciální 1stavovou topologii HMM, která má různé soubory pdf na přechodech self-loop a dopředných přechodech. Rádi bychom probrali nahrazení tohoto typického LF-MMI HMM různými typy topologií HMM (1-, 2- a 3-stavové HMM topologie, které mají výstupy spojené se stavy). Dále probereme výhody použití modelování kontextu bifonu oproti použití kontextu trifonu nebo ještě jednoduššího bezkontextového monofonu. Řešíme také vliv množství trénovacích dat a kontextu DNN na WER, a to vše s ohledem na speciální akustický model s jedním mluvčím a téměř konstantním akustickým kanálem.
Description
Subject(s)
rozpoznávání řeči, akustické modelování, topologie HMM, Lattice-free MMI, single-speaker
Citation
PSUTKA, J. VANĚK, J. PRAŽÁK, A. Various DNN-HMM architectures used in acoustic modeling with single-speaker and single-channel. In Statistical Language and Speech Processing, 9th International Conference, SLSP 2021, Cardiff, UK, November 23–25, 2021, Proceedings. Cham: Springer, 2021. s. 85-96. ISBN: 978-3-030-89578-5 , ISSN: 0302-9743