Training of speaker-clustered discriminative acoustic models for use in real-time recognizers

Vaněk, Jan

Training of speaker-clustered discriminative acoustic models for use in real-time recognizers

Files

VanekJan_2010_Trainingof.pdf (184.32 KB)

Date issued

2010

Authors

Publisher

Institute of photonics and electronics AS CR

Abstract

Je dobře známo, že akustické modely, založené na informaci o pohlaví řečníka, jsou více akusticky homogenní, a proto dosahují lepších výsledků rozpoznávání než jeden univerzální akustický model v případě, že je pohlaví řečníka úspěšně detekováno, nebo předem známo. Řečníci ovšem nemusí být rozděleni jen do dvou skupin. V tomto článku je popsán algoritmus, který je schopen vytvořit větší množství shluků řečníků. Dále se tento článek zabývá problémem vhodného použití těchto modelů v systémech rozpoznávání řeči pracujících v reálném čase, kde informace od detektoru správného shluku řečníků je často zpožděná nebo nesprávná. Dále jsou ještě v článku diskutovány různé přístupy k začlenění diskriminativních metod při trénování těchto akustických modelů.

Subject(s)

model shlukování řečníků, akustické modelování, automatické rozpoznávání řeči

Citation

VANĚK, Jan; PSUTKA, Josef V.; ZELINKA, Jan; TRMAL, Jan. Training of speaker-clustered discriminative acoustic models for use in real-time recognizers. In: Speech processing. Prague: Institute of photonics and electronics AS CR , 2010, p. 152-158. ISBN 978-80-86269-21-4.

Item identifier

http://hdl.handle.net/11025/16957

Collections

Articles (KKY)
Articles (KIV)

Show full item record

Training of speaker-clustered discriminative acoustic models for use in real-time recognizers

Files

Date issued

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Description

Subject(s)

Citation

Item identifier

Collections