Evaluation of Synthetic Speech by GMM-Based Continuous Detection of Emotional States

Date issued

2019

Journal Title

Journal ISSN

Volume Title

Publisher

Springer

Abstract

Příspěvek popisuje systém pro automatické hodnocení kvality syntetické řeči založený na spojité detekci emočních stavů během mluvené věty pomocí klasifikace s využitím modelu gaussovských směsí (GMM). Konečné hodnocení se provádí statistickou analýzou výsledků rozdílů emočních stavů mezi větami původních mužských nebo ženských hlasů a řečí syntetizovanými různými metodami s různými parametry, přístupy k manipulaci s prozodií atd. Základní experimenty potvrzují funkčnost vyvinutého systému, který poskytuje výsledky srovnatelné s výsledky získanými standardní metodou využívající poslechový test. Další výzkumy ukázaly, že počet směsí, typy řečových příznaků a řečové databáze používané pro tvorbu a výcvik GMM mají relativně velký vliv na spojitou detekci emočního stylu a konečné hodnocení kvality testované syntetické řeči.

Description

Subject(s)

klasifikace GMM, statistická analýza, hodnocení syntetické řeči, syntéza řeči z textu

Citation

PŘIBIL, J., PŘIBILOVÁ, A., MATOUŠEK, J. Evaluation of Synthetic Speech by GMM-Based Continuous Detection of Emotional States. In: Text, Speech, and Dialogue 22nd International Conference, TSD 2019, Ljubljana,Slovenia, September 11-13, 2019, Proceedings. Cham: Springer, 2019. s. 264-273. ISBN 978-3-030-27946-2 , ISSN 0302-9743.