Evaluation of Synthetic Speech by GMM-Based Continuous Detection of Emotional States
Date issued
2019
Journal Title
Journal ISSN
Volume Title
Publisher
Springer
Abstract
Příspěvek popisuje systém pro automatické hodnocení kvality syntetické řeči založený na spojité detekci emočních stavů během mluvené věty pomocí klasifikace s využitím modelu gaussovských směsí (GMM). Konečné hodnocení se provádí statistickou analýzou výsledků rozdílů emočních stavů mezi větami původních mužských nebo ženských hlasů a řečí syntetizovanými různými metodami s různými parametry, přístupy k manipulaci s prozodií atd. Základní experimenty potvrzují funkčnost vyvinutého systému, který poskytuje výsledky srovnatelné s výsledky získanými standardní metodou využívající poslechový test. Další výzkumy ukázaly, že počet směsí, typy řečových příznaků a řečové databáze používané pro tvorbu a výcvik GMM mají relativně velký vliv na spojitou detekci emočního stylu a konečné hodnocení kvality testované syntetické řeči.
Description
Subject(s)
klasifikace GMM, statistická analýza, hodnocení syntetické řeči, syntéza řeči z textu
Citation
PŘIBIL, J., PŘIBILOVÁ, A., MATOUŠEK, J. Evaluation of Synthetic Speech by GMM-Based Continuous Detection of Emotional States. In: Text, Speech, and Dialogue 22nd International Conference, TSD 2019, Ljubljana,Slovenia, September 11-13, 2019, Proceedings. Cham: Springer, 2019. s. 264-273. ISBN 978-3-030-27946-2 , ISSN 0302-9743.