Recent improvements on ARTIC: czech text-to-speech system

Abstract

Článek prezentuje nejnovější vylepšení systému ARTIC, moderního českého korpusově orientovaného TTS systému. Protože jsme použili statistický přístup (skryté Markovovy modely) k vytvoření inventáře akustických jednotek, vylepšení se týkala všech jeho komponent. Vylepšeným modelováním, shlukováním, a segmentací akustických jednotek jsme dosáhli zvýšené srozumitelnosti výsledné řeči. Navrhli jsme rovněž 2 přístupy ke generování prozodických charakteristik a získali tak vyšší přirozenost syntetické řeči. Abychom zvýšili i plynulost vytvářené řeči, navrhli jsme rovněž schéma využívající více realizací každé řečové jednotky s výběrem nejvhodnějšího kandidáta on-line. Zmíníme také alternativní metodu vytváření řeči využívající harmonický model a model šumu. Implementací německého a slovenského jazykového modulu (vedle 2 českých hlasů) jsme navíc vytvořili důležitý krok směrem k vícejazyčnosti našeho TTS systému ARTIC.

Description

Subject(s)

syntéza řeči, automatická vytváření inventáře akustických jednotek, modelování rázu, shlukování řečových jednotek, automatická segmentace řeči, datově řízené generování prozodie

Citation

MATOUŠEK, Jindřich; ROMPORTL, Jan; TIHELKA, Daniel; TYCHTL, Zbyněk. Recent improvements on ARTIC: czech text-to-speech system. In: Proceedings of ICSPL 2004: 8th Annual Conference of the International Speech Communication Association 2004, Jeju Island, Korea, 4-8 October 2004. [Baixas]: ISCA, 2004, p. 1933-1936.