On building phonetically and prosodically rich speech corpus for text-to-speech synthesis
Date issued
2006
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
ACTA Press
Abstract
Článek navrhuje metodu přípravy a pořízení řečového korpusu pro úlohu syntézy řeči z textu s dynamickým výběrem jednotek řízenou pomocí symbolické prozodie. Soustředí se na algoritmus výběru foneticky a prozodicky bohatých vět. Foneticky přepsané věty jsou obohaceny o symbolický popis na hrubé prozodické úrovni s respektováním typu prozodému, ve kterém se fony objevují. Výsledný algoritmus pak vybírá věty s ohledem na fonetická i prozodická kritéria. Abychom též pokryli i supravětné prozodické jevy, náhodně jsme vybrali odstavce a nahráli je. Nový řečový korpus se může využít k syntéze řeči s dynamickým výběrem jednotek a také k trénování datově orientovaného prozodického parseru.
Description
Subject(s)
zpracování přirozeného jazyka, syntéza řeči z textu, výběr vět, řečový korpus, prozodie
Citation
MATOUŠEK, Jindřch; ROMPORTL, Jan. On building phonetically and prosodically rich speech corpus for text-to-speech synthesis. In: Proceedings of the second IASTED international conference on Computational intelligence: 20-22 November 2006, San Francisco, USA. San Francisco: ACTA Press, 2006, p. 442-447. ISBN 0-88986-602-3.