Using the lemmatization technique for phonetic transcription in text-to-speech system
Date issued
2004
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Springer
Abstract
Tento článek se zabývá technikou lemmatizace a jejím využitím pro fonetickou transkripci slov, jež jsou výjimkami z pravidelné fonetické transkripce. Lemmatizátor je založen na morfologii jazyka a používá slovník základních tvarů a množinu inverzních derivačních pravidel k nalezení lemmatizačních pravidel, která jsou nezbytná pro hledání základních tvarů slov. Dále je v článku popsán algoritmus lemmatizace a jeho nutné modifikace pro zajištění fonetické transkripce výjimek. Hlavním cílem navrženého systému je úspora paměti při uložení slovníku výjimek. Výsledky experimentů ukazují, že lze uspořit 18,3 % (Angličtina) až 98,4 % (Finština) velikosti plného slovníku výjimek. Navržená technika tedy může být s výhodou použita pro vysoce flexivní a aglutinační jazyky.
Description
Subject(s)
lemmatizace, fonetická transkripce, výjimky z fonetické transkripce
Citation
KANIS, Jakub; MÜLLER, Luděk. Using the lemmatization technique for phonetic transcription in text-to-speech system. In: Text, speech and dialogue. Berlin: Springer, 2004, p. 355-361. (Lectures notes in computer science; 3206). ISBN 978-3-540-23049-6.