Using the lemmatization technique for phonetic transcription in text-to-speech system

dc.contributor.authorKanis, Jakub
dc.contributor.authorMüller, Luděk
dc.date.accessioned2016-01-06T13:09:00Z
dc.date.available2016-01-06T13:09:00Z
dc.date.issued2004
dc.description.abstractTento článek se zabývá technikou lemmatizace a jejím využitím pro fonetickou transkripci slov, jež jsou výjimkami z pravidelné fonetické transkripce. Lemmatizátor je založen na morfologii jazyka a používá slovník základních tvarů a množinu inverzních derivačních pravidel k nalezení lemmatizačních pravidel, která jsou nezbytná pro hledání základních tvarů slov. Dále je v článku popsán algoritmus lemmatizace a jeho nutné modifikace pro zajištění fonetické transkripce výjimek. Hlavním cílem navrženého systému je úspora paměti při uložení slovníku výjimek. Výsledky experimentů ukazují, že lze uspořit 18,3 % (Angličtina) až 98,4 % (Finština) velikosti plného slovníku výjimek. Navržená technika tedy může být s výhodou použita pro vysoce flexivní a aglutinační jazyky.cs
dc.description.abstract-translatedThis paper deals with a lemmatization technique and its using for phonetic transcription of exceptional words. The lemmatizer is based on language morphology and uses a lexicon of basic word forms and a set of inversion derivation rules to acquire lemmatization rules, which are essential for finding word bases. The lemmatization algorithm and its necessary modifications for transcription of exceptional words are described. The main goal of the designed system is to save computer memory for exceptional lexicon storing. The experimental results showed that it is possible to save from 18.3 % (English) to 98.4 % (Finnish) of the full lexicon size. Hence, the described technique can be applied with advantage for high inflectional and agglutinative languages.en
dc.format7 s.cs
dc.format.mimetypeapplication/pdf
dc.identifier.citationKANIS, Jakub; MÜLLER, Luděk. Using the lemmatization technique for phonetic transcription in text-to-speech system. In: Text, speech and dialogue. Berlin: Springer, 2004, p. 355-361. (Lectures notes in computer science; 3206). ISBN 978-3-540-23049-6.en
dc.identifier.isbn978-3-540-23049-6
dc.identifier.urihttp://www.kky.zcu.cz/cs/publications/KanisJ_2004_Usingthe_1
dc.identifier.urihttp://hdl.handle.net/11025/17131
dc.language.isoenen
dc.publisherSpringeren
dc.relation.ispartofseriesLectures notes in computer science; 3206en
dc.rights© Jakub Kanis - Luděk Müllercs
dc.rights.accessopenAccessen
dc.subjectlemmatizacecs
dc.subjectfonetická transkripcecs
dc.subjectvýjimky z fonetické transkripcecs
dc.subject.translatedlemmatizationen
dc.subject.translatedphonetic transcriptionen
dc.subject.translatedexceptions from letter to sound conversionen
dc.titleUsing the lemmatization technique for phonetic transcription in text-to-speech systemen
dc.title.alternativeVyužití techniky lemmatizace pro fonetickou transkripci v text-to-speech systémucs
dc.typečlánekcs
dc.typearticleen
dc.type.statusPeer-revieweden
dc.type.versionpublishedVersionen

Files

Original bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
KanisJ_2004_Usingthe_1.pdf
Size:
95.48 KB
Format:
Adobe Portable Document Format
Description:
Plný text
License bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: