Using lemmatization technique for automatic diacritics restoration

Date issued

2005

Journal Title

Journal ISSN

Volume Title

Publisher

Moscow state linguistic university

Abstract

Tento článek se zabývá automatickou konstrukcí lematizátoru z Plný tvar - Lema trénovacího slovníku a lematizací nových, v trénovacím slovníku neviděných, tj. OOV slov. Jsou představeny tři metody pro lematizaci tří různých typů OOV slov (chybějící plné tvary, složená a neznámá slova). Nakonec je posána aplikace metody pro automatickou konstrukci lematizátoru na problém obnovení diakritiky.

Description

Subject(s)

lemmatizace, OOV slova, obnovení diakritiky

Citation

KANIS, Jakub; MÜLLER, Luděk. Using lemmatization technique for automatic diacritics restoration. In: SPECOM 2005 Proceedings. St. Petersburg: Institute for Informatics and Automation of RAS (SPIIRAS), 2005, p. 255-258. ISBN 5-7452-0110-X.