Benefit of proper language processing for czech speech retrieval in the CL-SR task at CLEF 2006
Date issued
2007
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Springer
Abstract
Článek popisuje systém vytvořený týmem Západočeské univerzity pro účely participace v kampani CLEF 2006 CL-SR track. Rozhodli jsme se soustředit pouze na prohledávání české testovací kolekce a prozkoumání přínosu vhodného jazykového předzpracování pro úspěšnost vyhledávání. Pro účely lingvistického předzpracování dat jsme použili morfologický analyzátor a tagger. Pro vlastní vyhledávání jsme využili klasický tf.idf přístup se slepou zpětnou vazbou tak, jak je implementován v systému Lemur. Výsledky naznačují, že vhodné lingvistické předzpracování je pro úspěšné vyhledávání v mluvené češtině vskutku klíčové.
Description
Subject(s)
vyhledávání řečových dokumentů, zpracování přirozeného jazyka, morfologická analýza
Citation
IRCING, Pavel; MÜLLER, Luděk. Benefit of proper language processing for czech speech retrieval in the CL-SR task at CLEF 2006. In: Evaluation of multilingual and multi-modal information retrieval. Berlin: Springer, 2007, p. 759-765. (Lectures notes in computer science; 4730). ISBN 978-3-540-74998-1.