Benefit of proper language processing for czech speech retrieval in the CL-SR task at CLEF 2006

Date issued

2007

Journal Title

Journal ISSN

Volume Title

Publisher

Springer

Abstract

Článek popisuje systém vytvořený týmem Západočeské univerzity pro účely participace v kampani CLEF 2006 CL-SR track. Rozhodli jsme se soustředit pouze na prohledávání české testovací kolekce a prozkoumání přínosu vhodného jazykového předzpracování pro úspěšnost vyhledávání. Pro účely lingvistického předzpracování dat jsme použili morfologický analyzátor a tagger. Pro vlastní vyhledávání jsme využili klasický tf.idf přístup se slepou zpětnou vazbou tak, jak je implementován v systému Lemur. Výsledky naznačují, že vhodné lingvistické předzpracování je pro úspěšné vyhledávání v mluvené češtině vskutku klíčové.

Description

Subject(s)

vyhledávání řečových dokumentů, zpracování přirozeného jazyka, morfologická analýza

Citation

IRCING, Pavel; MÜLLER, Luděk. Benefit of proper language processing for czech speech retrieval in the CL-SR task at CLEF 2006. In: Evaluation of multilingual and multi-modal information retrieval. Berlin: Springer, 2007, p. 759-765. (Lectures notes in computer science; 4730). ISBN 978-3-540-74998-1.

Collections

OPEN License Selector