Information retrieval test collection for searching spontaneous czech speech

Abstract

Článek popisuje vývoj první rozsáhlé testovací kolekce pro vyhledávání informací vytvořené pro český jazyk. Tvorba této kolekce je shodou okolností velkou výzvou, neboť kolekce je postavena na souvislém proudu textu z automatického přepisu spontánní řeči a jako taková postrádá jasně definované hranice mezi dokumenty. Článek představuje všechny aspekty budování kolekce, včetně některých obecných zjištění vzešlých z prvních experimentů.

Description

Subject(s)

vyhledávání v řečových datech, evaluace

Citation

IRCING, Pavel; PECINA, Pavel; OARD, Douglas W.; WANG, Jianqiang; WHITE, Ryen W.; HOIDEKR, Jan. Information retrieval test collection for searching spontaneous czech speech. In: Text, speech and dialogue. Berlin: Springer, 2007, p. 439-446. (Lectures notes in computer science; 4629). ISBN 978-3-540-74627-0.

Collections

OPEN License Selector