Czech spontaneous speech corpus with structural metadata
Date issued
2005
Journal Title
Journal ISSN
Volume Title
Publisher
ISCA
Abstract
Tento článek popisuje český korpus spontánní řeči skládajícíse z nahrávek rozhlasových diskusních pořadů. Jako první kompletní neanglický MDE korpus byl anotován strukturálními metadaty, která zvyšují čitelnost přepisů člověkem a umožňují i další automatické zpracování. Anotace zahrnuje rozdělení přepisů do syntakticko-sémantických jednotek a identifikace výplní a neplynulostí. Mimo modifikací nutných pouze pro češtinu také navrhujeme některé modifikace nezávislé na jazyku, jako je například limitované prozodické značkování na hranicích syntakticko-sémantických jednotek.
Description
Subject(s)
strukturální metadata, spontánní řeč, neplynulost, výplně
Citation
KOLÁŘ, Jáchym; ŠVEC, Jan; STRASSEL, Stephanie; WALKER, Christopher; KOZLÍKOVÁ, Dagmar; PSUTKA, Josef. Czech spontaneous speech corpus with structural metadata. In: Proceedings of ICSPL 2005: 6th Annual Conference of the International Speech Communication Association 2005, Lisboa, Portugal, 4-8 September 2005. [Baixas]: ISCA, 2005, p. 1165-1168. ISSN 1990-9772.