Weak supervision for Question Type Detection with large language models
Date issued
2022
Journal Title
Journal ISSN
Volume Title
Publisher
International Speech Communication Association (ISCA)
Abstract
Velké předtrénované jazykové modely prokázaly pozoruhodné výkony v tzv. Zero-Shot Learning v mnoha úlohách zpracování přirozeného jazyka. Nicméně navrhování účinných vstupů (tzv. prompts) je stále velmi obtížné pro některé úkoly, zejména pro rozpoznávání dialogových aktů. Proto navrhujeme alternativní způsob, jak využít předtrénovaný model pro takové úkoly s využitím jednoduchých pravidel, která jsou intuitivnější a snáze se navrhují. Tento přístup demonstrujeme na úloze automatické detekce otázek a ukazujeme, že náš model dobře funguje v porovnání s modelem LSTM, který je natrénován na trénovací části datasetu MRDA. Dále analyzujeme limity navrhovaného přístupu, které nelze jednoduše aplikovat na zcella libovolnou úlohu, ale může být prospěšný jako doplněk pro přidání specifických tříd.
Description
Subject(s)
detekce typů otázek, zero-shot, dialogue acts, BART
Citation
MARTÍNEK, J.; CERISARA, C.; KRÁL, P.; LENC, L.; BALOUN, J. Weak supervision for Question Type Detection with large language models. In: 23rd Annual Conference of the International Speech Communication, Interspeech 2022. Baixas: International Speech Communication Association (ISCA), 2022, s. 3283-3287. ISBN neuvedeno, ISSN 2308-457X.