Weak supervision for Question Type Detection with large language models

Date issued

2022

Journal Title

Journal ISSN

Volume Title

Publisher

International Speech Communication Association (ISCA)

Abstract

Velké předtrénované jazykové modely prokázaly pozoruhodné výkony v tzv. Zero-Shot Learning v mnoha úlohách zpracování přirozeného jazyka. Nicméně navrhování účinných vstupů (tzv. prompts) je stále velmi obtížné pro některé úkoly, zejména pro rozpoznávání dialogových aktů. Proto navrhujeme alternativní způsob, jak využít předtrénovaný model pro takové úkoly s využitím jednoduchých pravidel, která jsou intuitivnější a snáze se navrhují. Tento přístup demonstrujeme na úloze automatické detekce otázek a ukazujeme, že náš model dobře funguje v porovnání s modelem LSTM, který je natrénován na trénovací části datasetu MRDA. Dále analyzujeme limity navrhovaného přístupu, které nelze jednoduše aplikovat na zcella libovolnou úlohu, ale může být prospěšný jako doplněk pro přidání specifických tříd.

Description

Subject(s)

detekce typů otázek, zero-shot, dialogue acts, BART

Citation

MARTÍNEK, J.; CERISARA, C.; KRÁL, P.; LENC, L.; BALOUN, J. Weak supervision for Question Type Detection with large language models. In: 23rd Annual Conference of the International Speech Communication, Interspeech 2022. Baixas: International Speech Communication Association (ISCA), 2022, s. 3283-3287. ISBN neuvedeno, ISSN 2308-457X.