Abilities of Contrastive Soft Prompting for Open Domain Rhetorical Question Detection

Baloun, Josef

Abilities of Contrastive Soft Prompting for Open Domain Rhetorical Question Detection

dc.contributor.author	Baloun, Josef
dc.contributor.author	Martínek, Jiří
dc.contributor.author	Cerisara, Christophe
dc.contributor.author	Král, Pavel
dc.date.accessioned	2026-03-31T18:05:31Z
dc.date.available	2026-03-31T18:05:31Z
dc.date.issued	2025
dc.date.updated	2026-03-31T18:05:31Z
dc.description.abstract	In this work, we start by demonstrating experimentally thatrhetorical question detection is still a challenging task, even for state-of-the-art Large Language Models (LLMs).We then propose an approach that boosts the performances of such LLMs by training a soft prompt in a waythat enables building a joint embedding space from multiple loosely related corpora.The advantages of using a soft-prompt compared to finetuning is to limit the training costs and combat overfittingand forgetting. Soft prompting is often viewed as a way to guide the model towards a specific known task, or tointroduce new knowledge into the model through in-context learning.We further show that soft prompting may also be used to modify the geometry of the embedding space, so thatthe distance between embeddings becomes semantically relevant for a target task, similarly to what is commonlyachieved with contrastive finetuning.We exploit this property to combat data scarcity for the task of rhetorical question detection bymerging several datasets into a joint semantic embedding space.We finally show on the standard Switchboard dataset that the resulting BERT-based model nearly divides by 2the number of errors as compared to Flan-T5-XXL with only 5 few-shot labeled samples, thanks to this jointembedding space. We have chosen in our experiments a BERT model because it has already been shown with S-BERT thatcontrastive finetuning of BERT leads to semantically meaningful representations. Therefore, we also show that thisproperty of BERT nicely transfers to the soft-prompting paradigm.Finally, we qualitatively analyze the resulting embedding space and propose a few heuristic criteria to selectappropriate related tasks for inclusion into the pool of training datasets.	en
dc.description.abstract	V této práci nejprve experimentálně ukazujeme, že detekce rétorických otázek je stále náročný úkol, a to i pro nejmodernější velké jazykové modely (LLM).Dále navrhujeme přístup, který zlepšuje výkonnost těchto LLM prostřednictvím trénování „soft promptu“ způsobem, který umožňuje vytváření společného prostoru vektorových reprezentací z několika volně souvisejících korpusů.Výhodou použití soft promptu oproti jemnému ladění (finetuningu) je omezení nákladů na trénink a snížení rizika přeučení a zapomínání. Soft prompting je často vnímán jako způsob, jak nasměrovat model k určité známé úloze, nebo jak zavést do modelu nové znalosti prostřednictvím učení v kontextu.Dále ukazujeme, že soft prompting může být také použit k modifikaci geometrie prostoru embeddingů tak, aby vzdálenosti mezi embeddingy měly sémantický význam pro cílovou úlohu, obdobně jako je běžně dosaženo pomocí kontrastního jemného ladění.Tuto vlastnost využíváme k řešení nedostatku dat pro úlohu detekce rétorických otázek sloučením několika datasetů do společného sémantického embeddingového prostoru.Nakonec ukazujeme na standardním datasetu Switchboard, že výsledný model založený na BERT téměř zdvojnásobuje přesnost ve srovnání s Flan-T5-XXL při použití pouze pěti málo označených vzorků, díky tomuto společnému embeddingovému prostoru. V našich experimentech jsme zvolili model BERT, protože již bylo ukázáno s S-BERT, že kontrastní jemné ladění BERT vede k sémanticky smysluplným reprezentacím. Ukazujeme tedy také, že tato vlastnost BERT se dobře přenáší do paradigmatu soft promptingu.Nakonec provádíme kvalitativní analýzu výsledného embeddingového prostoru a navrhujeme několik heuristických kritérií pro výběr vhodných souvisejících úloh pro zahrnutí do sady tréninkových datasetů.	cz
dc.format	26
dc.identifier.document-number	001621681300002
dc.identifier.doi	10.31577/cai_2025_3_523
dc.identifier.issn	1335-9150
dc.identifier.obd	43947643
dc.identifier.orcid	Baloun, Josef 0000-0003-1923-5355
dc.identifier.orcid	Martínek, Jiří 0000-0003-2981-1723
dc.identifier.orcid	Král, Pavel 0000-0002-3096-675X
dc.identifier.uri	http://hdl.handle.net/11025/67483
dc.language.iso	en
dc.project.ID	SGS-2025-022
dc.relation.ispartofseries	COMPUTING AND INFORMATICS
dc.rights.access	A
dc.subject	soft prompts	en
dc.subject	prompt-tuning	en
dc.subject	rhetorical questions	en
dc.subject	contrastive learning	en
dc.subject	triplet loss	en
dc.subject	pre-trained language models	en
dc.subject	soft prompt	cz
dc.subject	ladění promptu	cz
dc.subject	rétorické otázky	cz
dc.subject	kontrastní učení	cz
dc.subject	triplet loss	cz
dc.subject	předtrénované jazykové modely soft prompt	cz
dc.subject	ladění promptu	cz
dc.subject	rétorické otázky	cz
dc.subject	kontrastní učení	cz
dc.subject	triplet loss	cz
dc.subject	předtrénované jazykové modely	cz
dc.title	Abilities of Contrastive Soft Prompting for Open Domain Rhetorical Question Detection	en
dc.title	Schopnosti kontrastního soft promptingu pro detekci rétorických otázek v otevřeném doménovém prostředí	cz
dc.type	Článek v databázi WoS (Jimp)
dc.type	ČLÁNEK
dc.type.status	Published Version
local.files.count	1	*
local.files.size	2610139	*
local.has.files	yes	*
local.identifier.eid	2-s2.0-105022496658

Files

Original bundle

Showing 1 - 1 out of 1 results

Name:: 7269.pdf
Size:: 2.49 MB
Format:: Adobe Portable Document Format

Download

License bundle

Showing 1 - 1 out of 1 results

Name:: license.txt
Size:: 1.71 KB
Format:: Item-specific license agreed upon to submission
Description:

Download

Collections

Articles (KIV)