LACA: Improving Cross-lingual Aspect-Based Sentiment Analysis with LLM Data Augmentation

Šmíd, Jakub

LACA: Improving Cross-lingual Aspect-Based Sentiment Analysis with LLM Data Augmentation

dc.contributor.author	Šmíd, Jakub
dc.contributor.author	Přibáň, Pavel
dc.contributor.author	Král, Pavel
dc.date.accessioned	2026-03-31T18:05:17Z
dc.date.available	2026-03-31T18:05:17Z
dc.date.issued	2025
dc.date.updated	2026-03-31T18:05:17Z
dc.description.abstract	Cross-lingual aspect-based sentiment analysis (ABSA) involves detailed sentiment analysis in a target language by transferring knowledge from a source language with available annotated data. Most existing methods depend heavily on often unreliable translation tools to bridge the language gap. In this paper, we propose a new approach that leverages a large language model (LLM) to generate high-quality pseudo-labelled data in the target language without the need for translation tools. First, the framework trains an ABSA model to obtain predictions for unlabelled target language data. Next, LLM is prompted to generate natural sentences that better represent these noisy predictions than the original text. The ABSA model is then further fine-tuned on the resulting pseudo-labelled dataset. We demonstrate the effectiveness of this method across six languages and five backbone models, surpassing previous state-of-the-art translation-based approaches. The proposed framework also supports generative models, and we show that fine-tuned LLMs outperform smaller multilingual models.	en
dc.description.abstract	Mezijazyčná aspektově orientovaná analýza sentimentu (ABSA) se zabývá podrobnou analýzou sentimentu v cílovém jazyce přenosem znalostí ze zdrojového jazyka s dostupnými anotovanými daty. Většina současných metod se při překlenování jazykové bariéry silně spoléhá na často nespolehlivé nástroje strojového překladu. V tomto článku navrhujeme nový přístup, který využívá velký jazykový model (LLM) ke generování vysoce kvalitních pseudo-označených dat v cílovém jazyce bez nutnosti použití překladatelských nástrojů. Nejprve rámec trénuje ABSA model, aby získal předpovědi pro neoznačená data v cílovém jazyce. Následně je LLM instruován ke generování přirozených vět, které lépe reprezentují tyto zašuměné předpovědi než původní text. ABSA model je poté dále dotrénován na vzniklém pseudo-označeném datasetu. Účinnost této metody demonstrujeme napříč šesti jazyky a pěti základními modely, přičemž překonává dosavadní nejmodernější přístupy založené na překladu. Navrhovaný rámec rovněž podporuje generativní modely a ukazujeme, že natrénované LLMs překonávají menší vícejazyčné modely.	cz
dc.format	15
dc.identifier.document-number	001596029800041
dc.identifier.doi	10.18653/v1/2025.acl-long.41
dc.identifier.isbn	979-8-89176-251-0
dc.identifier.obd	43947215
dc.identifier.orcid	Šmíd, Jakub 0000-0002-4492-5481
dc.identifier.orcid	Přibáň, Pavel 0000-0002-8744-8726
dc.identifier.orcid	Král, Pavel 0000-0002-3096-675X
dc.identifier.uri	http://hdl.handle.net/11025/67475
dc.language.iso	en
dc.project.ID	EH23_021/0008436
dc.publisher	Association for Computational Linguistics
dc.relation.ispartofseries	63rd Annual Meeting of the Association for Computational Linguistics, ACL 2025
dc.subject	cross-lingual aspect-based sentiment analysis	en
dc.subject	aspect-based sentiment analysis	en
dc.subject	large language models	en
dc.subject	transformers	en
dc.subject	data augmentation	en
dc.subject	mezijazyčná aspektově orientovaná analýza sentimentu	cz
dc.subject	aspektově orientovaná analýza sentimentu	cz
dc.subject	velké jazykové modely	cz
dc.subject	transformery	cz
dc.subject	rozšíření dat	cz
dc.title	LACA: Improving Cross-lingual Aspect-Based Sentiment Analysis with LLM Data Augmentation	en
dc.title	LACA: Vylepšení mezijazyčné aspektově orientované analýzy sentimentu pomocí rozšíření dat velkými jazykovými modely	cz
dc.type	Stať ve sborníku (D)
dc.type	STAŤ VE SBORNÍKU
dc.type.status	Published Version
local.files.count	1	*
local.files.size	527346	*
local.has.files	yes	*
local.identifier.eid	2-s2.0-105021033034

Files

Original bundle

Showing 1 - 1 out of 1 results

Name:: 2025.acl-long.41.pdf
Size:: 514.99 KB
Format:: Adobe Portable Document Format

Download

License bundle

Showing 1 - 1 out of 1 results

Name:: license.txt
Size:: 1.71 KB
Format:: Item-specific license agreed upon to submission
Description:

Download

Collections

Conference Papers (KIV)