Large Language Models for Czech Aspect-Based Sentiment Analysis

dc.contributor.authorŠmíd, Jakub
dc.contributor.authorPřibáň, Pavel
dc.contributor.authorKrál, Pavel
dc.date.accessioned2026-04-20T18:06:41Z
dc.date.available2026-04-20T18:06:41Z
dc.date.issued2026
dc.date.updated2026-04-20T18:06:41Z
dc.description.abstractAspect-based sentiment analysis (ABSA) is a fine-grained sentiment analysis task that aims to identify sentiment toward specific aspects of an entity. While large language models (LLMs) have shown strong performance in various natural language processing (NLP) tasks, their capabilities for Czech ABSA remain largely unexplored. In this work, we conduct a comprehensive evaluation of 19 LLMs of varying sizes and architectures on Czech ABSA, comparing their performance in zero-shot, few-shot, and fine-tuning scenarios. Our results show that small domain-specific models fine-tuned for ABSA outperform general purpose LLMs in zero-shot and few-shot settings, while fine-tuned LLMs achieve state-of-the-art results. We analyze how factors such as multilingualism, model size, and recency influence performance and present an error analysis highlighting key challenges, particularly in aspect term prediction. Our findings provide insights into the suitability of LLMs for Czech ABSA and offer guidance for future research in this area.en
dc.description.abstractAspektově orientovaná analýza sentimentu (ABSA) je detailní analýza sentimentu, jejímž cílem je identifikovat sentiment vůči konkrétním aspektům dané entity. Přestože velké jazykové modely (LLMs) vykazují silný výkon v různých úlohách zpracování přirozeného jazyka (NLP), jejich schopnosti v oblasti české ABSA zůstávají dosud málo prozkoumány. V této práci provádíme komplexní hodnocení 19 LLMs různých velikostí a architektur na české ABSA a porovnáváme jejich výkon v režimech zero-shot, few-shot a při trénování (fine-tuning). Naše výsledky ukazují, že malé doménově specifické modely natrénované pro ABSA překonávají obecné LLMs v režimech zero-shot a few-shot, zatímco doladěné LLMs dosahují nejmodernějších výsledků (state-of-the-art). Analyzujeme, jak faktory jako vícejazyčnost, velikost modelu a aktuálnost dat ovlivňují výkon, a prezentujeme analýzu chyb, která poukazuje na klíčové výzvy, zejména při predikci aspektových termínů. Naše zjištění poskytují poznatky o vhodnosti LLMs pro českou ABSA a nabízejí doporučení pro budoucí výzkum v této oblasti.cz
dc.format12
dc.identifier.document-number001576349100002
dc.identifier.doi10.1007/978-3-032-02551-7_3
dc.identifier.isbn978-3-032-02550-0
dc.identifier.issn0302-9743
dc.identifier.obd43947197
dc.identifier.orcidŠmíd, Jakub 0000-0002-4492-5481
dc.identifier.orcidPřibáň, Pavel 0000-0002-8744-8726
dc.identifier.orcidKrál, Pavel 0000-0002-3096-675X
dc.identifier.urihttp://hdl.handle.net/11025/67733
dc.language.isoen
dc.project.IDSGS-2025-022
dc.publisherSpringer
dc.relation.ispartofseries28th International Conference on Text, Speech, and Dialogue, TSD 2025
dc.subjectaspect-based sentiment analysisen
dc.subjectsentiment analysisen
dc.subjectlarge language modelsen
dc.subjectpromptingen
dc.subjectaspektově orientovaná analýza sentimentucz
dc.subjectanalýza sentimentucz
dc.subjectvelké jazykové modelycz
dc.subjectpromptingcz
dc.titleLarge Language Models for Czech Aspect-Based Sentiment Analysisen
dc.titleVelké jazykové modely pro českou aspektově orientovanou analýzu sentimentucz
dc.typeStať ve sborníku (D)
dc.typeSTAŤ VE SBORNÍKU
dc.type.statusPublished Version
local.files.count1*
local.files.size1336598*
local.has.filesyes*
local.identifier.eid2-s2.0-105014425946

Files

Original bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
Smid-et-al-TSD-CS.pdf
Size:
1.27 MB
Format:
Adobe Portable Document Format
License bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: