Comparative Analyses of Multilingual Sentiment Analysis Systems for News and Social Media

dc.contributor.authorPřibáň, Pavel
dc.contributor.authorBalahur, Alexandra
dc.date.accessioned2025-06-20T08:44:24Z
dc.date.available2025-06-20T08:44:24Z
dc.date.issued2023
dc.date.updated2025-06-20T08:44:24Z
dc.description.abstractIn this paper, we present evaluation of three in-house sentiment analysis (SA) systems originally designed for three distinct SA tasks, in a highly multilingual setting. For the evaluation, we collected a large number of available gold standard datasets, in different languages and varied text types. The aim of using different domain datasets was to achieve a clear snapshot of the level of overall performance of the systems and thus obtain a better quality of an evaluation. We compare the results obtained with the best performing systems evaluated on their basis and performed an in-depth error analysis. Based on the results, we can see that some systems perform better for different datasets and tasks than the ones they were designed for, showing that we could replace one system with another and gain an improvement in performance. Our results are hardly comparable with the original dataset results because the datasets often contain a different number of polarity classes than we used, and for some datasets, there are even no basic results. For the cases in which a comparison was possible, our results show that our systems perform very well in view of multilinguality.en
dc.description.abstractV tomto článku představujeme hodnocení tří neveřejných systémů pro analýzu sentimentu (SA), které byly původně navrženy pro tři různé úlohy SA ve vícejazyčném prostředí. Pro hodnocení jsme shromáždili velké množství dostupných datových sad v různých jazycích a doménách. Cílem použití různých doménových datových sad bylo získat jasný přehled o úrovni celkové výkonnosti systémů, a tím získat kvalitnější hodnocení. Získané výsledky jsme porovnali s nejvýkonnějšími systémy a na jejich základě jsme provedli hloubkovou analýzu chyb. Na základě výsledků je vidět, že některé systémy mají lepší výkonnost pro jiné datové sady a úlohy, než pro které byly navrženy, což ukazuje, že bychom mohli nahradit jeden systém jiným a získat zlepšení výkonnosti. Naše výsledky jsou jen stěží srovnatelné s výsledky původních datových sad, protože datové sady často obsahují jiný počet tříd polarity, než jsme použili, a pro některé datové sady dokonce neexistují žádné oficiální výsledky. V případech, kdy bylo srovnání možné, výsledky ukazují, že naše systémy si vedou velmi dobře s ohledem na vícejazyčnost.cz
dc.format20
dc.identifier.doi10.1007/978-3-031-24340-0_20
dc.identifier.isbn978-3-031-24339-4
dc.identifier.issn0302-9743
dc.identifier.obd43941159
dc.identifier.orcidPřibáň, Pavel 0000-0002-8744-8726
dc.identifier.urihttp://hdl.handle.net/11025/60851
dc.language.isoen
dc.project.IDEF17_048/0007267
dc.project.IDSGS-2019-018
dc.publisherSpringer
dc.relation.ispartofseries20th International Conference on Computational Linguistics and Intelligent Text Processing
dc.subjectsentiment analysisen
dc.subjectmultilingualityen
dc.subjectevaluationen
dc.subjectanalýza sentimentucz
dc.subjectvícejazyčnostcz
dc.subjectevaluacecz
dc.titleComparative Analyses of Multilingual Sentiment Analysis Systems for News and Social Mediaen
dc.titleKomparativní analýza víjejazyčných systémů pro analýzu sentimentu v novinových článcích a sociálních sítíchcz
dc.typeStať ve sborníku (D)
dc.typeSTAŤ VE SBORNÍKU
dc.type.statusPublished Version
local.files.count1*
local.files.size395330*
local.has.filesyes*
local.identifier.eid2-s2.0-85149995281

Files

Original bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
Přibáň paper_978-3-031-24340-0_20.pdf
Size:
386.06 KB
Format:
Adobe Portable Document Format
License bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: