Comparative Analyses of Multilingual Sentiment Analysis Systems for News and Social Media
| dc.contributor.author | Přibáň, Pavel | |
| dc.contributor.author | Balahur, Alexandra | |
| dc.date.accessioned | 2025-06-20T08:44:24Z | |
| dc.date.available | 2025-06-20T08:44:24Z | |
| dc.date.issued | 2023 | |
| dc.date.updated | 2025-06-20T08:44:24Z | |
| dc.description.abstract | In this paper, we present evaluation of three in-house sentiment analysis (SA) systems originally designed for three distinct SA tasks, in a highly multilingual setting. For the evaluation, we collected a large number of available gold standard datasets, in different languages and varied text types. The aim of using different domain datasets was to achieve a clear snapshot of the level of overall performance of the systems and thus obtain a better quality of an evaluation. We compare the results obtained with the best performing systems evaluated on their basis and performed an in-depth error analysis. Based on the results, we can see that some systems perform better for different datasets and tasks than the ones they were designed for, showing that we could replace one system with another and gain an improvement in performance. Our results are hardly comparable with the original dataset results because the datasets often contain a different number of polarity classes than we used, and for some datasets, there are even no basic results. For the cases in which a comparison was possible, our results show that our systems perform very well in view of multilinguality. | en |
| dc.description.abstract | V tomto článku představujeme hodnocení tří neveřejných systémů pro analýzu sentimentu (SA), které byly původně navrženy pro tři různé úlohy SA ve vícejazyčném prostředí. Pro hodnocení jsme shromáždili velké množství dostupných datových sad v různých jazycích a doménách. Cílem použití různých doménových datových sad bylo získat jasný přehled o úrovni celkové výkonnosti systémů, a tím získat kvalitnější hodnocení. Získané výsledky jsme porovnali s nejvýkonnějšími systémy a na jejich základě jsme provedli hloubkovou analýzu chyb. Na základě výsledků je vidět, že některé systémy mají lepší výkonnost pro jiné datové sady a úlohy, než pro které byly navrženy, což ukazuje, že bychom mohli nahradit jeden systém jiným a získat zlepšení výkonnosti. Naše výsledky jsou jen stěží srovnatelné s výsledky původních datových sad, protože datové sady často obsahují jiný počet tříd polarity, než jsme použili, a pro některé datové sady dokonce neexistují žádné oficiální výsledky. V případech, kdy bylo srovnání možné, výsledky ukazují, že naše systémy si vedou velmi dobře s ohledem na vícejazyčnost. | cz |
| dc.format | 20 | |
| dc.identifier.doi | 10.1007/978-3-031-24340-0_20 | |
| dc.identifier.isbn | 978-3-031-24339-4 | |
| dc.identifier.issn | 0302-9743 | |
| dc.identifier.obd | 43941159 | |
| dc.identifier.orcid | Přibáň, Pavel 0000-0002-8744-8726 | |
| dc.identifier.uri | http://hdl.handle.net/11025/60851 | |
| dc.language.iso | en | |
| dc.project.ID | EF17_048/0007267 | |
| dc.project.ID | SGS-2019-018 | |
| dc.publisher | Springer | |
| dc.relation.ispartofseries | 20th International Conference on Computational Linguistics and Intelligent Text Processing | |
| dc.subject | sentiment analysis | en |
| dc.subject | multilinguality | en |
| dc.subject | evaluation | en |
| dc.subject | analýza sentimentu | cz |
| dc.subject | vícejazyčnost | cz |
| dc.subject | evaluace | cz |
| dc.title | Comparative Analyses of Multilingual Sentiment Analysis Systems for News and Social Media | en |
| dc.title | Komparativní analýza víjejazyčných systémů pro analýzu sentimentu v novinových článcích a sociálních sítích | cz |
| dc.type | Stať ve sborníku (D) | |
| dc.type | STAŤ VE SBORNÍKU | |
| dc.type.status | Published Version | |
| local.files.count | 1 | * |
| local.files.size | 395330 | * |
| local.has.files | yes | * |
| local.identifier.eid | 2-s2.0-85149995281 |
Files
Original bundle
1 - 1 out of 1 results
No Thumbnail Available
- Name:
- Přibáň paper_978-3-031-24340-0_20.pdf
- Size:
- 386.06 KB
- Format:
- Adobe Portable Document Format
License bundle
1 - 1 out of 1 results
No Thumbnail Available
- Name:
- license.txt
- Size:
- 1.71 KB
- Format:
- Item-specific license agreed upon to submission
- Description: