UWBA at SemEval-2024 Task 3: Dialogue Representation and Multimodal Fusion for Emotion Cause Analysis

dc.contributor.authorBaloun, Josef
dc.contributor.authorMartínek, Jiří
dc.contributor.authorLenc, Ladislav
dc.contributor.authorKrál, Pavel
dc.contributor.authorZeman, Matěj
dc.contributor.authorVlček, Lukáš
dc.date.accessioned2025-06-20T08:38:57Z
dc.date.available2025-06-20T08:38:57Z
dc.date.issued2024
dc.date.updated2025-06-20T08:38:57Z
dc.description.abstractIn this paper, we present an approach for solving SemEval-2024 Task 3: The Competition of Multimodal Emotion Cause Analysis in Conversations. The task includes two subtasks that focus on emotion-cause pair extraction using text, video, and audio modalities. Our approach is composed of encoding all modalities (MFCC and Wav2Vec for audio, 3D-CNN for video, and transformer-based models for text) and combining them in an utterance-level fusion module. The model is then optimized for link and emotion prediction simultaneously. Our approach achieved 6th place in both subtasks. The full leaderboard can be found at https://codalab.lisn.upsaclay.fr/competitions/16141#resultsen
dc.description.abstractV tomto článku představujeme přístup k řešení úlohy 3 v soutěži SemEval-2024: The competition of Multimodal Emotion Cause Analysis in Conversations. Úloha obsahuje dva dílčí úkoly, které se zaměřují na extrakci emocí a jejich příčin pomocí textových, obrazových a zvukových modalit. Náš přístup se skládá z kódování všech modalit (MFCC a Wav2Vec pro zvuk, 3D-CNN pro video a modely založené na architektuře Transformer pro text) a jejich zkombinování do fúzního modulu na úrovni promluvy. Model je poté optimalizován pro simultánní predikci emocí a jejich příčin. S naším přístupem jsme dosáhli 6. místa v obou dílčích úkolech. Kompletní žebříček je k dispozici na https://codalab.lisn.upsaclay.fr/competitions/16141#resultscz
dc.format10
dc.identifier.document-number001356736800049
dc.identifier.doi10.18653/v1/2024.semeval-1.49
dc.identifier.isbn979-8-89176-107-0
dc.identifier.obd43943633
dc.identifier.orcidBaloun, Josef 0000-0003-1923-5355
dc.identifier.orcidMartínek, Jiří 0000-0003-2981-1723
dc.identifier.orcidLenc, Ladislav 0000-0002-1066-7269
dc.identifier.orcidKrál, Pavel 0000-0002-3096-675X
dc.identifier.orcidZeman, Matěj 0009-0003-9916-0943
dc.identifier.orcidVlček, Lukáš 0009-0007-0375-9767
dc.identifier.urihttp://hdl.handle.net/11025/60617
dc.language.isoen
dc.project.IDSGS-2022-016
dc.project.IDEH23_021/0008436
dc.publisherAssociation for Computational Linguistics
dc.relation.ispartofseries18th International Workshop on Semantic Evaluation, SemEval 2024
dc.subjectUWBAen
dc.subjectSemEval-2024en
dc.subjectdialogueen
dc.subjectrepresentationen
dc.subjectmultimodal fusionen
dc.subjectemotionen
dc.subjectcauseen
dc.subjectanalysisen
dc.subjectSemEval-2024cz
dc.subjectdialogcz
dc.subjectreprezentace promluvcz
dc.subjectmultimodalitacz
dc.subjectfúze pro analýzu příčin emocícz
dc.titleUWBA at SemEval-2024 Task 3: Dialogue Representation and Multimodal Fusion for Emotion Cause Analysisen
dc.titleUWBA na SemEval-2024 Úkol 3: Reprezentace dialogu a multimodální fúze pro analýzu příčin emocícz
dc.typeStať ve sborníku (D)
dc.typeSTAŤ VE SBORNÍKU
dc.type.statusPublished Version
local.files.count1*
local.files.size251931*
local.has.filesyes*
local.identifier.eid2-s2.0-85201946759

Files

Original bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
2024.semeval-1.49.pdf
Size:
246.03 KB
Format:
Adobe Portable Document Format
License bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: