Findings of the Third Shared Task on Multilingual Coreference Resolution

dc.contributor.authorNovák, Michal
dc.contributor.authorDohnalová, Barbora
dc.contributor.authorKonopík, Miloslav
dc.contributor.authorNedoluzhko, Anna
dc.contributor.authorPopel, Martin
dc.contributor.authorPražák, Ondřej
dc.contributor.authorSido, Jakub
dc.contributor.authorStraka, Milan
dc.contributor.authorŽabokrtský, Zdeněk
dc.contributor.authorZeman, Daniel
dc.date.accessioned2025-06-20T08:35:08Z
dc.date.available2025-06-20T08:35:08Z
dc.date.issued2024
dc.date.updated2025-06-20T08:35:08Z
dc.description.abstractThe paper presents an overview of the third edition of the shared task on multilingual coreference resolution, held as part of the CRAC 2024 workshop. Similarly to the previous two editions, the participants were challenged to develop systems capable of identifying mentions and clustering them based on identity coreference. This year's edition took another step towards real-world application by not providing participants with gold slots for zero anaphora, increasing the task's complexity and realism. In addition, the shared task was expanded to include a more diverse set of languages, with a particular focus on historical languages. The training and evaluation data were drawn from version 1.2 of the multilingual collection of harmonized coreference resources CorefUD, encompassing 21 datasets across 15 languages. 6 systems competed in this shared task.en
dc.description.abstractČlánek představuje přehled třetího ročníku otevřené úlohy vícejazyčného hledání koreferencí, která se konala v rámci workshopu CRAC 2024. Stejně jako v předchozích dvou ročnících měli účastníci za úkol vyvinout systémy schopné identifikovat zmínky a shlukovat je na základě entit. Letošní ročník učinil další krok směrem k reálnému použití tím, že účastníkům neposkytl zlaté sloty pro nulovou anaforu, čímž zvýšil složitost a realističnost úlohy. Kromě toho byla úloha rozšířena o další jazyky se zvláštním zaměřením na historické jazyky. Trénovací a evaluační data byla čerpána z verze 1.2 vícejazyčné sbírky harmonizovaných koreferenčních zdrojů CorefUD, která zahrnuje 21 datových sad v 15 jazycích. V této společné úloze soutěžilo 6 systémů.cz
dc.format19
dc.identifier.isbn979-8-89176-171-1
dc.identifier.obd43944279
dc.identifier.orcidKonopík, Miloslav 0000-0001-7397-1658
dc.identifier.orcidPražák, Ondřej 0000-0001-5445-7792
dc.identifier.orcidSido, Jakub 0000-0002-7709-7512
dc.identifier.urihttp://hdl.handle.net/11025/60246
dc.language.isoen
dc.project.IDSGS-2022-016
dc.publisherAssociation for Computational Linguistics
dc.relation.ispartofseries7th Workshop on Computational Models of Reference, Anaphora and Coreference, CRAC 2024
dc.subjectcoreference resolutionen
dc.subjectshared tasken
dc.subjectmultilingual dataseten
dc.subjectsemanticsen
dc.subjecthledání koreferencícz
dc.subjectvícejazyčná datová sadacz
dc.subjectotevřená úlohacz
dc.subjectzpracování sémantiky textucz
dc.titleFindings of the Third Shared Task on Multilingual Coreference Resolutionen
dc.titlePoznatky ze třetí otevřené úlohy výceazyčného hledání koreferencícz
dc.typeStať ve sborníku (D)
dc.typeSTAŤ VE SBORNÍKU
dc.type.statusPublished Version
local.files.count1*
local.files.size314860*
local.has.filesyes*
local.identifier.eid2-s2.0-85212545064

Files

Original bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
Pražák a kol. 2024.crac-1.8.pdf
Size:
307.48 KB
Format:
Adobe Portable Document Format
License bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: