Findings of the Shared Task on Multilingual Coreference Resolution

dc.contributor.authorŽabokrtský, Zdeněk
dc.contributor.authorKonopík, Miloslav
dc.contributor.authorNedoluzhko, Anna
dc.contributor.authorNovák, Michal
dc.contributor.authorOgrodniczuk, Maciej
dc.contributor.authorPopel, Martin
dc.contributor.authorPražák, Ondřej
dc.contributor.authorSido, Jakub
dc.contributor.authorZeman, Daniel
dc.contributor.authorZhu, Yilun
dc.date.accessioned2025-06-20T08:16:20Z
dc.date.available2025-06-20T08:16:20Z
dc.date.issued2022
dc.date.updated2025-06-20T08:16:19Z
dc.description.abstractThis paper presents an overview of the shared task on multilingual coreference resolution associated with the CRAC 2022 workshop. Shared task participants were supposed to develop trainable systems capable of identifying mentions and clustering them according to identity coreference. The public edition of CorefUD~1.0, which contains \ndatasets{} datasets for \nlanguages{} languages, was used as the source of training and evaluation data. The CoNLL score used in previous coreference-oriented shared tasks was used as the main evaluation metric. There were \nsystems{} coreference prediction systems submitted by \nteams{} participating teams; in addition, there was a competitive Transformer-based baseline system provided by the organizers at the beginning of the shared task. The winner system outperformed the baseline by 12 percentage points (in terms of the CoNLL scores averaged across all datasets for individual languages).en
dc.description.abstractTento článek představuje přehled otevřené úlohy týkající se vícejazyčného hledání koreferencí spojené s workshopem CRAC 2022. Účastníci měli vyvinout systémy schopné identifikovat entity a shlukovat je podle identity koreference. Veřejné vydání CorefUD~1.0, které obsahuje 13 datasetů pro 10 jazyků bylo použito jako zdroj trénovacích dat. Jako evaluační metriku jsme použili CoNLL skóre používané v dřívějších úlohách na koreference. Bylo odevzdáno 8 systémů z pěti různých týmů; Dále byl vytvořen základní systém založený na architektuře Transformer, který poskytli organizátoři na začátku úlohy. Vítězný systém překonal základní systém o 12 procentních bodů CoNLL skóre zprůměrovaného přes všechny datové sady.cz
dc.format18
dc.identifier.isbnneuvedeno
dc.identifier.issn2951-2093
dc.identifier.obd43936918
dc.identifier.orcidKonopík, Miloslav 0000-0001-7397-1658
dc.identifier.orcidPražák, Ondřej 0000-0001-5445-7792
dc.identifier.orcidSido, Jakub 0000-0002-7709-7512
dc.identifier.urihttp://hdl.handle.net/11025/59289
dc.language.isoen
dc.project.IDSGS-2022-016
dc.publisherAssociation for Computational Linguistics
dc.relation.ispartofseriesCRAC 2022 Shared Task on Multilingual Coreference Resolution
dc.subjectCoreference resolution, shared task, multilingual dataset. semanticsen
dc.subjectHledání koreferencí, vícejazyčná datová sada, otevřená úloha, zpracování sémantiky textucz
dc.titleFindings of the Shared Task on Multilingual Coreference Resolutionen
dc.titlePoznatky z otevřené úlohy výcejazyčného hledání koreferencícz
dc.typeStať ve sborníku (O)
dc.typeSTAŤ VE SBORNÍKU
dc.type.statusPublished Version
local.files.count1*
local.files.size359062*
local.has.filesyes*

Files

Original bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
Pražák a kol. 2022.crac-mcr.1.pdf
Size:
350.65 KB
Format:
Adobe Portable Document Format
License bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: