Findings of the Second Shared Task on Multilingual Coreference Resolution

Abstract

This paper summarizes the second edition of the shared task on multilingual coreference resolution, held with the CRAC 2023 workshop. Just like last year, participants of the shared task were to create trainable systems that detect mentions and group them based on identity coreference; however, this year’s edition uses a slightly different primary evaluation score, and is also broader in terms of covered languages: version 1.1 of the multilingual collection of harmonized coreference resources CorefUD was used as the source of training and evaluation data this time, with 17 datasets for 12 languages. 7 systems competed in this shared task.
Tento příspěvek shrnuje druhý ročník otevřené úlohy na téma vícejazyčná koreference, který se konal v rámci workshopu CRAC 2023. Stejně jako v loňském roce měli účastníci otevřené úlohy vytvořit trénovatelné systémy, které detekují zmínky a seskupují je na základě identity koreference; letošní ročník však používá poněkud jiné primární hodnotící skóre a je také širší z hlediska zahrnutých jazyků: jako zdroj trénovacích a hodnotících dat byla tentokrát použita verze 1.1 vícejazyčné sbírky harmonizovaných koreferenčních zdrojů CorefUD se 17 datovými sadami pro 12 jazyků. V této společné úloze soutěžilo 7 systémů.

Description

Subject(s)

coreference resolution, shared task, multilingual dataset semantics, hledání koreferencí, vícejazyčná datová sada, otevřená úloha, zpracování sémantiky textu

Citation