End-to-end Multilingual Coreference Resolution with Headword Mention Representation
Date issued
2024
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Association for Computational Linguistics
Abstract
This paper describes our approach to the CRAC 2024 Shared Task on Multilingual Coreference Resolution. Our model is based on an endto-end coreference resolution system. Apart from joined multilingual training, we improved our results with headword mention representation and training large model mT5-xxl through LORA. We provide an analysis of the performance of our model. Our system ended up in 4th place. Moreover, we reached the best performance on three datasets out of 21.
Tento článek popisuje náš přístup ke sdílené úloze CRAC 2024 o vícejazyčném hledání koreferencí. Náš model je založen na end-to-end systému pro hledání koreferencí. Kromě spojeného vícejazyčného tréninku jsme zlepšili naše výsledky pomocí reprezentace zmínek syntaktickou hlavou a tréninku velkého modelu mT5-xxl prostřednictvím LORA. Uvádíme analýzu výkonnosti našeho modelu. Náš systém skončil na 4. místě. Navíc jsme dosáhli nejlepšího výkonu na třech datových sadách z 21.
Tento článek popisuje náš přístup ke sdílené úloze CRAC 2024 o vícejazyčném hledání koreferencí. Náš model je založen na end-to-end systému pro hledání koreferencí. Kromě spojeného vícejazyčného tréninku jsme zlepšili naše výsledky pomocí reprezentace zmínek syntaktickou hlavou a tréninku velkého modelu mT5-xxl prostřednictvím LORA. Uvádíme analýzu výkonnosti našeho modelu. Náš systém skončil na 4. místě. Navíc jsme dosáhli nejlepšího výkonu na třech datových sadách z 21.
Description
Subject(s)
coreference resolution, cross-lingual model, multilingual model, semantics, hledání koreferencí, vícejazyčný model, model přenositelný mezi jazyky, zpracování sémantiky textu