Transfer Learning for Czech Historical Named Entity Recognition
Date issued
2021
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
INCOMA, Ltd.
Abstract
V dnešní době dosáhlo rozpoznávání pojmenovaných entit (NER) vynikajících výsledků na standardních korpusech. Objevují se však velké problémy při jejich použití ve specifické doméně, protože rozpoznávání vyžaduje vhodný anotovaný korpus. To je patrné zejména v oblasti zpracování historických dokumentů. Hlavním cílem tohoto příspěvku je navrhnout a srovnat několik metod přenosu učení (transfer learning) ke zvýšení skóre českého historického NER. Studujeme několik informačních zdrojů a pro rozpoznávání používáme dvě neuronové sítě. Pro vyhodnocení metod využíváme dva korpusy: českých pojmenovaných entit a českých historických pojmenovaných entit. Ukazujeme, že BERT reprezentace s doladěním a jednoduchým klasifikátorem natrénovaným na spojených korpusech dosahuje vynikajících výsledků.
Description
Subject(s)
BERT, čeština, historický, rozpoznávání pojmenovaných entit, NER, neuronové sítě, přenos učení
Citation
HUBKOVÁ, H. KRÁL, P. Transfer Learning for Czech Historical Named Entity Recognition. In Deep Learning for Natural Language Processing Methods and Applications. Shoumen: INCOMA, Ltd., 2021. s. 576-582. ISBN: 978-954-452-072-4 , ISSN: 1313-8502