UWB at SemEval-2020 task 1: Lexical Semantic Change Detection

Date issued

2020

Journal Title

Journal ISSN

Volume Title

Publisher

International Committee for Computational Linguistics

Abstract

Článek popisuje naší metodu pro určení změny sémantiky slov v čase (Lexical Semantic Change Detection). Změnu významu slov měříme mezi dvěma korpusy ve čtyřech jazycích, Angličtině Němčině, Latině a Švédštině. Metoda byla vytvořena pro soutěž SemEval 2020 Task 1: Unsupervised Lexical Semantic Change Detection. Umístili jsme se na prvním místě v podúloze binární detekce změny a na čtvrtém místě v podúloze určení míry změny. Naše metoda využívá učení bez učitele a je nezávislá na jazyce. Skládá se z několika kroků: Vytvoření vektorového modelu slov pro oba korpusy,nalezení optimální lineární transformace mezi dvěma prostory s využitím Kanonické korelační analýzy a Ortogonální transformace; Dále změříme kosínovou podobnost zkoumaného slova v obou transformovaných vektorových prostorech.

Description

Subject(s)

zpracování přirozeného jazyka, sémantická analýza, změna významu slov, lineární transformace, model založený na vektorovém prostoru

Citation

PRAŽÁK, O. PŘIBÁŇ, P. TAYLOR, S. SIDO, J. UWB at SemEval-2020 task 1: Lexical Semantic Change Detection. In Proceedings of the Fourteenth Workshop on Semantic Evaluation. Barcelona: International Committee for Computational Linguistics, 2020. s. 246-254. ISBN: 978-1-952148-31-6
OPEN License Selector