UWB @ DIACR-Ita: Lexical Semantic Change Detection with CCA and Orthogonal Transformation

Date issued

2020

Journal Title

Journal ISSN

Volume Title

Publisher

CEUR Workshop Proceedings

Abstract

Článek popisuje naší metodu pro určení změny sémantiky slov v čase (Lexical Semantic Change Detection) pro soutěž DIACR-Ita, kde jsme skončili na prvním místě. Naše metoda využívá učení bez učitele a je nezávislá na jazyce. skládá se z několika kroků: Vytvoření vektorového modelu slov pro oba korpusy,nalezení optimální lineární transformace mezi dvěma prostory s využitím Kanonické korelační analýzy a Ortogonální transformace; Dále změříme kosínovou podobnost zkoumaného slova v obou transformovaných vektorových prostorech.

Description

Subject(s)

Zpracování přirozeného jazyka, sémantická analýza, změna významu slov, lineární transformace, model založený na vektorovém prostoru.

Citation

PRAŽÁK, O., PŘIBÁŇ, P., TAYLOR, S. UWB @ DIACR-Ita: Lexical Semantic Change Detection with CCA and Orthogonal Transformation. In: Proceedings of the Seventh Evaluation Campaign of Natural Language Processing and Speech Tools for Italian. Final Workshop (EVALITA 2020). online: CEUR Workshop Proceedings, 2020. s. 1-6. ISSN 1613-0073.