UWB @ DIACR-Ita: Lexical Semantic Change Detection with CCA and Orthogonal Transformation

dc.contributor.authorPražák, Ondřej
dc.contributor.authorPřibáň, Pavel
dc.contributor.authorTaylor, Stephen
dc.date.accessioned2021-02-15T11:00:18Z
dc.date.available2021-02-15T11:00:18Z
dc.date.issued2020
dc.description.abstractČlánek popisuje naší metodu pro určení změny sémantiky slov v čase (Lexical Semantic Change Detection) pro soutěž DIACR-Ita, kde jsme skončili na prvním místě. Naše metoda využívá učení bez učitele a je nezávislá na jazyce. skládá se z několika kroků: Vytvoření vektorového modelu slov pro oba korpusy,nalezení optimální lineární transformace mezi dvěma prostory s využitím Kanonické korelační analýzy a Ortogonální transformace; Dále změříme kosínovou podobnost zkoumaného slova v obou transformovaných vektorových prostorech.cs
dc.description.abstract-translatedIn this paper, we describe our method for detection of lexical semantic change (i.e.,word sense changes over time) for the DIACR-Ita shared task, where we ranked 1st. We examine semantic differences between specific words in two Italian corpora, chosen from different time periods. Our method is fully unsupervised and language independent. It consists of preparing a semantic vector space for each corpus, earlier and later. Then we compute a linear transformation between earlier and later spaces, using CCA and Orthogonal Transformation. Finally, we measure the cosines between the transformed vectors.en
dc.format6 s.cs
dc.format.mimetypeapplication/pdf
dc.identifier.citationPRAŽÁK, O., PŘIBÁŇ, P., TAYLOR, S. UWB @ DIACR-Ita: Lexical Semantic Change Detection with CCA and Orthogonal Transformation. In: Proceedings of the Seventh Evaluation Campaign of Natural Language Processing and Speech Tools for Italian. Final Workshop (EVALITA 2020). online: CEUR Workshop Proceedings, 2020. s. 1-6. ISSN 1613-0073.cs
dc.identifier.issn1613-0073
dc.identifier.obd43931304
dc.identifier.uri2-s2.0-85097525328
dc.identifier.urihttp://hdl.handle.net/11025/42686
dc.language.isoenen
dc.project.IDEF17_048/0007267/InteCom: VaV inteligentních komponent pokročilých technologií pro plzeňskou metropolitní oblastcs
dc.project.IDSGS-2019-018/Zpracování heterogenních dat a jejich specializované aplikacecs
dc.project.IDLO1506/PUNTIS - Podpora udržitelnosti centra NTIS - Nové technologie pro informační společnostcs
dc.publisherCEUR Workshop Proceedingsen
dc.relation.ispartofseriesProceedings of the Seventh Evaluation Campaign of Natural Language Processing and Speech Tools for Italian. Final Workshop (EVALITA 2020)en
dc.rightsPlný text je přístupný v rámci univerzity přihlášeným uživatelům.cs
dc.rights© CEURen
dc.rights.accessrestrictedAccessen
dc.subjectZpracování přirozeného jazykacs
dc.subjectsémantická analýzacs
dc.subjectzměna významu slovcs
dc.subjectlineární transformacecs
dc.subjectmodel založený na vektorovém prostoru.cs
dc.subject.translatedNatural language processingen
dc.subject.translatedsemantic analysisen
dc.subject.translatedlexical semantic change detectionen
dc.subject.translatedlinear transformationen
dc.subject.translatedvector space modelen
dc.titleUWB @ DIACR-Ita: Lexical Semantic Change Detection with CCA and Orthogonal Transformationen
dc.title.alternativeUWB @ DIACR-Ita: Detakce změny významu slov s využitím CCA a ortogonální transformacecs
dc.typekonferenční příspěvekcs
dc.typeconferenceObjecten
dc.type.statusPeer-revieweden
dc.type.versionpublishedVersionen

Files