Mezi-jazyčné transformace sémantických prostorů

dc.contributor.advisorBrychcín Tomáš, Ing. Ph.D.
dc.contributor.authorMištera, Adam
dc.contributor.refereeKrál Pavel, Doc. Ing. Ph.D.
dc.date.accepted2021-6-21
dc.date.accessioned2021-06-25T12:37:33Z
dc.date.available2020-9-11
dc.date.available2021-06-25T12:37:33Z
dc.date.issued2021
dc.date.submitted2021-5-20
dc.description.abstractMezi-jazyčná reprezentace významu je aktuální téma v oblasti zpracování přirozeného jazyka. Sémantické prostory z různých jazyků jsou transformovány do jednoho sdíleného univerzálního prostoru. Tento fakt umožňuje přenést znalosti z jazyků, které jsou velmi bohaté na zdroje, do jazyků, jež jsou na zdroje omezené. Cílem této diplomové práce bylo analyzovat, porovnat a implementovat dostupné metody pro jazykově nezávislou sémantickou reprezentaci. Většina souvisejících prací se zaměřuje na lineární transformace, jelikož vykazují velmi dobrý výkon. V této práci se však soustřeďujeme na zvolené nelineární transformace založené na umělých neuronových sítích a shlukování. Kvalita lineárních i nelineárních metod je následně vyhodnocena na různých úlohách, například datových sadách slovních podobností, slovních analogií a strojovém překladu. Nově implementované nelineární transformace v mnoha ohledech překonaly lineární transformace ve všech sledovaných kategoriích na rozdílných jazycích z odlišných jazykových rodin.cs
dc.description.abstract-translatedCross-lingual meaning representation is a current topic in the field of Natural Language Processing. Semantic spaces of various languages are transformed into a shared universal space. It allows to transfer knowledge between languages, especially between resource-rich and resource-poor languages. This Master Thesis aims to analyze, compare and implement available methods of language independent semantic representation. Most of related works focus on linear projections as they showed a very good performance. In this thesis, however, we study non-linear methods based on artificial neural networks and clustering. Both linear and non-linear methods were subsequently evaluated on different tasks such as datasets containing word similarities, word analogies and machine translation. The newly implemented non-linear transformations consistently outperformed state-of-the-art linear transformations in all evaluation criteria and on several languages within different language families.en
dc.description.resultObhájenocs
dc.format80 s.cs
dc.format.mimetypeapplication/pdf
dc.identifier86144
dc.identifier.urihttp://hdl.handle.net/11025/44775
dc.language.isocscs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.rights.accessopenAccessen
dc.subjectzpracování přirozeného jazykacs
dc.subjectsémantická reprezentacecs
dc.subjectmetoda nejmenších čtvercůcs
dc.subjectortogonální transformacecs
dc.subjectkanonická korelační analýzacs
dc.subjectnelineární transformacecs
dc.subjectneuronové sítěcs
dc.subjectshlukovánícs
dc.subjectword2veccs
dc.subjectfasttextcs
dc.subjectsemevalcs
dc.subject.translatednatural language processingen
dc.subject.translatedsemantic representationen
dc.subject.translatedlinear transformationen
dc.subject.translatedorthogonal transformationen
dc.subject.translatedcanonical correlation analysisen
dc.subject.translatednon-linear transformationen
dc.subject.translatedneural networksen
dc.subject.translatedclusteringen
dc.subject.translatedword2vecen
dc.subject.translatedfasttexten
dc.subject.translatedsemevalen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-levelNavazujícícs
dc.thesis.degree-nameIng.cs
dc.thesis.degree-programInženýrská informatikacs
dc.titleMezi-jazyčné transformace sémantických prostorůcs
dc.title.alternativeCross-lingual transformations between semantic spacesen
dc.typediplomová prácecs
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=86144

Files

Original bundle
Showing 1 - 5 out of 6 results
No Thumbnail Available
Name:
DP_Mistera_A19N0038P.pdf
Size:
753.72 KB
Format:
Adobe Portable Document Format
Description:
Plný text práce
No Thumbnail Available
Name:
A19N0038Phodnoceni-ved.PDF
Size:
894.68 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího práce
No Thumbnail Available
Name:
A19N0038Pposudek_op.pdf
Size:
41.94 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta práce
No Thumbnail Available
Name:
A19N0038Pobhajoba.PDF
Size:
212.63 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby práce
No Thumbnail Available
Name:
A19N0038P-zadani_DP.pdf
Size:
17.19 KB
Format:
Adobe Portable Document Format
Description:
VŠKP - příloha

Collections