Explicitní sémantická analýza
Date issued
2017
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Západočeská univerzita v Plzni
Abstract
Tato práce je zaměřena na sémantickou analýzu textů. Konkrétně na metody
Explicitní sémantická analýza a Latentní sémantická analýza. Tyto metody
jsou založené na trénování bez učitele a jako trénovací data využívají Wikipedii.
Na výsledek metod je aplikován singulární rozklad matic, který redukuje
paměťové nároky a zároveň vylepšuje výsledky metod. Testování výsledků je
prováděno na standardních datasetech pro anglický a český jazyk. Tyto datasety
obsahují páry slov a manuálně definovanou sémantickou podobnost.
Kvalita sémantické reprezentace je měrena pomocí Pearsonovy a Spearmanovy
korelace. Všechny testované metody dosahují na obou jazycích velmi
dobrých výsledků.
Description
Subject(s)
zpracování přirozeného jazyka, distribuční sémantika, sémantická podobnost, vektorové sémantické prostory, explicitní sémantická analýza, latentní sémantická analýza, singulární rozklad