Explicitní sémantická analýza

dc.contributor.advisorBrychcín Tomáš, Ing. Ph.D.
dc.contributor.authorTušl, Michal
dc.contributor.refereeSvoboda Lukáš, Ing.
dc.date.accepted2017-6-8
dc.date.accessioned2018-01-15T15:04:41Z
dc.date.available2016-10-10
dc.date.available2018-01-15T15:04:41Z
dc.date.issued2017
dc.date.submitted2017-5-4
dc.description.abstractTato práce je zaměřena na sémantickou analýzu textů. Konkrétně na metody Explicitní sémantická analýza a Latentní sémantická analýza. Tyto metody jsou založené na trénování bez učitele a jako trénovací data využívají Wikipedii. Na výsledek metod je aplikován singulární rozklad matic, který redukuje paměťové nároky a zároveň vylepšuje výsledky metod. Testování výsledků je prováděno na standardních datasetech pro anglický a český jazyk. Tyto datasety obsahují páry slov a manuálně definovanou sémantickou podobnost. Kvalita sémantické reprezentace je měrena pomocí Pearsonovy a Spearmanovy korelace. Všechny testované metody dosahují na obou jazycích velmi dobrých výsledků.cs
dc.description.abstract-translatedThis bachelor thesis investigates semantic analysis of texts in natural language. It focuses on Explicit Semantic Analysis and Latent Semantic Analysis methods. These methods are based on unsupervised machine learning and use Wikipedia as a training data. Singular Value Decomposition is used to reduce the memory requirements and also to improve the results. Standard English and Czech datasets are used for testing purposes. These datasets contain word pairs and manually annotated semantic similarity. The quality of semantic representation is evaluated by Pearson and Spearman correlation. All tested methods provide very promising results on both languages.en
dc.description.resultObhájenocs
dc.format36 s.cs
dc.format.mimetypeapplication/pdf
dc.identifier72174
dc.identifier.urihttp://hdl.handle.net/11025/27718
dc.language.isocscs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.rights.accessopenAccessen
dc.subjectzpracování přirozeného jazykacs
dc.subjectdistribuční sémantikacs
dc.subjectsémantická podobnostcs
dc.subjectvektorové sémantické prostorycs
dc.subjectexplicitní sémantická analýzacs
dc.subjectlatentní sémantická analýzacs
dc.subjectsingulární rozkladcs
dc.subject.translatednlpen
dc.subject.translateddistributional semanticsen
dc.subject.translatedsemantic similarityen
dc.subject.translatedvector space modelen
dc.subject.translatedexplicit semantic analysisen
dc.subject.translatedlatent semantic analysisen
dc.subject.translatedsingular value decompositionen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-levelBakalářskýcs
dc.thesis.degree-nameBc.cs
dc.thesis.degree-programInženýrská informatikacs
dc.titleExplicitní sémantická analýzacs
dc.title.alternativeExplicit semantic analysisen
dc.typebakalářská prácecs
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=72174

Files

Original bundle
Showing 1 - 4 out of 4 results
No Thumbnail Available
Name:
BP_Tusl_A14B0453P.pdf
Size:
516.22 KB
Format:
Adobe Portable Document Format
Description:
Plný text práce
No Thumbnail Available
Name:
A14B0453P-hodnoceni.pdf
Size:
235.16 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího práce
No Thumbnail Available
Name:
A14B0453P-posudek.pdf
Size:
412.13 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta práce
No Thumbnail Available
Name:
A14B0453P-obhajoba.pdf
Size:
185.69 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby práce