Explicitní sémantická analýza
| dc.contributor.advisor | Brychcín Tomáš, Ing. Ph.D. | |
| dc.contributor.author | Tušl, Michal | |
| dc.contributor.referee | Svoboda Lukáš, Ing. | |
| dc.date.accepted | 2017-6-8 | |
| dc.date.accessioned | 2018-01-15T15:04:41Z | |
| dc.date.available | 2016-10-10 | |
| dc.date.available | 2018-01-15T15:04:41Z | |
| dc.date.issued | 2017 | |
| dc.date.submitted | 2017-5-4 | |
| dc.description.abstract | Tato práce je zaměřena na sémantickou analýzu textů. Konkrétně na metody Explicitní sémantická analýza a Latentní sémantická analýza. Tyto metody jsou založené na trénování bez učitele a jako trénovací data využívají Wikipedii. Na výsledek metod je aplikován singulární rozklad matic, který redukuje paměťové nároky a zároveň vylepšuje výsledky metod. Testování výsledků je prováděno na standardních datasetech pro anglický a český jazyk. Tyto datasety obsahují páry slov a manuálně definovanou sémantickou podobnost. Kvalita sémantické reprezentace je měrena pomocí Pearsonovy a Spearmanovy korelace. Všechny testované metody dosahují na obou jazycích velmi dobrých výsledků. | cs |
| dc.description.abstract-translated | This bachelor thesis investigates semantic analysis of texts in natural language. It focuses on Explicit Semantic Analysis and Latent Semantic Analysis methods. These methods are based on unsupervised machine learning and use Wikipedia as a training data. Singular Value Decomposition is used to reduce the memory requirements and also to improve the results. Standard English and Czech datasets are used for testing purposes. These datasets contain word pairs and manually annotated semantic similarity. The quality of semantic representation is evaluated by Pearson and Spearman correlation. All tested methods provide very promising results on both languages. | en |
| dc.description.result | Obhájeno | cs |
| dc.format | 36 s. | cs |
| dc.format.mimetype | application/pdf | |
| dc.identifier | 72174 | |
| dc.identifier.uri | http://hdl.handle.net/11025/27718 | |
| dc.language.iso | cs | cs |
| dc.publisher | Západočeská univerzita v Plzni | cs |
| dc.rights | Plný text práce je přístupný bez omezení. | cs |
| dc.rights.access | openAccess | en |
| dc.subject | zpracování přirozeného jazyka | cs |
| dc.subject | distribuční sémantika | cs |
| dc.subject | sémantická podobnost | cs |
| dc.subject | vektorové sémantické prostory | cs |
| dc.subject | explicitní sémantická analýza | cs |
| dc.subject | latentní sémantická analýza | cs |
| dc.subject | singulární rozklad | cs |
| dc.subject.translated | nlp | en |
| dc.subject.translated | distributional semantics | en |
| dc.subject.translated | semantic similarity | en |
| dc.subject.translated | vector space model | en |
| dc.subject.translated | explicit semantic analysis | en |
| dc.subject.translated | latent semantic analysis | en |
| dc.subject.translated | singular value decomposition | en |
| dc.thesis.degree-grantor | Západočeská univerzita v Plzni. Fakulta aplikovaných věd | cs |
| dc.thesis.degree-level | Bakalářský | cs |
| dc.thesis.degree-name | Bc. | cs |
| dc.thesis.degree-program | Inženýrská informatika | cs |
| dc.title | Explicitní sémantická analýza | cs |
| dc.title.alternative | Explicit semantic analysis | en |
| dc.type | bakalářská práce | cs |
| local.relation.IS | https://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=72174 |
Files
Original bundle
1 - 4 out of 4 results
No Thumbnail Available
- Name:
- BP_Tusl_A14B0453P.pdf
- Size:
- 516.22 KB
- Format:
- Adobe Portable Document Format
- Description:
- Plný text práce
No Thumbnail Available
- Name:
- A14B0453P-hodnoceni.pdf
- Size:
- 235.16 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek vedoucího práce
No Thumbnail Available
- Name:
- A14B0453P-posudek.pdf
- Size:
- 412.13 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek oponenta práce
No Thumbnail Available
- Name:
- A14B0453P-obhajoba.pdf
- Size:
- 185.69 KB
- Format:
- Adobe Portable Document Format
- Description:
- Průběh obhajoby práce