Pokročilé metody srovnávání sémantiky vět
| dc.contributor.advisor | Habernal, Ivan | |
| dc.contributor.author | Ptáček, Tomáš | |
| dc.contributor.referee | Konopík, Miloslav | |
| dc.date.accepted | 2012-06-19 | |
| dc.date.accessioned | 2013-06-19T06:31:33Z | |
| dc.date.available | 2011-08-31 | cs |
| dc.date.available | 2013-06-19T06:31:33Z | |
| dc.date.issued | 2012 | |
| dc.date.submitted | 2012-05-17 | |
| dc.description.abstract | Tato práce se zaměřuje na problematiku sémantické podobnosti vět v anglickém jazyce. Popisuje předzpracování dokumentů, modely vyhledávání informací, sémantické metody pro získávání informací a metody výpočtu sémantické podobnosti mezi slovy. Bylo vybráno pět slibných metod a ověřena jejich úspěšnost. V praktické části je navrženo šest nových metod pro podobnost vět založených na existujících tzv. state-of-the-art metodách popsaných v teoretické části. Je vyhodnoceno celkem jedenáct metod větné podobnosti. Hodnocení se provádí na dvou různých datových sadách, konkrétně Microsoft Research Parphrase Corpus a Semantic Textual Similarity Shared Task. Získané výsledky jsou kriticky hodnoceny v závěru práce. | cs |
| dc.description.abstract-translated | This thesis is focused on the problem of sentence semantic similarity in English language. The theory for document preprocessing, information retrieval models, semantic methods in information retrieval, semantic similarity between words and sentence similarity measures are introduced in the theoretical part. We selected and implemented five promising sentence similarity measures. In the practical part we propose six new sentence similarity measures inspired by state-of-the-art measures described in the theoretical part. We evaluate eleven sentence similarity measures. The evaluation is conducted on two different data sets. The data sets are the Microsoft Research paraphrase corpus and the Semantic Textual Similarity shared task. At the end of the thesis the results are discussed. | en |
| dc.description.department | Katedra informatiky a výpočetní techniky | cs |
| dc.description.result | Obhájeno | cs |
| dc.format | 44 s. | cs |
| dc.format.mimetype | application/pdf | |
| dc.identifier | 47618 | |
| dc.identifier.uri | http://hdl.handle.net/11025/3077 | |
| dc.language.iso | cs | cs |
| dc.publisher | Západočeská univerzita v Plzni | cs |
| dc.rights | Plný text práce je přístupný bez omezení. | cs |
| dc.rights.access | openAccess | en |
| dc.subject | sémantická podobnost | cs |
| dc.subject.translated | semantic similarity | en |
| dc.thesis.degree-grantor | Západočeská univerzita v Plzni. Fakulta aplikovaných věd | cs |
| dc.thesis.degree-level | Navazující | cs |
| dc.thesis.degree-name | Ing. | cs |
| dc.thesis.degree-program | Inženýrská informatika | cs |
| dc.title | Pokročilé metody srovnávání sémantiky vět | cs |
| dc.title.alternative | Advanced Methods for Sentence Semantic Similarity | en |
| dc.type | diplomová práce | cs |
| local.relation.IS | https://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=47618 |
Files
Original bundle
1 - 4 out of 4 results
No Thumbnail Available
- Name:
- Thesis.pdf
- Size:
- 4.74 MB
- Format:
- Adobe Portable Document Format
- Description:
- Plný text práce
No Thumbnail Available
- Name:
- A10N0100Pposudek-ved.pdf
- Size:
- 325.12 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek vedoucího práce
No Thumbnail Available
- Name:
- A10N0100Pposudek-op.pdf
- Size:
- 508.07 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek oponenta práce
No Thumbnail Available
- Name:
- A10N0100Pprubeh.pdf
- Size:
- 166.64 KB
- Format:
- Adobe Portable Document Format
- Description:
- Průběh obhajoby práce