Pokročilé metody srovnávání sémantiky vět

dc.contributor.advisorHabernal, Ivan
dc.contributor.authorPtáček, Tomáš
dc.contributor.refereeKonopík, Miloslav
dc.date.accepted2012-06-19
dc.date.accessioned2013-06-19T06:31:33Z
dc.date.available2011-08-31cs
dc.date.available2013-06-19T06:31:33Z
dc.date.issued2012
dc.date.submitted2012-05-17
dc.description.abstractTato práce se zaměřuje na problematiku sémantické podobnosti vět v anglickém jazyce. Popisuje předzpracování dokumentů, modely vyhledávání informací, sémantické metody pro získávání informací a metody výpočtu sémantické podobnosti mezi slovy. Bylo vybráno pět slibných metod a ověřena jejich úspěšnost. V praktické části je navrženo šest nových metod pro podobnost vět založených na existujících tzv. state-of-the-art metodách popsaných v teoretické části. Je vyhodnoceno celkem jedenáct metod větné podobnosti. Hodnocení se provádí na dvou různých datových sadách, konkrétně Microsoft Research Parphrase Corpus a Semantic Textual Similarity Shared Task. Získané výsledky jsou kriticky hodnoceny v závěru práce.cs
dc.description.abstract-translatedThis thesis is focused on the problem of sentence semantic similarity in English language. The theory for document preprocessing, information retrieval models, semantic methods in information retrieval, semantic similarity between words and sentence similarity measures are introduced in the theoretical part. We selected and implemented five promising sentence similarity measures. In the practical part we propose six new sentence similarity measures inspired by state-of-the-art measures described in the theoretical part. We evaluate eleven sentence similarity measures. The evaluation is conducted on two different data sets. The data sets are the Microsoft Research paraphrase corpus and the Semantic Textual Similarity shared task. At the end of the thesis the results are discussed.en
dc.description.departmentKatedra informatiky a výpočetní technikycs
dc.description.resultObhájenocs
dc.format44 s.cs
dc.format.mimetypeapplication/pdf
dc.identifier47618
dc.identifier.urihttp://hdl.handle.net/11025/3077
dc.language.isocscs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.rights.accessopenAccessen
dc.subjectsémantická podobnostcs
dc.subject.translatedsemantic similarityen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-levelNavazujícícs
dc.thesis.degree-nameIng.cs
dc.thesis.degree-programInženýrská informatikacs
dc.titlePokročilé metody srovnávání sémantiky větcs
dc.title.alternativeAdvanced Methods for Sentence Semantic Similarityen
dc.typediplomová prácecs
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=47618

Files

Original bundle
Showing 1 - 4 out of 4 results
No Thumbnail Available
Name:
Thesis.pdf
Size:
4.74 MB
Format:
Adobe Portable Document Format
Description:
Plný text práce
No Thumbnail Available
Name:
A10N0100Pposudek-ved.pdf
Size:
325.12 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího práce
No Thumbnail Available
Name:
A10N0100Pposudek-op.pdf
Size:
508.07 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta práce
No Thumbnail Available
Name:
A10N0100Pprubeh.pdf
Size:
166.64 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby práce

Collections