Testování podobnosti vět

dc.contributor.advisorSvoboda Lukáš, Ing.
dc.contributor.authorHankovec, Jiří
dc.contributor.refereeBrychcín Tomáš, Ing. Ph.D.
dc.date.accepted2017-8-29
dc.date.accessioned2018-01-15T15:04:42Z
dc.date.available2016-10-10
dc.date.available2018-01-15T15:04:42Z
dc.date.issued2017
dc.date.submitted2017-6-29
dc.description.abstractCílem této práce je prozkoumat problematiku výpočtu sémantické podobnosti dvou českých vět. V této práci jsou představeny některé metody pro výpočet sémantické podobnosti jednotlivých slov i celých vět. Lidmi ohodnocené původní věty jsou převzaty z dat z mezinárodní soutěže SemEval. Testování sémantické podobnosti vět je prováděno na vytvořeném českém korpusu, který se skládá z 1200 dvojic vět bodově ohodnocených od 0 do 5 na základě jejich sémantické podobnosti. Přesnost vypočtené sémantické podobnosti u testovacích dvojic vět je měřena pomocí Pearsonovy korelace.cs
dc.description.abstract-translatedThe goal of this bachelor thesis is to analyze the problematics of Semantic Textual Similarity (STS) and adapt current state-of-the-art methods for Czech language. STS systems are usually compared with manually annotated data. The data comes from international SemEval competition. This thesis reveals methods and evaluation process of STS and consist of dataset with two sentences rated with a score between 0 and 5. Testing is done on manually created dataset of 1200 pair of sentences. System is measured by Pearson's correlation and compared with human annotators.en
dc.description.resultObhájenocs
dc.format49 s.cs
dc.format.mimetypeapplication/pdf
dc.identifier70681
dc.identifier.urihttp://hdl.handle.net/11025/27690
dc.language.isocscs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.rights.accessopenAccessen
dc.subjectzpracování přirozeného jazykacs
dc.subjectstrojové učenícs
dc.subjectsémantická podobnost větcs
dc.subjectpředzpracování textucs
dc.subjectlineární regresecs
dc.subject.translatednlpen
dc.subject.translatedmachine learningen
dc.subject.translatedstsen
dc.subject.translatedtext preprocessingen
dc.subject.translatedlinear regressionen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-levelBakalářskýcs
dc.thesis.degree-nameBc.cs
dc.thesis.degree-programInženýrská informatikacs
dc.titleTestování podobnosti větcs
dc.title.alternativeSemantic textual similarityen
dc.typebakalářská prácecs
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=70681

Files

Original bundle
Showing 1 - 4 out of 4 results
No Thumbnail Available
Name:
BP_Hankovec.pdf
Size:
613.58 KB
Format:
Adobe Portable Document Format
Description:
Plný text práce
No Thumbnail Available
Name:
A12B0058P-hodnoceni.pdf
Size:
384.81 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího práce
No Thumbnail Available
Name:
A12B0058P-posudek.pdf
Size:
525.97 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta práce
No Thumbnail Available
Name:
A12B0058P-obhajoba.pdf
Size:
204.32 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby práce
OPEN License Selector