Detekce polarity textu s využitím mezijazyčné transformace

dc.contributor.advisorPřibáň Pavel, Ing.
dc.contributor.authorŠmíd, Jakub
dc.contributor.refereePražák Ondřej, Ing.
dc.date.accepted2021-6-15
dc.date.accessioned2021-06-25T12:33:22Z
dc.date.available2020-10-5
dc.date.available2021-06-25T12:33:22Z
dc.date.issued2021
dc.date.submitted2021-5-6
dc.description.abstractTato bakalářská práce se zabývá detekcí polarity textu s využitím mezijazyčných transformací. Mezijazyčné transformace patří mezi metody, které umožňují přenos znalostí mezi jazyky. Konkrétně v této práci jsou použita anglická anotovaná data pro detekci polarity v českém textu. V rámci práce jsou navrženy a implementovány dva modely neuronových sítí - LSTM a CNN - v kombinaci se slovními vektory fastText. Modely jsou následně s využitím lineárních mezijazyčných transformací natrénovány na anglických datech a vyhodnoceny na českých datech. Výsledky těchto experimentů jsou porovnány s modely, které byly trénovány i vyhodnoceny pouze na češtině. Srovnání ukazuje, že s dostatečným množstvím výhradně anglických dat lze dosáhnout velmi dobrých výsledků, které jsou jen o 5 až 6 % horší v porovnání s modely trénovanými jen na českých datech.cs
dc.description.abstract-translatedThis bachelor's thesis focuses on text polarity detection using cross-lingual transformations. Cross-lingual transformations are among the methods that allow the transfer of knowledge between languages. Specifically, in this work, the English annotated data are used for polarity detection in Czech text. Within the thesis, two neural network models - LSTM and CNN - are proposed and implemented in combination with fastText word embeddings. The models are then trained on English data and evaluated on Czech data using linear cross-lingual transformations. The results of these experiments are compared with models that have been trained and evaluated only on Czech data. The comparison shows that with a sufficient amount of exclusively English data, it is possible to achieve very good results, which are only 5 to 6% worse compared to models trained only on Czech data.en
dc.description.resultObhájenocs
dc.format74 s.cs
dc.format.mimetypeapplication/pdf
dc.identifier86474
dc.identifier.urihttp://hdl.handle.net/11025/44232
dc.language.isocscs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.rights.accessopenAccessen
dc.subjectdetekce polaritycs
dc.subjectmezijazyčné transformacecs
dc.subjectstrojové učenícs
dc.subjectzpracování přirozeného jazykacs
dc.subjectneuronové sítěcs
dc.subjectanalýza sentimentucs
dc.subject.translatedpolarity detectionen
dc.subject.translatedcross-lingual transformationsen
dc.subject.translatedmachine learningen
dc.subject.translatednatural language processingen
dc.subject.translatedneural networksen
dc.subject.translatedsentiment analysisen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-levelBakalářskýcs
dc.thesis.degree-nameBc.cs
dc.thesis.degree-programInženýrská informatikacs
dc.titleDetekce polarity textu s využitím mezijazyčné transformacecs
dc.title.alternativeText polarity detection using cross-lingual transformationen
dc.typebakalářská prácecs
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=86474

Files

Original bundle
Showing 1 - 5 out of 6 results
No Thumbnail Available
Name:
BP_Jakub_Smid.pdf
Size:
1.01 MB
Format:
Adobe Portable Document Format
Description:
Plný text práce
No Thumbnail Available
Name:
A19B0675P_Hodnoceni.pdf
Size:
265.02 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího práce
No Thumbnail Available
Name:
A19B0675P_Posudek.pdf
Size:
237.11 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta práce
No Thumbnail Available
Name:
A19B0675P_Obhajoba.pdf
Size:
43.59 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby práce
No Thumbnail Available
Name:
A19B0675P_zadaniBP.pdf
Size:
17.36 KB
Format:
Adobe Portable Document Format
Description:
VŠKP - příloha