Kategorizace zákaznické zpětné vazby nezávislá na jazyce

dc.contributor.advisorSteinberger Josef, Doc. Ing. Ph.D.
dc.contributor.authorPrůcha, Pavel
dc.contributor.refereePřibáň Pavel, Ing.
dc.date.accepted2023-6-19
dc.date.accessioned2023-08-02T10:47:23Z
dc.date.available2022-9-9
dc.date.available2023-08-02T10:47:23Z
dc.date.issued2023
dc.date.submitted2023-5-12
dc.description.abstractKategorizaci zákaznické zpětné vazby využívají různé společnosti pro zkvalitnění produktu nebo služby, kterou nabízí. Tato diplomová práce se zabývá kategorizací zákaznické zpětné vazby nezávislé na jazyce. Konverze mezi jazyky využívá transformaci vektorového prostoru pomocí transformační matice a strojový překlad. Datový korpus pro trénování a testování klasifikátorů je vytvořen z recenzí řetězce McDonald's, ve kterých je následně manuálně označený sentiment ve vybraných kategoriích. Tímto způsobem je vytvořený trénovací korpus z českých recenzí a testovací korpusy z anglických a německých recenzí. Data jsou v různých kombinacích testována primárně na neuronových sítích CNN a LSTM s vektorovou reprezentací textu word2vec a fasttext. Nejúspěšnější kombinací modelů je LSTM s fasttext, která je použita v demonstrátoru práce.cs
dc.description.abstract-translatedCategorization of customer feedback is used by various companies to improve the quality of the product or service they offer. This thesis deals with language-independent categorization of customer feedback. Conversion between languages uses vector space transformation using a transformation matrix and machine translation. The data corpus for training and testing classifiers is created from reviews of the chain McDonald's, in which the sentiment in selected categories is then manually annotated. In this way, the training corpus is created from Czech reviews and the test corpus from English and German reviews. Data are tested in various combinations primarily on neural networks CNN and LSTM with word embeddings word2vec and fasttext. The most successful combination of models is LSTM with fasttext, which are used in the work demonstrator.en
dc.description.resultObhájeno
dc.format84 s. (104190 znaků)
dc.identifier93488
dc.identifier.urihttp://hdl.handle.net/11025/53738
dc.language.isocs
dc.publisherZápadočeská univerzita v Plzni
dc.rightsPlný text práce je přístupný bez omezení
dc.subjectnlpcs
dc.subjectstrojové učenícs
dc.subjectneuronové sítěcs
dc.subject.translatednlpen
dc.subject.translatedmachine learningen
dc.subject.translatedneural networksen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných věd
dc.thesis.degree-levelNavazující
dc.thesis.degree-nameIng.
dc.thesis.degree-programInženýrská informatika
dc.titleKategorizace zákaznické zpětné vazby nezávislá na jazycecs
dc.title.alternativeCategorization of customer feedback independent of the languageen
dc.typediplomová práce

Files

Original bundle
Showing 1 - 5 out of 6 results
No Thumbnail Available
Name:
A20N0102P_DP.pdf
Size:
1.13 MB
Format:
Adobe Portable Document Format
Description:
Plný text práce
No Thumbnail Available
Name:
A20N0102Pposudek-op.pdf
Size:
251.61 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta práce
No Thumbnail Available
Name:
A20N0102Phodnoceni-ved.pdf
Size:
102.18 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího práce
No Thumbnail Available
Name:
A20N0102Pobhajoba.pdf
Size:
528.28 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby práce
No Thumbnail Available
Name:
A20N0102P-zadani_DP.pdf
Size:
14.31 KB
Format:
Adobe Portable Document Format
Description:
VŠKP - příloha

Collections