Analýza příspěvků na sociální síti Twitter

dc.contributor.advisorJežek Karel, Prof. Ing. CSc.
dc.contributor.authorHain, Jakub
dc.date.accepted2019-6-18
dc.date.accessioned2020-07-17T13:41:25Z
dc.date.available2018-9-11
dc.date.available2020-07-17T13:41:25Z
dc.date.issued2019
dc.date.submitted2019-5-13
dc.description.abstractTato práce je zaměřena na analýzu sentimentu a sumarizaci dat. Konečné využití aplikace by melo být pro sociální sít Twitter v češtině. V textu jsou popsány jednotlivé metody strojového učení použité pro klasifikaci (Naivní Bayes, Support Vector Machine a Maximum Entropy). Extraktivní sumarizace je implementována pomocí Latentní sémantické analýzy. Vety jsou vybrány dvěma způsoby (Gong a Liu, Steinberger a Ježek). Sentiment byl testován na ohodnocených datech z českého Facebooku a anglických tweetech. Při testování na českých datech byly výsledky jednotlivých klasifikátoru srovnatelné kromě SVM. Sumarizace byla otestována na anglickém datasetu. Pro ověření byla použita metrika ROUGE-1, podle které obě verze sumarizace dosahovaly podobných výsledku.cs
dc.description.abstract-translatedThis thesis focuses on sentiment analysis and data summarization. Final use of the application should be for social network Twitter in Czech language. The text shows several machine learning methods used for classification (Naive Bayes, Support Vector Machine and Maximum Entropy). Extractive summarization is implemented as Latent semantic analysis. Selection of sentences is implemented in 2 versions (Gong and Liu, Steinberger and Ježek). Sentiment was tested on classified data from Czech Facebook and English tweets. Testing on Czech data shows comparable results on all classifiers except SVM. Summarization was tested on English dataset. ROUGE-1 metric was used for verification. Both versions of LSA performed similarly.en
dc.description.resultObhájenocs
dc.format86 s.cs
dc.format.mimetypeapplication/pdf
dc.identifier79959
dc.identifier.urihttp://hdl.handle.net/11025/37430
dc.language.isocscs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.rights.accessopenAccessen
dc.subjectsociální sítěcs
dc.subjecttwittercs
dc.subjectsentimentcs
dc.subjectklasifikacecs
dc.subjectmaximální entropiecs
dc.subjectnaivní bayescs
dc.subjectsvmcs
dc.subjectsumarizacecs
dc.subjectlatentní sémantická analýzacs
dc.subject.translatedsocial networken
dc.subject.translatedtwitteren
dc.subject.translatedsentimenten
dc.subject.translatedclassificationen
dc.subject.translatedmaximum entropyen
dc.subject.translatednaive bayesen
dc.subject.translatedsvmen
dc.subject.translatedsumarizationen
dc.subject.translatedlatent semantic analysisen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-levelNavazujícícs
dc.thesis.degree-nameIng.cs
dc.thesis.degree-programInženýrská informatikacs
dc.titleAnalýza příspěvků na sociální síti Twittercs
dc.title.alternativeTwitter post sentiment analysisen
dc.typediplomová prácecs
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=79959

Files

Original bundle
Showing 1 - 4 out of 4 results
No Thumbnail Available
Name:
Hain_DP_Text_2019.pdf
Size:
1.24 MB
Format:
Adobe Portable Document Format
Description:
Plný text práce
No Thumbnail Available
Name:
A16N0030Phodnoceni-ved.PDF
Size:
433.35 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího práce
No Thumbnail Available
Name:
A16N0030Pposudek-op.PDF
Size:
439.16 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta práce
No Thumbnail Available
Name:
A16N0030Pobhajoba.PDF
Size:
246.59 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby práce

Collections