Analýza příspěvků na sociální síti Twitter
Date issued
2019
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Západočeská univerzita v Plzni
Abstract
Tato práce je zaměřena na analýzu sentimentu a sumarizaci dat. Konečné
využití aplikace by melo být pro sociální sít Twitter v češtině.
V textu jsou popsány jednotlivé metody strojového učení použité pro
klasifikaci (Naivní Bayes, Support Vector Machine a Maximum Entropy).
Extraktivní sumarizace je implementována pomocí Latentní sémantické analýzy.
Vety jsou vybrány dvěma způsoby (Gong a Liu, Steinberger a Ježek).
Sentiment byl testován na ohodnocených datech z českého Facebooku a
anglických tweetech. Při testování na českých datech byly výsledky jednotlivých
klasifikátoru srovnatelné kromě SVM.
Sumarizace byla otestována na anglickém datasetu. Pro ověření byla použita
metrika ROUGE-1, podle které obě verze sumarizace dosahovaly podobných
výsledku.
Description
Subject(s)
sociální sítě, twitter, sentiment, klasifikace, maximální entropie, naivní bayes, svm, sumarizace, latentní sémantická analýza