Metody strojového učení pro analýzu sentimentu
Date issued
2013
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Západočeská univerzita v Plzni
Abstract
Tato práce prozkoumává možnosti použití algoritmu strojového učení pro
analýzu sentimentu v českém jazyce. Prozkoumávané techniky jsou testovány
na datech získaných ze serveru heureka.cz. Kromě použití tří základních
algoritmu strojového učení (Naive Bayes, Maximum Entropy a SVM),
je představeno a implementováno pět metod selekce příznaků (Mutual information,
Information gain, Chi square, Odds ratio a Relevancy score). V
rámci několika navržených experimentů je prozkoumán vliv těchto algoritmů
na úspěšnost klasifikace algoritmu strojového učení.
Description
Subject(s)
analýza sentimentu, strojové učení, výběr příznaků, mutual information, information gain, chi square, odds ratio, relevancy score, naive Bayes, maximum entropy, SVM, confusion matrix, nevyvážený dataset