Metody strojového učení pro analýzu sentimentu

Date issued

2013

Journal Title

Journal ISSN

Volume Title

Publisher

Západočeská univerzita v Plzni

Abstract

Tato práce prozkoumává možnosti použití algoritmu strojového učení pro analýzu sentimentu v českém jazyce. Prozkoumávané techniky jsou testovány na datech získaných ze serveru heureka.cz. Kromě použití tří základních algoritmu strojového učení (Naive Bayes, Maximum Entropy a SVM), je představeno a implementováno pět metod selekce příznaků (Mutual information, Information gain, Chi square, Odds ratio a Relevancy score). V rámci několika navržených experimentů je prozkoumán vliv těchto algoritmů na úspěšnost klasifikace algoritmu strojového učení.

Description

Subject(s)

analýza sentimentu, strojové učení, výběr příznaků, mutual information, information gain, chi square, odds ratio, relevancy score, naive Bayes, maximum entropy, SVM, confusion matrix, nevyvážený dataset

Citation

Collections

OPEN License Selector