Shlukování textů podle jejich podobnosti pomocí modulu Scikit-learn
Date issued
2013
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Západočeská univerzita v Plzni
Abstract
Cílem práce je prozkoumat vybrané algoritmy klasifikace (učení bez učitele) a jejich
vhodnost vzhledem k reálnému problému. Tímto problémem je shlukování, respektive
dělení novinových článku do skupin v závislosti na jejich tématu. Vybrané algoritmy jsou
K-means, analýza hlavních komponent a latentní sémantická analýza. Práce se kromě
teoretického úvodu zabývá také experimentální částí, kde jsou vybrané metody otestovány
dle určených kritérií.
Description
Subject(s)
klasifikace, učení bez učitele, shlukování, K-means, analýza hlavních komponent, latentní sémantická analýza