Shlukování textů podle jejich podobnosti pomocí modulu Scikit-learn

dc.contributor.advisorSkorkovská, Lucie
dc.contributor.authorSmolík, Tomáš
dc.date.accepted2013-08-29
dc.date.accessioned2014-02-06T13:02:18Z
dc.date.available2012-11-01cs
dc.date.available2014-02-06T13:02:18Z
dc.date.issued2013
dc.date.submitted2013-08-20
dc.description.abstractCílem práce je prozkoumat vybrané algoritmy klasifikace (učení bez učitele) a jejich vhodnost vzhledem k reálnému problému. Tímto problémem je shlukování, respektive dělení novinových článku do skupin v závislosti na jejich tématu. Vybrané algoritmy jsou K-means, analýza hlavních komponent a latentní sémantická analýza. Práce se kromě teoretického úvodu zabývá také experimentální částí, kde jsou vybrané metody otestovány dle určených kritérií.cs
dc.description.abstract-translatedThe goal is to explore the selected classification algorithms (unsupervised learning) and their suitability for the real problem. This problem is the clustering or separation of newspaper articles into groups depending on their topic. The selected algorithms are the K-means, principal component analysis and latent semantic analysis. The work in addition to theoretical introduction also deals with the experimental part, where some methods are tested according to specific criteria.en
dc.description.departmentKatedra kybernetikycs
dc.description.resultObhájenocs
dc.format77 s. (72 tisíc znaků)cs
dc.format.mimetypeapplication/pdf
dc.identifier54207
dc.identifier.urihttp://hdl.handle.net/11025/10442
dc.language.isocscs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.rights.accessopenAccessen
dc.subjectklasifikacecs
dc.subjectučení bez učitelecs
dc.subjectshlukovánícs
dc.subjectK-meanscs
dc.subjectanalýza hlavních komponentcs
dc.subjectlatentní sémantická analýzacs
dc.subject.translatedclassificationen
dc.subject.translatedunsupervised learningen
dc.subject.translatedclusteringen
dc.subject.translatedK-meansen
dc.subject.translatedprincipal component analysisen
dc.subject.translatedlatent semantic analysisen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-levelBakalářskýcs
dc.thesis.degree-nameBc.cs
dc.thesis.degree-programAplikované vědy a informatikacs
dc.titleShlukování textů podle jejich podobnosti pomocí modulu Scikit-learncs
dc.title.alternativeClustering of texts based on their similarity using the Scikit-learnen
dc.typebakalářská prácecs
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=54207

Files

Original bundle
Showing 1 - 3 out of 3 results
No Thumbnail Available
Name:
BP_Smolik_final.pdf
Size:
555.3 KB
Format:
Adobe Portable Document Format
Description:
Plný text práce
No Thumbnail Available
Name:
smolik-v.pdf
Size:
1.73 MB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího práce
No Thumbnail Available
Name:
smolik-p.pdf
Size:
847.49 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby práce