Shlukování textů podle jejich podobnosti pomocí modulu Scikit-learn
| dc.contributor.advisor | Skorkovská, Lucie | |
| dc.contributor.author | Smolík, Tomáš | |
| dc.date.accepted | 2013-08-29 | |
| dc.date.accessioned | 2014-02-06T13:02:18Z | |
| dc.date.available | 2012-11-01 | cs |
| dc.date.available | 2014-02-06T13:02:18Z | |
| dc.date.issued | 2013 | |
| dc.date.submitted | 2013-08-20 | |
| dc.description.abstract | Cílem práce je prozkoumat vybrané algoritmy klasifikace (učení bez učitele) a jejich vhodnost vzhledem k reálnému problému. Tímto problémem je shlukování, respektive dělení novinových článku do skupin v závislosti na jejich tématu. Vybrané algoritmy jsou K-means, analýza hlavních komponent a latentní sémantická analýza. Práce se kromě teoretického úvodu zabývá také experimentální částí, kde jsou vybrané metody otestovány dle určených kritérií. | cs |
| dc.description.abstract-translated | The goal is to explore the selected classification algorithms (unsupervised learning) and their suitability for the real problem. This problem is the clustering or separation of newspaper articles into groups depending on their topic. The selected algorithms are the K-means, principal component analysis and latent semantic analysis. The work in addition to theoretical introduction also deals with the experimental part, where some methods are tested according to specific criteria. | en |
| dc.description.department | Katedra kybernetiky | cs |
| dc.description.result | Obhájeno | cs |
| dc.format | 77 s. (72 tisíc znaků) | cs |
| dc.format.mimetype | application/pdf | |
| dc.identifier | 54207 | |
| dc.identifier.uri | http://hdl.handle.net/11025/10442 | |
| dc.language.iso | cs | cs |
| dc.publisher | Západočeská univerzita v Plzni | cs |
| dc.rights | Plný text práce je přístupný bez omezení. | cs |
| dc.rights.access | openAccess | en |
| dc.subject | klasifikace | cs |
| dc.subject | učení bez učitele | cs |
| dc.subject | shlukování | cs |
| dc.subject | K-means | cs |
| dc.subject | analýza hlavních komponent | cs |
| dc.subject | latentní sémantická analýza | cs |
| dc.subject.translated | classification | en |
| dc.subject.translated | unsupervised learning | en |
| dc.subject.translated | clustering | en |
| dc.subject.translated | K-means | en |
| dc.subject.translated | principal component analysis | en |
| dc.subject.translated | latent semantic analysis | en |
| dc.thesis.degree-grantor | Západočeská univerzita v Plzni. Fakulta aplikovaných věd | cs |
| dc.thesis.degree-level | Bakalářský | cs |
| dc.thesis.degree-name | Bc. | cs |
| dc.thesis.degree-program | Aplikované vědy a informatika | cs |
| dc.title | Shlukování textů podle jejich podobnosti pomocí modulu Scikit-learn | cs |
| dc.title.alternative | Clustering of texts based on their similarity using the Scikit-learn | en |
| dc.type | bakalářská práce | cs |
| local.relation.IS | https://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=54207 |
Files
Original bundle
1 - 3 out of 3 results
No Thumbnail Available
- Name:
- BP_Smolik_final.pdf
- Size:
- 555.3 KB
- Format:
- Adobe Portable Document Format
- Description:
- Plný text práce
No Thumbnail Available
- Name:
- smolik-v.pdf
- Size:
- 1.73 MB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek vedoucího práce
No Thumbnail Available
- Name:
- smolik-p.pdf
- Size:
- 847.49 KB
- Format:
- Adobe Portable Document Format
- Description:
- Průběh obhajoby práce