Automatická klasifikace textových dokumentů
| dc.contributor.advisor | Král, Pavel | |
| dc.contributor.author | Černá, Veronika | |
| dc.date.accepted | 2012-06-07 | |
| dc.date.accessioned | 2013-06-19T06:42:08Z | |
| dc.date.available | 2012-02-03 | cs |
| dc.date.available | 2013-06-19T06:42:08Z | |
| dc.date.issued | 2012 | |
| dc.date.submitted | 2012-05-11 | |
| dc.description.abstract | Tato práce se zabývá automatickou klasifikací textových dokumentů, jejímž cílem je přiřadit dokumentům kategorii z nějaké předdefinované množiny kategorií. Pro experimenty byly vybrány tři známé klasifikační techniky: naivní Bayesův klasifikátor, support vector machines a maximální entropie. K předzpracování dat byly použity lemmatizátor a POS-tagger a na základě různých kritérií pro výběr příznaků pak byly vytvořeny 4 sady dokumentů. Všechny experimenty byly prováděny na českém korpusu nástrojem MinorThird. | cs |
| dc.description.abstract-translated | This work deals with automatic text document classification. Text classification is a process of labelling documents with thematic categories from a predefined set of categories. Three known classification techniques were chosen for experiments in this work: naive Bayes, support vector machines and maximum entropy. A lemmatizer and a POS-tagger were used for the text pre-processing. Four sets of documents were created based on the different feature selection criteria. All experiments were performed on the Czech corpus using the MinorThird toolkit. | en |
| dc.description.department | Katedra informatiky a výpočetní techniky | cs |
| dc.description.result | Obhájeno | cs |
| dc.format | 47 s. | cs |
| dc.format.mimetype | application/pdf | |
| dc.identifier | 49895 | |
| dc.identifier.uri | http://hdl.handle.net/11025/5497 | |
| dc.language.iso | cs | cs |
| dc.publisher | Západočeská univerzita v Plzni | cs |
| dc.rights | Plný text práce je přístupný bez omezení. | cs |
| dc.rights.access | openAccess | en |
| dc.subject | klasifikace dokumentů | cs |
| dc.subject | naivní Bayesův klasifikátor | cs |
| dc.subject | support vector machines | cs |
| dc.subject | maximální entropie | cs |
| dc.subject.translated | document classification | en |
| dc.subject.translated | naive Bayes | en |
| dc.subject.translated | support vector machines | en |
| dc.subject.translated | maximum entropy | en |
| dc.thesis.degree-grantor | Západočeská univerzita v Plzni. Fakulta aplikovaných věd | cs |
| dc.thesis.degree-level | Bakalářský | cs |
| dc.thesis.degree-name | Bc. | cs |
| dc.thesis.degree-program | Inženýrská informatika | cs |
| dc.title | Automatická klasifikace textových dokumentů | cs |
| dc.title.alternative | Automatic Text Document Classification | en |
| dc.type | bakalářská práce | cs |
| local.relation.IS | https://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=49895 |
Files
Original bundle
1 - 3 out of 3 results
No Thumbnail Available
- Name:
- Automaticka klasifikace textovych dokumentu.pdf
- Size:
- 462.87 KB
- Format:
- Adobe Portable Document Format
- Description:
- Plný text práce
No Thumbnail Available
- Name:
- A10B0834Pposudek.pdf
- Size:
- 438.15 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek vedoucího práce
No Thumbnail Available
- Name:
- A10B0834Pprubeh.pdf
- Size:
- 53.01 KB
- Format:
- Adobe Portable Document Format
- Description:
- Průběh obhajoby práce