Klasifikace dokumentů s použitím hierarchické reprezentace
| dc.contributor.advisor | Lenc Ladislav, Ing. Ph.D. | |
| dc.contributor.author | Morávka, Jakub | |
| dc.contributor.referee | Král Pavel, Doc. Ing. Ph.D. | |
| dc.date.accepted | 2018-9-11 | |
| dc.date.accessioned | 2019-03-15T10:14:28Z | |
| dc.date.available | 2017-9-1 | |
| dc.date.available | 2019-03-15T10:14:28Z | |
| dc.date.issued | 2018 | |
| dc.date.submitted | 2018-6-28 | |
| dc.description.abstract | Distribuovaným reprezentacím slov či větších úseků textu se v posledních několika letech dostává poměrně velké pozornosti. Na rozdíl od tradičních reprezentací typu Bag-of-words, je výhodou distribuovaných reprezentací schopnost zachytit sémantický význam. Cílem této práce bylo vyzkoušet klasifikaci neuronovými sítěmi, postavenou nad hierarchickou distribuovanou reprezentací dokumentů. Při hierarchické reprezentaci je dokument reprezentován po částech jeho přirozené hierarchické struktury (např. dokument -> odstavce -> věty -> slova). Předpoklad je takový, že reprezentace částí textu ve vyšší úrovni hierarchie by mohla zachytit abstraktnější sémantický význam. Díky tomu by, co se týče úspěšnosti klasifikace, mohla celková reprezentace dokumentu být kvalitnější. Dosažené výsledky ukazují, že některé hierarchické distribuované reprezentace většinou poráží nehierarchické distribuované reprezentace a~tudíž mají potenciál, přestože nepřekonaly některé dostupné výsledky jiných prací. | cs |
| dc.description.abstract-translated | Recently, distributed representations of words or longer pieces of text have gotten quite an attention. In contrast with traditional representations like \emph{Bag-of-words}, distributed representations have the advantage of being able to capture semantic meaning. The main goal of this work was to try document classification via neural networks, which is built upon hierarchical distributed representations of documents. In case of hierarchical representation, document is represented as a collection of its segments (e,g. paragraphs or sentences). There is an assumption that representation of pieces of text at higher hierarchy level (than just words) can capture more abstract semantic meaning. That might lead to a document representation of better quality and thus increase the accuracy of classification. The results of conducted experiments show that some hierarchical distributed representations achieve better accuracy than most of the non-hierarchical ones, although they do not outperform some of the available results of other approaches. | en |
| dc.description.result | Obhájeno | cs |
| dc.format | 90 s. | cs |
| dc.format.mimetype | application/pdf | |
| dc.identifier | 74811 | |
| dc.identifier.uri | http://hdl.handle.net/11025/31809 | |
| dc.language.iso | cs | cs |
| dc.publisher | Západočeská univerzita v Plzni | cs |
| dc.rights | Plný text práce je přístupný bez omezení. | cs |
| dc.rights.access | openAccess | en |
| dc.subject | klasifikace dokumentů | cs |
| dc.subject | distribuovaná reprezentace | cs |
| dc.subject | hierarchická reprezentace | cs |
| dc.subject.translated | document classification | en |
| dc.subject.translated | distributed representation | en |
| dc.subject.translated | hierarchical representation | en |
| dc.thesis.degree-grantor | Západočeská univerzita v Plzni. Fakulta aplikovaných věd | cs |
| dc.thesis.degree-level | Navazující | cs |
| dc.thesis.degree-name | Ing. | cs |
| dc.thesis.degree-program | Inženýrská informatika | cs |
| dc.title | Klasifikace dokumentů s použitím hierarchické reprezentace | cs |
| dc.title.alternative | Document classification based on a hierarchical representation | en |
| dc.type | diplomová práce | cs |
| local.relation.IS | https://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=74811 |
Files
Original bundle
1 - 4 out of 4 results
No Thumbnail Available
- Name:
- DP_moravka_jakub_2018.pdf
- Size:
- 1.87 MB
- Format:
- Adobe Portable Document Format
- Description:
- Plný text práce
No Thumbnail Available
- Name:
- A15N0071Phodnoceni-ved.PDF
- Size:
- 366.41 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek vedoucího práce
No Thumbnail Available
- Name:
- A15N0071Pposudek-op.PDF
- Size:
- 442.43 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek oponenta práce
No Thumbnail Available
- Name:
- A15N0071Pobhajoba.PDF
- Size:
- 206.63 KB
- Format:
- Adobe Portable Document Format
- Description:
- Průběh obhajoby práce