Automatická detekce klíčových slov v textu
| dc.contributor.advisor | Sido Jakub, Ing. | |
| dc.contributor.author | Krajňák, Jan | |
| dc.contributor.referee | Pražák Ondřej, Ing. | |
| dc.date.accepted | 2022-6-14 | |
| dc.date.accessioned | 2022-08-29T14:33:21Z | |
| dc.date.available | 2021-10-4 | |
| dc.date.available | 2022-08-29T14:33:21Z | |
| dc.date.issued | 2022 | |
| dc.date.submitted | 2022-5-5 | |
| dc.description.abstract | Tato práce se zabývá problematikou automatické extrakce klíčových slov z textu. Nejprve jsou analyzovány již existující přístupy k řešení problému. Některé z existujících přístupů byly vybrány a vyzkoušeny na anglické datové sadě, použité i při soutěži SemEval 2010. Stejné metody byly rovněž otestovány na zcela nové, nikdy netestované datové sadě získané při spolupráci s Českou tiskovou kanceláří. Jelikož tento nový korpus obsahuje dostatek označených dat, práce se v další části zabývá návrhem metody využívající přístup učení s učitelem založené na BERT modelech a následném porovnání s již existujícími metodami. | cs |
| dc.description.abstract-translated | This thesis deals with automatic keywords extraction from documents. First, it analyzes already existing approaches to solve the problem then tests some of the methods on a dataset from SemEval 2010 competition. Same methods are then tested on a completely new czech dataset which has been obtained with cooperation with ČTK. As this new corpus contains enough annotated documents, the work in the final part deals with a proposal of a supervised method based on BERT models and the subsequent comparisson with already existing methods. | en |
| dc.description.result | Obhájeno | |
| dc.format | 43 s. (65358 znaků) | |
| dc.identifier | 89766 | |
| dc.identifier.uri | http://hdl.handle.net/11025/49552 | |
| dc.language.iso | cs | |
| dc.publisher | Západočeská univerzita v Plzni | |
| dc.rights | Plný text práce je přístupný bez omezení | |
| dc.subject | automatická extrakce klíčových slov | cs |
| dc.subject | tf-idf | cs |
| dc.subject | textrank | cs |
| dc.subject | yake | cs |
| dc.subject | keybert | cs |
| dc.subject | bert | cs |
| dc.subject | čtk | cs |
| dc.subject | semeval | cs |
| dc.subject.translated | automatic keyword extraction | en |
| dc.subject.translated | tf-idf | en |
| dc.subject.translated | textrank | en |
| dc.subject.translated | yake | en |
| dc.subject.translated | keybert | en |
| dc.subject.translated | bert | en |
| dc.subject.translated | čtk | en |
| dc.subject.translated | semeval | en |
| dc.thesis.degree-grantor | Západočeská univerzita v Plzni. Fakulta aplikovaných věd | |
| dc.thesis.degree-level | Bakalářský | |
| dc.thesis.degree-name | Bc. | |
| dc.thesis.degree-program | Informatika a výpočetní technika | |
| dc.title | Automatická detekce klíčových slov v textu | cs |
| dc.title.alternative | Automatic keyword detection | en |
| dc.type | bakalářská práce | |
| local.relation.IS | https://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=89766 |
Files
Original bundle
1 - 5 out of 6 results
No Thumbnail Available
- Name:
- A19B0103P.pdf
- Size:
- 1.73 MB
- Format:
- Adobe Portable Document Format
- Description:
- Plný text práce
No Thumbnail Available
- Name:
- A19B0103P_hodnoceni.pdf
- Size:
- 117.37 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek vedoucího práce
No Thumbnail Available
- Name:
- A19B0103P_posudek.pdf
- Size:
- 235.9 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek oponenta práce
No Thumbnail Available
- Name:
- A19B0103P_obhajoba.pdf
- Size:
- 85.35 KB
- Format:
- Adobe Portable Document Format
- Description:
- Průběh obhajoby práce
No Thumbnail Available
- Name:
- A19B0103P_zadaniBP.pdf
- Size:
- 12.83 KB
- Format:
- Adobe Portable Document Format
- Description:
- VŠKP - příloha