Automatická detekce klíčových slov v textu

dc.contributor.advisorSido Jakub, Ing.
dc.contributor.authorKrajňák, Jan
dc.contributor.refereePražák Ondřej, Ing.
dc.date.accepted2022-6-14
dc.date.accessioned2022-08-29T14:33:21Z
dc.date.available2021-10-4
dc.date.available2022-08-29T14:33:21Z
dc.date.issued2022
dc.date.submitted2022-5-5
dc.description.abstractTato práce se zabývá problematikou automatické extrakce klíčových slov z textu. Nejprve jsou analyzovány již existující přístupy k řešení problému. Některé z existujících přístupů byly vybrány a vyzkoušeny na anglické datové sadě, použité i při soutěži SemEval 2010. Stejné metody byly rovněž otestovány na zcela nové, nikdy netestované datové sadě získané při spolupráci s Českou tiskovou kanceláří. Jelikož tento nový korpus obsahuje dostatek označených dat, práce se v další části zabývá návrhem metody využívající přístup učení s učitelem založené na BERT modelech a následném porovnání s již existujícími metodami.cs
dc.description.abstract-translatedThis thesis deals with automatic keywords extraction from documents. First, it analyzes already existing approaches to solve the problem then tests some of the methods on a dataset from SemEval 2010 competition. Same methods are then tested on a completely new czech dataset which has been obtained with cooperation with ČTK. As this new corpus contains enough annotated documents, the work in the final part deals with a proposal of a supervised method based on BERT models and the subsequent comparisson with already existing methods.en
dc.description.resultObhájeno
dc.format43 s. (65358 znaků)
dc.identifier89766
dc.identifier.urihttp://hdl.handle.net/11025/49552
dc.language.isocs
dc.publisherZápadočeská univerzita v Plzni
dc.rightsPlný text práce je přístupný bez omezení
dc.subjectautomatická extrakce klíčových slovcs
dc.subjecttf-idfcs
dc.subjecttextrankcs
dc.subjectyakecs
dc.subjectkeybertcs
dc.subjectbertcs
dc.subjectčtkcs
dc.subjectsemevalcs
dc.subject.translatedautomatic keyword extractionen
dc.subject.translatedtf-idfen
dc.subject.translatedtextranken
dc.subject.translatedyakeen
dc.subject.translatedkeyberten
dc.subject.translatedberten
dc.subject.translatedčtken
dc.subject.translatedsemevalen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných věd
dc.thesis.degree-levelBakalářský
dc.thesis.degree-nameBc.
dc.thesis.degree-programInformatika a výpočetní technika
dc.titleAutomatická detekce klíčových slov v textucs
dc.title.alternativeAutomatic keyword detectionen
dc.typebakalářská práce
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=89766

Files

Original bundle
Showing 1 - 5 out of 6 results
No Thumbnail Available
Name:
A19B0103P.pdf
Size:
1.73 MB
Format:
Adobe Portable Document Format
Description:
Plný text práce
No Thumbnail Available
Name:
A19B0103P_hodnoceni.pdf
Size:
117.37 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího práce
No Thumbnail Available
Name:
A19B0103P_posudek.pdf
Size:
235.9 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta práce
No Thumbnail Available
Name:
A19B0103P_obhajoba.pdf
Size:
85.35 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby práce
No Thumbnail Available
Name:
A19B0103P_zadaniBP.pdf
Size:
12.83 KB
Format:
Adobe Portable Document Format
Description:
VŠKP - příloha