Automatická detekce klíčových slov v textu
Date issued
2022
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Západočeská univerzita v Plzni
Abstract
Tato práce se zabývá problematikou automatické extrakce klíčových slov z
textu. Nejprve jsou analyzovány již existující přístupy k řešení problému. Některé z existujících přístupů byly vybrány a vyzkoušeny na anglické datové
sadě, použité i při soutěži SemEval 2010. Stejné metody byly rovněž otestovány na zcela nové, nikdy netestované datové sadě získané při spolupráci
s Českou tiskovou kanceláří. Jelikož tento nový korpus obsahuje dostatek
označených dat, práce se v další části zabývá návrhem metody využívající
přístup učení s učitelem založené na BERT modelech a následném porovnání
s již existujícími metodami.
Description
Subject(s)
automatická extrakce klíčových slov, tf-idf, textrank, yake, keybert, bert, čtk, semeval