Automatická extrakce klíčových slov pomocí metod trénovaných bez učitele

dc.contributor.advisorBrychcín Tomáš, Ing. Ph.D.
dc.contributor.authorZíbar, Karel
dc.contributor.refereeHercig Tomáš, Ing.
dc.date.accepted2017-6-19
dc.date.accessioned2018-01-15T15:02:15Z
dc.date.available2016-9-1
dc.date.available2018-01-15T15:02:15Z
dc.date.issued2017
dc.date.submitted2017-5-15
dc.description.abstractTato práce se zabývá různými přístupy extrahování klíčových slov z textových dokumentů. Celkem byly implementovány tři dobře známé metody - TF-IDF, LDA a GloVe (extrakce pomocí reprezentace slov vektory GloVe). Jejich algoritmy byly lehce upraveny tak, aby metody mohly využívat více příznaků než před tím. Byla také navržena vlastní metoda (označena jako ZKEM) kombinující všechny výše zmíněné přístupy a otestována stejným způsobem. Všechny tyto metody byly testovány a srovnány s metodami, účastnících se mezinárodní programovací soutěže SemEval 2010. Nejlepší metoda (vylepšená metoda TF-IDF) dosáhla úspěšnosti 25,95 %. Tento výsledek by stačil na druhé místo v soutěži SemEval.cs
dc.description.abstract-translatedThis thesis deals with different approaches to keyword extraction from text documents. Three well-known methods have been implemented - TF-IDF, LDA and GloVe (keyword extraction by representing words as GloVe's vectors). Their algorithms have been slightly improved so that the methods can use more features. Finally, a new method (denoted as ZKEM), combining all three approaches mentioned above, has been created and properly evaluated in the same way as the others. All methods have been tested and compared with the algorithms participated at international programming competition SemEval 2010. The best method (improved TF-IDF) has achieved 25.95% accuracy. This result would be enough to take second place at SemEval competition.en
dc.description.resultObhájenocs
dc.format72 s.cs
dc.format.mimetypeapplication/pdf
dc.identifier71482
dc.identifier.urihttp://hdl.handle.net/11025/27152
dc.language.isocscs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.rights.accessopenAccessen
dc.subjectmetody extrakce klíčových slov trénované bez učitelecs
dc.subjecttf-idfcs
dc.subjectldacs
dc.subjectglovecs
dc.subjectsemeval 2010cs
dc.subject.translatedunsupervised keyword extraction methodsen
dc.subject.translatedtf-idfen
dc.subject.translatedldaen
dc.subject.translatedgloveen
dc.subject.translatedsemeval 2010en
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-levelNavazujícícs
dc.thesis.degree-nameIng.cs
dc.thesis.degree-programInženýrská informatikacs
dc.titleAutomatická extrakce klíčových slov pomocí metod trénovaných bez učitelecs
dc.title.alternativeUnsupervised methods for automatic keyword extractionen
dc.typediplomová prácecs
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=71482

Files

Original bundle
Showing 1 - 4 out of 4 results
No Thumbnail Available
Name:
zibar_unsupervised-methods-for-automatic-keyword-extraction_2017.pdf
Size:
5.36 MB
Format:
Adobe Portable Document Format
Description:
Plný text práce
No Thumbnail Available
Name:
A14N0151Phodnoceni-ved.PDF
Size:
436.44 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího práce
No Thumbnail Available
Name:
A14N0151Pposudek-op.PDF
Size:
379.82 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta práce
No Thumbnail Available
Name:
A14N0151Pobhajoba.PDF
Size:
203.7 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby práce

Collections