Klasifikace dokumentů s použitím hierarchické reprezentace

Date issued

2018

Journal Title

Journal ISSN

Volume Title

Publisher

Západočeská univerzita v Plzni

Abstract

Distribuovaným reprezentacím slov či větších úseků textu se v posledních několika letech dostává poměrně velké pozornosti. Na rozdíl od tradičních reprezentací typu Bag-of-words, je výhodou distribuovaných reprezentací schopnost zachytit sémantický význam. Cílem této práce bylo vyzkoušet klasifikaci neuronovými sítěmi, postavenou nad hierarchickou distribuovanou reprezentací dokumentů. Při hierarchické reprezentaci je dokument reprezentován po částech jeho přirozené hierarchické struktury (např. dokument -> odstavce -> věty -> slova). Předpoklad je takový, že reprezentace částí textu ve vyšší úrovni hierarchie by mohla zachytit abstraktnější sémantický význam. Díky tomu by, co se týče úspěšnosti klasifikace, mohla celková reprezentace dokumentu být kvalitnější. Dosažené výsledky ukazují, že některé hierarchické distribuované reprezentace většinou poráží nehierarchické distribuované reprezentace a~tudíž mají potenciál, přestože nepřekonaly některé dostupné výsledky jiných prací.

Description

Subject(s)

klasifikace dokumentů, distribuovaná reprezentace, hierarchická reprezentace

Citation

Collections