Rozpoznávání názvů značek v sociálních mediích

Date issued

2016

Journal Title

Journal ISSN

Volume Title

Publisher

Západočeská univerzita v Plzni

Abstract

Cílem práce je prozkoumat metody používané pro rozpoznávání pojmenovaných entit, z těchto technik jednu vybrat, implementovat, ověřit funkčnost porovnáním s již existujícími systémy a následně aplikovat na data pocházející ze sociálních médií, v nichž identifikuje názvy organizací a produktů. Implementované řešení staví na knihovně pro strojové učení Brainy a pro realizaci používá jí poskytovaný algoritmus Conditional Random Fields. Vytvořený systém na standardním korpusu (Czech Named Entity Corpus) dosahuje podobných výsledků jako ten, který se snaží napodobit. Systém pro korpus dosahuje úspěšnosti 70,69 % (Micro F-measure strict) a pro data pocházející ze sociálních sítí 83,04 %. Hlavním přínosem této práce je vytvoření systému umožňujícího rozpoznávání pojmenovaných entit v textu a otestování jeho výkonnosti na komentářích pocházející z internetového fóra zaměřujícího se především na jednu doménu, kterou jsou telekomunikace.

Description

Subject(s)

rozpoznávání pojmenovaných entit, strojové učení, sociální média

Citation

Collections

OPEN License Selector