Rozpoznávání názvů značek v sociálních mediích

dc.contributor.advisorKonkol Michal, Ing. Ph.D.
dc.contributor.authorWitz, Lukáš
dc.contributor.refereeSteinberger Josef, Doc. Ing. Ph.D.
dc.date.accepted2016-9-6
dc.date.accessioned2017-02-21T08:28:06Z
dc.date.available2015-9-1
dc.date.available2017-02-21T08:28:06Z
dc.date.issued2016
dc.date.submitted2016-6-23
dc.description.abstractCílem práce je prozkoumat metody používané pro rozpoznávání pojmenovaných entit, z těchto technik jednu vybrat, implementovat, ověřit funkčnost porovnáním s již existujícími systémy a následně aplikovat na data pocházející ze sociálních médií, v nichž identifikuje názvy organizací a produktů. Implementované řešení staví na knihovně pro strojové učení Brainy a pro realizaci používá jí poskytovaný algoritmus Conditional Random Fields. Vytvořený systém na standardním korpusu (Czech Named Entity Corpus) dosahuje podobných výsledků jako ten, který se snaží napodobit. Systém pro korpus dosahuje úspěšnosti 70,69 % (Micro F-measure strict) a pro data pocházející ze sociálních sítí 83,04 %. Hlavním přínosem této práce je vytvoření systému umožňujícího rozpoznávání pojmenovaných entit v textu a otestování jeho výkonnosti na komentářích pocházející z internetového fóra zaměřujícího se především na jednu doménu, kterou jsou telekomunikace.cs
dc.description.abstract-translatedThe goal of this thesis is to survey methods used for the Named-entity recognition, to choose one, implement it, verify the functionality by comparing it to an already existing system and apply it on data extracted from social media and recognize names of products and organisations. The implemented solution builds on a machine learning library named Brainy and uses its Conditional Random Fields implementation. The created system achieves similar results on the Czech Named Entity Corpus as the system we try to reproduce. The system performance for the corpus (measured in Micro F-measure strict) is 70.69 % and it scores 83.04 % for the social media data. The main benefit this thesis brings is a system able to recognise named entities and test its performance on comments from a forum focusing on telecommunication.en
dc.description.resultObhájenocs
dc.format71 s. (18 677 slov)cs
dc.format.mimetypeapplication/pdf
dc.identifier66806
dc.identifier.urihttp://hdl.handle.net/11025/23682
dc.language.isocscs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.rights.accessopenAccessen
dc.subjectrozpoznávání pojmenovaných entitcs
dc.subjectstrojové učenícs
dc.subjectsociální médiacs
dc.subject.translatednamed-entity recognitionen
dc.subject.translatedmachine learningen
dc.subject.translatedsocial mediaen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-levelNavazujícícs
dc.thesis.degree-nameIng.cs
dc.thesis.degree-programInženýrská informatikacs
dc.titleRozpoznávání názvů značek v sociálních mediíchcs
dc.title.alternativeRecognition of brands in social mediaen
dc.typediplomová prácecs
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=66806

Files

Original bundle
Showing 1 - 4 out of 4 results
No Thumbnail Available
Name:
Lukas_Witz_DP_2016.pdf
Size:
727.16 KB
Format:
Adobe Portable Document Format
Description:
Plný text práce
No Thumbnail Available
Name:
A14N0150Pposudek-op.PDF
Size:
391.14 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta práce
No Thumbnail Available
Name:
A14N0150Phodnoceni-ved.PDF
Size:
338.13 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího práce
No Thumbnail Available
Name:
A14N0150Pobhajoba.PDF
Size:
204.89 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby práce

Collections

OPEN License Selector