Automatická extrakce příspěvků z diskusních fór
Date issued
2017
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Západočeská univerzita v Plzni
Abstract
Internet je velice rychle rostoucí médium. Stává se více žádané data na něm obsažená zpracovávat automaticky. Tato práce se zabývá extrakcí informací z webových zdrojů, především z webových diskuzních fór. Pojednává o tomto oboru a zkoumá existující systémy. Následně jsou tyto poznatky aplikovány a je navrhnut systém, který tento úkol plní bez zásahu člověka. Dále jsou použity metody strojového učení a analýzy přirozeného jazyka k označení významu získaných dat.
Description
Subject(s)
diskuzní fórum, strojové učení, zpracování přirozeného jazyka, klasifikace textu, struktura webové stránky, extrakce informací, extrakce informací, strukturované zdroje informací