Prohledávání dokumentů podle automaticky extrahovaných vzorů
Date issued
2018
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Západočeská univerzita v Plzni
Abstract
Tato bakalářská práce se zabývá návrhem a implementací metod, které
umožní vyhledávání slov v ručně psaném textu. Předpokladem je již hotová
segmentace dokumentu na obrázky slov. V první části práce jsou zmapovány
dostupné datové kolekce pro vyhledávání v ručně psaných textech. Následuje
seznámení s možnými řešeními, mezi kterými jsou zvoleny neuronové sítě.
V druhé části jsou provedeny experimenty na datové kolekci Parzival. Účelem
experimentů je ověření funkčnosti metod, hledání vhodné architektury
sítě a zjištění vlivu jednotlivých částí metod na výsledek. Navrženy jsou tři
metody založené na neuronových sítích, které se dokáží vypořádat s rozdílnou
velikostí vstupních obrázků třemi způsoby. Tyto metody jsou otestovány
a porovnány na databázi Parzival, kde dosáhli výborných výsledků. Nejlep-
ších výsledků 92,62 % MAP QbS a 90,01 % MAP QbE bylo dosaženo s metodou,
která je založena na konvoluční neuronové síti a PHOC reprezentaci
výstupního vektoru.
Description
Subject(s)
vyhledávání slov, ručně psané dokumenty, databáze parzival, neuronová síť, konvoluční neuronová síť, phoc vektor, spatial pyramid pooling, konvoluční lstm, experiment, mean average precision