Segmentace stran rukopisných dokumentů
Date issued
2020
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Západočeská univerzita v Plzni
Abstract
Analýza stran dokumentů hraje významnou roli v procesu jejich elektronického zpřístupnění. Dokonce i v současné době může představovat nelehkou
výzvu pro historické ručně psané dokumenty vzhledem k jejich různorodé
struktuře a možné degradaci kvality. V rámci této práce je vypracován přehled možných metod pro řešení tohoto problému a vytvořena datová sada
složená ze stran ručně psaných kronik. Dále je navržen prototyp systému
pro analýzu stran dokumentů. Segmentace a klasifikace do tříd text, obrázek
a pozadí jsou řešeny označením každého obrazového bodu strany dokumentu
vhodnou třídou. Základem prototypu je plně konvoluční neuronová síť založená na síti U-Net. Nejlepších výsledků bylo dosaženo s prototypem, pro
který bylo nastaveno zpracování celých stran dokumentů, bylo provedeno
váhování chybové funkce a byla automaticky rozšířena trénovací množina.
Description
Subject(s)
segmentace, analýza rozvržení, strana, dokument, ručně psané, kronika