Semantic Segmentation of Historical Documents via Fully-Convolutional Neural Network

Date issued

2019

Journal Title

Journal ISSN

Volume Title

Publisher

Springer

Abstract

Tento článek prezentuje metodu semantické segmentace znaků ve full-textových dokumentů z období poválečného Československa. Naneštěstí, standardní OCR algoritmy mají problémy s přesným čtením těchto dokumentů vzhledem k jejich zašumění. Z tohoto důvodu jsme se rozhodli vyvinout metodu, která by zlepšila tyto nespokojivé výsledky. Náš přístup, inspirován U-Net architekturou, je založen na plně-konvolučních neuronových sítích. Využíváme generátor syntetických obrázků pro získání trénovacího setu pro naši metodu. Dosáhli jsme přesnosti rozpoznávání 99.53% pro tato syntetická data. Pro reálná data jsou poskytnuty kvalitativní výsledky.

Description

Subject(s)

rozpoznávání znaků, segmentace, OCR, strojové učení, generování obrázků, počítačové vidění

Citation

GRUBER, I.., HLAVÁČ, M.., HRÚZ, M.., ŽELEZNÝ, M.. Semantic Segmentation of Historical Documents via Fully-Convolutional Neural Network. In Speech and Computer, 21st International Conference, SPECOM 2019, Istanbul, turkey, August 20-25,2019, Proceedings. Cham: Springer, 2019. s. 142-149. ISBN 978-3-030-26060-6 , ISSN 0302-9743.
OPEN License Selector