Training Strategies for OCR Systems for Historical Documents

Date issued

2019

Journal Title

Journal ISSN

Volume Title

Publisher

Blackwell Publishing

Abstract

Tento článek prezentuje přehled trénovacích strategií pro systém optického rozpoznávání znaků v historických dokumentech. Hlavní problém je kvalita anotovaných dat a jejich nedostatek. Dále shrneme několik způsobů vytváření syntetických dat. Hlavním úkolem článku je ukázat a porovnat různé možnosti kombinace syntetických a anotovaných dat pro trénování konvoluční rekurentní neuronové sítě.

Description

Subject(s)

Konvoluční neuronová sí, , historické dokumenty, Long Short-Term Memory, Neuronová síť, optické rozpoznávání znaků, syntetická data

Citation

HRUDA, L., DVOŘÁK, J., VÁŠA, L. On evaluating consensus in RANSAC surface registration. Computer Graphics Forum, 2019, roč. 38, č. 5, s. 175-186. ISSN 1467-8659.