Training Strategies for OCR Systems for Historical Documents
Date issued
2019
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Blackwell Publishing
Abstract
Tento článek prezentuje přehled trénovacích strategií pro systém optického rozpoznávání znaků v historických dokumentech. Hlavní problém je kvalita anotovaných dat a jejich nedostatek. Dále shrneme několik způsobů vytváření syntetických dat. Hlavním úkolem článku je ukázat a porovnat různé možnosti kombinace syntetických a anotovaných dat pro trénování konvoluční rekurentní neuronové sítě.
Description
Subject(s)
Konvoluční neuronová sí, , historické dokumenty, Long Short-Term Memory, Neuronová síť, optické rozpoznávání znaků, syntetická data
Citation
HRUDA, L., DVOŘÁK, J., VÁŠA, L. On evaluating consensus in RANSAC surface registration. Computer Graphics Forum, 2019, roč. 38, č. 5, s. 175-186. ISSN 1467-8659.