ChronSeg: Novel dataset for segmentation of handwritten historical chronicles
Date issued
2021
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
ScitePress
Abstract
Segmentace obrázků dokumentů hraje důležitou roli v procesu elektronického zpřístupnění jejich obsahu. Tato práce se zaměřuje na segmentaci historických ručně psaných dokumentů, zejména kronik. V úvahu jsou brány třídy obrázek, text a pozadí. Za tímto účelem je nový datový soubor vytvořen hlavně z kronik poskytovaných Porta fontium. Celkově se datová sada skládá z 58 obrázků stránek dokumentů a jejich přesných anotací pro textové, obrazové a grafické oblasti ve formátu PAGE. Anotace je také k dispozici na úrovni pixelů. Dále je uvedeno řešení a vyhodnocení přístupu založeného na plně konvoluční neuronové síti. Součástí je řada experimentů včetně nové metody rozšiřování dat v podobě umělých stránek.
Description
Subject(s)
Segmentace stran, datová sada, historický dokument, kronika, obrázek, text, pozadí, plně konvoluční neuronová síť, umělá strana, klasifikace pixelů
Citation
BALOUN, J. KRÁL, P. LENC, L. ChronSeg: Novel dataset for segmentation of handwritten historical chronicles. In ICAART 2021 - Proceedings of the 13th International Conference on Agents and Artificial Intelligence. Setúbal: ScitePress, 2021. s. 314-322. ISBN: 978-989-758-484-8 , ISSN: 2184-433X