ChronSeg: Novel dataset for segmentation of handwritten historical chronicles

Date issued

2021

Journal Title

Journal ISSN

Volume Title

Publisher

ScitePress

Abstract

Segmentace obrázků dokumentů hraje důležitou roli v procesu elektronického zpřístupnění jejich obsahu. Tato práce se zaměřuje na segmentaci historických ručně psaných dokumentů, zejména kronik. V úvahu jsou brány třídy obrázek, text a pozadí. Za tímto účelem je nový datový soubor vytvořen hlavně z kronik poskytovaných Porta fontium. Celkově se datová sada skládá z 58 obrázků stránek dokumentů a jejich přesných anotací pro textové, obrazové a grafické oblasti ve formátu PAGE. Anotace je také k dispozici na úrovni pixelů. Dále je uvedeno řešení a vyhodnocení přístupu založeného na plně konvoluční neuronové síti. Součástí je řada experimentů včetně nové metody rozšiřování dat v podobě umělých stránek.

Description

Subject(s)

Segmentace stran, datová sada, historický dokument, kronika, obrázek, text, pozadí, plně konvoluční neuronová síť, umělá strana, klasifikace pixelů

Citation

BALOUN, J. KRÁL, P. LENC, L. ChronSeg: Novel dataset for segmentation of handwritten historical chronicles. In ICAART 2021 - Proceedings of the 13th International Conference on Agents and Artificial Intelligence. Setúbal: ScitePress, 2021. s. 314-322. ISBN: 978-989-758-484-8 , ISSN: 2184-433X