ChronSeg: Novel dataset for segmentation of handwritten historical chronicles

dc.contributor.authorBaloun, Josef
dc.contributor.authorKrál, Pavel
dc.contributor.authorLenc, Ladislav
dc.date.accessioned2021-10-04T10:00:11Z
dc.date.available2021-10-04T10:00:11Z
dc.date.issued2021
dc.description.abstractSegmentace obrázků dokumentů hraje důležitou roli v procesu elektronického zpřístupnění jejich obsahu. Tato práce se zaměřuje na segmentaci historických ručně psaných dokumentů, zejména kronik. V úvahu jsou brány třídy obrázek, text a pozadí. Za tímto účelem je nový datový soubor vytvořen hlavně z kronik poskytovaných Porta fontium. Celkově se datová sada skládá z 58 obrázků stránek dokumentů a jejich přesných anotací pro textové, obrazové a grafické oblasti ve formátu PAGE. Anotace je také k dispozici na úrovni pixelů. Dále je uvedeno řešení a vyhodnocení přístupu založeného na plně konvoluční neuronové síti. Součástí je řada experimentů včetně nové metody rozšiřování dat v podobě umělých stránek.cs
dc.description.abstract-translatedThe segmentation of document images plays an important role in the process of making their content electronically accessible. This work focuses on the segmentation of historical handwritten documents, namely chronicles. We take image, text and background classes into account. For this goal, a new dataset is created mainly from chronicles provided by Porta fontium. In total, the dataset consists of 58 images of document pages and their precise annotations for text, image and graphic regions in PAGE format. The annotations are also provided at a pixel level. Further, we present a baseline evaluation using an approach based on a fully convolutional neural network. We also perform a series of experiments in order to identify the best method configuration. It includes a novel data augmentation method which creates artificial pages.en
dc.format9 s.cs
dc.format.mimetypeapplication/pdf
dc.identifier.citationBALOUN, J. KRÁL, P. LENC, L. ChronSeg: Novel dataset for segmentation of handwritten historical chronicles. In ICAART 2021 - Proceedings of the 13th International Conference on Agents and Artificial Intelligence. Setúbal: ScitePress, 2021. s. 314-322. ISBN: 978-989-758-484-8 , ISSN: 2184-433Xcs
dc.identifier.document-number661455800031
dc.identifier.doi10.5220/0010317203140322
dc.identifier.isbn978-989-758-484-8
dc.identifier.issn2184-433X
dc.identifier.obd43933096
dc.identifier.uri2-s2.0-85103813721
dc.identifier.urihttp://hdl.handle.net/11025/45427
dc.language.isoenen
dc.publisherScitePressen
dc.relation.ispartofseriesICAART 2021 - Proceedings of the 13th International Conference on Agents and Artificial Intelligenceen
dc.rightsPlný text není přístupný.cs
dc.rights.accessclosedAccessen
dc.subjectSegmentace strancs
dc.subjectdatová sadacs
dc.subjecthistorický dokumentcs
dc.subjectkronikacs
dc.subjectobrázekcs
dc.subjecttextcs
dc.subjectpozadícs
dc.subjectplně konvoluční neuronová síťcs
dc.subjectumělá stranacs
dc.subjectklasifikace pixelůcs
dc.subject.translatedPage Segmentationen
dc.subject.translatedDataseten
dc.subject.translatedChronicleen
dc.subject.translatedHistorical Documenten
dc.subject.translatedImageen
dc.subject.translatedTexten
dc.subject.translatedBackgrounden
dc.subject.translatedFully Convolutional Neural Networken
dc.subject.translatedPixel Labelingen
dc.subject.translatedArtificial Pageen
dc.titleChronSeg: Novel dataset for segmentation of handwritten historical chroniclesen
dc.title.alternativeChronSeg: Nová datová sada pro segmentaci ručně psaných historických kronikcs
dc.typekonferenční příspěvekcs
dc.typeConferenceObjecten
dc.type.statusPeer-revieweden
dc.type.versionpublishedVersionen

Files