ChronSeg: Novel dataset for segmentation of handwritten historical chronicles
| dc.contributor.author | Baloun, Josef | |
| dc.contributor.author | Král, Pavel | |
| dc.contributor.author | Lenc, Ladislav | |
| dc.date.accessioned | 2021-10-04T10:00:11Z | |
| dc.date.available | 2021-10-04T10:00:11Z | |
| dc.date.issued | 2021 | |
| dc.description.abstract | Segmentace obrázků dokumentů hraje důležitou roli v procesu elektronického zpřístupnění jejich obsahu. Tato práce se zaměřuje na segmentaci historických ručně psaných dokumentů, zejména kronik. V úvahu jsou brány třídy obrázek, text a pozadí. Za tímto účelem je nový datový soubor vytvořen hlavně z kronik poskytovaných Porta fontium. Celkově se datová sada skládá z 58 obrázků stránek dokumentů a jejich přesných anotací pro textové, obrazové a grafické oblasti ve formátu PAGE. Anotace je také k dispozici na úrovni pixelů. Dále je uvedeno řešení a vyhodnocení přístupu založeného na plně konvoluční neuronové síti. Součástí je řada experimentů včetně nové metody rozšiřování dat v podobě umělých stránek. | cs |
| dc.description.abstract-translated | The segmentation of document images plays an important role in the process of making their content electronically accessible. This work focuses on the segmentation of historical handwritten documents, namely chronicles. We take image, text and background classes into account. For this goal, a new dataset is created mainly from chronicles provided by Porta fontium. In total, the dataset consists of 58 images of document pages and their precise annotations for text, image and graphic regions in PAGE format. The annotations are also provided at a pixel level. Further, we present a baseline evaluation using an approach based on a fully convolutional neural network. We also perform a series of experiments in order to identify the best method configuration. It includes a novel data augmentation method which creates artificial pages. | en |
| dc.format | 9 s. | cs |
| dc.format.mimetype | application/pdf | |
| dc.identifier.citation | BALOUN, J. KRÁL, P. LENC, L. ChronSeg: Novel dataset for segmentation of handwritten historical chronicles. In ICAART 2021 - Proceedings of the 13th International Conference on Agents and Artificial Intelligence. Setúbal: ScitePress, 2021. s. 314-322. ISBN: 978-989-758-484-8 , ISSN: 2184-433X | cs |
| dc.identifier.document-number | 661455800031 | |
| dc.identifier.doi | 10.5220/0010317203140322 | |
| dc.identifier.isbn | 978-989-758-484-8 | |
| dc.identifier.issn | 2184-433X | |
| dc.identifier.obd | 43933096 | |
| dc.identifier.uri | 2-s2.0-85103813721 | |
| dc.identifier.uri | http://hdl.handle.net/11025/45427 | |
| dc.language.iso | en | en |
| dc.publisher | ScitePress | en |
| dc.relation.ispartofseries | ICAART 2021 - Proceedings of the 13th International Conference on Agents and Artificial Intelligence | en |
| dc.rights | Plný text není přístupný. | cs |
| dc.rights.access | closedAccess | en |
| dc.subject | Segmentace stran | cs |
| dc.subject | datová sada | cs |
| dc.subject | historický dokument | cs |
| dc.subject | kronika | cs |
| dc.subject | obrázek | cs |
| dc.subject | text | cs |
| dc.subject | pozadí | cs |
| dc.subject | plně konvoluční neuronová síť | cs |
| dc.subject | umělá strana | cs |
| dc.subject | klasifikace pixelů | cs |
| dc.subject.translated | Page Segmentation | en |
| dc.subject.translated | Dataset | en |
| dc.subject.translated | Chronicle | en |
| dc.subject.translated | Historical Document | en |
| dc.subject.translated | Image | en |
| dc.subject.translated | Text | en |
| dc.subject.translated | Background | en |
| dc.subject.translated | Fully Convolutional Neural Network | en |
| dc.subject.translated | Pixel Labeling | en |
| dc.subject.translated | Artificial Page | en |
| dc.title | ChronSeg: Novel dataset for segmentation of handwritten historical chronicles | en |
| dc.title.alternative | ChronSeg: Nová datová sada pro segmentaci ručně psaných historických kronik | cs |
| dc.type | konferenční příspěvek | cs |
| dc.type | ConferenceObject | en |
| dc.type.status | Peer-reviewed | en |
| dc.type.version | publishedVersion | en |