Text Line Segmentation in Historical Newspapers
Date issued
2022
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Springer Nature Switzerland AG
Abstract
Článek řeší problematiku segmentace textových řádek v historických novinách. Je zde navržen nový přístup, který dělí úlohu na dvě části: detekci textových bloků a detekci řádek. Tento přístup by měl odstranit nedostatky metod, které segmentaci řádek provádějí v jednom kroku. Jednotlivé podúlohy jsou řešeny s využitím plně konvolučních neuronových sítí. Metoda je vyhodnocena na dvou standardních datasetech, Europeana a RDCL 2019, a na novém korpusu, který byl vytvořen z dat dostupných na portálu Porta fontium. Tato datová sada je volně přístupná pro výzkumné účely.
Description
Subject(s)
segmentace obrazových dokumentů, analýza rozložení stránky, plně konvoluční neuronové sítě, FCN
Citation
LENC, L. MARTÍNEK, J. KRÁL, P. Text Line Segmentation in Historical Newspapers. In Artificial Intelligence and Soft Computing. Cham: Springer Nature Switzerland AG, 2022. s. 35-48. ISBN: 978-3-031-23479-8 , ISSN: 0302-9743