Text Line Segmentation in Historical Newspapers

Date issued

2022

Journal Title

Journal ISSN

Volume Title

Publisher

Springer Nature Switzerland AG

Abstract

Článek řeší problematiku segmentace textových řádek v historických novinách. Je zde navržen nový přístup, který dělí úlohu na dvě části: detekci textových bloků a detekci řádek. Tento přístup by měl odstranit nedostatky metod, které segmentaci řádek provádějí v jednom kroku. Jednotlivé podúlohy jsou řešeny s využitím plně konvolučních neuronových sítí. Metoda je vyhodnocena na dvou standardních datasetech, Europeana a RDCL 2019, a na novém korpusu, který byl vytvořen z dat dostupných na portálu Porta fontium. Tato datová sada je volně přístupná pro výzkumné účely.

Description

Subject(s)

segmentace obrazových dokumentů, analýza rozložení stránky, plně konvoluční neuronové sítě, FCN

Citation

LENC, L. MARTÍNEK, J. KRÁL, P. Text Line Segmentation in Historical Newspapers. In Artificial Intelligence and Soft Computing. Cham: Springer Nature Switzerland AG, 2022. s. 35-48. ISBN: 978-3-031-23479-8 , ISSN: 0302-9743