Segmentace historických obrazových dokumentů

Date issued

2019

Journal Title

Journal ISSN

Volume Title

Publisher

Západočeská univerzita v Plzni

Abstract

Správná segmentace obrazových dokumentů je jednou z nejdůležitějších součástí OCR systémů. Během ní jsou v obrázcích automaticky označovány oblasti zájmu, jako jsou například textové bloky, řádky textů, oddělovací čáry a jiné. Historické obrazové dokumenty jsou často různě deformované, obsahují šum a mají nepravidelnou strukturu a tak je úspěšná segmentace těchto dokumentů velkou výzvou. V rámci diplomové práce byly prozkoumány možné přístupy k segmentaci historických dokumentů a po následné analýze byly použity plně konvoluční neuronové sítě ARU-Net, U-Net a její úprava. Dále se práce věnuje tvorbě datové sady, zejména pak vytvoření očekávaných výsledků segmentace a nástrojům pro jejich vytvoření. Na základě dosažených výsledků modelů na této datové sadě je pro označování textu vybrána síť upravený U-Net, pro nalezení oddělovacích čar a pro označení řádků textu síť ARU-Net. Spojením výsledků jednotlivých sítí a jejich následným zpracováním byl vytvořen program, který ve vstupním obrázku detekuje a vyřezává řádky textu a to tak, aby bylo zachováno pořadí čtení. Takto získané řádky jsou vhodné pro další zpracování OCR.

Description

Subject(s)

segmentace, historické dokumenty, konvoluční neuronové sítě

Citation

Collections

OPEN License Selector