Historical Map Toponym Extraction for Efficient Information Retrieval

Abstract

Článek se zabývá detekcí, klasifikací a rozpoznáváním toponym v ručně kreslených historických katastrálních mapách. Toponyma jsou místní jména měst, vesnic a dalších míst, jako jsou řeky, lesy atd. Extrahovaná toponyma se používají jako klíčová slova v systému vyhledávání informací, které umožňuje inteligentní a efektivní vyhledávání v historických mapových sbírkách. Vytvořili jsme novou datovou sadu, která je volně dostupná pro výzkumné účely. Poté navrhujeme nový přístup ke klasifikaci toponym založený na deskriptoru KAZE. Dále porovnáváme a vyhodnocujeme několik nejmodernějších metod pro detekci na naší úloze detekce toponym. Na závěr prezentujeme výsledky rozpoznávání textu toponym pomocí populárního enginu Tesseract.

Description

Subject(s)

historické mapy, toponyma, detekce textu, optické rozpoznávání znaků, vyhledávání informací, plně konvoluční neuronové sítě

Citation

LENC, L. MARTÍNEK, J. BALOUN, J. PRANTL, M. KRÁL, P. Historical Map Toponym Extraction for Efficient Information Retrieval. In Document Analysis Systems : 15th IAPR International Workshop on Document Analysis Systems, DAS 2022. Cham: Springer, 2022. s. 171-183. ISBN: 978-3-031-06554-5 , ISSN: 0302-9743