Historical Map Understanding Using End-to-end Methods

Date issued

2025

Journal Title

Journal ISSN

Volume Title

Publisher

Springer

Abstract

The main goal of this work is to detect and recognize so-called nomenclatures, text information composed of several components that specify the position of a map sheet in the coordinate system. This information will then be used to create a large seamless map, allowing for better online presentation. The main contribution of this work is the utilization of a modern end-to-end approach and its comparison with the currently used two-step approach combining text detection and OCR techniques. We chose a visual document understanding model, concretely Donut, for our experiments. The results prove that such models can be successfully trained for our task and outperform the traditional methods.
Hlavním cílem práce je detekce a rozpoznání tzv. nomenklatur. Nomenklatury jsou textové informace sestávající z několika částí, které udávají pozici mapového listu v systému souřadnic. Získané informace budou využity k tvorbě bezešvé mapy, která umožní lepší online prezentaci a usnadní vyhledávání. V rámci práce byla využita moderní tzv. end-to-end metoda a byla porovnána se stávajícím přístupem, který nejprve detekuje nomenklaturu a pak provede rozpoznání znaků pomocí OCR technik. Využili jsme model pro porozumění vizuálním dokumentům, konkrétně Donut. Výsledky ukazují, že modely tohoto typu mohou být úspěšně natrénovany a nasazeny pro tuto úlohu a dokáží překonat tradiční metody.

Description

Subject(s)

historical maps, visual document understanding, text recognition, Donut, historické mapy, porozumění vizuálním dokumentům, rozpoznávání textu, Donut

Citation