Historical Map Understanding Using End-to-end Methods
Date issued
2025
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Springer
Abstract
The main goal of this work is to detect and recognize so-called nomenclatures, text information composed of several components that specify the position of a map sheet in the coordinate system. This information will then be used to create a large seamless map, allowing for better online presentation. The main contribution of this work is the utilization of a modern end-to-end approach and its comparison with the currently used two-step approach combining text detection and OCR techniques. We chose a visual document understanding model, concretely Donut, for our experiments. The results prove that such models can be successfully trained for our task and outperform the traditional methods.
Hlavním cílem práce je detekce a rozpoznání tzv. nomenklatur. Nomenklatury jsou textové informace sestávající z několika částí, které udávají pozici mapového listu v systému souřadnic. Získané informace budou využity k tvorbě bezešvé mapy, která umožní lepší online prezentaci a usnadní vyhledávání. V rámci práce byla využita moderní tzv. end-to-end metoda a byla porovnána se stávajícím přístupem, který nejprve detekuje nomenklaturu a pak provede rozpoznání znaků pomocí OCR technik. Využili jsme model pro porozumění vizuálním dokumentům, konkrétně Donut. Výsledky ukazují, že modely tohoto typu mohou být úspěšně natrénovany a nasazeny pro tuto úlohu a dokáží překonat tradiční metody.
Hlavním cílem práce je detekce a rozpoznání tzv. nomenklatur. Nomenklatury jsou textové informace sestávající z několika částí, které udávají pozici mapového listu v systému souřadnic. Získané informace budou využity k tvorbě bezešvé mapy, která umožní lepší online prezentaci a usnadní vyhledávání. V rámci práce byla využita moderní tzv. end-to-end metoda a byla porovnána se stávajícím přístupem, který nejprve detekuje nomenklaturu a pak provede rozpoznání znaků pomocí OCR technik. Využili jsme model pro porozumění vizuálním dokumentům, konkrétně Donut. Výsledky ukazují, že modely tohoto typu mohou být úspěšně natrénovany a nasazeny pro tuto úlohu a dokáží překonat tradiční metody.
Description
Subject(s)
historical maps, visual document understanding, text recognition, Donut, historické mapy, porozumění vizuálním dokumentům, rozpoznávání textu, Donut