Historical Map Toponym Extraction for Efficient Information Retrieval

dc.contributor.authorLenc, Ladislav
dc.contributor.authorMartínek, Jiří
dc.contributor.authorBaloun, Josef
dc.contributor.authorPrantl, Martin
dc.contributor.authorKrál, Pavel
dc.date.accessioned2023-03-06T11:00:25Z
dc.date.available2023-03-06T11:00:25Z
dc.date.issued2022
dc.description.abstractČlánek se zabývá detekcí, klasifikací a rozpoznáváním toponym v ručně kreslených historických katastrálních mapách. Toponyma jsou místní jména měst, vesnic a dalších míst, jako jsou řeky, lesy atd. Extrahovaná toponyma se používají jako klíčová slova v systému vyhledávání informací, které umožňuje inteligentní a efektivní vyhledávání v historických mapových sbírkách. Vytvořili jsme novou datovou sadu, která je volně dostupná pro výzkumné účely. Poté navrhujeme nový přístup ke klasifikaci toponym založený na deskriptoru KAZE. Dále porovnáváme a vyhodnocujeme několik nejmodernějších metod pro detekci na naší úloze detekce toponym. Na závěr prezentujeme výsledky rozpoznávání textu toponym pomocí populárního enginu Tesseract.cs
dc.description.abstract-translatedThe paper deals with detection, classification and recognition of toponyms in hand-drawn historical cadastral maps. Toponyms are local names of towns, villages and landscape features such as rivers, forests etc. The detected and recognized toponyms are utilized as keywords in an information retrieval system that allows intelligent and efficient searching in historical map collections. We create a novel annotated dataset that is freely available for research and educational purposes. Then, we propose a novel approach for toponym classification based on KAZE descriptor. Next we compare and evaluate several state-of-the-art methods for text and object detection on our toponym detection task. We further show the results of toponym text recognition using popular Tesseract engine.en
dc.format13 s.cs
dc.format.mimetypeapplication/pdf
dc.identifier.citationLENC, L. MARTÍNEK, J. BALOUN, J. PRANTL, M. KRÁL, P. Historical Map Toponym Extraction for Efficient Information Retrieval. In Document Analysis Systems : 15th IAPR International Workshop on Document Analysis Systems, DAS 2022. Cham: Springer, 2022. s. 171-183. ISBN: 978-3-031-06554-5 , ISSN: 0302-9743cs
dc.identifier.document-number870314500012
dc.identifier.doi10.1007/978-3-031-06555-2_12
dc.identifier.isbn978-3-031-06554-5
dc.identifier.issn0302-9743
dc.identifier.obd43936496
dc.identifier.uri2-s2.0-85131115206
dc.identifier.urihttp://hdl.handle.net/11025/51648
dc.language.isoenen
dc.project.IDSGS-2022-016/Pokročilé metody zpracování a analýzy datcs
dc.project.IDEF17_048/0007267/InteCom: VaV inteligentních komponent pokročilých technologií pro plzeňskou metropolitní oblastcs
dc.publisherSpringeren
dc.relation.ispartofseriesDocument Analysis Systems : 15th IAPR International Workshop on Document Analysis Systems, DAS 2022en
dc.rightsPlný text je přístupný v rámci univerzity přihlášeným uživatelůmcs
dc.rights© Springer Nature Switzerland AGen
dc.rights.accessrestrictedAccessen
dc.subjecthistorické mapycs
dc.subjecttoponymacs
dc.subjectdetekce textucs
dc.subjectoptické rozpoznávání znakůcs
dc.subjectvyhledávání informacícs
dc.subjectplně konvoluční neuronové sítěcs
dc.subject.translatedHistorical mapsen
dc.subject.translatedToponymsen
dc.subject.translatedText detectionen
dc.subject.translatedOCRen
dc.subject.translatedIRen
dc.subject.translatedFCNen
dc.titleHistorical Map Toponym Extraction for Efficient Information Retrievalen
dc.title.alternativeExtrakce toponym z historických map pro efektivní vyhledávání informacícs
dc.typekonferenční příspěvekcs
dc.typeConferenceObjecten
dc.type.statusPeer-revieweden
dc.type.versionpublishedVersionen

Files

Original bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
DAS_clanek_ve_sborniku.pdf
Size:
2.11 MB
Format:
Adobe Portable Document Format