Prohledávání dokumentů podle automaticky extrahovaných vzorů

Baloun, Josef

Prohledávání dokumentů podle automaticky extrahovaných vzorů

Files

Baloun1.pdf (202.13 KB)

Date issued

2018

Authors

Baloun, Josef

Publisher

Západočeská univerzita v Plzni

Abstract

Prohledávání dokumentů podle automaticky extrahovaných vzorů je problém z oblasti information retrieval. Lze ho také nalézt pod pojmy jako rozpoznávání nebo vyhledávání slov v ručně psyných dokumentech. V anglické literatuře je nejčastěji použit termín word spotting. Toto prohledávání je děleno podle vstupního kritéria, kterým může být obrazový vzor (dále jako QbE) nebo textový řetězec (dále jako QbS). Při prohledávání se snažíme na základě vstupního kritéria nalézt obrázky s odpovídajícím slovem. Úspěšné vyřešení by usnadnilo práci např. v situaci, kdy má historik najít v kronice, která obsahuje 1 000 stran textu, všechny zmínky o klášteře v Teplé. Cílem této práce je návrh a implementace metod, které umožní vyhledávání těchto slov. Předpokladem je předem provedená segmentace dokumentu na obrázky slov. K dosažení tohoto cíle jsou použity neuronové sítě.

Subject(s)

vyhledávání informací, optické rozpoznávání znaků, neuronové sítě, historické dokumenty

Citation

RENDL, Jan ed. Studentská vědecká konference: bakalářské studijní programy, sborník rozšířených abstraktů, květen 2019, Plzeň. Plzeň: Západočeská univerzita v Plzni, 2018, s. 27-28. ISBN 978-80-261-0789-7.

Item identifier

http://hdl.handle.net/11025/29856
https://doi.org/svk.fav.zcu.cz/download/sbornik_svkb_2018.pdf

Collections

Studentská vědecká konference 2018-bakalářské studijní programy
Studentská vědecká konference 2018-bakalářské studijní programy

Show full item record

Prohledávání dokumentů podle automaticky extrahovaných vzorů

Files

Date issued

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Description

Subject(s)

Citation

Item identifier

Collections