Prohledávání dokumentů podle automaticky extrahovaných vzorů

dc.contributor.authorBaloun, Josef
dc.contributor.editorRendl, Jan
dc.date.accessioned2018-07-24T12:15:07Z
dc.date.available2018-07-24T12:15:07Z
dc.date.issued2018
dc.description.abstractProhledávání dokumentů podle automaticky extrahovaných vzorů je problém z oblasti information retrieval. Lze ho také nalézt pod pojmy jako rozpoznávání nebo vyhledávání slov v ručně psyných dokumentech. V anglické literatuře je nejčastěji použit termín word spotting. Toto prohledávání je děleno podle vstupního kritéria, kterým může být obrazový vzor (dále jako QbE) nebo textový řetězec (dále jako QbS). Při prohledávání se snažíme na základě vstupního kritéria nalézt obrázky s odpovídajícím slovem. Úspěšné vyřešení by usnadnilo práci např. v situaci, kdy má historik najít v kronice, která obsahuje 1 000 stran textu, všechny zmínky o klášteře v Teplé. Cílem této práce je návrh a implementace metod, které umožní vyhledávání těchto slov. Předpokladem je předem provedená segmentace dokumentu na obrázky slov. K dosažení tohoto cíle jsou použity neuronové sítě.cs
dc.description.sponsorshipTato práce vznikla za podpory projektů CERIT Scientific Cloud (LM2015085) a CESNET_ (LM2015042) financovaných z programu MŠMT Projekty velkých infrastruktur pro VaVaI.cs
dc.format2 s.cs
dc.format.mimetypeapplication/pdf
dc.identifier.citationRENDL, Jan ed. Studentská vědecká konference: bakalářské studijní programy, sborník rozšířených abstraktů, květen 2019, Plzeň. Plzeň: Západočeská univerzita v Plzni, 2018, s. 27-28. ISBN 978-80-261-0789-7.cs
dc.identifier.isbn978-80-261-0789-7
dc.identifier.urihttp://hdl.handle.net/11025/29856
dc.identifier.urisvk.fav.zcu.cz/download/sbornik_svkb_2018.pdf
dc.language.isocscs
dc.publisherZápadočeská univerzita v Plznics
dc.rights© Západočeská univerzita v Plznics
dc.rights.accessopenAccessen
dc.subjectvyhledávání informacícs
dc.subjectoptické rozpoznávání znakůcs
dc.subjectneuronové sítěcs
dc.subjecthistorické dokumentycs
dc.subject.translatedinformation retrievalen
dc.subject.translatedoptical character recognitionen
dc.subject.translatedneural networksen
dc.subject.translatedhistorical documentsen
dc.titleProhledávání dokumentů podle automaticky extrahovaných vzorůcs
dc.typekonferenční příspěvekcs
dc.typeconferenceObjecten
dc.type.statusPeer-revieweden
dc.type.versionpublishedVersionen

Files

Original bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
Baloun1.pdf
Size:
202.13 KB
Format:
Adobe Portable Document Format
Description:
Plný text
License bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: