Prohledávání dokumentů podle automaticky extrahovaných vzorů

dc.contributor.advisorKrál Pavel, Doc. Ing. Ph.D.
dc.contributor.authorBaloun, Josef
dc.contributor.refereeLenc Ladislav, Ing. Ph.D.
dc.date.accepted2018-6-7
dc.date.accessioned2019-03-15T10:17:46Z
dc.date.available2017-10-10
dc.date.available2019-03-15T10:17:46Z
dc.date.issued2018
dc.date.submitted2018-5-3
dc.description.abstractTato bakalářská práce se zabývá návrhem a implementací metod, které umožní vyhledávání slov v ručně psaném textu. Předpokladem je již hotová segmentace dokumentu na obrázky slov. V první části práce jsou zmapovány dostupné datové kolekce pro vyhledávání v ručně psaných textech. Následuje seznámení s možnými řešeními, mezi kterými jsou zvoleny neuronové sítě. V druhé části jsou provedeny experimenty na datové kolekci Parzival. Účelem experimentů je ověření funkčnosti metod, hledání vhodné architektury sítě a zjištění vlivu jednotlivých částí metod na výsledek. Navrženy jsou tři metody založené na neuronových sítích, které se dokáží vypořádat s rozdílnou velikostí vstupních obrázků třemi způsoby. Tyto metody jsou otestovány a porovnány na databázi Parzival, kde dosáhli výborných výsledků. Nejlep- ších výsledků 92,62 % MAP QbS a 90,01 % MAP QbE bylo dosaženo s metodou, která je založena na konvoluční neuronové síti a PHOC reprezentaci výstupního vektoru.cs
dc.description.abstract-translatedThis bachelor thesis deals with the design and implementation of methods that allow the search of handwritten words. A prerequisite is the ready segmentation of the document to the word images. In the first part of the thesis, the available data collections are mapped for searching in handwritten texts, followed by a list of possible solutions among which neural networks are selected. In the second part, experiments are performed on the Parzival data collection. The purpose of the experiments is to verify the functionality of the methods, a search for an appropriate network architecture and to determine the effect of the individual parts of the methods on the result. Three methods based on neural networks are designed to deal with the different sizes of input images in three ways. These methods are tested and compared on the Parzival database where they have achieved excellent results. The best results of 92,62 % MAP QbS and 90,01 % MAP QbE were achieved with a method based on the convolutional neural network and the PHOC representation of the output vector.en
dc.description.resultObhájenocs
dc.format54 s.cs
dc.format.mimetypeapplication/pdf
dc.identifier75853
dc.identifier.urihttp://hdl.handle.net/11025/32259
dc.language.isocscs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.rights.accessopenAccessen
dc.subjectvyhledávání slovcs
dc.subjectručně psané dokumentycs
dc.subjectdatabáze parzivalcs
dc.subjectneuronová síťcs
dc.subjectkonvoluční neuronová síťcs
dc.subjectphoc vektorcs
dc.subjectspatial pyramid poolingcs
dc.subjectkonvoluční lstmcs
dc.subjectexperimentcs
dc.subjectmean average precisioncs
dc.subject.translatedword spottingen
dc.subject.translatedhandwritten documentsen
dc.subject.translatedparzival databaseen
dc.subject.translatedneural networken
dc.subject.translatedconvolutional neural networken
dc.subject.translatedphoc vectoren
dc.subject.translatedspatial pyramid poolingen
dc.subject.translatedconvolutional lstmen
dc.subject.translatedexperimenten
dc.subject.translatedmean average precisionen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-levelBakalářskýcs
dc.thesis.degree-nameBc.cs
dc.thesis.degree-programInženýrská informatikacs
dc.titleProhledávání dokumentů podle automaticky extrahovaných vzorůcs
dc.title.alternativeDocument retrieval using automaticaly extracted patternsen
dc.typebakalářská prácecs
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=75853

Files

Original bundle
Showing 1 - 4 out of 4 results
No Thumbnail Available
Name:
balounj_bakalarka.pdf
Size:
2.93 MB
Format:
Adobe Portable Document Format
Description:
Plný text práce
No Thumbnail Available
Name:
A15B0005P posudek.pdf
Size:
277.82 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta práce
No Thumbnail Available
Name:
A15B0005P hodnoceni.pdf
Size:
167.88 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího práce
No Thumbnail Available
Name:
A15B0005P obhajoba.pdf
Size:
84.08 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby práce