Segmentace stran rukopisných dokumentů

dc.contributor.advisorKrál Pavel, Doc. Ing. Ph.D.
dc.contributor.authorBaloun, Josef
dc.contributor.refereeLenc Ladislav, Ing. Ph.D.
dc.date.accepted2020-6-22
dc.date.accessioned2020-11-10T00:38:40Z
dc.date.available2019-9-11
dc.date.available2020-11-10T00:38:40Z
dc.date.issued2020
dc.date.submitted2020-5-20
dc.description.abstractAnalýza stran dokumentů hraje významnou roli v procesu jejich elektronického zpřístupnění. Dokonce i v současné době může představovat nelehkou výzvu pro historické ručně psané dokumenty vzhledem k jejich různorodé struktuře a možné degradaci kvality. V rámci této práce je vypracován přehled možných metod pro řešení tohoto problému a vytvořena datová sada složená ze stran ručně psaných kronik. Dále je navržen prototyp systému pro analýzu stran dokumentů. Segmentace a klasifikace do tříd text, obrázek a pozadí jsou řešeny označením každého obrazového bodu strany dokumentu vhodnou třídou. Základem prototypu je plně konvoluční neuronová síť založená na síti U-Net. Nejlepších výsledků bylo dosaženo s prototypem, pro který bylo nastaveno zpracování celých stran dokumentů, bylo provedeno váhování chybové funkce a byla automaticky rozšířena trénovací množina.cs
dc.description.abstract-translatedPage layout analysis plays an important role in the process of document retrieval. It can still be a challenging task for historical handwritten documents due to their diverse structure and possible quality degradation. In this thesis, an overview of possible methods for solving this problem is presented and a dataset composed of the pages of handwritten chronicles is created. This thesis also presents a prototype of the system for page layout analysis. The segmentation and classification into text, image and background classes are solved as a pixel-labeling problem. The prototype is based on a fully convolutional neural network inspired by U-Net. The best results were achieved when the prototype was set to the processing of entire pages of documents, the loss function was weighted and the training set was automatically augmented.en
dc.description.resultObhájenocs
dc.format78 s.cs
dc.format.mimetypeapplication/pdf
dc.identifier82453
dc.identifier.urihttp://hdl.handle.net/11025/41748
dc.language.isocscs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.rights.accessopenAccessen
dc.subjectsegmentacecs
dc.subjectanalýza rozvrženícs
dc.subjectstranacs
dc.subjectdokumentcs
dc.subjectručně psanécs
dc.subjectkronikacs
dc.subject.translatedsegmentationen
dc.subject.translatedlayout analysisen
dc.subject.translatedpageen
dc.subject.translateddocumenten
dc.subject.translatedhandwrittenen
dc.subject.translatedchronicleen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-levelNavazujícícs
dc.thesis.degree-nameIng.cs
dc.thesis.degree-programInženýrská informatikacs
dc.titleSegmentace stran rukopisných dokumentůcs
dc.title.alternativePage Segmentation of Handwritten Documentsen
dc.typediplomová prácecs
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=82453

Files

Original bundle
Showing 1 - 4 out of 4 results
No Thumbnail Available
Name:
Baloun_Josef_2020_DP.pdf
Size:
36.92 MB
Format:
Adobe Portable Document Format
Description:
Plný text práce
No Thumbnail Available
Name:
A18N0044Pposudek-op.PDF
Size:
552.29 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta práce
No Thumbnail Available
Name:
A18N0044Phodnoceni-ved.pdf
Size:
40.98 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího práce
No Thumbnail Available
Name:
A18N0044Pobhajoba.PDF
Size:
386.02 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby práce

Collections

OPEN License Selector