Analýza a segmentace historických obrazových dokumentů

dc.contributor.advisorLenc Ladislav, Ing. Ph.D.
dc.contributor.authorTreml, Filip
dc.contributor.refereeKrál Pavel, Doc. Ing. Ph.D.
dc.date.accepted2022-6-14
dc.date.accessioned2022-07-25T22:31:02Z
dc.date.available2019-10-7
dc.date.available2022-07-25T22:31:02Z
dc.date.issued2022
dc.date.submitted2020-5-7
dc.description.abstractProces segmentace historických obrazových dokumentů je klíčový pro jejich následné převedení do textové podoby. Cílem segmentačního procesu je nalezení oblastí, které obsahují text a jejich uložení do PAGE xml, obsahující veškeré důležité informace o konkrétní stránce dokumentu. Segmentační proces je složen z mnoha kroků. S využitím plně propojených konvolučních neuronových sítí UNet a AruNet, vytvoříme predikované masky oblastí zájmu a oddělovačů jednotlivých částí. V rámci bakalářské práce budou provedeny experimenty s cílem nalézt vhodné parametry neuronových sítí. Dále bude implementováno rozšíření, které umožní odlišit typy textových oblastí a také lépe oddělit jednotlivé odstavce.cs
dc.description.abstract-translatedSegmentation process of historical document images is important for their conversion into text form. The goal of segmentation process is find areas containing text and save them into a PAGE xml file, which contains all important information about the specific page of the document. Segmentation process consists of many steps. With fully convolution neural networks UNet and Arunet, we create predication masks of areas of interest and separators. As a part of this bachelor thesis, experiments that help to find appropriate parameters of the neural networks will be carried out.The next step will be to implement an extension, which will make it possible to distinguish the types of text blocks and also better separate specific paragraphs.en
dc.description.resultObhájeno
dc.format50
dc.identifier83015
dc.identifier.urihttp://hdl.handle.net/11025/49352
dc.language.isocs
dc.publisherZápadočeská univerzita v Plzni
dc.rightsPlný text práce je přístupný bez omezení
dc.subjectsegmentacecs
dc.subjectsíťcs
dc.subjectneuronová síťcs
dc.subjectkonvoluční neuronová síťcs
dc.subjectplně konvoluční neuronová síťcs
dc.subjectunetcs
dc.subjectu-netcs
dc.subjectaru-netcs
dc.subjectarunetcs
dc.subjectpagecs
dc.subjectanotacecs
dc.subjectseparátorcs
dc.subjectmaskacs
dc.subjectpredikcecs
dc.subjectobrazový dokumentcs
dc.subjectdatasetcs
dc.subjecteuropeanacs
dc.subjectporta fontiumcs
dc.subjectlayout evaluationcs
dc.subjecttensorflowcs
dc.subjectkerascs
dc.subject.translatedsegmentationen
dc.subject.translatednetworken
dc.subject.translatedneural networken
dc.subject.translatedconvolution neural networken
dc.subject.translatedfully convolution neural networken
dc.subject.translateduneten
dc.subject.translatedu-neten
dc.subject.translatedaru-neten
dc.subject.translatedaruneten
dc.subject.translatedpageen
dc.subject.translatedannotationen
dc.subject.translatedseparatoren
dc.subject.translatedmasken
dc.subject.translatedpredictionen
dc.subject.translatedimage documenten
dc.subject.translateddataseten
dc.subject.translatedeuropeanaen
dc.subject.translatedporta fontiumen
dc.subject.translatedlayout evaluationen
dc.subject.translatedtensorflowen
dc.subject.translatedkerasen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných věd
dc.thesis.degree-levelBakalářský
dc.thesis.degree-nameBc.
dc.thesis.degree-programInženýrská informatika
dc.titleAnalýza a segmentace historických obrazových dokumentůcs
dc.title.alternativeAnalysis and segmentation of historical document imagesen
dc.typebakalářská práce
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=83015

Files

Original bundle
Showing 1 - 5 out of 5 results
No Thumbnail Available
Name:
A17B0378P_Treml_Filip_BP.pdf
Size:
17.1 MB
Format:
Adobe Portable Document Format
Description:
Plný text práce
No Thumbnail Available
Name:
A17B0378P_Hodnoceni.pdf
Size:
186.18 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího práce
No Thumbnail Available
Name:
A17B0378P_Posudek.pdf
Size:
38.89 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta práce
No Thumbnail Available
Name:
A17B0378P_obhajoba.pdf
Size:
70.18 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby práce
No Thumbnail Available
Name:
Zadani_Treml.pdf
Size:
112.54 KB
Format:
Adobe Portable Document Format
Description:
VŠKP - příloha