Klasifikace skenovaných dokumentů

dc.contributor.advisorMartínek Jiří, Ing. Ph.D.
dc.contributor.authorFafek, Jakub
dc.contributor.refereePártl František, Ing.
dc.date.accepted2024-6-11
dc.date.accessioned2024-07-12T09:13:06Z
dc.date.available2023-8-29
dc.date.available2024-07-12T09:13:06Z
dc.date.issued2024
dc.date.submitted2024-5-2
dc.description.abstractTato bakalářská práce se zabývá tématem klasifikace skenovaných dokumentů. Cílem této práce je vyvinout klasifikátor, který bude schopen rozlišit naskenované dokumenty do celkem deseti tříd. Jako příznak se použije text, který je rozpoznán pomocí metod optického rozpoznávání znaků (OCR). Dále bude využita hluboká konvoluční neuronová síť, která zohlední vizuální příznaky. Nakonec bude vytvořen klasifikátor, který zohledňuje oba typy příznaků. Klasifikátor bude vyhodnocen na datové sadě dokumentů Tobacco-3482.cs
dc.description.abstract-translatedThis bachelor thesis deals with the topic of classification of scanned documents. The aim of this thesis is to develop a~classifier that will be able to distinguish scanned documents into a~total of ten classes. Text will be used as a~feature which is recognized using optical character recognition (OCR) methods. Furthermore, a~deep convolutional neural network will be used to take visual features into account. Finally, a~classifier will be created that accounts for both types of features. The classifier will be evaluated on the Tobacco-3482 document dataset.en
dc.description.resultObhájeno
dc.format53
dc.identifier97034
dc.identifier.urihttp://hdl.handle.net/11025/57111
dc.language.isocs
dc.publisherZápadočeská univerzita v Plzni
dc.rightsPlný text práce je přístupný bez omezení
dc.subjectklasifikace dokumentucs
dc.subjectskenovaný dokumentcs
dc.subjectneuronová síťcs
dc.subjectklasifikace textucs
dc.subjectklasifikace obrázkucs
dc.subjectocrcs
dc.subject.translateddocument classificationen
dc.subject.translatedscanned documenten
dc.subject.translatedneural networken
dc.subject.translatedtext classificationen
dc.subject.translatedimage classificationen
dc.subject.translatedocren
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných věd
dc.thesis.degree-levelBakalářský
dc.thesis.degree-nameBc.
dc.thesis.degree-programInformatika a výpočetní technika
dc.titleKlasifikace skenovaných dokumentůcs
dc.title.alternativeClassification of scanned documentsen
dc.typebakalářská práce

Files

Original bundle
Showing 1 - 5 out of 10 results
No Thumbnail Available
Name:
A19B0034P_text_prace.pdf
Size:
1.32 MB
Format:
Adobe Portable Document Format
Description:
Plný text práce
No Thumbnail Available
Name:
A19B0034P_Posudek.pdf
Size:
215.39 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta práce
No Thumbnail Available
Name:
A19B0034P_Hodnoceni.pdf
Size:
233.25 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího práce
No Thumbnail Available
Name:
A19B0034P_Obhajoba.pdf
Size:
124.5 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby práce
No Thumbnail Available
Name:
A19B0034P_Zadani.pdf
Size:
21.77 KB
Format:
Adobe Portable Document Format
Description:
VŠKP - příloha