Generování obrazových dat pro účely trénování hlubokých neuronových sítí

dc.contributor.advisorHrúz Marek, Ing. Ph.D.
dc.contributor.authorAndrlík, Pavel
dc.contributor.refereeNeduchal Petr, Ing.
dc.date.accepted2020-7-20
dc.date.accessioned2020-11-10T00:39:34Z
dc.date.available2019-10-15
dc.date.available2020-11-10T00:39:34Z
dc.date.issued2020
dc.date.submitted2020-7-7
dc.description.abstractCílem bakalářské práce je vytvoření a implementace algoritmu pro generování obrázků s texty, imitující texty zpravodajských relací. Tyto obrázky budou následně sloužit pro trénování umělých neuronových sítí pro rozpoznávání textů v obraze. V první části práce jsou analyzovány zpravodajské relace, respektive je zjišťována struktura a rozložení obrazových dat. Dále jsou analyzovány používané texty a znaky včetně používaných fontů. Zjišťováno je také, jaká se nejčastěji objevují slova, speciální nebo v běžném jazyce neobvyklé znaky a symboly a kombinace těchto neobvyklých znaků s používanými slovy nebo druhy textů, jako jsou například jména, místa, povolání, politické strany a podobně. V druhé části se zabývám konkrétním návrhem algoritmu, jeho zobecněním pro možnost použití u různých stanic provozujících zpravodajské relace a v poslední řadě jeho implementací v konkrétním programovacím jazyce. V poslední části je experimentálně ověřena kvalita dosažených výsledků. Jaccardův index (také IoU) rozpoznaných oblastí s textem s použitím stávající natrénované sítě je průměrně 0,7. Dále jsou tyto výsledky diskutovány a podrobněji rozebrány. Úplně na závěr je diskutováno navrhnutí možných vylepšení a budoucí práce navázané na tuto práci.cs
dc.description.abstract-translatedThe purpose of this bachelor thesis is to create and implement an algorithm for generating images with texts imitating the texts of news sessions. These images will be used to train artificial neural networks for text-in-image recognition. In the first part of the work, the news sessions are analyzed, more precisely the structure and distribution of image data is discovered. In addition to, the used texts and characters, including the used fonts, are analyzed. Ascertained are also the most common words, special or unusual characters and symbols in common language, and combinations of these unusual characters with words or types of text used, such as names, places, professions, political parties, and so on. The second part is focused on a specific design of the algorithm, its generalization for the possibility of using for various news sessions and finally its implementation in a specific programming language. In the last part, the quality of the achieved results is experimentally verified. The Jaccard index (also IoU) of recognized areas with text using the existing trained network is on average 0.7. These results are then discussed and examined. Finally, the proposal of possible improvements and future work related to this work is discussed.en
dc.description.resultObhájenocs
dc.format43 s. (34 956 znaků)cs
dc.format.mimetypeapplication/pdf
dc.identifier82837
dc.identifier.urihttp://hdl.handle.net/11025/41862
dc.language.isocscs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.rights.accessopenAccessen
dc.subjectgenerování datcs
dc.subjectsyntetická datacs
dc.subjectrozpoznávání textucs
dc.subjectzpravodajské relacecs
dc.subjectneuronové sítěcs
dc.subjectobrazová datacs
dc.subject.translateddata generationen
dc.subject.translatedsynthetic dataen
dc.subject.translatedtext recognitionen
dc.subject.translatednews sessionsen
dc.subject.translatedneural networken
dc.subject.translatedimage dataen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-levelBakalářskýcs
dc.thesis.degree-nameBc.cs
dc.thesis.degree-programAplikované vědy a informatikacs
dc.titleGenerování obrazových dat pro účely trénování hlubokých neuronových sítícs
dc.title.alternativeImage data generation for the purpose of deep neural network trainingen
dc.typebakalářská prácecs
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=82837

Files

Original bundle
Showing 1 - 5 out of 5 results
No Thumbnail Available
Name:
BP Pavel Andrlik.pdf
Size:
3.54 MB
Format:
Adobe Portable Document Format
Description:
Plný text práce
No Thumbnail Available
Name:
andrlik-p.pdf
Size:
305.47 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby práce
No Thumbnail Available
Name:
andrlik-v.pdf
Size:
688.1 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího práce
No Thumbnail Available
Name:
andrlik-o.pdf
Size:
757.56 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta práce
No Thumbnail Available
Name:
BP_Pavel_Andrlik-prilohy.rar
Size:
40.99 MB
Format:
Description:
VŠKP - příloha