Generování obrazových dat pro účely trénování hlubokých neuronových sítí
| dc.contributor.advisor | Hrúz Marek, Ing. Ph.D. | |
| dc.contributor.author | Andrlík, Pavel | |
| dc.contributor.referee | Neduchal Petr, Ing. | |
| dc.date.accepted | 2020-7-20 | |
| dc.date.accessioned | 2020-11-10T00:39:34Z | |
| dc.date.available | 2019-10-15 | |
| dc.date.available | 2020-11-10T00:39:34Z | |
| dc.date.issued | 2020 | |
| dc.date.submitted | 2020-7-7 | |
| dc.description.abstract | Cílem bakalářské práce je vytvoření a implementace algoritmu pro generování obrázků s texty, imitující texty zpravodajských relací. Tyto obrázky budou následně sloužit pro trénování umělých neuronových sítí pro rozpoznávání textů v obraze. V první části práce jsou analyzovány zpravodajské relace, respektive je zjišťována struktura a rozložení obrazových dat. Dále jsou analyzovány používané texty a znaky včetně používaných fontů. Zjišťováno je také, jaká se nejčastěji objevují slova, speciální nebo v běžném jazyce neobvyklé znaky a symboly a kombinace těchto neobvyklých znaků s používanými slovy nebo druhy textů, jako jsou například jména, místa, povolání, politické strany a podobně. V druhé části se zabývám konkrétním návrhem algoritmu, jeho zobecněním pro možnost použití u různých stanic provozujících zpravodajské relace a v poslední řadě jeho implementací v konkrétním programovacím jazyce. V poslední části je experimentálně ověřena kvalita dosažených výsledků. Jaccardův index (také IoU) rozpoznaných oblastí s textem s použitím stávající natrénované sítě je průměrně 0,7. Dále jsou tyto výsledky diskutovány a podrobněji rozebrány. Úplně na závěr je diskutováno navrhnutí možných vylepšení a budoucí práce navázané na tuto práci. | cs |
| dc.description.abstract-translated | The purpose of this bachelor thesis is to create and implement an algorithm for generating images with texts imitating the texts of news sessions. These images will be used to train artificial neural networks for text-in-image recognition. In the first part of the work, the news sessions are analyzed, more precisely the structure and distribution of image data is discovered. In addition to, the used texts and characters, including the used fonts, are analyzed. Ascertained are also the most common words, special or unusual characters and symbols in common language, and combinations of these unusual characters with words or types of text used, such as names, places, professions, political parties, and so on. The second part is focused on a specific design of the algorithm, its generalization for the possibility of using for various news sessions and finally its implementation in a specific programming language. In the last part, the quality of the achieved results is experimentally verified. The Jaccard index (also IoU) of recognized areas with text using the existing trained network is on average 0.7. These results are then discussed and examined. Finally, the proposal of possible improvements and future work related to this work is discussed. | en |
| dc.description.result | Obhájeno | cs |
| dc.format | 43 s. (34 956 znaků) | cs |
| dc.format.mimetype | application/pdf | |
| dc.identifier | 82837 | |
| dc.identifier.uri | http://hdl.handle.net/11025/41862 | |
| dc.language.iso | cs | cs |
| dc.publisher | Západočeská univerzita v Plzni | cs |
| dc.rights | Plný text práce je přístupný bez omezení. | cs |
| dc.rights.access | openAccess | en |
| dc.subject | generování dat | cs |
| dc.subject | syntetická data | cs |
| dc.subject | rozpoznávání textu | cs |
| dc.subject | zpravodajské relace | cs |
| dc.subject | neuronové sítě | cs |
| dc.subject | obrazová data | cs |
| dc.subject.translated | data generation | en |
| dc.subject.translated | synthetic data | en |
| dc.subject.translated | text recognition | en |
| dc.subject.translated | news sessions | en |
| dc.subject.translated | neural network | en |
| dc.subject.translated | image data | en |
| dc.thesis.degree-grantor | Západočeská univerzita v Plzni. Fakulta aplikovaných věd | cs |
| dc.thesis.degree-level | Bakalářský | cs |
| dc.thesis.degree-name | Bc. | cs |
| dc.thesis.degree-program | Aplikované vědy a informatika | cs |
| dc.title | Generování obrazových dat pro účely trénování hlubokých neuronových sítí | cs |
| dc.title.alternative | Image data generation for the purpose of deep neural network training | en |
| dc.type | bakalářská práce | cs |
| local.relation.IS | https://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=82837 |
Files
Original bundle
1 - 5 out of 5 results
No Thumbnail Available
- Name:
- BP Pavel Andrlik.pdf
- Size:
- 3.54 MB
- Format:
- Adobe Portable Document Format
- Description:
- Plný text práce
No Thumbnail Available
- Name:
- andrlik-p.pdf
- Size:
- 305.47 KB
- Format:
- Adobe Portable Document Format
- Description:
- Průběh obhajoby práce
No Thumbnail Available
- Name:
- andrlik-v.pdf
- Size:
- 688.1 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek vedoucího práce
No Thumbnail Available
- Name:
- andrlik-o.pdf
- Size:
- 757.56 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek oponenta práce
No Thumbnail Available
- Name:
- BP_Pavel_Andrlik-prilohy.rar
- Size:
- 40.99 MB
- Format:
- Description:
- VŠKP - příloha