Čtení textů pomocí metod hlubokého učení

dc.contributor.advisorHrúz Marek, Ing. Ph.D.
dc.contributor.authorAndrlík, Pavel
dc.contributor.refereeSoukup Lukáš, Ing.
dc.date.accepted2022-6-22
dc.date.accessioned2022-06-27T22:23:57Z
dc.date.available2021-10-1
dc.date.available2022-06-27T22:23:57Z
dc.date.issued2022
dc.date.submitted2022-5-30
dc.description.abstractTato diplomová práce pojednává o problému optického rozpoznávání znaků při použití neuronových sítí. Zaměřuji se na zlepšení detekce a rozpoznávání textu pomocí dotrénování E2E-MLT scénového detektoru textu tak, že ho trénuji na umělých datech, která napodobují reálná data. Model byl dotrénováván na několika datasetech obsahujících uměle generovaná a reálná data, poté byly vybrány nejlepší modely a otestovány na jednom umělém a dvou reálných datasetech, jeden s převahou divokého textu, druhý s většinou textu vtištěného televizním zpravodajstvím. Na datasetu s většinout digitálně vložených textů bylo dosaženo zlepšení snížením chybovosti znaků z 52\% na 31.6\% a chybovosti slov z 56.5\% na 22\%. Během experimentů bylo také zjištěno, že trénování modelů na umělých datech simulující skutečné obrázky ze zpravodajství zhoršuje schopnost sítě detekovat a číst reálné divoké texty.cs
dc.description.abstract-translatedThis diploma thesis deals with the problem of optical character recognition (OCR) using neural networks. I am focusing on improving text detection and OCR by fine-tuning an E2E-MLT scene text detector by training it on synthetic data which emulates real data. The model was fine-tuned on several datasets with synthetically generated data and real data, then the models were tested on one synthetic and two real datasets, one with the majority of the wild text, the second with the majority of TV news imprinted text. On the dataset with majority of TV news imprinted texts the fine-tuned models achieved improvement by decreasing character error rate from 52\% to 31.6\% word error rate and from 56.5\% to 22\%. It was also experimentally discovered that training models on synthetic data simulating real TV news images deteriorate detection and reading model capability on wild text data.en
dc.description.resultObhájeno
dc.format51
dc.identifier89614
dc.identifier.urihttp://hdl.handle.net/11025/48953
dc.language.isoen
dc.publisherZápadočeská univerzita v Plzni
dc.rightsPlný text práce je přístupný bez omezení
dc.subjectneuronová síťcs
dc.subjectoptické rozpoznávání znakůcs
dc.subjectdetektor textu ve scéněcs
dc.subjecthluboké učenícs
dc.subjectgenerování datcs
dc.subject.translatedneural networken
dc.subject.translatedoptical character recognitionen
dc.subject.translatedscene text detectoren
dc.subject.translateddeep learningen
dc.subject.translateddata generatingen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných věd
dc.thesis.degree-levelNavazující
dc.thesis.degree-nameIng.
dc.thesis.degree-programAplikované vědy a informatika
dc.titleČtení textů pomocí metod hlubokého učenícs
dc.title.alternativeOptical character recognition using deep learningen
dc.title.otherČtení textů pomocí metod hlubokého učení
dc.typediplomová práce
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=89614

Files

Original bundle
Showing 1 - 5 out of 5 results
No Thumbnail Available
Name:
Thesis___Pavel_Andrlik.pdf
Size:
7.98 MB
Format:
Adobe Portable Document Format
Description:
Plný text práce
No Thumbnail Available
Name:
Andrlik_V.pdf
Size:
492.11 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího práce
No Thumbnail Available
Name:
Andrlik_O.pdf
Size:
472.13 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta práce
No Thumbnail Available
Name:
Andrlik_P.pdf
Size:
237.5 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby práce
No Thumbnail Available
Name:
Zadani_DP_Pavel_Andrlik.pdf
Size:
43.96 KB
Format:
Adobe Portable Document Format
Description:
VŠKP - příloha

Collections