Syntéza obrázků člověka podmíněná vstupní pózou
| dc.contributor.advisor | Hrúz Marek, Ing. Ph.D. | cs |
| dc.contributor.author | Honzík, Jakub | cs |
| dc.contributor.referee | Gruber Ivan, Ing. Ph.D. | cs |
| dc.date.accepted | 2025-06-17 | |
| dc.date.accessioned | 2026-02-20T16:37:14Z | |
| dc.date.available | 2024-10-01 | |
| dc.date.available | 2026-02-20T16:37:14Z | |
| dc.date.issued | 2025-05-19 | |
| dc.date.submitted | 2025-05-19 | |
| dc.description.abstract | Tato práce se zabývá syntézou znakového jazyka. Trénovací a testovací data pocházejí z datové sady YouTube-ASL. Stabilní difúze byla implementována pomocí knihovny Huggingface Diffusers. Podmínění mapy rysů z HRNetu, detekce hran Cannyho a Sobelovy detekce hran bylo použito prostřednictvím konkatenace nebo jako vstup do ControlNetu. Modely byly testovány kvalitativně pozorováním snímků a kvantitativně měřením vzdáleností a míry detekce klíčových bodů z generovaných snímků a cílových snímků shromážděných pomocí mediapipe a normalizovaných ve znakovém prostoru. Z míry detekce bylo vypočteno skóre F1 s použitím detekce cílového obrazu jako základní pravdy. HRNet podmiňování mělo průměrnou vzdálenost 1,814 a F1 skóre 0,9557; Canny dosáhl 1,29 a 0,9607; Sobel překonal oba s 0,8767 a 0,9714. | cs |
| dc.description.abstract-translated | This thesis explores the synthesis of sign language. Training and testing data are from the YouTube-ASL dataset. Stable Diffusion was implemented with the use of the Huggingface Diffusers library. Feature map conditionings from HRNet, canny edge detection, Sobel edge detection were used through concatenation or as input into ControlNet. The models were tested qualitatively by observing images and quantitatively by measuring distances and detection rates of keypoints from generated images and target images gathered with mediapipe and normalized in the signing space. From detection rates, F1 scores were calculated using target image detection as ground truth. HRNet conditioning had an average distance 1.814 and the F1 score 0.9557; Canny achieved 1.29 and 0.9607; Sobel outperformed both with 0.8767 and 0.9714, respectively. | en |
| dc.description.department | Katedra kybernetiky | cs |
| dc.description.result | Obhájeno | cs |
| dc.format | 54 | |
| dc.identifier | 100004 | |
| dc.identifier.uri | http://hdl.handle.net/11025/66117 | |
| dc.language.iso | en | |
| dc.publisher | Západočeská univerzita v Plzni | cs |
| dc.rights | Plný text práce je přístupný bez omezení | cs |
| dc.rights.access | openAccess | cs |
| dc.subject | Znaková řeč | cs |
| dc.subject | neuronové sítě | cs |
| dc.subject | U-Net | cs |
| dc.subject | HRNet | cs |
| dc.subject | YouTube-ASL | cs |
| dc.subject | ControlNet | cs |
| dc.subject.translated | Sign language | en |
| dc.subject.translated | neural networks | en |
| dc.subject.translated | U-Net | en |
| dc.subject.translated | HRNet | en |
| dc.subject.translated | YouTube-ASL | en |
| dc.subject.translated | ControlNet | en |
| dc.thesis.degree-grantor | Západočeská univerzita v Plzni. Fakulta aplikovaných věd | cs |
| dc.thesis.degree-level | Navazující | cs |
| dc.thesis.degree-name | Ing. | cs |
| dc.thesis.degree-program | Kybernetika a řídicí technika | cs |
| dc.title | Syntéza obrázků člověka podmíněná vstupní pózou | cs |
| dc.title.alternative | Pose-Conditioned Human Image Synthesis | en |
| dc.type | diplomová práce | cs |
| local.files.count | 5 | * |
| local.files.size | 36761849 | * |
| local.has.files | yes | * |
| local.relation.IS | https://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=100004 |
Files
Original bundle
1 - 5 out of 5 results
No Thumbnail Available
- Name:
- DP_Honzik_A22N0108P.pdf
- Size:
- 21.92 MB
- Format:
- Adobe Portable Document Format
- Description:
- VŠKP
No Thumbnail Available
- Name:
- PO_Honzik_A22N0108P.pdf
- Size:
- 61.38 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek oponenta VŠKP
No Thumbnail Available
- Name:
- PV_Honzik_A22N0108P.pdf
- Size:
- 62.4 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek vedoucího VŠKP
No Thumbnail Available
- Name:
- PB_Honzik_A22N0108P.pdf
- Size:
- 39.7 KB
- Format:
- Adobe Portable Document Format
- Description:
- Průběh obhajoby VŠKP