Detekce syntetické řeči

dc.contributor.advisorKunešová Marie, Ing. Ph.D.cs
dc.contributor.authorRottenborn, Ondřejcs
dc.contributor.refereeMatoušek Jindřich, doc. Ing. Ph.D.cs
dc.date.accepted2025-06-18
dc.date.accessioned2026-02-19T16:29:42Z
dc.date.available2023-10-17
dc.date.available2026-02-19T16:29:42Z
dc.date.issued2024-08-12
dc.date.submitted2024-08-12
dc.description.abstractTato bakalářská práce se zaměřuje na problematiku detekce syntetické řeči, což je stále důležitější téma vzhledem k rychlému rozvoji hlasových technologií a umělé inteligence. Teoretická část práce se zaměřuje na klíčové oblasti související s tímto tématem, včetně základních metod syntézy řeči, konverzí hlasu a problematiky deepfake. Dále se zabývá moderními přístupy, jako je model wav2vec 2.0. Tento model, který je postaven na pokročilých metodách hlubokého učení, nabízí nový přístup k automatickému zpracování řeči. Praktická část práce pak aplikuje tyto teoretické poznatky na konkrétní data, která zahrnují nahrávky ze soutěže ASVspoof a také nahrávky poskytnuté Katedrou kybernetiky Fakulty aplikovaných věd Západočeské univerzity v Plzni, s cílem analyzovat a vyhodnotit efektivitu detekčního modelu při rozpoznávání syntetické řeči.cs
dc.description.abstract-translatedThis bachelor's thesis focuses on the issue of synthetic speech detection, which is becoming increasingly important due to the rapid advancement in voice technologies and artificial intelligence. The theoretical part of the thesis addresses key areas related to this topic, including fundamental methods of speech synthesis, voice conversion, and the challenges of deepfakes. It also covers modern approaches such as the wav2vec 2.0 model. This model, based on advanced deep learning techniques, offers a novel approach to automatic speech processing. The practical part of the thesis applies these theoretical insights to specific data, including recordings from the ASVspoof competition and recordings provided by the Department of Cybernetics at the Faculty of Applied Sciences, University of West Bohemia, in Pilsen, with the aim of analyzing and evaluating the effectiveness of the detection model in recognizing synthetic speech.en
dc.description.departmentKatedra kybernetikycs
dc.description.resultObhájenocs
dc.format38 stran
dc.identifier96785
dc.identifier.urihttp://hdl.handle.net/11025/64875
dc.language.isocs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezenícs
dc.rights.accessopenAccesscs
dc.subjectsyntéza řečics
dc.subjectdetekce syntetické řečics
dc.subjectmodel wav2vec 2.0cs
dc.subjectklasifikacecs
dc.subject.translatedspeech synthesisen
dc.subject.translatedsynthetic speech detectionen
dc.subject.translatedwav2vec 2.0 modelen
dc.subject.translatedclassificationen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-levelBakalářskýcs
dc.thesis.degree-nameBc.cs
dc.thesis.degree-programKybernetika a řídicí technikacs
dc.titleDetekce syntetické řečics
dc.title.alternativeSynthetic speech detectionen
dc.typebakalářská prácecs
local.files.count4*
local.files.size867962*
local.has.filesyes*
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=96785

Files

Original bundle
Showing 1 - 4 out of 4 results
No Thumbnail Available
Name:
Rottenborn_Ondrej_BP.pdf
Size:
675.92 KB
Format:
Adobe Portable Document Format
Description:
VŠKP
No Thumbnail Available
Name:
PosudekVedoucihoSTAG-KunesovaM-243987.pdf
Size:
62.27 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího VŠKP
No Thumbnail Available
Name:
PO_Rottenborn_A21B0436P.pdf
Size:
69.33 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta VŠKP
No Thumbnail Available
Name:
PB_Rottenborn_A21B0436P.pdf
Size:
40.1 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby VŠKP