Automatické odezírání ze rtů pomocí LipsID

dc.contributor.authorHlaváč, Miroslav
dc.date.accepted2019-12-19
dc.date.accessioned2020-08-24T11:43:15Z
dc.date.available2018-11-19
dc.date.available2020-08-24T11:43:15Z
dc.date.issued2019
dc.date.submitted2019-10-29
dc.description.abstractCílem této práce je vytvoření nových vizuálních příznaků pro systémy automatického odezírání ze rtů. Metody současného stavu poznání (především metody strojového učení) nevyužívají při svém trénování možnosti adaptace na konkrétního řečníka. Vyvstává tedy otázka, jak tuto metodu adaptace přizpůsobit pro oblast rozpoznávání vizuální řeči a jak ji implementovat do současných algoritmů pro strojové odezírání ze rtů. Pomocí analýzy současného stavu poznání v oblasti vizuálních příznaků pro rozpoznávání řeči navrhujeme novou parametrizaci LipsID a metodu pro její získání. Ukazujeme, že adaptací současných systému (založených na neuronových sítích) navrženou metodou LipsID se dá dosáhnout vyšší přesnosti rozpoznávání vizuální řeči. Význam této práce spočívá v prokázání významnosti příznaků založených na identitě řečníka pro automatické metody odezírání ze rtů.cs
dc.description.abstract-translatedThe aim of this is thesis is the creation of new visual features for the automatic lipreading systems. State-of-the-art methods (mainly machine learning methods) are not using any form of adaptation for a specific speaker during their training. We ask, how to adapt this method for the purpose of visual speech recognition and how to implement it into the current lipreading methods. Using the analysis of state-of-the-art methods for visual speech feature extraction we propose a new set of features LipsID and the method for extracting them. We show that by adapting the current system (based on neural networks) by the proposed LipsID features a higher recognition rate of the speech can be achieved. The significance of this work is in showing the importance of features based on the speaker identity for the task of lipreading.en
dc.description.resultObhájenocs
dc.format105 s.cs
dc.format.mimetypeapplication/pdf
dc.identifier81346
dc.identifier.urihttp://hdl.handle.net/11025/39247
dc.language.isoenen
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.rights.accessopenAccessen
dc.subjectodezírání ze rtůcs
dc.subjectstrojové učenícs
dc.subjectneuronové sítěcs
dc.subjectvizuální příznakycs
dc.subjectrozpoznávání řečics
dc.subject.translatedlipreadingen
dc.subject.translatedmachine learningen
dc.subject.translatedneural networksen
dc.subject.translatedvisual featuresen
dc.subject.translatedspeech recognitionen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-levelDoktorskýcs
dc.thesis.degree-namePh.D.cs
dc.thesis.degree-programAplikované vědy a informatikacs
dc.titleAutomatické odezírání ze rtů pomocí LipsIDcs
dc.title.alternativeAutomated lipreading using LipsIDen
dc.title.otherAutomatické odezírání ze rtů pomocí příznaků LipsIDcs
dc.typedisertační prácecs
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=81346

Files

Original bundle
Showing 1 - 3 out of 3 results
No Thumbnail Available
Name:
Hlavac_PhD_Thesis.pdf
Size:
9.09 MB
Format:
Adobe Portable Document Format
Description:
Plný text práce
No Thumbnail Available
Name:
posudek-odp-hlavac.pdf
Size:
300.45 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta práce
No Thumbnail Available
Name:
protokol-odp-hlavac.pdf
Size:
784.84 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby práce