Vyhledávání slov v rozsáhlém archívu mluvené řeči

dc.contributor.advisorŠvec, Jan
dc.contributor.authorVavruška, Jan
dc.contributor.refereeIrcing, Pavel
dc.date.accepted2012-06-20
dc.date.accessioned2013-06-19T06:29:08Z
dc.date.available2011-09-19cs
dc.date.available2013-06-19T06:29:08Z
dc.date.issued2012
dc.date.submitted2012-05-18
dc.description.abstractTato práce se zabývá metodami pro úlohu vyhledávání slov v rozsáhlém archivu mluvené řeči. Vyhledávání v takovém archivu je umožněno prostřednictvím indexace slovních a fonémových mřížek, které jsou výstupem systému automatického rozpoznávání řeči. Hlavním cílem práce bylo nastudovat a aplikovat přístup k indexaci a vyhledávání v mřížkách s využitím teorie vážených konečných automatů a nástrojů STDTools. Následně jej pak otestovat na zvolených experimentálních datech a porovnat se systémem, založeným na indexaci vybraných mřížkových hran. Porovnávání probíhalo vyhodnocením přístupu z hlediska jeho přesnosti, rychlosti vyhledávání a nároků na datový prostor.cs
dc.description.abstract-translatedThe focus of this thesis is the Spoken Term Detection (STD) task whose aim is to index and search word and phoneme lattices resulting from the Automatic Speech Recognition (ASR) system. The main goal of this thesis was to thoroughly familiarize with the theory of weighted finite-state automata (WFSA) and then implement a spoken term detection system using existing software framework (STDTools). Consequently, the implemented system has been tested on the large real-world data and results were compared with the existing STD engine developed previously within the research group. The comparison was based on the evaluation of precision, search time and also data storage requirements.en
dc.description.departmentKatedra kybernetikycs
dc.description.resultObhájenocs
dc.format63 s.cs
dc.format.mimetypeapplication/pdf
dc.identifier47937
dc.identifier.urihttp://hdl.handle.net/11025/2655
dc.language.isocscs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.rights.accessopenAccessen
dc.subjectvyhledávání slov v řečovém archivucs
dc.subjectautomatické rozpoznávání řečics
dc.subjectslovní a fonémové mřížkycs
dc.subjectvážené konečné automaty a transducerycs
dc.subjectprojekt MALACHcs
dc.subjectSTDToolscs
dc.subjectOpenFSTcs
dc.subject.translatedspoken term detectionen
dc.subject.translatedautomatic speech recognitionen
dc.subject.translatedword and phoneme latticesen
dc.subject.translatedweighted finite-state automata and transducersen
dc.subject.translatedSTDToolsen
dc.subject.translatedOpenFSTen
dc.subject.translatedproject MALACHen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-levelNavazujícícs
dc.thesis.degree-nameIng.cs
dc.thesis.degree-programAplikované vědy a informatikacs
dc.titleVyhledávání slov v rozsáhlém archívu mluvené řečics
dc.title.alternativeSpoken term detection in a large spoken archiveen
dc.typediplomová prácecs
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=47937

Files

Original bundle
Showing 1 - 4 out of 4 results
No Thumbnail Available
Name:
ZCU-FAV-KKY-Vavruska-DP.pdf
Size:
1.24 MB
Format:
Adobe Portable Document Format
Description:
Plný text práce
No Thumbnail Available
Name:
vavruska-v.pdf
Size:
1.91 MB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího práce
No Thumbnail Available
Name:
vavruska-o.pdf
Size:
1.87 MB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta práce
No Thumbnail Available
Name:
vavruska-p.pdf
Size:
1.42 MB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby práce

Collections