Vyhledávání slov v rozsáhlém archívu mluvené řeči
| dc.contributor.advisor | Švec, Jan | |
| dc.contributor.author | Vavruška, Jan | |
| dc.contributor.referee | Ircing, Pavel | |
| dc.date.accepted | 2012-06-20 | |
| dc.date.accessioned | 2013-06-19T06:29:08Z | |
| dc.date.available | 2011-09-19 | cs |
| dc.date.available | 2013-06-19T06:29:08Z | |
| dc.date.issued | 2012 | |
| dc.date.submitted | 2012-05-18 | |
| dc.description.abstract | Tato práce se zabývá metodami pro úlohu vyhledávání slov v rozsáhlém archivu mluvené řeči. Vyhledávání v takovém archivu je umožněno prostřednictvím indexace slovních a fonémových mřížek, které jsou výstupem systému automatického rozpoznávání řeči. Hlavním cílem práce bylo nastudovat a aplikovat přístup k indexaci a vyhledávání v mřížkách s využitím teorie vážených konečných automatů a nástrojů STDTools. Následně jej pak otestovat na zvolených experimentálních datech a porovnat se systémem, založeným na indexaci vybraných mřížkových hran. Porovnávání probíhalo vyhodnocením přístupu z hlediska jeho přesnosti, rychlosti vyhledávání a nároků na datový prostor. | cs |
| dc.description.abstract-translated | The focus of this thesis is the Spoken Term Detection (STD) task whose aim is to index and search word and phoneme lattices resulting from the Automatic Speech Recognition (ASR) system. The main goal of this thesis was to thoroughly familiarize with the theory of weighted finite-state automata (WFSA) and then implement a spoken term detection system using existing software framework (STDTools). Consequently, the implemented system has been tested on the large real-world data and results were compared with the existing STD engine developed previously within the research group. The comparison was based on the evaluation of precision, search time and also data storage requirements. | en |
| dc.description.department | Katedra kybernetiky | cs |
| dc.description.result | Obhájeno | cs |
| dc.format | 63 s. | cs |
| dc.format.mimetype | application/pdf | |
| dc.identifier | 47937 | |
| dc.identifier.uri | http://hdl.handle.net/11025/2655 | |
| dc.language.iso | cs | cs |
| dc.publisher | Západočeská univerzita v Plzni | cs |
| dc.rights | Plný text práce je přístupný bez omezení. | cs |
| dc.rights.access | openAccess | en |
| dc.subject | vyhledávání slov v řečovém archivu | cs |
| dc.subject | automatické rozpoznávání řeči | cs |
| dc.subject | slovní a fonémové mřížky | cs |
| dc.subject | vážené konečné automaty a transducery | cs |
| dc.subject | projekt MALACH | cs |
| dc.subject | STDTools | cs |
| dc.subject | OpenFST | cs |
| dc.subject.translated | spoken term detection | en |
| dc.subject.translated | automatic speech recognition | en |
| dc.subject.translated | word and phoneme lattices | en |
| dc.subject.translated | weighted finite-state automata and transducers | en |
| dc.subject.translated | STDTools | en |
| dc.subject.translated | OpenFST | en |
| dc.subject.translated | project MALACH | en |
| dc.thesis.degree-grantor | Západočeská univerzita v Plzni. Fakulta aplikovaných věd | cs |
| dc.thesis.degree-level | Navazující | cs |
| dc.thesis.degree-name | Ing. | cs |
| dc.thesis.degree-program | Aplikované vědy a informatika | cs |
| dc.title | Vyhledávání slov v rozsáhlém archívu mluvené řeči | cs |
| dc.title.alternative | Spoken term detection in a large spoken archive | en |
| dc.type | diplomová práce | cs |
| local.relation.IS | https://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=47937 |
Files
Original bundle
1 - 4 out of 4 results
No Thumbnail Available
- Name:
- ZCU-FAV-KKY-Vavruska-DP.pdf
- Size:
- 1.24 MB
- Format:
- Adobe Portable Document Format
- Description:
- Plný text práce
No Thumbnail Available
- Name:
- vavruska-v.pdf
- Size:
- 1.91 MB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek vedoucího práce
No Thumbnail Available
- Name:
- vavruska-o.pdf
- Size:
- 1.87 MB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek oponenta práce
No Thumbnail Available
- Name:
- vavruska-p.pdf
- Size:
- 1.42 MB
- Format:
- Adobe Portable Document Format
- Description:
- Průběh obhajoby práce