Optimalizace rozmístění pásmových filtrů v MFCC s ohledem na zpracovávanou množinu řečníků
| dc.contributor.advisor | Psutka Jr., Josef | |
| dc.contributor.author | Jarolín, Milan | |
| dc.date.accepted | 2012-08-30 | |
| dc.date.accessioned | 2013-06-19T07:01:59Z | |
| dc.date.available | 2011-02-14 | cs |
| dc.date.available | 2013-06-19T07:01:59Z | |
| dc.date.issued | 2012 | |
| dc.date.submitted | 2012-08-21 | |
| dc.description.abstract | V této bakalářské práci se zabýváme problematikou parametrizace řečového signálu pomocí různých způsobů modifikace metody Melovských kepstrálních koeficientů(MFCC) v procesu rozpoznávání řeči s ohledem na množiny řečníků. Naším cílem je ověření optimálního rozmístění a tvaru filtrů na frekvenční ose u metody MFCC. První modifikace metody MFCC spočívá v použití alternativních tvarů filtrů (obdélníkový, cosinusový, sinusový, lichoběžníkový). Druhá modifikace se zabývá odlišným rozmístěním filtrů v melovské bance oproti původnímu, které se snaží o kompenzaci nelinearity citlivosti sluchového ústrojí vůči frekvenci. Ve výsledku zkoumáme vliv těchto modifikací parametrizační metody MFCC na úspěšnost rozpoznávání promluv ze zvolené množiny testovaných dat, pro jednotlivé množiny trénovacích řečníků. Pro realizaci procesů trénování a rozpoznávání používáme modul HTK. Získané poznatky poté konfrontujeme s výsledky dosaženými původním nastavením metody MFCC. | cs |
| dc.description.abstract-translated | In this bachelor thesis we deal with parametrization of the speech signal problem using different ways of modification method Mel cepstral coefficients (MFCC) in the process of speech recognition with respect to a set of speakers. Our aim is to verify the optimal location and the shape of the filters on the frequency axis at the method MFCC. The first modification of the method MFCC consists in using alternative shapes of filters(rectangle, cosine, sine, trapezoid). The second modification deals with a different placement of filters in the mel bank compared to the original, which tries to compensate nonlinear sensitivity of the auditory system to frequency. As a result, we examine the effects of these modifications parameterization method MFCC for recognition success utterances from a selected set of test data for each set of training speakers. For the execution of the processes of training and recognition using HTK module. Gained knowledge is then confronted with the results achieved by setting the original method MFCC. | en |
| dc.description.department | Katedra kybernetiky | cs |
| dc.description.result | Obhájeno | cs |
| dc.format | 50 s. (58 000 znaků) | cs |
| dc.format.mimetype | application/pdf | |
| dc.identifier | 43529 | |
| dc.identifier.uri | http://hdl.handle.net/11025/5845 | |
| dc.language.iso | cs | cs |
| dc.publisher | Západočeská univerzita v Plzni | cs |
| dc.rights | Plný text práce je přístupný bez omezení. | cs |
| dc.rights.access | openAccess | en |
| dc.subject | parametrizace řeči | cs |
| dc.subject | pásmový filtr | cs |
| dc.subject | melovské filtry | cs |
| dc.subject | MFCC | cs |
| dc.subject.translated | speech parameterization | en |
| dc.subject.translated | bandpass filter | en |
| dc.subject.translated | mel filter | en |
| dc.subject.translated | MFCC | en |
| dc.thesis.degree-grantor | Západočeská univerzita v Plzni. Fakulta aplikovaných věd | cs |
| dc.thesis.degree-level | Bakalářský | cs |
| dc.thesis.degree-name | Bc. | cs |
| dc.thesis.degree-program | Aplikované vědy a informatika | cs |
| dc.title | Optimalizace rozmístění pásmových filtrů v MFCC s ohledem na zpracovávanou množinu řečníků | cs |
| dc.title.alternative | Optimization of band-pass filters in MFCC with respect to clusters of speakers | en |
| dc.type | bakalářská práce | cs |
| local.relation.IS | https://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=43529 |
Files
Original bundle
1 - 3 out of 3 results
No Thumbnail Available
- Name:
- M.Jarolin - Bakalarska Prace 2012.pdf
- Size:
- 457.39 KB
- Format:
- Adobe Portable Document Format
- Description:
- Plný text práce
No Thumbnail Available
- Name:
- jarolin-v.pdf
- Size:
- 1.63 MB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek vedoucího práce
No Thumbnail Available
- Name:
- jarolin-p.pdf
- Size:
- 1.27 MB
- Format:
- Adobe Portable Document Format
- Description:
- Průběh obhajoby práce