Klasifikace hudebních žánrů pomocí metod strojového učení
| dc.contributor.advisor | Psutka Josef, doc. Ing. Mgr. Ph.D. | cs |
| dc.contributor.author | Kadlecová, Andrea | cs |
| dc.contributor.referee | Vaněk Jan, Ing. Ph.D. | cs |
| dc.date.accepted | 2025-08-26 | |
| dc.date.accessioned | 2026-02-20T16:34:17Z | |
| dc.date.available | 2024-10-01 | |
| dc.date.available | 2026-02-20T16:34:17Z | |
| dc.date.issued | 2025-08-11 | |
| dc.date.submitted | 2025-08-11 | |
| dc.description.abstract | Tato diplomová práce se zaměřuje na klasifikaci žánrů česky zpívaných písní. Cílem práce je prozkoumat a porovnat různé přístupy ke klasifikaci hudby pomocí metod strojového učení. Tyto přístupy jsou nejprve testovány na veřejně dostupném datasetu GTZAN a následně aplikovány na vlastní sadu českých skladeb. Klasifikace probíhá do deseti žánrů definovaných původním datasetem. Výsledky mohou sloužit jako základ pro budoucí využití např. pro automatické třídění hudby v médiích, jako je Český rozhlas.<br>Nejdříve se zkoumá vliv parametrů, jako je počet MFCC koeficientů, velikost Hannova okénka a velikost segmentu nahrávky, na výslednou úspěšnost klasifikace. Následuje část s příznakovým vektorem. Dále se klasifikuje mel-spektrogram pomocí klasické konvoluční neuronové sítě, dvouvětvové konvoluční neuronové sítě, modelu VGG16 s 1D vstupem a s 3D vstupem. Nakonec se klasifikují embeddingy extrahované pomocí modelů Music2Vec, MAEST a Jukebox. <br>Z výsledků je patrné, že rozdělení nahrávky na kratší segmenty je praktické. Zvětší se tím trénovací set a z predikce žánrů jednotlivých segmentů se lépe určí výsledný žánr celé nahrávky. | cs |
| dc.description.abstract-translated | This thesis focuses on the classification of Czech-language songs by genre. The aim is to explore and compare various approaches to music classification using machine learning methods. These approaches are first evaluated on the publicly available GTZAN dataset and subsequently applied to a custom set of Czech songs. The classification is performed into ten genres defined by the original dataset. The results may serve as a basis for future applications, such as the automatic categorization of music in media like Czech Radio.<br>The study first examines the impact of parameters such as the number of MFCC coefficients, the size of the Hann window, and the length of the audio segment on classification accuracy. This is followed by an experiment with a feature vector approach. Next, Mel-spectrograms are classified by a standard convolutional neural network, a two-branch convolutional neural network, and the VGG16 model with both 1D and 3D inputs. Finally, embeddings extracted using the Music2Vec, MAEST, and Jukebox models are classified.<br>The results show that splitting an audio recording into shorter segments is practical. This increases the size of the training set and enables a more reliable determination of the overall genre of the recording from the predictions of individual segments. | en |
| dc.description.department | Katedra kybernetiky | cs |
| dc.description.result | Obhájeno | cs |
| dc.format | 93 s | |
| dc.identifier | 99974 | |
| dc.identifier.uri | http://hdl.handle.net/11025/66097 | |
| dc.language.iso | cs | |
| dc.publisher | Západočeská univerzita v Plzni | cs |
| dc.rights | Plný text práce je přístupný bez omezení | cs |
| dc.rights.access | openAccess | cs |
| dc.subject | Klasifikace hudebních žánrů | cs |
| dc.subject | klasifikace českých písní | cs |
| dc.subject | GTZAN | cs |
| dc.subject | hudební příznaky | cs |
| dc.subject | příznakový vektor | cs |
| dc.subject | metody strojového učení | cs |
| dc.subject | vícevrstvý perceptron | cs |
| dc.subject | konvoluční neuronová síť | cs |
| dc.subject | VGG16 | cs |
| dc.subject | Music2Vec | cs |
| dc.subject | MAEST | cs |
| dc.subject | Jukebox | cs |
| dc.subject.translated | Music genre classification | en |
| dc.subject.translated | Czech song classification | en |
| dc.subject.translated | GTZAN | en |
| dc.subject.translated | music features | en |
| dc.subject.translated | feature vector | en |
| dc.subject.translated | machine learning methods | en |
| dc.subject.translated | multilayer perceptron | en |
| dc.subject.translated | convolutional neural network | en |
| dc.subject.translated | VGG16 | en |
| dc.subject.translated | Music2Vec | en |
| dc.subject.translated | MAEST | en |
| dc.subject.translated | Jukebox | en |
| dc.thesis.degree-grantor | Západočeská univerzita v Plzni. Fakulta aplikovaných věd | cs |
| dc.thesis.degree-level | Navazující | cs |
| dc.thesis.degree-name | Ing. | cs |
| dc.thesis.degree-program | Kybernetika a řídicí technika | cs |
| dc.title | Klasifikace hudebních žánrů pomocí metod strojového učení | cs |
| dc.title.alternative | Music genre classification using machine learning methods | en |
| dc.type | diplomová práce | cs |
| local.files.count | 4 | * |
| local.files.size | 8414373 | * |
| local.has.files | yes | * |
| local.relation.IS | https://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=99974 |
Files
Original bundle
1 - 4 out of 4 results
No Thumbnail Available
- Name:
- DP_Kadlecova_A23N0050P.pdf
- Size:
- 7.86 MB
- Format:
- Adobe Portable Document Format
- Description:
- VŠKP
No Thumbnail Available
- Name:
- PO_Kadlecova_A23N0050P_55197_generated_by_STAG.pdf
- Size:
- 63.01 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek oponenta VŠKP
No Thumbnail Available
- Name:
- PV_Kadlecova_A23N0050P_49915_generated_by_STAG.pdf
- Size:
- 61.24 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek vedoucího VŠKP
No Thumbnail Available
- Name:
- PB_Kadlecova_A23N0050P_generated_by_STAG.pdf
- Size:
- 39.97 KB
- Format:
- Adobe Portable Document Format
- Description:
- Průběh obhajoby VŠKP