Klasifikace hudebních žánrů pomocí metod strojového učení
Date issued
2025-08-11
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Západočeská univerzita v Plzni
Abstract
Tato diplomová práce se zaměřuje na klasifikaci žánrů česky zpívaných písní. Cílem práce je prozkoumat a porovnat různé přístupy ke klasifikaci hudby pomocí metod strojového učení. Tyto přístupy jsou nejprve testovány na veřejně dostupném datasetu GTZAN a následně aplikovány na vlastní sadu českých skladeb. Klasifikace probíhá do deseti žánrů definovaných původním datasetem. Výsledky mohou sloužit jako základ pro budoucí využití např. pro automatické třídění hudby v médiích, jako je Český rozhlas.<br>Nejdříve se zkoumá vliv parametrů, jako je počet MFCC koeficientů, velikost Hannova okénka a velikost segmentu nahrávky, na výslednou úspěšnost klasifikace. Následuje část s příznakovým vektorem. Dále se klasifikuje mel-spektrogram pomocí klasické konvoluční neuronové sítě, dvouvětvové konvoluční neuronové sítě, modelu VGG16 s 1D vstupem a s 3D vstupem. Nakonec se klasifikují embeddingy extrahované pomocí modelů Music2Vec, MAEST a Jukebox. <br>Z výsledků je patrné, že rozdělení nahrávky na kratší segmenty je praktické. Zvětší se tím trénovací set a z predikce žánrů jednotlivých segmentů se lépe určí výsledný žánr celé nahrávky.
Description
Subject(s)
Klasifikace hudebních žánrů, klasifikace českých písní, GTZAN, hudební příznaky, příznakový vektor, metody strojového učení, vícevrstvý perceptron, konvoluční neuronová síť, VGG16, Music2Vec, MAEST, Jukebox