Klasifikace hudebních žánrů pomocí metod strojového učení

dc.contributor.advisorPsutka Josef, doc. Ing. Mgr. Ph.D.cs
dc.contributor.authorKadlecová, Andreacs
dc.contributor.refereeVaněk Jan, Ing. Ph.D.cs
dc.date.accepted2025-08-26
dc.date.accessioned2026-02-20T16:34:17Z
dc.date.available2024-10-01
dc.date.available2026-02-20T16:34:17Z
dc.date.issued2025-08-11
dc.date.submitted2025-08-11
dc.description.abstractTato diplomová práce se zaměřuje na klasifikaci žánrů česky zpívaných písní. Cílem práce je prozkoumat a porovnat různé přístupy ke klasifikaci hudby pomocí metod strojového učení. Tyto přístupy jsou nejprve testovány na veřejně dostupném datasetu GTZAN a následně aplikovány na vlastní sadu českých skladeb. Klasifikace probíhá do deseti žánrů definovaných původním datasetem. Výsledky mohou sloužit jako základ pro budoucí využití např. pro automatické třídění hudby v médiích, jako je Český rozhlas.<br>Nejdříve se zkoumá vliv parametrů, jako je počet MFCC koeficientů, velikost Hannova okénka a velikost segmentu nahrávky, na výslednou úspěšnost klasifikace. Následuje část s příznakovým vektorem. Dále se klasifikuje mel-spektrogram pomocí klasické konvoluční neuronové sítě, dvouvětvové konvoluční neuronové sítě, modelu VGG16 s 1D vstupem a s 3D vstupem. Nakonec se klasifikují embeddingy extrahované pomocí modelů Music2Vec, MAEST a Jukebox. <br>Z výsledků je patrné, že rozdělení nahrávky na kratší segmenty je praktické. Zvětší se tím trénovací set a z predikce žánrů jednotlivých segmentů se lépe určí výsledný žánr celé nahrávky.cs
dc.description.abstract-translatedThis thesis focuses on the classification of Czech-language songs by genre. The aim is to explore and compare various approaches to music classification using machine learning methods. These approaches are first evaluated on the publicly available GTZAN dataset and subsequently applied to a custom set of Czech songs. The classification is performed into ten genres defined by the original dataset. The results may serve as a basis for future applications, such as the automatic categorization of music in media like Czech Radio.<br>The study first examines the impact of parameters such as the number of MFCC coefficients, the size of the Hann window, and the length of the audio segment on classification accuracy. This is followed by an experiment with a feature vector approach. Next, Mel-spectrograms are classified by a standard convolutional neural network, a two-branch convolutional neural network, and the VGG16 model with both 1D and 3D inputs. Finally, embeddings extracted using the Music2Vec, MAEST, and Jukebox models are classified.<br>The results show that splitting an audio recording into shorter segments is practical. This increases the size of the training set and enables a more reliable determination of the overall genre of the recording from the predictions of individual segments.en
dc.description.departmentKatedra kybernetikycs
dc.description.resultObhájenocs
dc.format93 s
dc.identifier99974
dc.identifier.urihttp://hdl.handle.net/11025/66097
dc.language.isocs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezenícs
dc.rights.accessopenAccesscs
dc.subjectKlasifikace hudebních žánrůcs
dc.subjectklasifikace českých písnícs
dc.subjectGTZANcs
dc.subjecthudební příznakycs
dc.subjectpříznakový vektorcs
dc.subjectmetody strojového učenícs
dc.subjectvícevrstvý perceptroncs
dc.subjectkonvoluční neuronová síťcs
dc.subjectVGG16cs
dc.subjectMusic2Veccs
dc.subjectMAESTcs
dc.subjectJukeboxcs
dc.subject.translatedMusic genre classificationen
dc.subject.translatedCzech song classificationen
dc.subject.translatedGTZANen
dc.subject.translatedmusic featuresen
dc.subject.translatedfeature vectoren
dc.subject.translatedmachine learning methodsen
dc.subject.translatedmultilayer perceptronen
dc.subject.translatedconvolutional neural networken
dc.subject.translatedVGG16en
dc.subject.translatedMusic2Vecen
dc.subject.translatedMAESTen
dc.subject.translatedJukeboxen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-levelNavazujícícs
dc.thesis.degree-nameIng.cs
dc.thesis.degree-programKybernetika a řídicí technikacs
dc.titleKlasifikace hudebních žánrů pomocí metod strojového učenícs
dc.title.alternativeMusic genre classification using machine learning methodsen
dc.typediplomová prácecs
local.files.count4*
local.files.size8414373*
local.has.filesyes*
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=99974

Files

Original bundle
Showing 1 - 4 out of 4 results
No Thumbnail Available
Name:
DP_Kadlecova_A23N0050P.pdf
Size:
7.86 MB
Format:
Adobe Portable Document Format
Description:
VŠKP
No Thumbnail Available
Name:
PO_Kadlecova_A23N0050P_55197_generated_by_STAG.pdf
Size:
63.01 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta VŠKP
No Thumbnail Available
Name:
PV_Kadlecova_A23N0050P_49915_generated_by_STAG.pdf
Size:
61.24 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího VŠKP
No Thumbnail Available
Name:
PB_Kadlecova_A23N0050P_generated_by_STAG.pdf
Size:
39.97 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby VŠKP

Collections