Klasifikace typu scény televizního vysílání z vizuálních dat

Abstract

Tato práce se zabývá klasifikací typů scén v televizním vysílání pomocí moderních metod hlubokého učení. Hlavním cílem je navrhnout a implementovat systém, který dokáže na základě vizuálních dat rozpoznat typ scény. Jsou zde porovnány dva přístupy založené na architekturách ViViT a VideoMAE, včetně detailní analýzy dat, tréninku a vyhodnocení výsledků. Práce ukazuje výhody i nevýhody jednotlivých modelů a navrhuje směr pro budoucí rozvoj

Description

Subject(s)

klasifikace videa, televizní vysílání, VideoMAE, ViViT, anotace, analýza datasetu, předtrénování, jemné doladění, míra učení, F1 skóre

Citation

Collections