Využití C++ knihoven a frameworků pro úlohu klasifikace a segmentace obrázků grafů

Abstract

Tato diplomová práce se zabývá automatizovanou analýzou obrazů grafů a infografik s využitím hlubokého učení, konkrétně klasifikací typu grafu a segmentací klíčových prvků na datové sadě ICPR CHART-Infographics 2022. Součástí práce je trénování klasifikačního (ResNet50 s transfer learningem) a segmentačního (U-Net) modelu. Hlavním přínosem je vývoj modulární knihovny v C++ pro provádění inference s podporou více backendů (Frugally-Deep, LibTorch, TensorRT). Práce popisuje implementaci pomocí CMake a hodnotí provozní charakteristiky (čas, paměť) různých inference frameworků na daných úlohách, čímž přináší poznatky pro automatizovanou extrakci dat z vizualizací.

Description

Subject(s)

grafy, infografika, klasifikace obrazu, segmentace obrazu, hluboké učení, neuronové sítě, ResNet, U-Net, inference, TensorFlow, Keras, LibTorch, Frugally-Deep, TensorRT, výkonnostní analýza, CMake

Citation

Collections