Identity Extraction from Clusters of Multi-modal Observations
Date issued
2019
Journal Title
Journal ISSN
Volume Title
Publisher
Springer
Abstract
V tomto článku představujeme metodu extrakce identity z televizních zpravodajských vysílání. Identitu definujeme jako soubor multimodálních pozorování. V našem případě je to tvář osoby a jméno osoby. Metoda je založena na aglomeračním seskupování pozorování. Výsledné shluky představují individuální identity, které se objevily ve vysílání. Pro vyhodnocení přesnosti našeho systému jsme ručně označili televizní zpravodajství v hodnotě přibližně jednoho roku. Výsledkem bylo celkem 10301 multimodálních pozorování a 2563 jedinečných identit. Naše metoda dosáhla míry pokrytí 90,69% a míry přesnosti 94,69%. Vzhledem k jednoduchosti navrhovaného algoritmu jsou tyto výsledky velmi uspokojivé. Navržený systém je navíc modulární a tak lze snadno přidat nové modality.
Description
Subject(s)
extrakce identity, aglomerační shlukování, rozpoznání tváře, čtení textu
Citation
HRÚZ, M.., SALAJKA, P.., GRUBER, I.., HLAVÁČ, M.. Identity Extraction from Clusters of Multi-modal Observations. In: Speech and Computer, 21st International Conference, SPECOM 2019, Istanbul, turkey, August 20-25,2019, Proceedings. Cham: Springer, 2019. s. 171-179. ISBN 978-3-030-26060-6 , ISSN 0302-9743.