Identity Extraction from Clusters of Multi-modal Observations

Hrúz, Marek

Identity Extraction from Clusters of Multi-modal Observations

Date issued

2019

Authors

Publisher

Springer

Abstract

V tomto článku představujeme metodu extrakce identity z televizních zpravodajských vysílání. Identitu definujeme jako soubor multimodálních pozorování. V našem případě je to tvář osoby a jméno osoby. Metoda je založena na aglomeračním seskupování pozorování. Výsledné shluky představují individuální identity, které se objevily ve vysílání. Pro vyhodnocení přesnosti našeho systému jsme ručně označili televizní zpravodajství v hodnotě přibližně jednoho roku. Výsledkem bylo celkem 10301 multimodálních pozorování a 2563 jedinečných identit. Naše metoda dosáhla míry pokrytí 90,69% a míry přesnosti 94,69%. Vzhledem k jednoduchosti navrhovaného algoritmu jsou tyto výsledky velmi uspokojivé. Navržený systém je navíc modulární a tak lze snadno přidat nové modality.

Subject(s)

extrakce identity, aglomerační shlukování, rozpoznání tváře, čtení textu

Citation

HRÚZ, M.., SALAJKA, P.., GRUBER, I.., HLAVÁČ, M.. Identity Extraction from Clusters of Multi-modal Observations. In: Speech and Computer, 21st International Conference, SPECOM 2019, Istanbul, turkey, August 20-25,2019, Proceedings. Cham: Springer, 2019. s. 171-179. ISBN 978-3-030-26060-6 , ISSN 0302-9743.