Vyhledávání duplicitních videí ve velkých databázích

Date issued

2016

Journal Title

Journal ISSN

Volume Title

Publisher

Západočeská univerzita v Plzni

Abstract

Práce je zaměřena na vyhledávání duplicitních videí ve velkých databázích. V oblasti zpracování obrazu jsou často zažité anglické termíny, které se používají i v češtině. Překládání takových termínů způsobuje zmatek. Budu proto používat zažité anglické termíny. Používám dva různé přístupy k popisu (fingerprinting) médií. První z nich je založený na SURF deskriptoru, druhý využívá siamské neuronové sítě. Fingerprinting je proces popisu obrazu pomocí n-dimenzionálního číselného příznakového vektoru (feature vector). Nejjednodušší feature vector obrazu může být například histogram jasových hodnot. Termíny fingerprint, feature vector a descriptor mají v této práci stejný význam. Fingerptinty jsou velikostí malé soubory reprezentující video. Mohou být rychle prohledávány a jejich uchovávání zabírá jenom zlomek paměti počítače ve srovnání s uchováváním původních video souborů. Cílem práce je určit schopnost představených přístupů popsat původní média a jejich upravené kopie. Upravená verze videa je nějakým způsobem změněná proti originálu. Upravenému videu se také říká duplicitní video. Může být změněné například kompresí, použitím geometrických transformací a podobně. Další část práce se zaměřuje na algoritmus sloužící k párování fingerprintů dvou vzorků vizuálně podobných videí. Porovnávám také schopnost představených deskriptorů popsat obecně originální a upravenou verzi videí. Obecný příznakový vektor by měl být podobný pro originální a duplicitní video. Jinými slovy, příznakové vektory získané z původního a transformovaného videa by měly mít malou vzdálenost v prostoru příznakových vektorů a zároveň by měly být vzdálené od příznakových vektorů spočtených pro jiná videa. Celý program se skládá z části, která počítá příznakové vektory videí, a části, která páruje příznakové vektory podobných videí. Použítí programu může být k automatickému vyhledávání duplicitních videí v rozsáhlých databázích nebo online zdrojích (YouTube a podobně) například kvůli ochraně autorských práv. Pro účely práce byl vytvořen dataset čítající tisíce videí a jejich transformovaných kopií. Podařilo se mi vytvořit systém, který je schopný celkem spolehlivě nalézt duplicitní video, pokud už v databázi předpočítaných videí existuje podobným způsobem poškozená verze stejného videa.

Description

Subject(s)

vyhledávání duplicitních videí, matchování videí, siamské neuronové sítě pro popis obrazu

Citation

Collections

OPEN License Selector