Vyhledávání duplicitních videí ve velkých databázích

Fara, Adam

Vyhledávání duplicitních videí ve velkých databázích

Files

Master_Thesis_Adam_Fara.pdf.pdf.pdf (4.24 MB)

fara-v.pdf (779.01 KB)

fara-o.pdf (710.96 KB)

fara-p.pdf (449.66 KB)

Date issued

2016

Authors

Fara, Adam

Publisher

Západočeská univerzita v Plzni

Abstract

Práce je zaměřena na vyhledávání duplicitních videí ve velkých databázích. V oblasti zpracování obrazu jsou často zažité anglické termíny, které se používají i v češtině. Překládání takových termínů způsobuje zmatek. Budu proto používat zažité anglické termíny. Používám dva různé přístupy k popisu (fingerprinting) médií. První z nich je založený na SURF deskriptoru, druhý využívá siamské neuronové sítě. Fingerprinting je proces popisu obrazu pomocí n-dimenzionálního číselného příznakového vektoru (feature vector). Nejjednodušší feature vector obrazu může být například histogram jasových hodnot. Termíny fingerprint, feature vector a descriptor mají v této práci stejný význam. Fingerptinty jsou velikostí malé soubory reprezentující video. Mohou být rychle prohledávány a jejich uchovávání zabírá jenom zlomek paměti počítače ve srovnání s uchováváním původních video souborů. Cílem práce je určit schopnost představených přístupů popsat původní média a jejich upravené kopie. Upravená verze videa je nějakým způsobem změněná proti originálu. Upravenému videu se také říká duplicitní video. Může být změněné například kompresí, použitím geometrických transformací a podobně. Další část práce se zaměřuje na algoritmus sloužící k párování fingerprintů dvou vzorků vizuálně podobných videí. Porovnávám také schopnost představených deskriptorů popsat obecně originální a upravenou verzi videí. Obecný příznakový vektor by měl být podobný pro originální a duplicitní video. Jinými slovy, příznakové vektory získané z původního a transformovaného videa by měly mít malou vzdálenost v prostoru příznakových vektorů a zároveň by měly být vzdálené od příznakových vektorů spočtených pro jiná videa. Celý program se skládá z části, která počítá příznakové vektory videí, a části, která páruje příznakové vektory podobných videí. Použítí programu může být k automatickému vyhledávání duplicitních videí v rozsáhlých databázích nebo online zdrojích (YouTube a podobně) například kvůli ochraně autorských práv. Pro účely práce byl vytvořen dataset čítající tisíce videí a jejich transformovaných kopií. Podařilo se mi vytvořit systém, který je schopný celkem spolehlivě nalézt duplicitní video, pokud už v databázi předpočítaných videí existuje podobným způsobem poškozená verze stejného videa.

Subject(s)

vyhledávání duplicitních videí, matchování videí, siamské neuronové sítě pro popis obrazu

Item identifier

http://hdl.handle.net/11025/23641

Collections

Theses (KKY)

Show full item record

Vyhledávání duplicitních videí ve velkých databázích

Files

Date issued

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Description

Subject(s)

Citation

Item identifier

Collections