Detekce objektů s využitím textových dotazů

Date issued

2023

Journal Title

Journal ISSN

Volume Title

Publisher

Západočeská univerzita v Plzni

Abstract

V teoretické části práce je představena obecná teorie dopředných, rekurentních a konvolučních neuronových sítí. Následuje podrobný popis Transformer architektury, použitých modelů a datasetů pro detekci objektů. V praktické části práce byla navržena architektura modelu pro detekci objektů v obrazu s využitím textových dotazů. Dotazy mohly být jednoslovné nebo ve formě vět. Pro obě varianty bylo natrénováno několik modelů s různými kombinacemi parametrů. Na závěr byly tyto modely vyhodnoceny a byla navržena některá vylepšení.

Description

Subject(s)

neuronové sítě, transformer, bert, roberta, vision transformer, transfer learning, coco, detekce objektů, textové dotazy, detekce objektů s využitím textových dotazů

Citation

OPEN License Selector