Detekce objektů s využitím textových dotazů
Date issued
2023
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Západočeská univerzita v Plzni
Abstract
V teoretické části práce je představena obecná teorie dopředných, rekurentních a konvolučních neuronových sítí. Následuje podrobný popis Transformer architektury, použitých modelů a datasetů pro detekci objektů. V praktické části práce byla navržena architektura modelu pro detekci objektů v obrazu s využitím textových dotazů. Dotazy mohly být jednoslovné nebo ve formě vět. Pro obě varianty bylo natrénováno několik modelů s různými kombinacemi parametrů. Na závěr byly tyto modely vyhodnoceny a byla navržena některá vylepšení.
Description
Subject(s)
neuronové sítě, transformer, bert, roberta, vision transformer, transfer learning, coco, detekce objektů, textové dotazy, detekce objektů s využitím textových dotazů