Atribuční metody pro Transformer modely

Bartička, Vojtěch

Atribuční metody pro Transformer modely

Files

prace.pdf (2.01 MB)

A21N0038Pposudek-op.pdf (107.04 KB)

A21N0038Phodnoceni-ved.pdf (232.37 KB)

A21N0038Pobhajoba.pdf (522.62 KB)

A21N0038P-zadani_DP.pdf (14.24 KB)

Date issued

2023

Authors

Bartička, Vojtěch

Publisher

Západočeská univerzita v Plzni

Abstract

Tato práce zkoumá atrubuční metody aplikovatelné na Transformer modely pomocí datových sad SST a CTDC. Do datové sady CTDC přidáváme anotace založené na klíčových slovech a bodové vzájemné informaci, čímž umožňujeme evaluaci atribučních metod na české datové sadě. Používáme sedm modelů různých velikostí a architektur, každý s pěti instancemi, což nám umožňuje měřit vliv náhodné inicializace a velikosti modelu. Používáme také destilovaný vícejazyčný model na datové sadě CTDC a ukazujeme, že se rozhoduje racionálně i při použití s jazykem méně frekventovaným v předtrénování. Testujeme atribuční metody s různými referenčními vstupy a počty vzorků, což poskytuje cenné poznatky pro praktické aplikace. Ukazujeme, že přeučení negativně ovlivňuje atribuční metody využívající gradient, zatímco u metody KernelSHAP, která gradient nevyužívá, dochází k velmi malému zhoršení.

Subject(s)

vysvětlitelná umělá inteligence, transformer, neuronové sítě, strojové učení, zpracování přirozeného jazyka, atribuční metody

Item identifier

http://hdl.handle.net/11025/53734

Collections

Theses (KIV)

Show full item record

Atribuční metody pro Transformer modely

Files

Date issued

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Description

Subject(s)

Citation

Item identifier

Collections