Automatická analýza vztahů mezi vědeckými publikacemi s využitím velkých jazykových modelů

Vodička, Daniel

Automatická analýza vztahů mezi vědeckými publikacemi s využitím velkých jazykových modelů

Files

A22B0143P_Zadani.pdf (22.44 KB)

A22B0143P_prilohy.zip (276.28 MB)

BP_Vodicka_A22B0143P.pdf (1.27 MB)

PO_Vodicka_A22B0143P.pdf (93.34 KB)

PV_Vodicka_A22B0143P.pdf (32.09 KB)

Date issued

2025-05-04

Authors

Vodička, Daniel

Publisher

Západočeská univerzita v Plzni

Abstract

Tato práce se zabývá využitím velkých jazykových modelů (LLMs) pro automatickou analýzu vztahů mezi vědeckými publikacemi, se zaměřením na klasifikaci citací. Zkoumáme různé datasety vědeckých publikací a citační klasifikační schémata, včetně vytvoření nového datasetu s rozšířenou klasifikační taxonomií. Práce implementuje funkční prototyp systému a porovnává několik předem natrénovaných a doladěných velkých jazykových modelů pro úlohu klasifikace citací s využitím technik tzv. zero-shot, few-shot a fine-tuning. Experimentální výsledky ukazují významné rozdíly ve výkonu mezi různými modely a datasety, přičemž nejlepších výsledků dosahují modely s doladěním na specifická data. Analýza také odhaluje, že kontext citace významně ovlivňuje výsledek klasifikace a že modely mají tendenci k nesprávné klasifikaci vzácnějších citačních tříd. Tato práce poskytuje cenné poznatky pro budoucí výzkum v oblasti automatické analýzy vědeckých textů a nabízí směry pro zlepšení klasifikace citací pomocí velkých jazykových modelů.

Subject(s)

Analýza citací, Klasifikace citací, LLama, Velké jazykové modely, Mistral, Dolování textu

Item identifier

http://hdl.handle.net/11025/66572

Collections

Bachelor´s works (KIV)

Show full item record

Automatická analýza vztahů mezi vědeckými publikacemi s využitím velkých jazykových modelů

Files

Date issued

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Description

Subject(s)

Citation

Item identifier

Collections