Automatická analýza vztahů mezi vědeckými publikacemi s využitím velkých jazykových modelů

Abstract

Tato práce se zabývá využitím velkých jazykových modelů (LLMs) pro automatickou analýzu vztahů mezi vědeckými publikacemi, se zaměřením na klasifikaci citací. Zkoumáme různé datasety vědeckých publikací a citační klasifikační schémata, včetně vytvoření nového datasetu s rozšířenou klasifikační taxonomií. Práce implementuje funkční prototyp systému a porovnává několik předem natrénovaných a doladěných velkých jazykových modelů pro úlohu klasifikace citací s využitím technik tzv. zero-shot, few-shot a fine-tuning. Experimentální výsledky ukazují významné rozdíly ve výkonu mezi různými modely a datasety, přičemž nejlepších výsledků dosahují modely s doladěním na specifická data. Analýza také odhaluje, že kontext citace významně ovlivňuje výsledek klasifikace a že modely mají tendenci k nesprávné klasifikaci vzácnějších citačních tříd. Tato práce poskytuje cenné poznatky pro budoucí výzkum v oblasti automatické analýzy vědeckých textů a nabízí směry pro zlepšení klasifikace citací pomocí velkých jazykových modelů.

Description

Subject(s)

Analýza citací, Klasifikace citací, LLama, Velké jazykové modely, Mistral, Dolování textu

Citation