Automatická analýza vztahů mezi vědeckými publikacemi s využitím velkých jazykových modelů
Date issued
2025-05-04
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Západočeská univerzita v Plzni
Abstract
Tato práce se zabývá využitím velkých jazykových modelů (LLMs) pro automatickou analýzu vztahů mezi vědeckými publikacemi, se zaměřením na klasifikaci citací. Zkoumáme různé datasety vědeckých publikací a citační klasifikační schémata,
včetně vytvoření nového datasetu s rozšířenou klasifikační taxonomií. Práce implementuje funkční prototyp systému a porovnává několik předem natrénovaných
a doladěných velkých jazykových modelů pro úlohu klasifikace citací s využitím
technik tzv. zero-shot, few-shot a fine-tuning. Experimentální výsledky ukazují významné rozdíly ve výkonu mezi různými modely a datasety, přičemž nejlepších
výsledků dosahují modely s doladěním na specifická data. Analýza také odhaluje, že kontext citace významně ovlivňuje výsledek klasifikace a že modely mají tendenci k nesprávné klasifikaci vzácnějších citačních tříd. Tato práce poskytuje cenné poznatky pro budoucí výzkum v oblasti automatické analýzy vědeckých textů a nabízí směry pro zlepšení klasifikace citací pomocí velkých jazykových modelů.
Description
Subject(s)
Analýza citací, Klasifikace citací, LLama, Velké jazykové modely, Mistral, Dolování textu