Automatická analýza vztahů mezi vědeckými publikacemi s využitím velkých jazykových modelů

dc.contributor.advisorKrál Pavel, prof. Ing. Ph.D.cs
dc.contributor.authorVodička, Danielcs
dc.contributor.refereeŠmíd Jakub, Ing.cs
dc.date.accepted2025-06-09
dc.date.accessioned2026-02-21T03:52:17Z
dc.date.available2024-09-30
dc.date.available2026-02-21T03:52:17Z
dc.date.issued2025-05-04
dc.date.submitted2025-05-04
dc.description.abstractTato práce se zabývá využitím velkých jazykových modelů (LLMs) pro automatickou analýzu vztahů mezi vědeckými publikacemi, se zaměřením na klasifikaci citací. Zkoumáme různé datasety vědeckých publikací a citační klasifikační schémata, včetně vytvoření nového datasetu s rozšířenou klasifikační taxonomií. Práce implementuje funkční prototyp systému a porovnává několik předem natrénovaných a doladěných velkých jazykových modelů pro úlohu klasifikace citací s využitím technik tzv. zero-shot, few-shot a fine-tuning. Experimentální výsledky ukazují významné rozdíly ve výkonu mezi různými modely a datasety, přičemž nejlepších výsledků dosahují modely s doladěním na specifická data. Analýza také odhaluje, že kontext citace významně ovlivňuje výsledek klasifikace a že modely mají tendenci k nesprávné klasifikaci vzácnějších citačních tříd. Tato práce poskytuje cenné poznatky pro budoucí výzkum v oblasti automatické analýzy vědeckých textů a nabízí směry pro zlepšení klasifikace citací pomocí velkých jazykových modelů.cs
dc.description.abstract-translatedThis thesis explores the use of large language models (LLMs) for automatic analysis of relationships between scientific publications, with a focus on citation classification. We examine various scientific publication datasets and citation classification schemes, including the creation of a novel dataset with an expanded classification taxonomy. The work implements a functional prototype and compares several pretrained and fine-tuned LLMs for the citation classification task using zero-shot, few-shot, and fine-tuning techniques. Experimental results show significant variations in performance across different models and datasets, with fine-tuned models achieving the best results. The analysis also reveals that citation context significantly impacts result of classification, and models show a tendency to misclassify rarer citation classes. This work provides valuable insights in automatic scientific text analysis and suggests directions for improving citation classification using LLMs.en
dc.description.departmentKatedra informatiky a výpočetní technikycs
dc.description.resultObhájenocs
dc.format81
dc.identifier100720
dc.identifier.urihttp://hdl.handle.net/11025/66572
dc.language.isoen
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezenícs
dc.rights.accessopenAccesscs
dc.subjectAnalýza citacícs
dc.subjectKlasifikace citacícs
dc.subjectLLamacs
dc.subjectVelké jazykové modelycs
dc.subjectMistralcs
dc.subjectDolování textucs
dc.subject.translatedCitation Analysisen
dc.subject.translatedCitation Classificationen
dc.subject.translatedLLamaen
dc.subject.translatedLLMs (Large Language Models)en
dc.subject.translatedMistralen
dc.subject.translatedText Miningen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-levelBakalářskýcs
dc.thesis.degree-nameBc.cs
dc.thesis.degree-programInformatika a výpočetní technikacs
dc.titleAutomatická analýza vztahů mezi vědeckými publikacemi s využitím velkých jazykových modelůcs
dc.title.alternativeAutomatic Analysis of Relations between Scientific Publications using Large Language Modelsen
dc.typebakalářská prácecs
local.files.count6*
local.files.size291279890*
local.has.filesyes*
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=100720

Files

Original bundle
Showing 1 - 5 out of 6 results
No Thumbnail Available
Name:
A22B0143P_Zadani.pdf
Size:
22.44 KB
Format:
Adobe Portable Document Format
Description:
VŠKP - příloha
No Thumbnail Available
Name:
A22B0143P_prilohy.zip
Size:
276.28 MB
Format:
ZIP
Description:
VŠKP - příloha
No Thumbnail Available
Name:
BP_Vodicka_A22B0143P.pdf
Size:
1.27 MB
Format:
Adobe Portable Document Format
Description:
VŠKP
No Thumbnail Available
Name:
PO_Vodicka_A22B0143P.pdf
Size:
93.34 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta VŠKP
No Thumbnail Available
Name:
PV_Vodicka_A22B0143P.pdf
Size:
32.09 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího VŠKP