Automatická analýza vztahů mezi vědeckými publikacemi s využitím velkých jazykových modelů
| dc.contributor.advisor | Král Pavel, prof. Ing. Ph.D. | cs |
| dc.contributor.author | Vodička, Daniel | cs |
| dc.contributor.referee | Šmíd Jakub, Ing. | cs |
| dc.date.accepted | 2025-06-09 | |
| dc.date.accessioned | 2026-02-21T03:52:17Z | |
| dc.date.available | 2024-09-30 | |
| dc.date.available | 2026-02-21T03:52:17Z | |
| dc.date.issued | 2025-05-04 | |
| dc.date.submitted | 2025-05-04 | |
| dc.description.abstract | Tato práce se zabývá využitím velkých jazykových modelů (LLMs) pro automatickou analýzu vztahů mezi vědeckými publikacemi, se zaměřením na klasifikaci citací. Zkoumáme různé datasety vědeckých publikací a citační klasifikační schémata, včetně vytvoření nového datasetu s rozšířenou klasifikační taxonomií. Práce implementuje funkční prototyp systému a porovnává několik předem natrénovaných a doladěných velkých jazykových modelů pro úlohu klasifikace citací s využitím technik tzv. zero-shot, few-shot a fine-tuning. Experimentální výsledky ukazují významné rozdíly ve výkonu mezi různými modely a datasety, přičemž nejlepších výsledků dosahují modely s doladěním na specifická data. Analýza také odhaluje, že kontext citace významně ovlivňuje výsledek klasifikace a že modely mají tendenci k nesprávné klasifikaci vzácnějších citačních tříd. Tato práce poskytuje cenné poznatky pro budoucí výzkum v oblasti automatické analýzy vědeckých textů a nabízí směry pro zlepšení klasifikace citací pomocí velkých jazykových modelů. | cs |
| dc.description.abstract-translated | This thesis explores the use of large language models (LLMs) for automatic analysis of relationships between scientific publications, with a focus on citation classification. We examine various scientific publication datasets and citation classification schemes, including the creation of a novel dataset with an expanded classification taxonomy. The work implements a functional prototype and compares several pretrained and fine-tuned LLMs for the citation classification task using zero-shot, few-shot, and fine-tuning techniques. Experimental results show significant variations in performance across different models and datasets, with fine-tuned models achieving the best results. The analysis also reveals that citation context significantly impacts result of classification, and models show a tendency to misclassify rarer citation classes. This work provides valuable insights in automatic scientific text analysis and suggests directions for improving citation classification using LLMs. | en |
| dc.description.department | Katedra informatiky a výpočetní techniky | cs |
| dc.description.result | Obhájeno | cs |
| dc.format | 81 | |
| dc.identifier | 100720 | |
| dc.identifier.uri | http://hdl.handle.net/11025/66572 | |
| dc.language.iso | en | |
| dc.publisher | Západočeská univerzita v Plzni | cs |
| dc.rights | Plný text práce je přístupný bez omezení | cs |
| dc.rights.access | openAccess | cs |
| dc.subject | Analýza citací | cs |
| dc.subject | Klasifikace citací | cs |
| dc.subject | LLama | cs |
| dc.subject | Velké jazykové modely | cs |
| dc.subject | Mistral | cs |
| dc.subject | Dolování textu | cs |
| dc.subject.translated | Citation Analysis | en |
| dc.subject.translated | Citation Classification | en |
| dc.subject.translated | LLama | en |
| dc.subject.translated | LLMs (Large Language Models) | en |
| dc.subject.translated | Mistral | en |
| dc.subject.translated | Text Mining | en |
| dc.thesis.degree-grantor | Západočeská univerzita v Plzni. Fakulta aplikovaných věd | cs |
| dc.thesis.degree-level | Bakalářský | cs |
| dc.thesis.degree-name | Bc. | cs |
| dc.thesis.degree-program | Informatika a výpočetní technika | cs |
| dc.title | Automatická analýza vztahů mezi vědeckými publikacemi s využitím velkých jazykových modelů | cs |
| dc.title.alternative | Automatic Analysis of Relations between Scientific Publications using Large Language Models | en |
| dc.type | bakalářská práce | cs |
| local.files.count | 6 | * |
| local.files.size | 291279890 | * |
| local.has.files | yes | * |
| local.relation.IS | https://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=100720 |
Files
Original bundle
1 - 5 out of 6 results
No Thumbnail Available
- Name:
- A22B0143P_Zadani.pdf
- Size:
- 22.44 KB
- Format:
- Adobe Portable Document Format
- Description:
- VŠKP - příloha
No Thumbnail Available
- Name:
- A22B0143P_prilohy.zip
- Size:
- 276.28 MB
- Format:
- ZIP
- Description:
- VŠKP - příloha
No Thumbnail Available
- Name:
- BP_Vodicka_A22B0143P.pdf
- Size:
- 1.27 MB
- Format:
- Adobe Portable Document Format
- Description:
- VŠKP
No Thumbnail Available
- Name:
- PO_Vodicka_A22B0143P.pdf
- Size:
- 93.34 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek oponenta VŠKP
No Thumbnail Available
- Name:
- PV_Vodicka_A22B0143P.pdf
- Size:
- 32.09 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek vedoucího VŠKP