Efektivní adaptace velkých jazykových modelů na české úlohy

dc.contributor.advisorKonopík Miloslav, Ing. Ph.D.cs
dc.contributor.authorHejman, Jakubcs
dc.contributor.refereeŠmíd Jakub, Ing.cs
dc.date.accepted2025-09-02
dc.date.accessioned2026-02-20T22:48:57Z
dc.date.available2024-09-09
dc.date.available2026-02-20T22:48:57Z
dc.date.issued2025-06-19
dc.date.submitted2025-06-19
dc.description.abstractTato diplomová práce zkoumá adaptaci velkých jazykových modelů na úlohách zpracování přirozeného jazyka v češtině. Pozornost je věnována praktické použitelnosti velkých jazykových modelů pro vybrané české úlohy a na přístupy k efektivní adaptaci těchto modelů. Zkoumané úlohy zahrnují klasifikaci sentimentu na datasetu filmových recenzí ČSFD, sumarizaci na datasetu SumeCzech a rozpoznávání koreferencí na CorefUD 1.1. Hlavním přístupem je fine-tuning předtrénovaných open-source LLM pomocí text-to-text přístupu. Konkrétně jsou využity modely Mistral-7B, Llama-3 a Gemma 3, za pomocí Parameter-Efficient Fine-Tuning technik Low-Rank Adaptation a přístupů založených na promptingu. Klíčový příspěvek spočívá v demonstraci efektivního trénování na hardware s omezenými zdroji pomocíQuantizedLowRankAdaptation. Experimentální výsledky dosahují nejlepších výsledků na jedné z úloh a slibného výkonu ve všech ostatních úlohách.cs
dc.description.abstract-translatedThis thesis explores the adaptation of Large Language Models to Natural Language Processing tasks in the Czech language. The main focus is on the practical usability of Large Language Models for selected Czech tasks and the approaches for efficient adaptation of these models. The investigated tasks are Sentiment Classification on the ČSFD movie review dataset, Summarization using SumeCzech and Coreference Resolution with CorefUD 1.1. The core methodology involves fine-tuning various open-source LLMs in a text-to-text manner, including Mistral-7B, Llama-3 and Gemma3, using Parameter-Efficient Fine-Tuning techniques, specifically Low-Rank Adaptation and prompting approaches. A key contribution lies in demonstrating effective training on resource-constrained hardware through Quantized Low-Rank Adaptation. Experimental results show state-of-the-art results on one task and promising performance on all other tasks.en
dc.description.departmentKatedra informatiky a výpočetní technikycs
dc.description.resultObhájenocs
dc.format82
dc.identifier100151
dc.identifier.urihttp://hdl.handle.net/11025/66192
dc.language.isoen
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezenícs
dc.rights.accessopenAccesscs
dc.subjectNatural Language Processingcs
dc.subjectSentiment Classificationcs
dc.subjectSummarizationcs
dc.subjectCoreference Resolutioncs
dc.subjectDeep Learningcs
dc.subjectParameter Efficient Fine-Tuningcs
dc.subjectPromptingcs
dc.subjectLarge Language Modelscs
dc.subjectTransformerscs
dc.subjectLoRAcs
dc.subjectQLoRAcs
dc.subject.translatedNatural Language Processingen
dc.subject.translatedSentiment Classificationen
dc.subject.translatedSummarizationen
dc.subject.translatedCoreference Resolutionen
dc.subject.translatedDeep Learningen
dc.subject.translatedParameter Efficient Fine-Tuningen
dc.subject.translatedPromptingen
dc.subject.translatedLarge Language Modelsen
dc.subject.translatedTransformersen
dc.subject.translatedLoRAen
dc.subject.translatedQLoRAen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-levelNavazujícícs
dc.thesis.degree-nameIng.cs
dc.thesis.degree-programInformatika a její specializacecs
dc.titleEfektivní adaptace velkých jazykových modelů na české úlohycs
dc.title.alternativeEffective Adaptation of Large Language Models for Czech Tasksen
dc.typediplomová prácecs
local.files.count6*
local.files.size7698278*
local.has.filesyes*
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=100151

Files

Original bundle
Showing 1 - 5 out of 6 results
No Thumbnail Available
Name:
A22N0065P-zadani_DP.pdf
Size:
82.3 KB
Format:
Adobe Portable Document Format
Description:
VŠKP - příloha
No Thumbnail Available
Name:
A22N0065P_prilohy.zip
Size:
5.66 MB
Format:
ZIP
Description:
VŠKP - příloha
No Thumbnail Available
Name:
DP_Hejman_A22N0065P.pdf
Size:
768.71 KB
Format:
Adobe Portable Document Format
Description:
VŠKP
No Thumbnail Available
Name:
PO_Hejman_A22N0065P.pdf
Size:
116.99 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta VŠKP
No Thumbnail Available
Name:
PV_Hejman_A22N0065P.pdf
Size:
504.89 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího VŠKP

Collections