Využití velkých jazykových modelů pro vyhledávání informací

dc.contributor.advisorKrál Pavel, prof. Ing. Ph.D.cs
dc.contributor.authorVlček, Lukášcs
dc.contributor.refereeMartínek Jiří, Ing. Ph.D.cs
dc.date.accepted2025-09-02
dc.date.accessioned2026-02-20T16:04:22Z
dc.date.available2024-09-09
dc.date.available2026-02-20T16:04:22Z
dc.date.issued2025-06-19
dc.date.submitted2025-06-19
dc.description.abstractTato práce se zaměřuje na klíčové problémy velkých jazykových modelů a navrhuje dva nové systémy kombinující velké jazykové modely s externími datovými zdroji pro řešení komplexních úloh v oblasti získávání informací. První systém je navržený na odpovídání uživatelských dotazů na základě nestrukturovaných dat a využívá architekturu retrieval-augmented generation doplněnou o hybridní systém vyhledávání dokumentů kombinující sémantickou a lexikální podobnost. Nalezené dokumenty se poté seřadí pomocí cross-encoderu. Při vyhodnocení na benchmarku TriviaQA dosáhl tento systém úplnosti 0,78 a správnosti odpovědi 0,71.<br>Druhý systém je zaměřen na generování databázových dotazů na základě uživatelského vstupu a znalosti struktury databáze. Systém využívá velké jazykové modely pro automatizovanou analýzu dat a klasifikaci jejich typu, dále zahrnuje iterativní mechanismus založený na automatické zpětné vazbě, díky kterému dokáže dosahovat lepších výsledků. Na náročné datové sadě BEAVER dosáhl úplnosti získávání tabulek 0.58 a přesnosti získaných výsledků 0.12.cs
dc.description.abstract-translatedThis thesis focuses on the key issues of large language models (LLMs) and proposes two systems combining LLMs with external data sources to solve complex information retrieval tasks. The first system designed for open-domain questions answering uses a retrieval-augmented generation architecture combined with a hybrid retrieval with dense embeddings and lexical chunk representation followed by a cross-encoder reranker. Evaluated on the TriviaQA benchmark, this system achieved a recall metric of 0.78 and an answer correctness 0.71. The second system focuses on generating database queries based on user input and knowledge of the database schema. It uses LLMs for automated schema analysis and data type classification and includes an iterative mechanism built on automatic feedback to achieve better results. On the challenging enterprise-like BEAVER dataset, it achieved a table recall of 0.58 and an execution accuracy of 0.12.en
dc.description.departmentKatedra informatiky a výpočetní technikycs
dc.description.resultObhájenocs
dc.format73 s
dc.identifier99643
dc.identifier.urihttp://hdl.handle.net/11025/65893
dc.language.isoen
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezenícs
dc.rights.accessopenAccesscs
dc.subjectVyhledávání informacícs
dc.subjectvelké jazykové modelycs
dc.subjectgenerování SQLcs
dc.subject.translatedInformation Retrievalen
dc.subject.translatedIRen
dc.subject.translatedLarge Language Modelsen
dc.subject.translatedLLMen
dc.subject.translatedRAGen
dc.subject.translatedText-To-SQLen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-levelNavazujícícs
dc.thesis.degree-nameIng.cs
dc.thesis.degree-programSoftwarové a informační systémycs
dc.titleVyužití velkých jazykových modelů pro vyhledávání informacícs
dc.title.alternativeApplication of Large Language Models for Information Retrievalen
dc.typediplomová prácecs
local.files.count6*
local.files.size28748249*
local.has.filesyes*
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=99643

Files

Original bundle
Showing 1 - 5 out of 6 results
No Thumbnail Available
Name:
A24N0112P-zadani_DP.pdf
Size:
22.99 KB
Format:
Adobe Portable Document Format
Description:
VŠKP - příloha
No Thumbnail Available
Name:
A24N0112P_prilohy.zip
Size:
24.87 MB
Format:
ZIP
Description:
VŠKP - příloha
No Thumbnail Available
Name:
DP_Vlcek_A24N0112P.pdf
Size:
2.01 MB
Format:
Adobe Portable Document Format
Description:
VŠKP
No Thumbnail Available
Name:
PO_Vlcek_A24N0112P.pdf
Size:
228.75 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta VŠKP
No Thumbnail Available
Name:
PV_Vlcek_A24N0112P.pdf
Size:
99.67 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího VŠKP

Collections