Využití velkých jazykových modelů pro vyhledávání informací
| dc.contributor.advisor | Král Pavel, prof. Ing. Ph.D. | cs |
| dc.contributor.author | Vlček, Lukáš | cs |
| dc.contributor.referee | Martínek Jiří, Ing. Ph.D. | cs |
| dc.date.accepted | 2025-09-02 | |
| dc.date.accessioned | 2026-02-20T16:04:22Z | |
| dc.date.available | 2024-09-09 | |
| dc.date.available | 2026-02-20T16:04:22Z | |
| dc.date.issued | 2025-06-19 | |
| dc.date.submitted | 2025-06-19 | |
| dc.description.abstract | Tato práce se zaměřuje na klíčové problémy velkých jazykových modelů a navrhuje dva nové systémy kombinující velké jazykové modely s externími datovými zdroji pro řešení komplexních úloh v oblasti získávání informací. První systém je navržený na odpovídání uživatelských dotazů na základě nestrukturovaných dat a využívá architekturu retrieval-augmented generation doplněnou o hybridní systém vyhledávání dokumentů kombinující sémantickou a lexikální podobnost. Nalezené dokumenty se poté seřadí pomocí cross-encoderu. Při vyhodnocení na benchmarku TriviaQA dosáhl tento systém úplnosti 0,78 a správnosti odpovědi 0,71.<br>Druhý systém je zaměřen na generování databázových dotazů na základě uživatelského vstupu a znalosti struktury databáze. Systém využívá velké jazykové modely pro automatizovanou analýzu dat a klasifikaci jejich typu, dále zahrnuje iterativní mechanismus založený na automatické zpětné vazbě, díky kterému dokáže dosahovat lepších výsledků. Na náročné datové sadě BEAVER dosáhl úplnosti získávání tabulek 0.58 a přesnosti získaných výsledků 0.12. | cs |
| dc.description.abstract-translated | This thesis focuses on the key issues of large language models (LLMs) and proposes two systems combining LLMs with external data sources to solve complex information retrieval tasks. The first system designed for open-domain questions answering uses a retrieval-augmented generation architecture combined with a hybrid retrieval with dense embeddings and lexical chunk representation followed by a cross-encoder reranker. Evaluated on the TriviaQA benchmark, this system achieved a recall metric of 0.78 and an answer correctness 0.71. The second system focuses on generating database queries based on user input and knowledge of the database schema. It uses LLMs for automated schema analysis and data type classification and includes an iterative mechanism built on automatic feedback to achieve better results. On the challenging enterprise-like BEAVER dataset, it achieved a table recall of 0.58 and an execution accuracy of 0.12. | en |
| dc.description.department | Katedra informatiky a výpočetní techniky | cs |
| dc.description.result | Obhájeno | cs |
| dc.format | 73 s | |
| dc.identifier | 99643 | |
| dc.identifier.uri | http://hdl.handle.net/11025/65893 | |
| dc.language.iso | en | |
| dc.publisher | Západočeská univerzita v Plzni | cs |
| dc.rights | Plný text práce je přístupný bez omezení | cs |
| dc.rights.access | openAccess | cs |
| dc.subject | Vyhledávání informací | cs |
| dc.subject | velké jazykové modely | cs |
| dc.subject | generování SQL | cs |
| dc.subject.translated | Information Retrieval | en |
| dc.subject.translated | IR | en |
| dc.subject.translated | Large Language Models | en |
| dc.subject.translated | LLM | en |
| dc.subject.translated | RAG | en |
| dc.subject.translated | Text-To-SQL | en |
| dc.thesis.degree-grantor | Západočeská univerzita v Plzni. Fakulta aplikovaných věd | cs |
| dc.thesis.degree-level | Navazující | cs |
| dc.thesis.degree-name | Ing. | cs |
| dc.thesis.degree-program | Softwarové a informační systémy | cs |
| dc.title | Využití velkých jazykových modelů pro vyhledávání informací | cs |
| dc.title.alternative | Application of Large Language Models for Information Retrieval | en |
| dc.type | diplomová práce | cs |
| local.files.count | 6 | * |
| local.files.size | 28748249 | * |
| local.has.files | yes | * |
| local.relation.IS | https://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=99643 |
Files
Original bundle
1 - 5 out of 6 results
No Thumbnail Available
- Name:
- A24N0112P-zadani_DP.pdf
- Size:
- 22.99 KB
- Format:
- Adobe Portable Document Format
- Description:
- VŠKP - příloha
No Thumbnail Available
- Name:
- A24N0112P_prilohy.zip
- Size:
- 24.87 MB
- Format:
- ZIP
- Description:
- VŠKP - příloha
No Thumbnail Available
- Name:
- DP_Vlcek_A24N0112P.pdf
- Size:
- 2.01 MB
- Format:
- Adobe Portable Document Format
- Description:
- VŠKP
No Thumbnail Available
- Name:
- PO_Vlcek_A24N0112P.pdf
- Size:
- 228.75 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek oponenta VŠKP
No Thumbnail Available
- Name:
- PV_Vlcek_A24N0112P.pdf
- Size:
- 99.67 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek vedoucího VŠKP