Využití velkých jazykových modelů pro vyhledávání informací
Date issued
2025-06-19
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Západočeská univerzita v Plzni
Abstract
Tato práce se zaměřuje na klíčové problémy velkých jazykových modelů a navrhuje dva nové systémy kombinující velké jazykové modely s externími datovými zdroji pro řešení komplexních úloh v oblasti získávání informací. První systém je navržený na odpovídání uživatelských dotazů na základě nestrukturovaných dat a využívá architekturu retrieval-augmented generation doplněnou o hybridní systém vyhledávání dokumentů kombinující sémantickou a lexikální podobnost. Nalezené dokumenty se poté seřadí pomocí cross-encoderu. Při vyhodnocení na benchmarku TriviaQA dosáhl tento systém úplnosti 0,78 a správnosti odpovědi 0,71.<br>Druhý systém je zaměřen na generování databázových dotazů na základě uživatelského vstupu a znalosti struktury databáze. Systém využívá velké jazykové modely pro automatizovanou analýzu dat a klasifikaci jejich typu, dále zahrnuje iterativní mechanismus založený na automatické zpětné vazbě, díky kterému dokáže dosahovat lepších výsledků. Na náročné datové sadě BEAVER dosáhl úplnosti získávání tabulek 0.58 a přesnosti získaných výsledků 0.12.
Description
Subject(s)
Vyhledávání informací, velké jazykové modely, generování SQL