Ověření schopností LLM generovat použitelné testy software

dc.contributor.advisorLipka Richard, Ing. Ph.D.cs
dc.contributor.authorVelc, Matyáš Josefcs
dc.contributor.refereeHerout Pavel, doc. Ing. Ph.D.cs
dc.date.accepted2025-06-10
dc.date.accessioned2026-02-21T00:18:58Z
dc.date.available2024-09-30
dc.date.available2026-02-21T00:18:58Z
dc.date.issued2025-05-05
dc.date.submitted2025-05-05
dc.description.abstractTato bakalářská práce zkoumá schopnosti různých velkých jazykových modelů (LLM) generovat automatizované testy pro webové aplikace. Práce navazuje na před- chozí výzkum v oblasti generování testů a rozšiřuje ho o systematické porovnání sedmi modelů od předních poskytovatelů (Google, OpenAI, Anthropic a Mistral AI). Experimentálně jsem implementoval systém pro automatizované generování, spouš- tění a vyhodnocování testů v prostředí Robot Framework včetně schopnosti auto- matické opravy chybných testů a měření pokrytí kódu. Na základě experimentů s testováním webové aplikace TbUIS jsou analyzovány schopnosti jednotlivých mo- delů z hlediska úspěšnosti generovaných testů, jejich schopnosti detekovat chyby, časové náročnosti generování, schopnosti automatických oprav a pokrytí kódu. Výsledky ukazují výrazné rozdíly mezi modely, přičemž nejvyšší úspěšnost dosáhl Claude 3.7 Sonnet (91,7%), následovaný modely Gemini Pro 2.5 (79,2%) a Claude 3 Opus (75,0%). Práce přináší empiricky podložená doporučení pro využití různých LLM v procesu testování softwaru.cs
dc.description.abstract-translatedThis bachelor thesis investigates the capabilities of various large language models (LLMs) to generate automated tests for web applications. The thesis builds on pre- vious research in test generation and extends it with a systematic comparison of seven models from leading providers (Google, OpenAI, Anthropic, and Mistral AI). I experimentally implemented a system for automated generation, execution, and evaluation of tests in the Robot Framework environment, including the ability to automatically repair failed tests and measure code coverage. Based on experiments with testing the TbUIS web application, the capabilities of individual models are analyzed in terms of success rate of generated tests, their ability to detect errors, time requirements for generation, and automatic repair capabilities. The results show significant differences between models, with Claude 3.7 Sonnet achieving the highest success rate (91.7%), followed by Gemini Pro 2.5 (79.2%) and Claude 3 Opus (75.0%). The thesis provides empirically based recommendations for using various LLMs in the software testing process.en
dc.description.departmentKatedra informatiky a výpočetní technikycs
dc.description.resultObhájenocs
dc.format53
dc.identifier100586
dc.identifier.urihttp://hdl.handle.net/11025/66472
dc.language.isocs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezenícs
dc.rights.accessopenAccesscs
dc.subjectRobot Frameworkcs
dc.subjectvelký jazykový modelcs
dc.subjectgenerování testůcs
dc.subjectautomatizované testovánícs
dc.subject.translatedRobot Frameworken
dc.subject.translatedlarge language modelen
dc.subject.translatedtest generationen
dc.subject.translatedautomated testingen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-levelBakalářskýcs
dc.thesis.degree-nameBc.cs
dc.thesis.degree-programInformatika a výpočetní technikacs
dc.titleOvěření schopností LLM generovat použitelné testy softwarecs
dc.title.alternativeAnalysis of the LLM's ability to generate useful software testsen
dc.typebakalářská prácecs
local.files.count6*
local.files.size949742474*
local.has.filesyes*
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=100586

Files

Original bundle
Showing 1 - 5 out of 6 results
No Thumbnail Available
Name:
A22B0200P_Zadani.pdf
Size:
21.92 KB
Format:
Adobe Portable Document Format
Description:
VŠKP - příloha
No Thumbnail Available
Name:
A22B0200P_prilohy.zip
Size:
904.55 MB
Format:
ZIP
Description:
VŠKP - příloha
No Thumbnail Available
Name:
BP_Velc_A22B0200P.pdf
Size:
780.96 KB
Format:
Adobe Portable Document Format
Description:
VŠKP
No Thumbnail Available
Name:
PO_Velc_A22B0200P.pdf
Size:
168.02 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta VŠKP
No Thumbnail Available
Name:
PV_Velc_A22B0200P.pdf
Size:
103.17 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího VŠKP