Semantic Search and Filtering with AI Agents

dc.contributor.authorBulín, Martin
dc.contributor.authorŠvec, Jan
dc.contributor.authorPolák, Filip
dc.contributor.authorŠmídl, Luboš
dc.date.accessioned2026-03-24T19:05:28Z
dc.date.available2026-03-24T19:05:28Z
dc.date.issued2025
dc.date.updated2026-03-24T19:05:27Z
dc.description.abstractThe rapid advancement of pre-trained large language models (LLMs) has enabled the creation of innovative applications, especially in natural language processing. This work employs LLMs alongside our in-house technologies to develop an intuitive database search engine that processes natural language queries. The system uses a network of AI agents, including prompted LLMs and single-purpose neural classifiers, to categorize user queries into conditions for filtering individual data sources or direct matches to database entries. Enhanced with a Retrieval-Augmented Generation (RAG) approach, the application allows users to search large databases conversationally through a voice-enabled web-based interface. Currently, in the demo stage, this project shows full pipeline functionality and has been tested with approximately 150 h of transcribed speech data. Initial findings confirm the overall concept of the application.en
dc.description.abstractRychlý rozvoj velkých jazykových modelů (LLM) umožnil vznik nových aplikací v oblasti zpracování přirozeného jazyka. Tato práce využívá LLM ve spojení s interně vyvíjenými technologiemi k vytvoření intuitivního vyhledávacího systému nad databázemi, který zpracovává dotazy formulované v přirozeném jazyce. Systém používá síť AI agentů, zahrnující promptované LLM a specializované neuronové klasifikátory, které kategorizují uživatelské dotazy na podmínky pro filtrování jednotlivých datových zdrojů nebo na přímé shody s databázovými záznamy. Pomocí přístupu Retrieval-Augmented Generation (RAG) aplikace umožňuje konverzační vyhledávání ve velkých databázích prostřednictvím webového rozhraní s podporou hlasového vstupu. V současné době se projekt nachází ve fázi demonstračního nasazení, přičemž celý zpracovatelský řetězec byl otestován na přibližně 150 hodinách přepsaných hlasových dat. Dosavadní výsledky potvrzují funkčnost navrženého konceptu.cz
dc.format5
dc.identifier.doi10.1007/978-3-031-88720-8_4
dc.identifier.isbn978-3-031-88719-2
dc.identifier.issn0302-9743
dc.identifier.obd43947496
dc.identifier.orcidBulín, Martin 0000-0003-0276-3143
dc.identifier.orcidŠvec, Jan 0000-0001-8362-5927
dc.identifier.orcidPolák, Filip 0009-0003-3969-3772
dc.identifier.orcidŠmídl, Luboš 0000-0002-8169-2410
dc.identifier.urihttp://hdl.handle.net/11025/67355
dc.language.isoen
dc.project.IDEH23_021/0008436
dc.publisherSpringer
dc.relation.ispartofseries47th European Conference on Information Retrieval, ECIR 2025
dc.subjectsemantic searchen
dc.subjectAI agentsen
dc.subjectRAGen
dc.subjectvoice-based Interfaceen
dc.subjectsémantické vyhledávánícz
dc.subjectAI agenticz
dc.subjectRAGcz
dc.subjecthlasové rozhranícz
dc.titleSemantic Search and Filtering with AI Agentsen
dc.titleSémantické vyhledávání a filtrování pomocí AI agentůcz
dc.typeStať ve sborníku (D)
dc.typeSTAŤ VE SBORNÍKU
dc.type.statusPublished Version
local.files.count1*
local.files.size554007*
local.has.filesyes*
local.identifier.eid2-s2.0-105006612285

Files

Original bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
v3-compiled-by-easychair.pdf
Size:
541.02 KB
Format:
Adobe Portable Document Format
License bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: