Semantic Search and Filtering with AI Agents
Date issued
2025
Journal Title
Journal ISSN
Volume Title
Publisher
Springer
Abstract
The rapid advancement of pre-trained large language models (LLMs) has enabled the creation of innovative applications, especially in natural language processing. This work employs LLMs alongside our in-house technologies to develop an intuitive database search engine that processes natural language queries. The system uses a network of AI agents, including prompted LLMs and single-purpose neural classifiers, to categorize user queries into conditions for filtering individual data sources or direct matches to database entries. Enhanced with a Retrieval-Augmented Generation (RAG) approach, the application allows users to search large databases conversationally through a voice-enabled web-based interface. Currently, in the demo stage, this project shows full pipeline functionality and has been tested with approximately 150 h of transcribed speech data. Initial findings confirm the overall concept of the application.
Rychlý rozvoj velkých jazykových modelů (LLM) umožnil vznik nových aplikací v oblasti zpracování přirozeného jazyka. Tato práce využívá LLM ve spojení s interně vyvíjenými technologiemi k vytvoření intuitivního vyhledávacího systému nad databázemi, který zpracovává dotazy formulované v přirozeném jazyce. Systém používá síť AI agentů, zahrnující promptované LLM a specializované neuronové klasifikátory, které kategorizují uživatelské dotazy na podmínky pro filtrování jednotlivých datových zdrojů nebo na přímé shody s databázovými záznamy. Pomocí přístupu Retrieval-Augmented Generation (RAG) aplikace umožňuje konverzační vyhledávání ve velkých databázích prostřednictvím webového rozhraní s podporou hlasového vstupu. V současné době se projekt nachází ve fázi demonstračního nasazení, přičemž celý zpracovatelský řetězec byl otestován na přibližně 150 hodinách přepsaných hlasových dat. Dosavadní výsledky potvrzují funkčnost navrženého konceptu.
Rychlý rozvoj velkých jazykových modelů (LLM) umožnil vznik nových aplikací v oblasti zpracování přirozeného jazyka. Tato práce využívá LLM ve spojení s interně vyvíjenými technologiemi k vytvoření intuitivního vyhledávacího systému nad databázemi, který zpracovává dotazy formulované v přirozeném jazyce. Systém používá síť AI agentů, zahrnující promptované LLM a specializované neuronové klasifikátory, které kategorizují uživatelské dotazy na podmínky pro filtrování jednotlivých datových zdrojů nebo na přímé shody s databázovými záznamy. Pomocí přístupu Retrieval-Augmented Generation (RAG) aplikace umožňuje konverzační vyhledávání ve velkých databázích prostřednictvím webového rozhraní s podporou hlasového vstupu. V současné době se projekt nachází ve fázi demonstračního nasazení, přičemž celý zpracovatelský řetězec byl otestován na přibližně 150 hodinách přepsaných hlasových dat. Dosavadní výsledky potvrzují funkčnost navrženého konceptu.
Description
Subject(s)
semantic search, AI agents, RAG, voice-based Interface, sémantické vyhledávání, AI agenti, RAG, hlasové rozhraní