Voice-Interactive Semantic Search Interface with Vector Databases
| dc.contributor.author | Bulín, Martin | |
| dc.contributor.author | Frémund, Adam | |
| dc.date.accessioned | 2025-06-20T08:36:13Z | |
| dc.date.available | 2025-06-20T08:36:13Z | |
| dc.date.issued | 2024 | |
| dc.date.updated | 2025-06-20T08:36:13Z | |
| dc.description.abstract | Semantic searching offers significant advantages over full-text search, particularly be- cause it allows users to formulate queries in natural language without needing to know the precise indexed key phrases. By using vector databases that store and index data as high- dimensional vectors, we can search through large datasets in real-time. In this work, we present a custom web-based interface for state-of-the-art semantic search on arbitrary textual data. Additionally, we integrate our in-house speech technologies - ASR and TTS to enhance user interaction. The interface supports two modes: 1) Searching based on retrieval- augmented generation (RAG) with an LLM generating answers in a chat-like format, and 2) raw semantic matching with indexed data. In both modes, the original PDF file is shown and the exact source of the retrieved information is provided. | en |
| dc.description.abstract | Sémantické vyhledávání nabízí významné výhody oproti full-textovému vyhledávání, zejména proto, že uživatelům umožňuje formulovat dotazy v přirozeném jazyce, aniž by museli znát přesné indexované klíčové fráze. Použitím vektorových databází, které ukládají a indexují data jako vysoko-dimenzionální vektory, můžeme prohledávat rozsáhlé datové sady v reálném čase. V této práci představujeme vlastní webové rozhraní pro nejmodernější sémantické vyhledávání na libovolných textových datech. Dále integrujeme naše interní technologie pro rozpoznávání řeči (ASR) a syntézu řeči (TTS) ke zlepšení interakce s uživateli. Rozhraní podporuje dva režimy: 1) Vyhledávání založené na generování odpovědí s podporou získávání informací (RAG) s využitím velkého jazykového modelu (LLM), který generuje odpovědi ve formátu podobném chatu, a 2) surové sémantické párování s indexovanými daty. V obou režimech se zobrazuje původní PDF soubor a přesný zdroj získaných informací. | cz |
| dc.format | 2 | |
| dc.identifier.isbn | 978-80-261-1228-0 | |
| dc.identifier.obd | 43944058 | |
| dc.identifier.orcid | Bulín, Martin 0000-0003-0276-3143 | |
| dc.identifier.orcid | Frémund, Adam 0000-0001-8780-6629 | |
| dc.identifier.uri | http://hdl.handle.net/11025/60361 | |
| dc.language.iso | en | |
| dc.project.ID | SGS-2022-017 | |
| dc.publisher | Západočeská univerzita v Plzni | |
| dc.relation.ispartofseries | Studentská vědecká konference Fakulty aplikovaných věd 2024 | |
| dc.subject | semantic search | en |
| dc.subject | RAG | en |
| dc.subject | voice-interactive interface | en |
| dc.subject | sémantické vyhledávání | cz |
| dc.subject | RAG | cz |
| dc.subject | hlasově interaktivní rozhraní | cz |
| dc.title | Voice-Interactive Semantic Search Interface with Vector Databases | en |
| dc.title | Hlasově interaktivní rozhraní s vektorovou databází pro sémantické vyhledávání | cz |
| dc.type | Stať ve sborníku (O) | |
| dc.type | STAŤ VE SBORNÍKU | |
| dc.type.status | Published Version | |
| local.files.count | 1 | * |
| local.files.size | 2325813 | * |
| local.has.files | yes | * |
Files
Original bundle
1 - 1 out of 1 results
No Thumbnail Available
- Name:
- svk-2024-rag-demo.pdf
- Size:
- 2.22 MB
- Format:
- Adobe Portable Document Format
License bundle
1 - 1 out of 1 results
No Thumbnail Available
- Name:
- license.txt
- Size:
- 1.71 KB
- Format:
- Item-specific license agreed upon to submission
- Description: