Open-source hlasový dialogový asistent
| dc.contributor.advisor | Frémund Adam, Ing. | cs |
| dc.contributor.author | Ivannikov, Viacheslav | cs |
| dc.contributor.referee | Polák Filip, Ing. | cs |
| dc.date.accepted | 2025-06-18 | |
| dc.date.accessioned | 2026-02-20T23:21:00Z | |
| dc.date.available | 2024-10-15 | |
| dc.date.available | 2026-02-20T23:21:00Z | |
| dc.date.issued | 2025-05-19 | |
| dc.date.submitted | 2025-05-19 | |
| dc.description.abstract | Tato práce se zabývá vývojem pokročilého AI asistenta, navrženého pro robustní lokální inferenci na platformě macOS a pokročilé schopnosti umělé inteligence. Cílem je excelovat v úkolech dostupných již existujícím asistentům a zároveň rozšířit škálu nových funkcí, jako je pokročilé lokální vyhledávání na internetu, kvalitní rozpoznávání a generování řeči, schopnosti konstruktivního chatování a další. Významnou součástí tohoto výzkumu bylo experimentální zkoumání jemného ladění LLM zaměřeného na uvažování, specificky pro úlohy volání funkcí, s využitím technik Parameter-Efficient Fine-Tuning (PEFT). Cílem tohoto experimentu bylo zlepšit schopnost modelu přesně vyvolávat nástroje na základě záměru uživatele. Tato práce také zahrnuje analýzu historického kontextu, zkoumání funkčnosti populárních asistentů a návrhové poznatky. | cs |
| dc.description.abstract-translated | This thesis addresses the development of an advanced AI assistant, designed for robust local inference on the macOS platform, and advanced intelligence capabilities. It aims to excel in tasks available to already existing assistants, while expanding the range of new features, such as advanced local internet search, quality speech recognition and generation, constructive chatting abilities, and more. A significant component of this research involved an experimental investigation into fine-tuning a reasoning-oriented LLM specifically for function calling tasks using Parameter-Efficient Fine-Tuning techniques (PEFT). This experiment aimed to enhance the model's ability to accurately invoke tools based on user intent. This work also includes analysis of the historical context, popular assistants' functionality examination, and design insights. | en |
| dc.description.department | Katedra kybernetiky | cs |
| dc.description.result | Obhájeno | cs |
| dc.format | 47 s. | |
| dc.identifier | 100367 | |
| dc.identifier.uri | http://hdl.handle.net/11025/66325 | |
| dc.language.iso | en | |
| dc.publisher | Západočeská univerzita v Plzni | cs |
| dc.rights | Plný text práce je přístupný bez omezení | cs |
| dc.rights.access | openAccess | cs |
| dc.subject | macOS | cs |
| dc.subject | AI Asistent | cs |
| dc.subject | Hlasové ovládání | cs |
| dc.subject | Lokální zpracování | cs |
| dc.subject | Velké jazykové modely (LLM) | cs |
| dc.subject | Volání funkcí | cs |
| dc.subject | Automatické rozpoznávání řeči (ASR) | cs |
| dc.subject | Převod textu na řeč (TTS) | cs |
| dc.subject | Retrieval-Augmented Generation (RAG) | cs |
| dc.subject | Systémová integrace | cs |
| dc.subject | SwiftUI | cs |
| dc.subject | Python | cs |
| dc.subject | Jemné ladění modelů | cs |
| dc.subject | Interakce člověka s počítačem | cs |
| dc.subject.translated | macOS | en |
| dc.subject.translated | AI Assistant | en |
| dc.subject.translated | Voice Control | en |
| dc.subject.translated | Local Processing | en |
| dc.subject.translated | Large Language Models (LLM) | en |
| dc.subject.translated | Function Calling | en |
| dc.subject.translated | Automatic Speech Recognition (ASR) | en |
| dc.subject.translated | Text-to-Speech (TTS) | en |
| dc.subject.translated | Retrieval-Augmented Generation (RAG) | en |
| dc.subject.translated | System Integration | en |
| dc.subject.translated | SwiftUI | en |
| dc.subject.translated | Python | en |
| dc.subject.translated | Model Fine-tuning | en |
| dc.subject.translated | Human-Computer Interaction | en |
| dc.thesis.degree-grantor | Západočeská univerzita v Plzni. Fakulta aplikovaných věd | cs |
| dc.thesis.degree-level | Bakalářský | cs |
| dc.thesis.degree-name | Bc. | cs |
| dc.thesis.degree-program | Kybernetika a řídicí technika | cs |
| dc.title | Open-source hlasový dialogový asistent | cs |
| dc.title.alternative | Open-source spoken dialogue assistant | en |
| dc.type | bakalářská práce | cs |
| local.files.count | 4 | * |
| local.files.size | 3791050 | * |
| local.has.files | yes | * |
| local.relation.IS | https://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=100367 |
Files
Original bundle
1 - 4 out of 4 results
No Thumbnail Available
- Name:
- BP_Ivannikov_A22B0366P.pdf
- Size:
- 3.12 MB
- Format:
- Adobe Portable Document Format
- Description:
- VŠKP
No Thumbnail Available
- Name:
- PO_Ivannikov_A22B0366P.pdf
- Size:
- 66.06 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek oponenta VŠKP
No Thumbnail Available
- Name:
- PV_Ivannikov_A22B0366P.pdf
- Size:
- 404.57 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek vedoucího VŠKP
No Thumbnail Available
- Name:
- PB_Ivannikov_A22B0366P.pdf
- Size:
- 39.28 KB
- Format:
- Adobe Portable Document Format
- Description:
- Průběh obhajoby VŠKP