Voice-Interactive Learning Dialogue on a Low-Cost Device

dc.contributor.authorBulín, Martin
dc.contributor.authorAdamec, Martin
dc.contributor.authorNeduchal, Petr
dc.contributor.authorHrúz, Marek
dc.contributor.authorŠvec, Jan
dc.date.accessioned2025-06-20T08:23:51Z
dc.date.available2025-06-20T08:23:51Z
dc.date.issued2023
dc.date.updated2025-06-20T08:23:51Z
dc.description.abstractTraditional offline learning approaches are reaching their limits in meeting the dynamic demands of specialized applications, such as real-time human-robot interaction. While high benchmark scores attained through offline fine-tuning large models on extensive data, offer a glimpse of their potential, the true functionality is validated when these models are deployed on target devices and utilized in real-life scenarios. This paper presents a method incorporating humans in an interactive learning loop, using their real-time feedback for online neural network retraining. By leveraging the power of transfer learning, we can proficiently adapt the model to suit the specific requirements of the target application through a natural voice-based dialogue. The approach is evaluated on the image classification task utilizing a unique low-cost device and a practical example of the real-time dialogue is presented to demonstrate the functionality.en
dc.description.abstractTradiční přístupy strojového učení narážejí na své limity v plnění dynamických požadavků specializovaných aplikací jako jsou úlohy interakce v reálném čase mezi lidmi a roboty. Zatímco vysoká přesnost klasifikace na offline úlohách dosažená díky offline optimalizaci velkých modelů na rozsáhlých datech nabízí pohled na jejich potenciál, pravá funkčnost je ověřena, až když jsou tyto modely nasazeny na cílová zařízení a využity v reálných situacích. Tento článek představuje metodu, která zahrnuje lidskou účast v interaktivním učícím cyklu a využívá lidskou zpětnou vazbu v reálném čase pro online přetrénování neuronové sítě. Využitím síly tzv. transfer learning dokážeme efektivně přizpůsobit model tak, aby vyhovoval specifickým požadavkům cílové aplikace prostřednictvím přirozeného hlasového dialogu. Přístup je vyhodnocen na úloze klasifikace obrazů s využitím unikátního low-cost zařízení, a je představen praktický příklad reálného dialogu k prokázání funkčnosti.cz
dc.format14
dc.identifier.doi10.1007/978-3-031-47665-5_30
dc.identifier.isbn978-3-031-47664-8
dc.identifier.issn0302-9743
dc.identifier.obd43940583
dc.identifier.orcidBulín, Martin 0000-0003-0276-3143
dc.identifier.orcidAdamec, Martin 0009-0006-8721-298X
dc.identifier.orcidNeduchal, Petr 0000-0001-5788-604X
dc.identifier.orcidHrúz, Marek 0000-0002-7851-9879
dc.identifier.orcidŠvec, Jan 0000-0001-8362-5927
dc.identifier.urihttp://hdl.handle.net/11025/59578
dc.language.isoen
dc.project.IDSGS-2022-017
dc.project.IDGA22-27800S
dc.publisherSpringer
dc.relation.ispartofseriesThe 7th Asian Conference on Pattern Recognition (ACPR 2023)
dc.subjecthuman in the loopen
dc.subjectinteractive Learningen
dc.subjectLow-Cost Device Deploymenten
dc.subjectaudio-visual dialogueen
dc.subjectimage classificationen
dc.subjecthuman in the loopcz
dc.subjectinteraktivní učenícz
dc.subjectlow-cost zařízenícz
dc.subjectaudio-vizuální dialogcz
dc.subjectklasifikace obrazucz
dc.titleVoice-Interactive Learning Dialogue on a Low-Cost Deviceen
dc.titleHlasově interaktivní učící dialog na low-cost zařízenícz
dc.typeStať ve sborníku (D)
dc.typeSTAŤ VE SBORNÍKU
dc.type.statusPublished Version
local.files.count1*
local.files.size2201069*
local.has.filesyes*
local.identifier.eid2-s2.0-85177472685

Files

Original bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
Bulin_Adamec_Neduchal_Hruz_Svec_Voice-Interactive_Learning_Dialogue_on_a_Low-Cost_Device_2023.pdf
Size:
2.1 MB
Format:
Adobe Portable Document Format
License bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: