Voice-Interactive Learning Dialogue on a Low-Cost Device
| dc.contributor.author | Bulín, Martin | |
| dc.contributor.author | Adamec, Martin | |
| dc.contributor.author | Neduchal, Petr | |
| dc.contributor.author | Hrúz, Marek | |
| dc.contributor.author | Švec, Jan | |
| dc.date.accessioned | 2025-06-20T08:23:51Z | |
| dc.date.available | 2025-06-20T08:23:51Z | |
| dc.date.issued | 2023 | |
| dc.date.updated | 2025-06-20T08:23:51Z | |
| dc.description.abstract | Traditional offline learning approaches are reaching their limits in meeting the dynamic demands of specialized applications, such as real-time human-robot interaction. While high benchmark scores attained through offline fine-tuning large models on extensive data, offer a glimpse of their potential, the true functionality is validated when these models are deployed on target devices and utilized in real-life scenarios. This paper presents a method incorporating humans in an interactive learning loop, using their real-time feedback for online neural network retraining. By leveraging the power of transfer learning, we can proficiently adapt the model to suit the specific requirements of the target application through a natural voice-based dialogue. The approach is evaluated on the image classification task utilizing a unique low-cost device and a practical example of the real-time dialogue is presented to demonstrate the functionality. | en |
| dc.description.abstract | Tradiční přístupy strojového učení narážejí na své limity v plnění dynamických požadavků specializovaných aplikací jako jsou úlohy interakce v reálném čase mezi lidmi a roboty. Zatímco vysoká přesnost klasifikace na offline úlohách dosažená díky offline optimalizaci velkých modelů na rozsáhlých datech nabízí pohled na jejich potenciál, pravá funkčnost je ověřena, až když jsou tyto modely nasazeny na cílová zařízení a využity v reálných situacích. Tento článek představuje metodu, která zahrnuje lidskou účast v interaktivním učícím cyklu a využívá lidskou zpětnou vazbu v reálném čase pro online přetrénování neuronové sítě. Využitím síly tzv. transfer learning dokážeme efektivně přizpůsobit model tak, aby vyhovoval specifickým požadavkům cílové aplikace prostřednictvím přirozeného hlasového dialogu. Přístup je vyhodnocen na úloze klasifikace obrazů s využitím unikátního low-cost zařízení, a je představen praktický příklad reálného dialogu k prokázání funkčnosti. | cz |
| dc.format | 14 | |
| dc.identifier.doi | 10.1007/978-3-031-47665-5_30 | |
| dc.identifier.isbn | 978-3-031-47664-8 | |
| dc.identifier.issn | 0302-9743 | |
| dc.identifier.obd | 43940583 | |
| dc.identifier.orcid | Bulín, Martin 0000-0003-0276-3143 | |
| dc.identifier.orcid | Adamec, Martin 0009-0006-8721-298X | |
| dc.identifier.orcid | Neduchal, Petr 0000-0001-5788-604X | |
| dc.identifier.orcid | Hrúz, Marek 0000-0002-7851-9879 | |
| dc.identifier.orcid | Švec, Jan 0000-0001-8362-5927 | |
| dc.identifier.uri | http://hdl.handle.net/11025/59578 | |
| dc.language.iso | en | |
| dc.project.ID | SGS-2022-017 | |
| dc.project.ID | GA22-27800S | |
| dc.publisher | Springer | |
| dc.relation.ispartofseries | The 7th Asian Conference on Pattern Recognition (ACPR 2023) | |
| dc.subject | human in the loop | en |
| dc.subject | interactive Learning | en |
| dc.subject | Low-Cost Device Deployment | en |
| dc.subject | audio-visual dialogue | en |
| dc.subject | image classification | en |
| dc.subject | human in the loop | cz |
| dc.subject | interaktivní učení | cz |
| dc.subject | low-cost zařízení | cz |
| dc.subject | audio-vizuální dialog | cz |
| dc.subject | klasifikace obrazu | cz |
| dc.title | Voice-Interactive Learning Dialogue on a Low-Cost Device | en |
| dc.title | Hlasově interaktivní učící dialog na low-cost zařízení | cz |
| dc.type | Stať ve sborníku (D) | |
| dc.type | STAŤ VE SBORNÍKU | |
| dc.type.status | Published Version | |
| local.files.count | 1 | * |
| local.files.size | 2201069 | * |
| local.has.files | yes | * |
| local.identifier.eid | 2-s2.0-85177472685 |
Files
Original bundle
1 - 1 out of 1 results
No Thumbnail Available
- Name:
- Bulin_Adamec_Neduchal_Hruz_Svec_Voice-Interactive_Learning_Dialogue_on_a_Low-Cost_Device_2023.pdf
- Size:
- 2.1 MB
- Format:
- Adobe Portable Document Format
License bundle
1 - 1 out of 1 results
No Thumbnail Available
- Name:
- license.txt
- Size:
- 1.71 KB
- Format:
- Item-specific license agreed upon to submission
- Description: