Perspektivy řečové komunikace mezi člověkem a strojem

Abstract

Cílem této práce je představit stav současných řečových technologií a upozornit na těžkosti, se kterými se vědci v tomto oboru potýkají. Za svatý grál ve vývoji řečových technologií je považováno vytvořit takový dialogový systém, který je schopen porozumět souvislé lidské řeči s nízkou chybovostí, s relativně neomezeným slovníkem a doménou, bez předchozí zkušenosti s mluvčím a zároveň schopným produkovat srozumitelnou a přirozenou řeč, tedy takový systém, který je nerozeznatelný od člověka. Tento cíl však v sobě může skrývat riziko zvané uncanny valley, reakci člověka na stroj, který vypadá a pohybuje se stejně jako člověk. Reakce člověka na takového robota může přejít od pozitivních pocitů k negativním, a interakce tak může být narušena, a to ve chvíli, kdy se robot svým vzhledem přiblíží člověku, ale jeho podoba je nedokonalá. Tato hypotéza je v této práci aplikována na použití řečových technologii v rámci projektu Senior Companions. Experimentální data pořízená v rámci tohoto projektu metodou Wizard of Oz prokázala, že synteticky znějící hlas může vyvolat podobné emoční reakce, které se odehrávají v mezilidské komunikaci. Pozorované subjekty cítily dostačující míru souznění s avatarem a zároveň strojově znějící hlas nenesl riziko, že se ocitne v uncanny valley. Bylo tak prokázáno, že syntetiticky znějící hlas může být nejen dostačující, ale i lepší, jelikož v sobě nenese riziko uncanny valley.

Description

Subject(s)

rozpoznávání řeči, syntéza řeči, Uncanny valley, Wizard of OZ, projekt Senior Companions

Citation

Collections

OPEN License Selector