光明网综合报道 一种新方法让“智能”机器既能听懂言语,还能理解声音。
因为有了诸如iPhone的Siri一样的语音识别软件,已经可以识别语音并做出相应的反应。但 “智能”机器还在为能识别更多其他的声音而不懈努力。 “从某种意义上说,这是一个更为简单的问题,但到目前为止,我们对自然环境中的声音的研究还不多,还没将其用在反馈中。”机器人专家Joseph Romano说。
现在Romano正试图让机器人听懂我们谈话以外的声音。他和他的合作者在宾夕法尼亚大学创建了一个名叫ROAR(全称为机器人操作系统的开源音频识别器)的软件工具。该软件能帮助机器人专家训练机器对更宽泛意义的声音作出反应。这个工具主要需要一个麦克风。
训练开始时,机器人的麦克风首先捕捉周围的声音,ROAR对这些声音进行打磨。接下来,操作者通过反复重复某个动作教ROAR识别主要声音,在机器人听这些声音的同时标记这些独特的语音信号。最后,根据那套训练片断,程序会生成一套通用模式,包含各个动作对应的不同的声音。
研究队员们在一个独臂机器人身上测试了ROAR,以提高这个机器人完成特定任务的能力。在其中一个场景中, 要求机器人尝试自发抓住并启动一个电钻。在没有任何声反馈的情况下,机器人尝试20次成功9次,但使用了ROAR后,成功率提高了一倍。抓住电钻后,如果机器人没有听到电钻的呼呼运转声,它会重新调整握电钻的姿势,再次尝试。
下一步是确保系统能早高噪音环境下运转。通过将语音整合进视觉和触觉旁边的机器人反馈回路中,机器人护士将能对求救声做出迅速回应,工厂机器人将能在机器运转中断时做出反应。虽然这些技术还处在研发初期阶段,但Romano认为它的潜力是巨大的。(编译:李娟)
参与评论
登录后参与讨论 0/1000