橙色云资讯 - 工业互联网行业信息门户

如何构建与机器人对话的语音识别解决方案

电子工程专辑 2014-01-24

1244 字丨阅读本文需 2 分钟

　　直到最近，在人类语音的机器翻译领域内的进展还远远没有发展到为主流用户带来实质性好处的地步，与机器对话依然还不太顺畅。目前在低功耗音频技术方面的开发活动具有了改善这种永远是瓶颈的人-机交互关系的潜力，而这种先前曾阻碍了语音识别领域内真正进步的瓶颈将被突破。一条通往人-机互动领域内快速创新的道路正在开启，这将沿着我们与机器互动的方向引领诸多有趣的开发活动，这些机器将能够倾听我们，而且越来越多地听懂我们。

　　语音也许是人类最自然的交流方式，但是将一台机器引入到该过程则产生了对新的行为协议的需求，特别是在语音沟通过程中没有另一方持续视觉线索的时候更为重要。对于早期的用户，第一次电话通话是极不顺畅的；而且即使在今天，双向无线电台的断续通话方式也要求新用户进行一些调整。在这两种情况下，很快就发展出来一些常用的方法来实现相当自然的沟通方式，主要是因为通话的另一方也是人类。随着移动用户面临新的语音识别界面，他们将面临与使用那些很老的通信手段时所出现的类似挑战。

　　一个更近期的例子是，触摸屏革命展示出了它们如果能实现高品质同时具有可为用户体验带来附件价值的功能时，新的、陌生的、棘手的界面如何切入到主流并且受到欢迎。

　　因此值得去在一个比传统案例更为广泛的意义上去定义语音控制的“性能”。因而能够在考虑到下一代瓶颈时，设计出更多不会过时的解决方案。

　　构建一种高性能的语音识别解决方案

　　过去一直用非常简单的性能指标来评估语音识别解决方案。这些指标通常被换算为单独的“精度”或者“命中率”数值，从根本上来表述正确识别字和词组的概率。在定义“性能”时，需要一种更广泛的和深思熟虑的方式，它能够反映语音界面的长期发展潜力，以便向用户提供像触屏界面一样的舒适性和可用性等级。

　　翻译质量扮演了一个关键的角色，从根本上讲它是一种人工智能，远不止基本的字词识别。访问所有设备功能也使语音识别成为了触摸屏的一种切实可行的替代方案，有趣的是这也使该技术可用于一个更大范围的设备种类，包括像可穿戴技术这样更小的设备。低响应延迟以及一种自然的、“无协议的”的交互方式，以及即使在有噪音环境中也能很好地运行，也改善了体验。这要求精心的系统设计，以使设备级的信号处理技术能够与基于云计算的智能很好地结合，以将这些性能增强带给用户。

　　去除按键

　　语音识别目前最大的人体工程学局限性是需要进行按键或者其它机械性启动，从而限制了它在许多环境中的可用性。这种机械触发是功耗这一制约因素的终极结果。为了保持具有竞争力的电池寿命数值，移动设备中待机功耗的预算都极低，典型的电池电流值为单位数毫安。当功率预算这么低的时候，连续地运行语音识别(或者至少随意的语音识别)是不可行的。

　　到目前为止，一个按键触发器为这个问题提供了一种粗放的解决方案，它通过在按下按键之前禁用语音识别，使功率消耗平均值降到最低。但是，现今的语音触发功能作为一种特性正在被加载到最新的高端音频中枢(Audio Hubs)上，因为OEM厂商希望语音识别功能能够更灵活、更易于使用。通过显著地降低语音识别的平均功耗数值，甚至降到待机模式预算范围内这样的水平，允许主处理器“休眠”。这种功耗降低(通常为一个数量级)是如此的显著，以至于可以完全消除对按键的需要。

免责声明：凡注明来源本网的所有作品，均为本网合法拥有版权或有权使用的作品，欢迎转载，注明出处本网。非本网作品均来自其他媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容，请依照下方联系方式进行沟通，我们将第一时间进行处理。

0赞好资讯，需要你的鼓励

来自：电子工程专辑

0 0

参与评论

登录后参与讨论 0/1000

下一篇一种与机器人对话的语音识别解决方案

　　直到最近，在人类语音的机器翻译领域内...

2014-05-05

如何构建与机器人对话的语音识别解决方案

参与评论

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

如何构建与机器人对话的语音识别解决方案

参与评论

为你推荐

中国智慧城市“药方”如何化解海外城市治理症结？

AI健身/3D试衣/AI烤肉……黑科技扎堆的AWE2021都有哪些硬货？

年内 IPO 上市？哪吒汽车完成超 20 亿融资｜ 镁客网每周硬科技领域投融资汇总

下一个10年，将会发生的12个趋势

从工业机器人产业链看智能制造机会

最新总结：冬奥会的100个创业机会

每个细分方向都是万亿级市场，超6000家公司携资本入局建筑业数字化 | 年度行业

机器人产业全面分析（七）：移动四类四技术，全球波士顿中国振华极智嘉！

做行业听风者，云里物里搭建万物互联的数字基石

人工智能五年内将爆发 国家与地方政策鼎力支持政策法规

年度盘点：2020年工控行业十大收购案，国内三起，金额最高323亿！

GMIC2014：智能机器人大热 手游引全球化思考

与德美PK智能制造，中国机会何在

【智慧社区解决方案】视频智能检测与分析技术如何赋能社区智慧化建设？

埃夫特今日敲钟，股票大涨400%！核心竞争力助股价腾飞！

加快数智化转型，开启智能制造新时代

嵌入式计算机与常规台式计算机的区别

引领站点能源数字化，成就无处不在的绿色联接和计算

用“乐高”逻辑做机械臂，「慧灵科技」欲通过自主研发，重构自动化执行部件

独角兽机器人发布！小鹏汽车葫芦里卖的什么药？

地平线机器人的完全自动驾驶功能完全可以和特斯拉媲美

3D打印机亮相市科技馆 多款机器人受市民热捧

英特尔发布智慧社区解决方案参考架构

36氪独家 | 「自然机器人Naturobot」获两轮共500万美元融资，前阿里云RPA负责人再创业

全球最大塔机智能工厂开园 拥有100多台工业机器人

干货满满！从机器人四大家族在华订单数据看20年工业机器人行业走势

谷歌3D智能手机将进入国际空间站 充当机器人大脑及眼睛

ABB机器人推动建筑行业自动化升级，提升行业安全性和可持续性

猎豹移动发布2020年Q2财报：总收入3.94亿元 AI机器人部署超万台

【首发】医疗+3D+机器人+AI：一影医疗获6500万A+轮融资，深入骨科精准手术

相关推荐

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

年内 IPO 上市？哪吒汽车完成超 20 亿融资｜镁客网每周硬科技领域投融资汇总

人工智能五年内将爆发国家与地方政策鼎力支持政策法规

GMIC2014：智能机器人大热手游引全球化思考

3D打印机亮相市科技馆　多款机器人受市民热捧

全球最大塔机智能工厂开园拥有100多台工业机器人

谷歌3D智能手机将进入国际空间站充当机器人大脑及眼睛