语音助手太鸡肋,但亚马逊为何亏损百亿也不放弃?车载端“钱”途太美好

微观人 2022-12-06
2915 字丨阅读本文需 8 分钟

根据Business Insider日前的报道,亚马逊的语音助手Alexa和智能音箱的业务亏损可能高达100亿美元。而在这一消息发布之际,Alexa的竞争对手也正在应对各自的困难,并努力寻找语音助手业务的获利方法。

Alexa和其他语音助手面临的困境提醒着人们,创造一项令人印象深刻的技术和围绕它建立业务之间存在差距。随着科技公司忙于裁员,为即将到来的经济衰退做好准备,炫酷但不盈利的技术将不得不找到一种方式来展示它们的价值,否则将被淘汰。

在亚马逊Alexa推出8年之后,人们可以从语音助手的技术和业务中学到一些经验和教训。

技术很好,但还不够好

许多创新使像亚马逊Alexa这样的语音助手能够完成10~15年前不可能完成的任务。自动语音识别技术的进步帮助语音助手在不同背景噪声条件下,以及其他声音和不同口音下,提取和分析人们的声音。由深度神经网络(Transformer、RNN、LSTM等)支持的自然语言处理系统帮助语音助手将不同的语音细微差别映射到相应的命令中(例如询问天气或请求计时器的所有不同方式)。现在有很多应用平台、API等可以让语音助手遍历网络上的大量信息,并将语音命令映射到应用功能。

然而,语音助手目前所能做的也有局限性。在大多数情况下,亚马逊Alexa可以执行简单的任务,如设置计时器,播放音乐,询问天气,在网上搜索简单的信息。这些任务或者范围非常狭窄,并没有太多出错的空间;或者不敏感,即使语音助手出错也不会造成太大的损害。一旦用户想要执行敏感、需要多次交互或多模态的任务,语音助手就会变得不可靠。

例如,购物是亚马逊最初为Alexa计划的重要用例之一。这是一项敏感的任务,因为它涉及到个人资金,而且用户希望最大限度地减少错误。它通常需要多个步骤,用户希望能够看到他们正在购买的产品,能够浏览建议和替代方案,而通过语音来实现这一点是非常困难的。同样的事情也会发生在安排会议等其他任务上。

手机语音助手沦为“鸡肋”

Strategy Analytic公布的报告显示,2018年,在全球出售的智能手机中,有47.7%的智能手机配置了AI语音助手。用户熟知的iPhone X、三星Galaxy S9+、华为P20 Pro、小米8、vivo X21、OPPO R15等热门手机都有语音助手,手机语音助手已经变的越来越流行了。

但是,从用户的角度来考虑,有几个人是真的在用手机语音助手呢?其使用语音助手的频率跟手机语音助手的流行度成正比吗?

手机语音助手的终极形态,是相当于用户手机端的“个人助理”,即用户有需求的时候,直接对手机语音呼出,手机即会答应用户。可目前的手机语音助手却做不到这种终极形态。

其原因在于,手机语音助手对用户的语义识别仍有差距,要知道不是每个人的普通话都是一级的,而且按照用户正常的说话语境,其在吐字方面本身就比较随意,这种时候里面会包含各种语气词以及平时常用的一些说话习惯,机器理解起来就更加困难,所谓“汉语博大精深”,一个不同的语气词,一句用户平时的常用语句,人本身是可以理解的,但机器却无法理解,这样手机语音助手就无法彻底理解用户说的是什么,它的“助理”作用就会失效,很有可能就是“牛头不对马嘴”。

另一方面,则是机器需要用户与其多次对话才能达到用户的需求,比如,手机语音助手经常会说“您说的我不太理解,麻烦再说一遍”,需要有三四句彼此之间的对话手机语音助手才能达到用户的最终目的。

而对于用户来说,与其跟手机语音助手多次对话,不如直接解锁后打开相关App,或者直接在手机搜索里输入用户的问题,再在答案里找,这也远远要比跟手机语音助手对话快的多。

一定程度上,手机语音助手的功能与内置应用的功能是重叠的,比如“明天早上8点叫醒我”,用户真要定闹钟的话,自己直接设置8点的闹钟即可,再比如管理日程,用户直接在备忘录里也能实现,查询商品的相关信息,用户直接在某电商App里输入商品即可,通过手机语音助手的效率远比直接打开App更低。

据郭静的互联网圈观察发现,在搜索引擎里,随处可见各种手机语音助手关闭的教程,包括Siri、Bixby、Assistant、Alex、小米小爱同学、jovi、华为语音助手等都有,这从侧面也反映出用户对手机语音助手的需求量并不高,否则也不会想办法关闭它。

日前,有外媒报道称,“三星Bixby从智商到用户口碑都表现十分糟糕,甚至已经没有拯救的希望。”实际上并不是只有Bixby的表现不佳,Siri、Assistant、Alex、小米小爱同学、jovi、华为语音助手等的表现都不算好,用户们吐槽的地方也不少。

就目前来看,手机语音助手还是蛮鸡肋的,真正实用的地方并不多,但是卸载的话,似乎又缺了点儿什么。而对于手机厂商而言,其之所以大力推动手机语音助手,是因为手机语音助手是目前唯一在人工智能落地比较明显的地方,否则,用户根本感受不到手机厂商的人工智能技术点。

B端商业模式成为“出口”

AI技术的不断发展让语音助手的功能越来越强大,逐渐走出小小的智能手机和可穿戴设备,在更多应用场景提供服务支持。第一代语音助手提出了使用语音作为与计算机的接口的关键思路,但还没有创造出有利可图的商业模式。

目前的语音助手几乎都是被动式服务,而主动式语音助手是值得关注的方向。比如目前在大型商超看到的服务机器人已经搭载了看到人驻足识别人脸的主动打招呼功能,但交互功能并不十分完善。

其次是发展为特定场景的专业助手,把语音助手集成到应用场景的上下文和工作流中,让它们有能力处理步骤更多、复杂度更高的任务。这种形式可以建立高效的B2B商业模式,特别是在那些需要大量手动操作的行业中,比如制造业、饭店、酒店等可以利用语音助手实现降本增效。第二代谷歌眼镜在手工领域获得了不错的市场认可,这类业务场景的附加价值也将远超普通消费级市场。

目前智能语音在To B市场的应用尚浅,像智能家居等普遍配套装备的也没能准确找到其价值爆发点,智能软件是AI助手的一个重要领域,让AI助手辅助交通、金融、安防、医疗、养老、环保、教育等将会比在C端能爆发出更大效益。

车载语音助手将为未来主要市场

语音交互是车内最简洁、最人性化、最安全的交互方式,也是未来最主要的车内交互方式。随着AI和硬件性能的增强,语音交互是未来汽车的绝对主流。语音交互主要是车载自然语音识别与语音助手,也可以简单地说是NLP和NLU技术。不同于早期的只能拨打电话或简单地识别几个单词,自然语音识别一般指可以识别一个句子,语音助手则是基于自然语义的理解并做出对应的调整或给出对应的资讯。2020年智能座舱中自然语音识别搭载率大约为67%,预计2024年可达84%。

无人驾驶时代还将加入紧急车辆如救护车、消防车声音识别,多座位智能识别。未来还将识别车主的情绪,如喜悦、愤怒等,并根据情绪调整灯光或音乐音量,语音交互是最自然的交互。此外还有声纹识别。

中美两国是自然语音识别与语音助手的最主要市场,根据车载语音识别专业调查公司VOICEBOT的2021年8月的调查报告,美国的车载语音助手使用高达1.27亿人次,月度活跃使用为8380万人次。德国是2700万人次,英国是1900万人次。

根据美国市场汽车品牌月度语音助手使用率,从中可以看出并非只有豪华车才有高的使用率,起亚、福特、Dodge都是平价车型为主,强调操控的豪华品牌如宝马和讴歌,使用率很低。实际上就是语音助手做得好,用户立刻就会养成使用习惯,也就是说即使廉价车型也很有必要装语音助手。

实际上,驾驶场景可以说是最适合人工智能语音助手发挥作用的地方。

数据显示,截止2021年中国乘用车智能语音交互功能的搭载率已经高达86%。目前,汽车座舱正朝着智能化趋势发展,而车载语音助手是智能驾驶舱中最核心的功能。

在驾驶过程中,由于驾驶员的手和眼睛都被任务所占据,因此车载场景对于语音的免提交互功能提出更高的要求。

近日,各大公司争相投资智能车载语音交互领域。

小度与蔚来汽车达成合作,双方将围绕蔚来汽车车载语音操作系统使用体验进行优化升级,进一步提升人车交互体验。不久前,微软正式宣布,在基于微软智能云Azure的深度神经网络TTS(Text-to-Speech)支持下,小鹏汽车已经顺利完成其车规级语音助手的升级。华为更是开始自主研发智能座舱。

对于大多数企业而言,智能车载语音助手是目前智能驾舱研发的最大卖点。

文章来源: 郭静的互联网圈,物联传媒,佐思汽车研究,极客网

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:微观人
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...