语音助手完成“升学”,智能产品即将迈入“动口不动手”的时代

智生活 2023-08-11
3107 字丨阅读本文需 8 分钟

在今天的AI大模型时代,AI和终端场景要如何结合才能真正为我们的生活带来便利?这是当下每一家科技巨头都在思考和面对的问题。

在大模型落地千行百业的大潮之下,智能手机作为与普通消费者生活最为贴近的产品,也在快速卷入AI革命的浪潮中。

iOS版、安卓版ChatGPT的先后发布让更多人可以接触到大模型带来的技术红利,而语音助手与大模型的结合也成为科技巨头们正在争夺的关键高地。

一边谷歌计划彻底重塑其智能语音助手,将大模型能力融入,另一边苹果Siri也曾被多次曝光将融入大模型相关能力,微软的Copilot则已经完成对Cortana的替代。

终端设备中的AI迎来一场大模型革命,已成大势所趋。一直被消费者诟病不够“智能”的语音助手,究竟要如何借助大模型变得“更智能”?

语言理解力暴涨,人人化身玩机达人

小艺变得更聪明了

从大模型进入大众视野的第一天起,一个讨论就从未停息:由大模型驱动的聊天机器人是否会取代手机上的智慧助手?

就在8月4日,华为率先交出了一份答卷。

在华为盘古L0基座大模型的基础上,华为针对终端消费者场景构建了大量的场景数据与精调模型后的L1层对话模型,并将该模型用在了智慧助手小艺中,全新的小艺在今年华为开发者大会上正式亮相。

从华为给出的答案来看,两者绝非替代关系,由大模型赋能的智慧助手能够带来的体验革新,可以说让许多曾经的“想象”真正走入了“现实”。智慧助手越来越像你真正的管家、朋友,人工智能的“智能化”迈入了新的阶段。

纵观小艺的升级,最直观的体现就是:小艺真的变“聪明”了,它知道我在说什么、能够更精准地读懂我话里的意思了。

比如我可以直接跟小艺说,“能不能把手机壁纸设置成实时天气?”此时小艺就能明白我是想要全景天气壁纸。

对于再复杂一点的场景,比如今晚我想请人吃饭,就可以直接跟小艺说,“找一家附近评分高的海鲜餐厅,最好有适合四个人的优惠套餐”,此时小艺可以准确理解我的意图,并直接调用美团服务给我找到相关餐厅。

当我随手拍一个海报,针对海报图片,就可以用自然交流的方式去问小艺相关的信息并获取服务,比如我可以跟小艺说,“我想参加技术论坛,导航去图上的地址”,此时小艺就可以准确识别海报中的地址信息并打开导航App进行导航。

在大模型能力的加持下,小艺还可以处理更加复杂的场景编排任务,帮我们创造专属于自己的特殊场景。

如果喜欢运动健身,我可以让小艺创建一个“晨跑场景”,要求为“每周一到周五早上6点半为我播报当天天气,6点半到7点我会跑步,当我戴上蓝牙耳机的时候,就播放收藏的歌曲,并把手机设置为静音模式”。

这一系列看似复杂的操作,都可以通过这“一句话的时间”让小艺直接设置完成。

可以说,在“更聪明”的小艺的帮助下,我们不再需要一项项地查看玩机技巧和大量的功能说明,每个人都可以成为“玩机达人”,因为我们只需要问小艺就可以了。

小艺这种能力的提升,让很多智能手机具有的强大功能,可以简单便捷地、通过语音口述的方式被用户所接触到。

纵观小艺在“更聪明”层面的诸多升级,我们能清晰地看到,大模型能力的融入,搬开了阻碍用户养成智慧助手使用习惯的最大绊脚石之一——不够自然的对话、无法随心所欲的自然交流。

想要真正让智能语音助手从好玩、新奇走向好用,甚至成为一种“习惯动作”,优秀的语言理解和交互能力是必不可少的。大模型让智能语音助手真正能够读懂、听懂我们,其易用性的提升是极为显著的。

谷歌推动Assistant AI升级

将扩展到所有智能型产品中

据Axios获得的谷歌内部备忘录显示,谷歌计划将最新的大语言模型(LLM)技术引入Google Assistant,提高其内容生成能力,该技术类似于ChatGPT和谷歌自研的Bard聊天机器人。

大模型热潮来临后,巨头们都正在用大模型将自家产品一个个“升级”。比如微软与OpenAI建立合作后,将生成式AI助手就嵌入到Edge浏览器、Microsoft Office和Azure云服务中,让服务变得更加智能

Goggle Assistant的升级同样体现了这一点。

Google Assistant是谷歌开发的语音助手,相当于亚马逊的Alexa和苹果的Siri。用户只需说出唤醒词“OK Google”或者“Hey Google”,Google Assistant就会执行用户在这之后发出的语音命令,例如暂停视频、指定任务或者接听电话。

Axio的备忘录并没有详细说明Assistant将要增加哪些具体功能,但大概率将具有和Bard类似的AI聊天功能——Bard是谷歌基于PaLM 2之上建立的对话式AI模型。

新的Google Assistant或将采用LaMDA来生成逻辑通畅、文本自然的对话语言,从网络上收集信息后回答用户问题。

而引入大模型之后的Google Assistant,也会更加“聪明”。以前,Google Assistant、Siri、Alexa一类的语音助手,常被视作“假AI”——因为它们只能支持简单的用户交互,例如回答“明天天气如何?”一类的简单问题,或者提供围绕问题搜集到的信息,供用户参考,还经常答非所问。

将Bard和Google Assistant结合,是一项互补的操作。Bard能根据从网络上搜索到的信息回答问题,但无法单独执行用户指令,和Google Assistant结合后,依附一定的载体,就能实际执行播放音乐或设置闹钟等服务,这将大大增强Assistant回答、解决用户问题的能力。

随着Google Assistant的升级,谷歌内部团队也将进行重组,部分原Google Assistant团队成员将面临解雇。

如今,谷歌也正是计划从移动端着手推进强化Assistant计划。安卓端的Google Assistant已经具备了由AI驱动的功能,能够帮助用户总结网页内容。

移动端的改造只是开始,可以预见,Google Assistant升级后,起调整影响范围比想象中的要广得多,因为Google Assistant已经作为AI助手嵌入到了Google各类产品之中——比如智能音箱和智能显示器。

AI是语音助手的最优解?

得益于AI的加入,智能手机的“智能”维度已经不仅体现在功能上,了解用户的喜好与使用习惯步入现实,这也是手机体验渐佳的表现。

多年以来,默默无闻的AI给大家带来了实质性的体验提升,却在人机交互方面显得极为生疏。智能手机现阶段的语音助手,只能判断用户下达的诸如“帮我打开XX” “帮我搜索XX”的“命令”。

如果说要聊天,或是识别更为复杂的命令、语义等,语音助手只能“双手一摊”,帮你“百度一下”。

2016年诞生的Bixby,为三星的智能手机带来了先进的智能语音控制功能,也可以理解为S Voice的“重生”。Bixby在当时确实领先了不少友商的语音助手,但由于Google等厂商的发力,它在智能手机中的竞争力逐步下降。

不少是用三星手机的网友也称,Bixby能带来的价值已经远不如当初,在小雷看来这应该是需求与技术不对等导致。

这也使得语音助手在智能手机中,往往是被忽略的角色,叫半天还不如自己动手来得高效,用户肯定不乐意。能“好好说话”的语音助手实在太少,厂商宣传的智能化落实到使用场景反而弄巧成拙,“智障助手”这一点,苹果Siri与三星的Bixby经常成为大家调侃的点。

小雷此前浅浅体验过一下移动端的ChatGPT,它只能充当一个问答的工具,且因为本身不接入互联网,见识也有些过时。说点实在的话,移动端ChatGPT能提供的价值相对有限。

与此同时,对话式AI在智能手机上的应用多集中在浏览器,更像在对话的过程中为用户提供价值,但小雷认为,AI能够在智能手机中产生更大的作用,语音助手毫无疑问是AI语言大模型的最佳切入口。

借助大模型,把语音助手从“智障”的境地带出来。在此之前,把AI技术率先应用到自带浏览器,与微软、谷歌等公司展开竞争,尽快确定自己在AI领域的地位,为以后铺好道路。

另一方面,三星现阶段推进的AI技术虽然与Bixby无关,大概率只是时候未到,网友猜测的“取代Bixby”不一定会发生。

相反,小雷更愿意相信,未来的Bixby会集成AI大模型,能够处理复杂命令的同时,带来更流畅的对话,提供情绪上的价值,或许才是三星引入AI大模型的初衷。

而主打高端体验的三星Galaxy S24系列,不但需要足够旗舰的硬件,在体验上也要做出更多的差异化。如今三星智能手机在国内的份额不足1%,凭借先进的折叠屏虽然挽回了一些“颜面”,但三星仍然需要更多能够领先行业的技术。

AIGC对智能家居持续赋能

AI热潮下,以智能音箱为首的智能家居也被视作人工智能的一个主要终端入口。前有亚马逊Alexa与小米小爱同学,但ChatGPT横空出世后,用户多认为这些语音助手的智能化程度仍有待提高。

天风证券研报指出,2023 年以来以GPT为代表的多模态大模型得到市场广泛关注,各大厂均快速跟进发布大模型产品。其中以Open AI 的GPT-4 为例,其能力已在各种专业和学术基准上表现出人类的水平,包括以约前10%的成绩通过模拟律师资格考试。而对于生成式的幻觉、安全问题均有较大的改善;同时因对于图片模态的强大识别能力扩大了 GPT-4 应用范围。天风证券认为多模态大模型的快速迭代有望加速下游应用层(如智能家居)行业发展。

当前智能家居渗透主要受困于人机交互弱、器件间交互弱、低频器件与高频消费资源未打通等问题困扰,对用户体验提升不大。AI 的发展在未来有望实质性推动智能家居领域的发展。

海通证券研报认为,家电产品多样,对智能化有一定需求,现阶段家电智能产品仍处于单品智能阶段,多数通过语言或者手势对家电设备进行控制,并且存在语音识别不准和人机交互不顺畅等痛点,而在AIGC 的引领下,我们认为智能家电产品将具备更强的人机交互能力,AIGC有望为智能家居持续赋能。

文章来源: 智东西,36氪,雷科技,数据宝

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:智生活
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...