智能音箱,为何是大模型产品路线图上的“兵家必争之地”?

智生活 2023-10-10
2667 字丨阅读本文需 7 分钟

9月15日,有媒体报道称阿里巴巴旗下“天猫精灵”将更名,并且已有XGENIE品牌字样的新品在部分渠道露出。阿里方面相关负责人的回应是,“确实计划推出全新品牌,强化精灵属于用户的个性化特征”。

“换号重练”的动作背后,是生成式大模型浪潮给已经沉寂的智能音箱行业刮来的一缕新风。

去年国内智能音箱的出货量仅有2600万台,市场结构呈现出高度的集中化,小度、小爱和天猫精灵三家合计份额超过了90%。不过头部这几家整体的市场份额差距不大,百度是35%、小米是31%、天猫精灵则是27%,三分天下的结果意味着没有一家迈过1000万台出货量的门槛。

这个成绩放在曾经被视为下一代互联网关键入口的智能音箱赛道上,即便不能说泡沫完全破裂,也是实实在在退了潮。站在今天回头看,阿里2020年投入100亿围绕天猫精灵的战略布局,性价比大概还赶不上李彦宏当年拿200亿做糯米。

不过在大模型涌现出更高水平的智能后,智能音箱这个行业似乎有了东山再起的可能。

智能音箱:产品路线图上的“兵家必争之地”

为什么说智能音箱是产品路线图上的兵家必争之地呢?因为以AI为主打的多模态产品怎么都绕不过它。

就像喀什之所以重要就在于它是两条西去路线的交汇处一样,大山就留了这么个口子,你想如果要像玄奘那样西行就怎么也绕不过这地儿。

智能音箱是智能产品的一个槛,它成了很多同种类产品比如故事机、镜子等就成了,它不成AI大模型的力量其实就在纯软的空间里憋着,我们设想的多模态产品等就止于想象。在从Agent到多模态,大模型想要什么?中我画了一张产品的图,无意间也正好把智能音箱放到了这么一个中间的位置上。

这产品非常的承上启下。承上承的就是纯软的Siri类助理,启下启的的就是各种机器人。(兵家必争之地的一个隐含意义就是这地儿本身不一定有那么大价值但丢了会很难受)

那为什么智能音箱会在这么个位子呢?

原因也不复杂。

但在回答这问题之前需要区分两类产品:一类是AI为主打特征的产品,一类是AI是辅助特征的产品。

遥控器上也可以放语音交互功能,但那是辅助特征。智能音箱则不是。智能音箱如果AI不出彩,这产品就立不住。对于很多产品AI是作料,像遥控器那样辅助其它特征,智能音箱这个产品上AI是主菜,别的功能特征辅助AI。

这是很少的几款真正靠AI特征驱动并且达到一定量级的产品(扫地机器人其实也是)。

对于AI主打的产品要么你处理纯粹的数字世界的工作,否则要想走出来和现实世界有交互则需要通过声光电热力磁各个维度的不同传感器,感知现实世界并进行决策等,基于此提供新的体验和功能。在其中智能音箱主要改变交互,感知和接入现实的程度最浅,也就意味着难度其实最低。如果这么说不好理解,可以类比导购机器人,显然的导购机器人需要对现实进行更深层次的感知。

最容易的产品立不立得住基本表示大模型等的新能力是不是能够走出数字空间,走出想象,获得一条商业上真的能够通往现实世界的路。

当然智能音箱可以涵盖带屏不带屏的版本。顺道说一句电视不管加多少语音特征都不是AI主打的,电视主要还是依赖自己的内容分发通路,核心支撑是它的屏。依赖屏和依赖智能特征很容易混杂,但其实不是一个事。(这个区分和综合后面会落在AR眼镜上)

如果智能音箱能成立,具身机器人就肯定可以获得一个比较坚实的基础,在它上面进行生长,否则就得变成必须靠自己移动的特征、更深层的感知来获得应用场景上的支撑,这显然更困难。这就是为什么前面说智能音箱可以启下。

当然反过来也成立,智能音箱都做不好,却指望一个更难的能成立,这不虚妄么。

音箱背后,是智慧生态入口争夺之战

智能音箱,对现在很多家庭来说,早已不是什么稀罕物。有的家庭中,甚至拥有不止一台,从小度音箱到天猫精灵、小爱同学,不一而足。但问题是,购买它的人,却往往都不太满意。

早在很久前,西局就问了周围一圈人对智能音箱的看法,包括年轻人、老人以及小孩,得到最多的反馈就是:鸡肋。老人喜欢看剧、听书,而智能音箱的内容偏少,不太好用;低龄儿童则对智能音箱的语音交互功能理解不够。对他们来说,更喜欢带屏的智能音箱,而它更受欢迎是因为能提供视频通话的功能。

但当初的智能设备入口之争,为什么落在了音箱的头上?

在智能手机陷入红海之后,手机的故事也已经挖空了市场的想象力。那么,接下来什么才是人类未来新的入口级产品?从智能眼镜到可穿戴设备,科技公司们进行了无数试验。但在这个过程中,随着互联网的成熟,人工智能技术的发展,触屏之外,语音成为被寄予期望的下一个核心入口。

当初亚马逊Echo的成功,给科技公司们提供了一个现成的样本,证实了这一产品的可行性。于是,不肯错失机会的巨头们,纷纷在智能音箱市场会师,这类产品也日趋同质化。

尽管智能音箱市场已经扩大,但AI语音识别技术的算法却没有在近几年获得更大的突破。厂商们作出了创新,包括在其上加入大屏,但始终缺乏一个真正实现质变的拐点。

实际上,大厂们还希望,智能音箱能够在AIoT时代,当更多的设备可以联网时,替代手机,担负起其智慧家庭战略中,全屋智能设备的“唯一入口”的重担。

像小米,在2019年启动“手机+AIoT”双引擎战略时,就将智能音箱作为其了全屋智能设备的操控入口之一。

2020年,小度科技宣布独立融资,之后公布了其“一屋一屏”战略,加快了全屋智能的布局。在智能音箱之后,其围绕着对话式AI操作系统,不断扩充家庭硬件品类。2021年3月,小度发布了首款专业学习平板;今年3月,小度推出“添添闺蜜机”;今年5月22日,小度正式发布了旗下首款小度青禾学习手机。

天猫精灵也不止植根于音箱。早年其就成立了“天猫精灵AI联盟”,并已植入到越来越多的产品中,如空调、扫地机、投影仪等,还发布了智慧屏天猫精灵E1切入教育赛道。天猫精灵启动首个大模型全面驱动的终端操作系统内测消息传出后,有媒体报道,在技术架构上大模型已全面掌管和驱动对话式AI操作系统,这个版本对大部分存量智能硬件也可用,具有几十秒内在线升级能力,将陆续覆盖音箱、眼镜、智慧屏、APP和部分AIoT生态设备和场景。

“百箱大战”竞争、智能音箱卖出“白菜价”背后,是一场AIoT生态的争夺战。

但“交互”没有得到改善,其他创新都缺乏力量。智能音箱在很多家庭中,也更多地是像普通的蓝牙音箱一样,用来听歌了,更遑论和其他家居设备打通。

创新服务难以持续,用户增长也就放缓。同时,智能音箱市场也逐步集中到头部企业产品,缺乏充分竞争,市场活力逐渐减弱。

大模型能不能带来希望?

当大模型火热推出后,大厂们也在为其寻找落地场景。

通义千问大模型发布时,张勇曾说:“所有行业、所有应用、所有软件、所有服务都值得基于新型人工智能技术、基于AIGC各方面技术支撑、大模型支撑重做一遍。”

这也包括家庭和办公场景应用,而其中,智能交互入口的重要性也再度得到了关注。大模型不断拓展新的应用场景,或许也将给智能音箱带来破局机会。

ChatGPT的出现,给语音助手提供了新的优化思路。ChatGPT背后的大语言模型,自然语言理解能力更强,且具有更强的通用性。当机器理解人类语音指令的能力能够实现飞跃,AI语音助手也就能够成为用户工作和生活中真正的“助手”。

这为智能音箱担负起更多的服务功能,充当“入口”,又一次提供了可能。申万宏源证券报告曾提出,ChatGPT将助力智能音箱成为AI“嘴替”,点燃智能语音应用生态。

技术的飞跃,为智慧入口带来了希望。而一切尝试,或许都给未来打开了一扇大门。

文章来源: ​西局科技,琢磨事,新立场NewPosition

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:智生活
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...