看似只能“夸大”语音助手功能的手机AI大模型,或许醉翁之意不在酒

摩尔后时代 2023-11-23
2799 字丨阅读本文需 7 分钟

近年来各家手机厂商除了在UI上竞争堆料,各种卷以外,在人工智能的赛道看,他们似乎也拿出了浑身解数,以求自己能在AI“军备竞赛”的初期就能占据领先的市场优势,当前市面上的许多大品牌厂商确实已经在这方面有所努力。

最近两个月,国内手机厂商的陆续公布了他们的AI模型表现以及成绩,AI能做到什么?怎么做?核心思路是什么已经被验证过很多次,那么,手机从语音助手升级至AI助手后功能性又有如何长足性的进步呢?

大模型将重新定义手机?

今年8月,华为宣布HarmonyOS 4系统全面接入盘古大模型,成为全球首个嵌入AI大模型能力的移动终端操作系统。华为语音助手小艺因为融合了盘古自然语言大模型、盘古视觉大模型和盘古多模态大模型正变得更加聪明,首批支持机型为Mate 60系列。

今年10月,小米宣布自研AI大模型已经接入小米澎湃OS,这一系统将承接小米集团未来的新战略。目前,小爱同学已在AI大模型的加持下,拥有了文本创作、AI扩图等能力,这些能力在小米手机14系列已有体现。

11月1日,vivo正式发布自研大模型矩阵蓝心大模型(BlueLM),包含十亿、百亿、千亿三个参数量级,并推出基于其打造的功能应用“蓝心小V”和“蓝心千询”。11月13日,vivo又发布了首款AI大模型手机X100系列,落地终端侧70亿参数大语言模型,跑通端侧130亿参数模型。

11月16日,OPPO宣布在最新发布的ColorOS 14中,内置了安第斯大模型(AndesGPT),该模型包含了从10亿到千亿不同参数规模的多种模型,并将与自研的潘塔纳尔智慧跨端系统全面融合。

荣耀的大模型虽然还没有正式揭开面纱,但据荣耀公司CEO赵明的“剧透”:荣耀即将推出自研70亿端侧AI大模型和全新云服务,在即将发布的荣耀Magic6上用户就可以体验。

此外,许多媒体也在报道苹果的Ajax大模型、三星的高斯大模型的相关传闻。总之,AI大模型已经“忽如一夜春风来”,恨不得成为每台手机的标配。

“AI是我做手机以来最让我兴奋的技术创新,甚至是革命,它会给移动生活体验带来革命性的变化。未来,AI可能让手机呈现出新的面目,会让你感觉手机好像跟以前完全不一样了。”OPPO首席产品官刘作虎告诉《中国经济周刊》记者。

“现在已经能够看到大模型在增强手机已有模块的能力,比如更强大的语音助手,但这并不是全部。大模型将会以其颠覆式的能力,让手机成为智能体,从而改变人们对于手机的定义。”vivo副总裁、vivo AI全球研究院院长周围告诉《中国经济周刊》记者。

“AI大模型有可能颠覆未来智能手机的形态和使用方式。当然这不会是一蹴而就的,第一阶段是增强已有功能,比如让语音助手更智能;第二阶段是开发新功能,比如通过调用外部工具和知识库完成用户的复杂需求;第三阶段是手机变成一个智能体,在理解用户行为习惯的基础上,主动提示用户完成一些设置或任务。”小米技术委员会AI实验室大模型团队负责人栾剑告诉《中国经济周刊》。

2007年第一代iPhone的发布,拉开了从功能机到智能机时代的序幕,手机的功能属性和在人们工作生活的地位被重新定义。之后,虽然智能手机拥有了更大的屏幕、更好的影像、更快的速度、更多样的功能……但似乎已经很久没有出现令人眼晴一亮的颠覆性创新。

虽然手机厂商们已经使出浑身解数,狂卷硬件、性能和价格,但用户的换机周期还是越来越长,因为对于相当一部分用户来说,手机的性能已经是“超需求供给”状态了。

在此背景下,手机厂商们当然就会非常期待能够借助AI大模型,为手机带来新的体验和新的可能,来激发消费者的换机欲望。

大模型,不只要「大」

过去一年,大模型发展的核心关键词,就是「大」。

参量是大模型展现出惊人智慧的核心原因,所谓「大力出奇迹」。参数的规模越大、层级越多,大模型就能对数据进行更细腻的理解,最终拟合出更真实的结果。

如果把智慧比作声音,人类智慧是连贯的模拟信号,AI 则像是数字录音回放设备,采样率决定了音质。采样率越高,就与自然的声音越接近,到一定程度,人耳就不再能分辨出区别。同样的,参量够大,AI 就能「骗」过人类。

所以,目前宣布将大模型部署到手机上的厂商,都不同程度地遭到了舆论质疑。很多人认为手机上可以部署的模型,参量不够大。进行多端、多模型部署,反而会带来混乱。

如果大模型应用的目标仅仅是打造出一个「能通过图灵测试,上知天文,下知地理的人工智能」,那确实是,参量决定一切。

但实际上,一个模型是否实用,并不是靠参量来判断的。一切模型,最终都是为了模拟一部分现实,推演、拟合出合理、正确的结果,满足需要即可,并不能武断地说「越大越好」。

对这个问题,手机厂商有更深的认识,一个典型例子是语音助手。

语音助手的核心模型,就是要把用户发出的声音波形,拟合成自然语言。这个模型的复杂度和运算量,对于早期的智能手机来说已经很大了,大部分手机芯片跑不动。所以早期的语音助手,都会将用户语音指令的声音波形,发送到云端,由服务器上的模型识别成指令后,再发回手机执行。

但随着手机上 NPU(神经引擎)的算力发展,以及对声音识别模型的简化,手机厂商发现,也可以把这个模型部署到本地,直接让 NPU 来跑。它带来的好处也很实际:响应速度变快了,无网络环境也可以用,且增强了隐私安全性。

目前大模型应用主要以生成式 AI 为主,并未进入那些更接地气的复杂场景。当大模型应用真正触及到用户需求的细枝末节时,会有更多问题出现,其中最关键的两个就是「数据安全」和「响应速度」。

从这个角度,就不难理解 OPPO 为什么在推出 AndesGPT 的时候,如此笃定地采用了「端云协同」的技术架构。

从十亿参量到千亿参量,OPPO 计划部署一系列不同参数规模的大模型,兼顾响应速度、安全性,同时追求提升大模型的能力上限。

通过端云分工,AndesGPT 会根据对指令、任务需求的梯度理解,来智能调用不同模型。比如用户的指令只是查询手机内一个联系人,那就通过端侧模型迅速响应,如果用户问的是更复杂的知识,就通过云端大模型,生成更复杂,准确的回答。

AndesGPT 的能力覆盖非常广阔,从「智能摘要」、「智能消除」,到基于语义的多模态信息搜索,加深对用户个性化习惯的理解、记忆……

据 OPPO 内部透露,这些能力也将会支持端侧化,目前他们已经在端侧跑通 13B(130 亿)参量模型,突破了端侧大模型的能力上限。这些模型能力,加上智能手机十亿级的用户规模,将展开大模型应用的广阔未来。

理解能力升级 将迎来更多需求

现在很多人手机里的各种语音助手主要原理依然是对先做语音识别,再从库里找到对应问题的回答。这种方式的语义理解能力不够好,经常会出现答非所问,甚至“抱歉,我听不懂”,且对话上下不够连续。

但在接入生成式人工智能大模型后,不仅可以提升语义理解、上下文对话,这显然会让语音助手更智能。

而以大模型的能力,即便是会议录音的场景,接入人工智能大模型的语音助手还可以将会议录音快速整理成去掉语气词和重复内容的文字版,以及可以提炼要点。也就是说,在接入人工智能大模型后,只用带着手机去听听会议,手机就能自动帮我们做出一份会议纪要。

而现在手机厂商们可不仅只是想让手机调用云端算力使用各类AI应用,还想要让AI大模型直接内置到手机上。也就是说,没网也能用上AI大模型了。

与单纯在云端部署生成式 AI 应用和服务相比,手机终端内置的生成式AI可以实现在设备端运行复杂的AI算法,从而减少对云端服务的依赖,个人私密信息也不用上传的云端,保障数据安全。

此外,手机可以更好地理解和响应用户的需求,从而满足用户对更加智能化手机的期待。

这么一来,内置AI大模型将有助于拓展手机的功能边界。可以实现更多的应用场景,如实时翻译、智能家居控制、健康管理、在线教育等,满足用户多样化的需求。

生成式大模型的能力可以让智能手机变成人类在各种场景交互时的专属助手与秘书。

当人工智能大模型与智能手机结合之后,智能手机的创新体验可就多了,新的需求自然也就来了。

文章来源: 极客公园,智能化的悄悄话,中国经济周刊

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:摩尔后时代
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...