大模型找到最佳载体,时尚轻巧的智能眼镜成为统一风口

硬件君 2023-12-19
1713 字丨阅读本文需 4 分钟

大模型之战席卷了整个2023年,紧接着的是,各大科技巨头似乎都瞄准了AI可穿戴设备,尤其是智能眼镜!

据The Information报道,Meta、谷歌、微软、亚马逊、苹果五大科技巨头都准备将AI大模型应用在智能眼镜等带有摄像头的可穿戴设备上。他们认为智能眼镜等硬件将成为AI大模型的合适载体,因为多模态AI大模型可以处理声音、图片、视频等多类型的信息。

有知情人士透露,明星AI创业OpenAI最近也正在将“GPT-4 with Vision”的物体识别软件嵌入到社交公司Snap的产品中。这或许将为Snap的智能眼镜Spectacles提供新功能。

Meta在上周二展示了自己将AI功能融入至雷朋(Ray-Ban)智能眼镜的效果。该智能眼镜可以通过AI语音助手描述用户看到哪些东西,同时能够告诉用户哪件衬衫适合哪件裤子,以及拥有西班牙语报纸翻译成英语等一系列新功能。

亚马逊Alexa AI助理团队内同样有个小组在研发一种新型带有设觉功能的AI设备。此外,和多数手机厂商一样,谷歌开始尝试将AI功能应用到手机中。

不仅如此,今年6月,苹果Vision Pro头显正式亮相,计划在明年出售。但据The Information推测,该设备可能刚开始并不会具备多模态AI功能。

AI可穿戴设备+摄像头,

或成大模型最佳硬件载体

这不是硅谷巨头们第一次设计这类带有摄像头的可穿戴设备产品。此前谷歌、微软以及其他科技巨头都曾研发过AR头显。他们当初希望能够让数字屏幕出现在头显的半透明屏幕上,逐步提供指引帮助用户完成任务。但由于光学设计较复杂,最后多数产品反响不佳。

OpenAI推出的多模态大语言模型,可以通过视觉识别功能,让AI知道人们在看什么,在做什么,并且可以对这些行为、事物提供进一步信息。当大语言模型开始轻量化,一些小型设备也可以搭载模型,能够即时反馈用户的请求。考虑到人们对隐私安全的重视,人们可能还需要一段时间才能接受智能眼镜,以及一些内置摄像头的AI设备。

The Information觉得智能眼镜拥有AI助手后,或许将会成为像智能手机一样变革性的产品。它不但能成为指导学生数学问题或者论文问题的导师,还可以随时给周边的人提供环境信息,如翻译广告牌、告诉用户如何解决汽车故障等。

苹果公司前工程经理,AI搜索公司Objective的首席执行官巴勃罗·门德斯(Pablo Mendes)说:“AI大模型对一切都至关重要,它们将在计算机、手机和其他设备的底层架构中起到作用”。

智能硬件必将是下一个风口

相较于在软件应用领域的互相角逐,智能硬件与大模型相互结合也存在无限可能。这个共识,在许多互联网公司的产品表现中皆可窥得一二。可以预见的是,未来AIGC硬件的应用场景也将更为垂直化、更为个性化。

从国外来看,本周OpenAI宣布在美国推出聊天机器人ChatGPT的iPhone应用,并承诺未来也将为安卓手机提供相同的服务。国内方面,除了天猫精灵智能眼镜选择“嵌入”大模型外,百度近期也发布了集成AI大模型能力的小度青禾学习手机,科大讯飞亦将星火大模型融合进了讯飞智能办公本。

不管此时国内外各方的进展如何,唯一能确定的,智能硬件必将是下一个风口。

如果非要找出都搭载大模型的智能硬件和软件应用两者之间的区别,那个答案更可能会落脚到个性化上。相比以广义理论框架搭建、公用数据训练出的通用大模型,经微调后加入人格化标签、融入更加细分领域的数据的个性化大模型更显有趣,也更符合新趋势的走向。

然而前有被竞相追捧的元宇宙风口,后有个性化大模型结合智能终端的现实方向,这些在高热风口都被寄予众望,而事实好像恰恰相反。

不管是元宇宙,还是大模型,消费场景的建立和使用,更多取决于用户的“无感”体验,即要求更多具有沉浸感的交互能够在无意识的情况下自然下发生。“沉浸感”已经不是最高要求,虚拟现实体验的前提是虚拟环境,直白点说,就是游戏、VR、AR等使用场景,完全区别于现实的场景。

而在大模型需求的多模态交互语境下,虚拟环境不是必须的,那么这份“沉浸感”能否转化为“无感”呢?若真要以“无感”作为智能硬件的一项标杆,那起码现阶段的任一落地产品都无法达到。

多模态AI 为可穿戴设备赋能

早在今年9月接受媒体采访时,扎克伯格就透露过,Meta会在智能眼镜上推出多模态人工智能功能。所谓的多模态,即支持文本、图像、语音等多种形式的媒介输入的人工智能。

虽然这些功能在桌面端的AI软件里已经很常见,但搬到眼镜上,还是让人感到相当新鲜。

据报道,Meta未来还计划让眼镜能够检测人体的感官数据,进一步强化多模态能力。眼镜上搭载的高通AI芯片目前似乎表现良好,Meta未来还计划进一步对使用流程进行优化。

Meta CTO Andrew Bosworth九月份曾表示,由于续航限制,智能眼镜现在必须要用语音来激活,但未来迭代后可能会配备足够低功耗的传感器,能够智能检测需要用到AI的场景,自行启动。

目前,Meta眼镜已经上架销售,售价为300美元,AI功能处于早期测试阶段,仅向部分用户开放。但值得指出的是,Meta也表示,会使用匿名数据来帮助改进眼镜的AI服务,可能会让许多关心隐私的用户感到不适。

文章来源: 华尔街见闻,新立场NewPosition,智东西

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:硬件君
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...