对标“擎天柱”,成本20万内!华为“天才少年”创业具身智能,前景几何?

智造部落 2023-09-08
2832 字丨阅读本文需 7 分钟

终于,“天才少年”稚晖君交出了创业的首份答卷!8月18日,具身智能机器人初创企业智元机器人(AgiBOT)在上海举办发布会,推出其最新研发的具身智能机器人远征A1。

智元机器人是“含着金钥匙”出生的公司。2023年2月,智元机器人成立,截至目前,公司已经完成了天使轮、A轮、A1轮、A1+轮等多轮融资。天眼查显示,投资方包括BV百度风投、经纬创投、鼎晖投资、高榕资本等。稚晖君表示,智元机器人的初心和使用就是:创造出和人一样灵活以及智能的机器人,让智能机器人创造无限生产力。“这个初心也被我们写在公司名字中,‘智’的意思就是智能,‘元’就是人的形象,英文名中的Agi就是通用人工智能的意思。”

为什么是人形机器人?

稚晖君解释了智元为什么要设计人形机器人。“我们人类习惯于在人形的环境中生活,人形机器人更加符合人类熟悉的生活、生产场景。”

关于自己对于这条赛道的选择,则要追溯到稚晖君过往的兴趣和经历。稚晖君在B站发布的视频大多和“动手”有关,例如给葡萄缝针、制作机械臂等等,几次“爆款视频”都是用实物征服了观众。如今,稚晖君在B站拥有249万粉丝,被平台赋予的标签是“bilibili 2021百大UP主”、“知名科技UP主”。稚晖君在OPPO和华为的工作经历与AI有关,而在大学时期,稚晖君就参加过多次机器人项目的开发和比赛,研究生时期组建的机器人创业团队还获得过投资。这些经验都给智元的诞生打下了基础。

实际上,稚晖君也考虑过其他领域,比如自动驾驶。他解释称,在选择赛道时,第一个考虑的因素是市场逻辑,他认为,在国内环境下单做软件,商业逻辑很难成立。而软硬件结合的产品,最合适的就是自动驾驶和机器人。AI大模型的爆发一定程度上推动了稚晖君的创业。在他的考虑中,一方面,AI大语言模型和一些通用人工智能技术的成熟,让行业走到了拐点;另一方面,AI和机器人技术的深度结合,也一直是他个人最感兴趣和理想的研究方向。

在技术方面,智元的确交出了一份不错的答卷。今年6月,团队就研发出了“远征A1”的第一台样机,之后开始不断调整算法等,半年内完成从0到1的建设。在“远征A1”发布会现场,稚晖君介绍了智元自研的核心组件及其技术指标,包括核心关节电机PowerFlow 、灵巧手SkillHand、统一软件框架AgiROS、语言任务模型WorkGPT、具身智脑EI-Brain等。

以核心关节电机PowerFlow为例,智元自研的PowerFlow使用了准直驱关节方案,实现了低齿槽转矩设计,峰值扭矩超过350NM,重量仅为1.6KG。

驱动关节占据了机器人硬件成本40%,在这一环节智元投注了不少精力。稚晖君说,之前他们也找了一些供应商提供核心零部件,但测试的效果并不好,所以决定自研。最终,从测试外部零部件到立项、再到部分自研做出关节原型机,只用了一个月左右的时间。

具身智能创业机会转瞬即逝

稚晖君算是最早感知到这一波大环境变化,并且付诸实践的那拨人。外界看来,他去年年底宣布创业时,机器人和大模型都是科技领域的大热议题,尤其是ChatGPT刚出道,带给大家暴力美学的震撼。那个时间节点,赛道远没有今天拥挤。技术从业者闻风而动,不算意外。但稚晖君第一次透露了他当时的心态:要是选择再晚一点,也许就没必要出来创业做这事了。

为了解释这句话,他给竞品特斯拉擎天柱拉出一条时间线:去年9月展示原型机,今年5月展示识别周围环境存储记忆和准确控制物品拿放的能力,7月表示已经生产10台,预计11月进行行走测试,明年在特斯拉自己的工厂进行实用性测试。动作很快,实际效果也哇噻。马斯克,一个从不按套路出牌的男人,自从宣布入局机器人赛道,就用火箭般的速度推进量产节奏,在他的口中,未来机器人的数量会超过人类。

稚晖君看到这一切,心潮澎湃。与此同时,他也观察到机器人和大模型结合的潜力。

微软的ChatGPT for Robotics,谷歌的Palm-E、RT-1、RT-2,还有VoxPoser、RoboCat等众多工作,都在尝试把图像语言大模型的能力和知识迁移到机器人领域。其中轰动最大的谷歌RT(Robot Transformer)系列,在论文阐述和demo视频中,都展示出抓取领域非常优秀的泛化能力。要做到这一点并不容易,核心门槛,在于数据。光是训练它,谷歌就花了17个月,收集13台机器人的13万条机器人真实数据——这大概也是RT模型开源而数据暂时闭源的一个小小心机。

稚晖君坦言,虽然也从一开始就在准备自家的动作任务数据集,但目前能用来训练自家产品的数据,“只有上千”。一对比,差距之大,显而易见。数字上的直观差距,足以解释稚晖君说的,“当前节点,远征A1最需要提升的地方,是数据带来的AI泛化能力”,足以解释这为什么“会是一个相对长期的布局”。也能部分解释发布机器人时,直播间网友对展示时间较短、展示能力不如想象炫酷的疑问。

“我觉得要想达到真正理想的实用效果,还是需要大量的真实场景数据。我们时间太短了,这方面还没有做够积累。”稚晖君如是说。竞争对手不会给你多留喘息的机会。正因如此,稚晖君表示团队接下来的工作重心之一,是建立自己的数据中心。计划未来几个月内落地临港,主要目的是搭建场景和仿真平台,填补运动数据,提高泛化能力。

数据是如何生成的?稚晖君的总结有三:监督学习数据:靠人做示范,控制机器人做分拣等各种操作,在过程中采集真实数据。仿真数据:需要自己搭建仿真平台,有一个比较好的渲染引擎、物理引擎,以及比较好的人机交互流程装置。AIGC生成数据:主要是真实数据的补充扩充,是低成本数据增强的一个重要手段。

建数据中心是工作重点之一,另一个重点则是对硬件结构进行迭代重构,加强机器人本体运动性能。按稚晖君的说法,团队会用做软件敏捷开发的速度和效率去迭代硬件。这是非常颠覆并且有挑战性的一件事情。

对标“擎天柱”马斯克有对手了

就人形机器人而言,特斯拉的“擎天柱”每次出现总是引起很多关注。特斯拉CEO马斯克曾表示,擎天柱的成本预计在2万美元左右(约合人民币14.5万元)。稚晖君现场表示,未来他们将把A1探险的成本控制在20万元——这对于一家成立仅半年的公司来说是一个很大的野心。虽然产品展示遵循酷炫甚至有些科幻,但智元在创立之初就有了相当具体的实施计划。成本控制是应用的前提。

稚晖君也大致描述了一下智元为量产控制成本的方法。一是尽最大可能采取自研路线,降本增效。如关节电机和灵巧手等部件占硬件成本一半以上,而且市场现有供应还存在特性不匹配的情况,自主研发核心部件能让成本降低一半以上。二是采用类似特斯拉造车的部分思路,用软件和算法补硬件方面的精度要求,降低硬件成本。如放弃谐波减速器而选择行星减速器,灵巧手上面使用的视觉闭环方案等等。

再说落地应用场景。稚晖君表示,预计明年下半年商业化落地,先应用在工业制造领域,家庭等服务型应用场景都往后排,现阶段突出一个“场景相对简单,任务相对复杂”。

最新工商动态显示,比亚迪入股了智元下属公司,另外据了解,公司已与国产头部智能汽车厂商和3C厂商等密切洽谈。由此在官宣前推测一波,远征A1在工业制造领域的首发打工地点,不出意外,就是比亚迪汽车工厂。为了适应不同的场景,元征A1的设计采用了上下肢分离的模块化设计。上肢支撑末端工具灵活互换,满足不同任务的需要;下肢采用双足、轮式、轮式等多种配置。旨在实现机器人在各种应用场景下的最优配置和扩展。

毋庸置疑,具身智能很可能是AI机器人的最终形式,赋予包括人形机器人在内的各种AI机器人更高的智力和感知能力,以便完成更多只有人才能实现的动作。

正如稚晖君所说:人形双足机器人是人类环境中最为通用的终极形态。生活的物理世界中各种场景、设备、任务、工具,都是为人体形态量身打造的。只有机器人像人,具备类似的身体结构和能力,才能够帮助机器人更好地融入人类的生活和工作环境,并且无需对机器人做任何改造。

随着ChatGPT的流量下滑以及人气的趋冷,人们都在期待和寻找下一个现象级AI应用的出现。所以,叠加人工智能、AI大模型、人形机器人等多重前沿技术的具身智能机器人很可能成为新的风口,再度引爆全球。所以,具身智能机器人的真正落地,值得我们期待。

文章来源: 永剧场,物联网智库,我是AI虎大王

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:智造部落
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...