“远征A1”具身智能!“90后”的天才少年造出“最实用最酷的机器人”

工程师张非 2023-08-22
2632 字丨阅读本文需 7 分钟

时至8月,火热了半年之久的AI赛道,已俨然显示出了降温之势。可就在这个关头,由号称华为天才少稚晖君打造的人形AI机器人“远征A1”却赫然登场,用一系列亮眼的特点,振奋了已显冷淡的AI赛场。

舞台之上,这个迈着小碎步入场的机器人,引来了整个行业的关注。而这个由智元机器人(Agibot)发布的具身智能机器人,之所以能在业内引起如此大反响,则是因为其具备了最新的AI大模型能力。根据稚晖君在发布会上展示的内容,灵巧自如的远征A1,不但能做家务、制备实验样本,甚至还能胜任看护老人这类需要“体贴”的工作。

“天才少年”为梦想赴上海创业

在哔哩哔哩拥有249万粉丝、在新浪微博上有96万粉丝的稚晖君(真名:彭志辉)是电子科技大学硕士,2020年入职一家大企业,从事人工智能边缘计算领域的研发工作,取得了不俗业绩。

然而,他的心中一直有一个机器人梦想。作为知名UP主稚晖君,他在B站上发布了很多自研机器人的视频,如《我把自行车做成了自动驾驶!》《我造了一台钢铁侠的机械臂!》《技术宅UP耗时三个月,自制B站最强小电视!》。这些视频的点击量都高达上百万,粉丝戏称稚晖君为“野生钢铁侠”。

去年底,彭志辉从大企业离职,走上了创业道路。不出所料,他与合作者创立的是一家机器人企业,公司总部设在上海。之所以选择在上海创业,是因为这座国际化大都市拥有众多高端研发人才、发达的高端制造业供应链,还有支持智能机器人企业发展的产业政策,国际交流合作也很便利。

今年3月,智元机器人落户浦东康桥。公司一成立,就走上了发展快车道,迄今已完成4轮融资,估值达到“独角兽”标准;目前员工人数近百人,其中研发人员占80%左右。彭志辉表示,智元二字,“智”就是智慧,“元”看起来像两足的人,让人联想到这是一家机器人公司。它是将先进的机器人和人工智能技术与人类生活紧密结合,让机器人成为人类得力的助手。这也是彭志辉坚持的方向:通用人工智能。

万里“远征” 始于足下

时隔半年,稚晖君终于在万众期待中,带着团队造出的一代机器人远征A1,站在了聚光灯下。略微青涩、ppt式的演讲,没有掩盖其“人因梦想而伟大”的野心——“造最实用最酷的机器人”。

能够直立行走、上下台阶、可以按照指令辨别、挑选物件的灵巧手……彭志辉通过一段视频向观众展示了远征A1的技能。未来它的工作场景将包括汽车工业生产线、家庭陪伴、科学实验等。在掌声中,远征A1缓慢走上了舞台。和此前亮相的特斯拉机器人、小米铁大类似,远征A1最大的特点是人形。金属头部、身体四肢齐全,下半身膝盖部分呈反曲状,足部成三角支撑状。

为什么人类总是倾向于将机器人设计成人形?对于这个问题,稚晖君表示,原因就在于“从第一性原理出发,人形双足机器人是人类环境中最为通用的终极形态!”换句话说,机器人要想真正进入人类的生活,就得适应各种为人体形态量身打造的场景、设备、任务。例如,具身机器人如果想帮人类操作仪器,抓握东西,那就必须具备人类那样灵巧的手指;

如果它想在城市环境中,迈过各种楼梯、台阶,那就得具备和人类一样能弯曲的膝盖。而要想实现这样的灵活性、协调性,就必须在机器人的硬件构成上,进行一系列重要的设计。在这方面,智元机器人较为独特的技术之一,就是谐波一体关节。这是机器人的传动装置,用来降低转速、增大扭矩等,相当于人类的“关节”。

一般来说,机器人的结构和关节,决定了它的自由度,而自由度是指机器人的运动能力,也就是机器人能够独立控制的运动变量的个数。自由度越高,机器人的运动越灵活,越能适应各种复杂的环境和任务。

目前,远征A1的自由度超过了49个,手部有12个主动自由度。而相较之下,马斯克的“擎天柱”人形双足机器人全身有200多个自由度,手部27个自由度。虽与世界顶尖机器人有着一定差距,但六个月的时间,能做到这个地步,也实属可观了。

具身通用人工智能更“智慧”

这款人形机器人的“远征”目标是“具身通用人工智能”,即让机器人具备通用人工智能,可通过自我学习掌握各项技能,以更自然、更智能的方式与周边环境进行交互,并完成各种任务。人工智能大模型问世后,人们看到了实现“具身通用人工智能”的可行性。

据介绍,“远征A1”体内已部署大模型。它是研发团队对开源大模型进行优化迭代的产物,特别是针对机器人抓取物品时,要处理各种情况的需求,研发团队对大模型做了优化,加强了它的实时感知能力。完成模型优化训练后,公司采用“CPU+GPU”架构,开发出一款无须联网的“端脑”(端侧的大脑),将其安装在机器人体内。

有了大模型“端脑”,“远征A1”就能听懂自然语言指令,分析出讲话者的意图。比如,主人说“我要一杯水”或“我渴了”,它都能理解,随后前往饮水机或其他地方取水,并把水杯递给主人。在制造业场景中,它不必像传统工业机器人那样按设定轨迹运行,而是像人那样进行自主学习,随后根据实际工况,将学到的“原子动作”以最优轨迹组成“工作流”,从而更高效地完成操作。

彭志辉表示,公司计划明年二季度或下半年发布商用人形机器人,让它早日进入制造业和家政服务业。在工业智造领域,部署大模型的人形机器人适用于3C(电脑、通信和消费电子产品)制造等复杂程度较高的行业,可快速适配场景,比传统工业机器人更高效更灵活。在家政服务领域,“远征”机器人已具备中餐烹饪、端菜上桌以及使用洗衣机、晾衣、叠衣、熨烫衣物等功能,有望在不久的将来胜任“机器人管家”一职。

人形机器人市场前景

在具备了更灵活的运动能力、和更强的泛化性、通用性后,具身机器人的市场前景究竟如何?或许,从各个科技巨头对该领域的相关布局中,我们就可看到一些端倪。

2022年8月,特斯拉宣布将在该年特斯拉AI day上发布全尺寸仿生人形机器人Optimus 。同月,小米全尺寸人形机器人CyberOne正式发布。宣传片中,昵称为「铁大」的机器?能够独立行走、弯腰,完成抓取等简单动作。而今年6月,腾讯发布了旗下机器人工作室Robotics X研发的四足机器人Max的最新视频。其自主研发的多模态四足机器人“机器狗Max”再度得到升级,动作、行为都更加接近真实动物。同样的,近期华为也成立了“极目机器”,布局机器人与智能制造,注册资本8.7亿,经营范围包含电子元器件制造、工程和技术研究和试验发展等。

种种迹象表明,众多巨头科技公司纷纷看好仿生机器人,行业正火热发展中。

实际上,人形AI机器人的兴起,并非仅仅是由于大模型的“火热”所致,而是科技发展的内在规律。正如个人终端从台式电脑到个人电脑,再到手机的发展趋势一样,每一代终端的迭代,都意味着人类将更多的功能,集合到了统一的平台中。时至今日,手机几乎成了这样一个平台的终极形态,因为其在一块小小的屏幕中,集合了人们日常所需的购物、视频、社交、学习等各种功能。

然而,人形AI机器人的出现,则填补了此前所有平台都无法弥补的空缺:即与真实的物理世界互动的能力。也正因如此,巨头们相继推出机器人产品,并非赶热点,而更多是之前即有的布局。

在大模型的赋能下,一个可预见的产业趋势,则是机器人会在2C端的服务领域,向着更多元的方向发展。

此前,清华大学交叉信息研究院教授陈建宇曾说:“人形机器人将是下一代终端。具身智能机器人的出现才会是真正的「iPhone」时刻。”在国内机器人百花齐放的生态下,具身机器人的发展,就像一场自然界充满了未知与惊奇的进化,当参与进化的个体数量足够多时,神奇的突变也终将会在某一刻显现。

文章来源: 上观新闻,封面新闻,协作机器人服务平台,金融界

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:工程师张非
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...