DeepMind 新基准可以显著提高机器人的堆叠能力

绕波特 2021-10-12

机器人deepmind

1123 字丨阅读本文需 2 分钟

对于大多数人来说,将一个对象堆叠在另一个对象上是一项简单的任务。但即使是最复杂的机器人也很难一次处理多项此类任务。堆叠需要一系列不同的运动、感知和分析技能,包括与不同类型物体交互的能力。所涉及的复杂程度将这项简单的人工任务提升为机器人技术的“巨大挑战”,并催生了一个致力于开发新技术和方法的家庭手工业。

DeepMind 的一组研究人员认为,推进机器人堆叠的最新技术将需要一个新的基准。在机器人学习会议 (CoRL 2021) 上发表的一篇论文中,他们介绍了RGB-Stacking,它的任务是让机器人学习如何抓住不同的物体并在彼此之间保持平衡。


研究人员断言,使他们的研究与众不同的是所用对象的多样性,以及为验证他们的发现而进行的评估。研究人员在论文中写道,结果表明,模拟和现实世界数据的组合可用于学习“多对象操作”,这为泛化到新对象的问题提供了强大的基线。

为了支持其他研究人员,开源模拟环境的一个版本,并发布用于构建我们真实机器人 RGB 堆叠环境的设计,以及用于 3D 打印它们的 RGB 对象模型和信息。

使用 RGB-Stacking,目标是通过强化学习训练机械臂堆叠不同形状的物体。强化学习是一种机器学习技术,它使系统(在这种情况下是机器人)能够使用来自其动作和经验的反馈通过反复试验来学习。

RGB-Stacking 将一个抓手连接到篮子上方的机器人手臂上,篮子里放着三个物体:一个红色、一个绿色和一个蓝色(因此得名 RGB)。机器人必须在 20 秒内将红色物体堆叠在蓝色物体的顶部,而绿色物体则作为障碍物和分散注意力。

据 DeepMind 研究人员称,学习过程确保机器人通过对多个对象集的训练获得通用技能。RGB-Stacking 有意改变了定义机器人如何抓取和堆叠每个物体的抓取和堆叠质量,这迫使机器人表现出超越简单拾放策略的行为。

深度思维

RGB-Stacking 基准测试包括两个不同难度级别的任务版本,在‘技能掌握’中,我们的目标是训练一个能够熟练堆叠一组预定义的五个三元组的智能体。在“技能泛化”中,我们使用相同的三元组进行评估,但在大量训练对象上训练代理——总共超过一百万个可能的三元组。为了测试泛化,这些训练对象排除了从中选择测试三元组的对象家族。在这两个版本中,我们将学习管道分解为三个阶段。

研究人员声称,他们在 RGB 堆叠中的方法导致了“令人惊讶”的堆叠策略和堆叠对象子集的“精通”。尽管如此,他们承认他们只触及了可能的表面,泛化挑战仍未解决。

随着研究人员不断努力解决机器人技术中真正泛化的公开挑战,我们希望这个新的基准,连同我们发布的环境、设计和工具,有助于产生新的想法和方法,使操作更容易,机器人更有能力。

随着机器人越来越擅长堆叠和抓取物体,一些专家认为,这种类型的自动化可能会推动美国的下一次制造业繁荣。在谷歌云和哈里斯民意调查最近的一项研究中,三分之二的制造商表示,人工智能在日常运营中的使用正在增加,74% 的制造商声称他们与不断变化的工作环境保持一致。

制造业公司预计未来五年的效率将因数字化转型而提高。麦肯锡与世界经济论坛的研究表明,到 2025 年,实施“工业 4.0”(传统工业实践的自动化)的制造商的价值创造潜力将达到 3.7 万亿美元。

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:绕波特
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...