橙色云资讯 - 工业互联网行业信息门户

纸片人「活」了，Meta AI新作：只需几分钟，手绘小人有了灵魂

新智元 2021-12-17

meta https 人工智能

1868 字丨阅读本文需 11 分钟

快看，「纸片人」居然自己跳出来了！

小猫学会了hiphop。

小蜜蜂还会做wave。

火柴人竟然会打跆拳道。

糖果人还能空中飞踢。

这些卡通动画都是用孩子们的简笔画生成的，不过，作者可是一个AI！

AI动画工具在儿童绘画上翻车？

孩子们富有想象力和创造性的简笔画，有的时候能带给人一些不一样的思考。

不过，虽然家长或老师很容易就能看出孩子的画想展示什么，但人工智能却很难完成这项任务。

为什么呢？

这是因为孩子们的绘画通常比较超脱常规，比如，人物的脚并不能支撑身子，或者人物的双臂位于身体的同一侧。

这样一来，AI系统有时候就无法识别出图像和绘画中的人物。

不过，研究人员已经有了一些眉目。

昨日，Meta AI宣布了一种独创性方法，只需几分钟，就能自动生成儿童手绘人物或类人角色（即具有双臂、两条腿等的角色）的动画，而且生成的动画还能做到栩栩如生。

只需将孩子的手绘上传给Meta AI，就可以看到它们变成会跳舞的角色，十分逼真。

手绘变动画四步走

许多AI工具和技术都是为了处理真实的人类图像而设计的，但儿童绘画增加了人物特征的多样性和不可预测性，这使得识别手绘人物变得更加复杂。

儿童绘画中的「人」有许多不同的形式、颜色、大小和比例，在身体对称性、形态等方面几乎没有相似之处。

于是，Meta AI通过四个步骤来应对这一挑战。

制作儿童人物动画的第一步是将人物与背景和图片中的其他类型的角色区分开来。

Meta AI采用基于卷积神经网络的目标检测模型Mask R-CNN来提取儿童绘画中的人物。

虽然Mask R-CNN已经在最大的分割数据集上进行过预训练，但是这些数据集都是由真实世界物体的照片组成的，不包含手绘图。

因此，研究人员又将模型在大约1000张手绘图上进行了微调。

经过微调过程后，模型就能够很好地检测出测试数据集中的人物。

不过，虽然现有的目标检测技术在区分儿童绘图上的人物时非常有效，但是产生的分割mask不够精确，无法用于动画。

为了解决这个问题，我们改为使用从目标检测器获得的边界框，并应用一系列形态学操作和图像处理步骤来获得mask。

从绘图中识别并提取人形后，下一步就是通过mask将主体与背景分开。

理论上，该步骤完成后，mask掉的部分应该只含有人形的部分，没有任何背景。

但是，如果手绘图中的人物的手、脚、身体等部位在外观上过于不符合常规时，Mask R-CNN预测的mask往往无法准确地捕捉整个图形。

比如下图那个倒三角的小人，其中，黄色三角形代表身体，一条横杠代表手臂。

Mask R-CNN的结果显然非常粗糙，不是「砍掉」了手臂，就是加粗了大腿。

为此，Meta的研究人员开发了一种经典的基于图像处理的方法，对这些形状各异的身体部件更加稳健。

研究人员先用预测的人形边界框来裁剪图像，然后，应用自适应阈值处理和形态学操作，从框的边缘进行泛填充，并假设mask是未被泛填充触及的最大多边形。

虽然这种方法可以精确提取提取适合于动画的mask，但是当背景杂乱无章或者纸张上有褶皱、破损或阴影时，就不好使了。

孩子们画的人物有各种各样的身体形状，这些都远远超出了AI所见过的传统人的头部、手臂、腿部和躯干的形状。

举个例子，孩子画的「火柴人」没有躯干，胳膊和腿直接连在头上。

因此，研究人员需要一种能够处理这类形态「变异」的全新方法。

Meta使用专为人体姿势检测而训练的模型AlphaPose来识别人物上的关键点，这些关键点可以用作臀部、肩膀、肘部、膝盖、手腕和脚踝的识别。

由于AlphaPose是在真人的图像上训练的，所以要想让它能检测儿童绘画中的姿势，必须对它进行重新训练，以处理儿童绘画中千奇百怪的姿势。

为此，Meta的研究人员先内部收集了一波儿童绘画的数据。

然后，研究人员利用在这个初始数据集上训练的姿势检测器创建了一个内部工具，并允许父母上传他们孩子的画作，而研究人员则可以利用上传的画进行额外的训练。

随着数据越来越多，模型也得到反复地训练，最终达到了一个较高的准确度。

一旦有了mask和联合预测，也就有了制作动画所需的一切。

Meta首先使用提取的mask生成一个网格，用原始图形对其进行纹理化。

使用预测的关节位置，研究人员为角色创建一个骨架，通过旋转骨骼和使用新的关节位置来生成各种姿势。

在制作动画之前，先从绘图中创建一个需要操作的角色。

然后，通过将一帧运动捕捉数据投影到2D平面上并更改角色姿态。从前面（顶行）、侧面（中间行）和扭曲的视角（底部）投射运动捕捉数据都可以。

最后，再让角色产生一系列连续的姿势，就可以创建一个动画了。

Meta AI可以根据关节预测的可信度来选择不同的运动：在手臂和腿都被正确预测的情况下，动画可以无缝地产生。

但是如果躯干没有出现在绘图中，它的关节置信度值将会很低，这时，这只AI将不得不放弃任务，要求用户纠正预测，或者宣布动画「做不了」。

用AI制作更复杂的动画

AI已经成为富有「创造力」的强大工具，能够赋予艺术家力量，激发新的表达形式。Meta的动画工具能鼓励人们去尝试绘画，并把他们带向更多的方向。

也许有一天，AI可以绘制出一幅复杂的图画，然后利用多个的角色相互作用以及背景中的元素，立即制作出一部详细的动画。

有了增强现实眼镜，这些动画人物甚至可以在现实世界中变得栩栩如生，与孩子们一起跳舞或交谈。

可能，AI的想象力就像人类的想象力一样，是无限的。

https://ai.facebook.com/blog/using-ai-to-bring-childrens-drawings-to-life/

本文来自微信公众号“新智元”（ID:AI_era），作者：新智元，编辑：小咸鱼好困，36氪经授权发布。

免责声明：凡注明来源本网的所有作品，均为本网合法拥有版权或有权使用的作品，欢迎转载，注明出处本网。非本网作品均来自其他媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容，请依照下方联系方式进行沟通，我们将第一时间进行处理。

0赞好资讯，需要你的鼓励

来自：新智元

0 0

参与评论

登录后参与讨论 0/1000

下一篇仿鸟无人机的威力

　　石海明李平　　在俄罗斯“军队-2019...

2019-09-27

纸片人「活」了，Meta AI新作：只需几分钟，手绘小人有了灵魂

参与评论

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

纸片人「活」了，Meta AI新作：只需几分钟，手绘小人有了灵魂

参与评论

为你推荐

智能网联汽车周报(6月第三周) | 《汽车软件升级通用技术要求》征求意见；中国牵头成立ISO车载激光雷达工作组

智能网联汽车周报(7月第一周) | 广州智能网联自动驾驶混行试点南沙首发；浙江德清颁发L4级自动驾驶卡车路测牌照

燧原科技完成C＋轮融资，大基金二期入股｜ 镁客网每周硬科技领域投融资汇总（8.6-8.12）

智能网联汽车周报(6月第一周) | 长安6月30日起关闭远程智能泊车等功能；首款前装量产全无人驾驶环卫车批量交付

智能网联汽车周报(1月第一周) | 首个自动驾驶公交车标准发布；京台高速部分路段为智能网联车测试道路

智能网联汽车周报(11月第三周) | 工信部发布十四五信息通信行业发展规划，福特车路协同系统正式落地广州

AI新基建：AIoT领域群雄逐鹿，七家标杆企业各有什么过人之处？

下一个消费电子蓝海，VR/AR市场海外玩家走到哪一步，中国大厂布局情况又如何？

虚拟偶像、虚拟主播逐渐出现在人们的视野中，未来虚拟人行业将向何发展？

“灯塔工厂”的中国路径：智造从点到面铺开

AI健身/3D试衣/AI烤肉……黑科技扎堆的AWE2021都有哪些硬货？

智能网联汽车周报(8月第一周) | 自然资源部开展汽车高精度地图应用试点；智能网联汽车测试示范区评估结果发布

智能网联汽车周报(1月第三周) | 北京建设2022年高级别自动驾驶示范区3.0；上海将制定智能网联汽车终端发展计划

安防智能化升级的一大助力：端边云，有啥不一样？

Nvidia英伟达的AI智能汽车信仰

看三大巨头如何逐鹿智能安防？精细化场景需求提升AI应用范围

Web3社交的兴起，脸书和腾讯打造的社交帝国迎来了劲敌

再次创业的李一男官宣造车，已获5亿美元投资，首款车2022年上市｜ 镁客网每周硬科技领域投融资

机器人产业全面分析（七）：移动四类四技术，全球波士顿中国振华极智嘉！

亚马逊、微软、苹果、谷歌：一文读懂科技巨头的2022医疗图谱（二）

对话清华大学张亚勤：AI发展应遵循3R法则

Facebook改名换运？扎克伯格画出元宇宙10年大饼，连甩13个XR眼镜黑科技

因涉嫌违反营销政策，谷歌撤下多个手机跟踪App广告

人工智能五年内将爆发 国家与地方政策鼎力支持政策法规

全球“工业4.0”发展现状及产业链上下游分析

最前线丨微软小冰发布社交APP"小冰岛”：不是元宇宙，是虚拟版微信

GMIC2014：智能机器人大热 手游引全球化思考

3D视觉大规模进入消费电子领域，场景落地之争进入白热化阶段

经过元宇宙的“加温”，VR设备将迎来大爆发，VR/AR显示器产业链上谁将受益？

2021年度科技大事件回顾（下）| OFweek维科号精选文章

相关推荐

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

燧原科技完成C＋轮融资，大基金二期入股｜镁客网每周硬科技领域投融资汇总（8.6-8.12）

再次创业的李一男官宣造车，已获5亿美元投资，首款车2022年上市｜镁客网每周硬科技领域投融资

人工智能五年内将爆发国家与地方政策鼎力支持政策法规

GMIC2014：智能机器人大热手游引全球化思考