橙色云资讯 - 工业互联网行业信息门户

一组照片渲染出3D视频，单像素点实时渲染火了，网友：在家也能制作3A游戏了？

机器之心 2021-10-18

2209 字丨阅读本文需 14 分钟

合成逼真的虚拟环境是计算机图形学和计算机视觉中研究最多的主题之一，它们所面临是一个重要问题是 3D 形状应该如何编码和存储在内存中。用户通常在三角形网格、体素网格、隐函数和点云之间进行选择。每种表示法都有不同的优点和缺点。为了有效渲染不透明表面，通常会选择三角形网格，体素网格常用于体绘制，而隐函数可用于精确描述非线性分析表面，另一方面，点云具有易于使用的优点，因为不必考虑拓扑。

近日，来自国埃尔朗根 - 纽伦堡大学视觉计算实验室的研究者提出了一种新颖的基于点的、可微的神经渲染 pipeline，可用于场景细化和新颖的视图合成。

我们先来看下该研究的效果：

有网友表示，这是电子游戏制作人的梦想。

「这种效果是由 2D 图像生成的，输出是如此平滑，令人疯狂，给人印象非常深刻。」DeepMind 产品经理 Alexandre Moufarek 表示。

「如果你对这项研究感到困惑，不明白它为什么令人印象深刻，它实际上不是一个视频， 它是由一组照片制作而成（顺便说一下，不是平滑的照片） 。该研究发布的流畅视频是用神经技术渲染的，效果非常自然。为制作者点赞。」有网友总结道。

具体来讲，该研究的输入是点云和相机参数的初始估计，输出是由任意相机姿态合成的图像。点云渲染由使用多分辨率单像素点栅格化的可微渲染器执行。离散栅格化的空间梯度由 ghost 几何近似。渲染后，神经图像金字塔通过一个深度神经网络进行着色计算和孔填充（hole-filling）。然后，可微、基于物理的色调映射器（tonemapper）将中间输出转换为目标图像。由于 pipeline 的所有阶段都是可微的，该研究优化了所有场景参数，即相机模型、相机姿态、点位置、点颜色、环境映射、渲染网络权重、晕影、相机响应函数、每张图像曝光和每张图像白平衡。

该研究表明所提出的系统能够合成比现有方法更清晰、更一致的新视图，因为在训练期间就对初始重建进行了优化。 高效的每像素点栅格化允许研究者使用任意相机模型并实时显示超过 1 亿点的场景 。

论文地址：https://arxiv.org/pdf/2110.06635.pdf

源代码会在之后进行发布。

技术细节

该研究提出的方法在 Aliev 等人的 pipeline 上构建，并通过多种方式进行了改进。具体地，研究者添加了一个物理可微的相机模型和一个可微的色调映射器，并提供了一个更好地逼近单像素点栅格化的空间梯度的公式。

这种可微的 pipeline 不仅可以优化神经点特征，而且在训练阶段能够纠正不精确的输入。因此，该系统基于神经渲染网络的视觉损失调整相机姿态和相机模型，并结合晕影模型和每个相机的传感器响应曲线估计每个图像的曝光和白平衡值。

下图 1 为这种方法的示意图：

完整的端到端可训练神经渲染 pipeline 如下图 2 所示，其中 输入为新帧的相机参数、一个点云（每个点被分配给可学得的神经描述器）和一个环境图，输出为给定新视点的 LDR 场景图像 。由于所有步骤都是可微的，因此可以同时对场景结构、网络参数和传感器模型进行优化：

具体地，该 pipeline 的第一个步骤是可微的栅格化单元（图 2 左），通过使用相机参数将每个点映射到图像空间，进而将该点渲染为单像素大小的 splat；

神经渲染器（图 2 中）使用多分辨率神经图像来生成单个 HDR 输出图像，它包含一个具有跳跃连接的四层全卷积 UNet，其中更低像素的输入图像连接到中间特征向量；

该 pipeline 的最后一个步骤（图 2 右）是可学得的色调映射操作器，它将渲染的 HDR 图像转换为 LDR。这个色调映射器模拟了数码相机的物理镜头和传感器特性，因此最适合智能手机、DSL 相机和摄像机的 LDR 图像捕捉。

可微的单像素点渲染

如上所述，可微的栅格化单元使用单像素大小的 splat 对多分辨率的变形点云进行渲染。形式上来讲，神经图像 I 的分辨率层 l ϵ {0,1...,L−1} 的是渲染器函数Φ_l 的输出，如下公式（1）所示：

点栅格化的前向传递可以分解为三个主要步骤，分别是映射、遮挡检查和混合。下图 3 展示了使用单像素点栅格化方法渲染的两张彩色图像的示意图：

点栅格化单元的后向传递首先计算参数相关的渲染器函数（1）的偏导数，如下公式（8）所示。使用链式法则，研究者可以计算损失梯度并传递到优化器。

如下图 4 所示，研究者通过在每个方向上将 p = (u, v) 移动一个像素来计算近似值。

在下图 5 中，在混合阶段前插入一个 dropout 层，该层将点云分割为两个集。第一个集正常地混合，并生成输入图像；第二个集，研究者称之为假性触控点（ghost point），不在前向传递中使用。

通过进一步的性能分析，研究者发现即使在小的分辨率层，数百个点也可以通过单个像素的模糊深度测试。为了将这一数字降低到合理的范围，研究者采用了类似于 [72] 的随机点丢弃方法。随机丢弃的效果如下图 6 所示，其中基于渲染点的数量对每个像素进行上色。

实验展示

在实验部分，研究者首先针对前向和后向单像素点栅格化的运行时（runtime）与其他可微渲染系统进行了比较。下表 1 展示了自己的方法与 Synsin、Pulsar、使用 GL POINTS 方法的 OpenGL 默认点渲染的 GPU 帧时间的度量结果，计时时仅包含栅格化本身，不包括神经网络和色调映射器。可以看到，研究者的方法在所有指标上均优于其他方法。

研究者提出了用于可微单像素点渲染的假性梯度（ghost gradient），并表示假性梯度在场景细化过程中可以提升梯度准确性和增强稳健性。他们通过一个消融实验来确认这一说法。实验结果如下图 7 所示，图（上）展示了姿态优化前后合成图像和真值之间的像素误差。可以清楚地看到，在添加位置和旋转噪声之前，使用假性梯度可以使感知损失收敛到初始解。

新视角合成。除了场景细化外，该方法还可以在多视角立体数据集上合成新的视图。下图 8 展示了合成的两个测试帧。比较结果可以发现 Synsin、NPBG 和该研究所用方法可以很好地合成参考帧，而 Pulsar 和 NRW 的输出稍差。

该研究还在下表 II 中提供了定量评估。该表显示了所有测试图像的平均 VGG 损失、LPIPS 损失 [87] 和峰值信噪比 (PSNR)。所有方法都是通过最小化 VGG 损失来训练的。

HDR 神经渲染。出于评估目的，该研究从训练集中删除了 20 个随机选择的帧，并让系统从估计的姿势中合成它们。存储在图像元数据中的测试帧的曝光值传递给色调映射器（tone mapper）。下图 11 显示了一些测试帧，左列是真实情况，中间是合成视图，右列是每像素误差图。

优化的色调映射器 (TM) 类似于捕获过程中使用的数码相机的物理和光学特性。在推理时替换 TM 的结果如下图 12 所示：

本文来自微信公众号“机器之心”（ID:almosthuman2014），编辑：杜伟、陈萍，36氪经授权发布。

免责声明：凡注明来源本网的所有作品，均为本网合法拥有版权或有权使用的作品，欢迎转载，注明出处本网。非本网作品均来自其他媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容，请依照下方联系方式进行沟通，我们将第一时间进行处理。

0赞好资讯，需要你的鼓励

来自：机器之心

0 0

参与评论

登录后参与讨论 0/1000

下一篇关于图像处理和Python深度学习的教程：第二部分

我们将以对比度增强开始第二部分。6、对比度...

2022-07-22

一组照片渲染出3D视频，单像素点实时渲染火了，网友：在家也能制作3A游戏了？

参与评论

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

一组照片渲染出3D视频，单像素点实时渲染火了，网友：在家也能制作3A游戏了？

参与评论

为你推荐

国产CIS开始向2亿像素时代迈进，巨头垄断格局或将被打破

人脸识别技术哪家强？OPPO专利解读：多帧超分与深度学习结合提升精度

对话清华大学张亚勤：AI发展应遵循3R法则

因涉嫌违反营销政策，谷歌撤下多个手机跟踪App广告

最前线丨微软小冰发布社交APP"小冰岛”：不是元宇宙，是虚拟版微信

经过元宇宙的“加温”，VR设备将迎来大爆发，VR/AR显示器产业链上谁将受益？

2021年度科技大事件回顾（下）| OFweek维科号精选文章

手机的潜望长焦镜头不香了?盘点今年搭载潜望式长焦摄像头的手机

如何将你的照片存储1000年？哈佛大学最新研究：用这个

东芝面向工业设备推出适合缩影镜头的1500像素单色CCD线性图像传感器

这块手表大小的相机能否替大疆征服户外运动领域？

工业视觉发展对图像传感器技术的五大影响

36氪独家 | 「自然机器人Naturobot」获两轮共500万美元融资，前阿里云RPA负责人再创业

36氪首发 ｜ AMOLED驱动芯片供应商昇显微完成亿元A轮融资，元禾璞华和中芯聚源领投

5G通话占道4G，你的5G套餐性价比真的高吗？

解密vivo发展之路：从颜值至上到内外兼修

英特尔锐炫会动谁的蛋糕？

最前线丨壁仞科技首款通用GPU流片，采用台积电7nm制程

微软携手联想，未来将在3大领域更深入合作

如何在Azure DevOps中构建CI/CD管道

一文读懂扎克伯格公司更名演讲：五到十年内让元宇宙成主流

苹果暗示Apple Music将登陆PS5，索尼主机又变强了

音画体验全方位升级 小米电视『大师』65”OLED评测

的卢深视：开拓二维向三维机器视觉迭代的蓝海市场 | 创业

另类元宇宙：虚拟与现实不是融为一体，而是分道扬镳（上）

一周热点，带你速览科技资讯 | OFweek维科号精选文章

投影仪成为“肥宅”必需品！我国投影仪相关企业达1.2万家，深圳最多

戴上这副手套，我们就能「摸到」元宇宙

安卓机内卷出了挖孔、水滴和真全面屏，iPhone为什么还要保留刘海屏？

iphone 13降价，苹果在下一盘怎么样的大棋

相关推荐

协同+研发

400-800-1557

我是需求方

我是服务商

交易保障

帮助中心

工程社区

36氪首发｜ AMOLED驱动芯片供应商昇显微完成亿元A轮融资，元禾璞华和中芯聚源领投

音画体验全方位升级小米电视『大师』65”OLED评测