人工智能
NeRF:编辑神经辐射场内容的挑战
今年早些时候,NVIDIA 推出了先进的神经辐射场 (Neural Radiance Fields)(神经RF)特别是研究 即时NeRF,显然能够在短短几秒钟内生成可探索的神经场景——通过一种技术,当它 出现 2020 年,经常需要几个小时甚至几天的时间来训练。
虽然这种插值会产生静态场景,但 NeRF 也能够 描绘运动,以及基本的“复制和粘贴”编辑,其中单个 NeRF 可以整理成 复合场景 or 插入 进入现有场景。
然而,如果你想干预计算出的 NeRF 并实际改变其中正在发生的事情(就像你可以改变传统 CGI 场景中的元素一样),行业兴趣的快速发展已经出现 非常 少数 迄今为止,还没有一个能够与 CGI 工作流程的功能相匹配。
尽管几何估计对于创建 NeRF 场景至关重要,但最终结果由相当“锁定”的值组成。 虽然有 一些进展 NeRF 场景中的实际对象不是可以编辑和使用的参数化网格,而是更类似于脆弱且冻结的点云。
在这种情况下,NeRF 中渲染的人本质上是一座雕像(或视频 NeRF 中的一系列雕像); 它们投射在自身和其他物体上的阴影是纹理,而不是基于光源的灵活计算; NeRF 内容的可编辑性仅限于拍摄生成 NeRF 的稀疏源照片的摄影师所做的选择。 从任何创意意义上来说,阴影和姿势等参数仍然是不可编辑的。
NeRF 编辑
中国和英国之间的一项新的学术研究合作解决了这一挑战 NeRF 编辑,其中代理 CGI 样式的网格从 NeRF 中提取,由用户随意变形,并将变形传递回 NeRF 的神经计算:
该方法适应 新星 2021 年美国/中国重建技术,提取 有符号距离函数 (SDF,一种更古老的体积重建方法)能够学习 NeRF 内部表示的几何形状。
这个 SDF 对象成为用户的雕刻基础,具有由受人尊敬的 As-Rigid-As-Possible 提供的扭曲和成型功能(澳大利亚亚太地区协会) 技术。
应用变形后,需要将这些信息从矢量转换为 NeRF 原生的 RGB/像素级别,这是一个稍长的过程。
用户变形的网格的三角形顶点首先转换为四面体网格,这在用户网格周围形成皮肤。 从该附加网格中提取空间离散变形场,最终获得 NeRF 友好的连续变形场,该连续变形场可以传回神经辐射环境,反映用户的更改和编辑,并直接影响目标中的解释射线内尔夫。
该文件指出:
将表面变形传递到四面体网格后,我们可以得到“有效空间”的离散变形场。 我们现在利用这些离散变换来弯曲投射光线。 为了生成变形辐射场的图像,我们将光线投射到包含变形四面体网格的空间。
纸 标题为 NeRF-Editing:神经辐射场的几何编辑,来自中国三所大学和机构的研究人员,以及卡迪夫大学计算机科学与信息学学院的一名研究人员,以及另外两名来自阿里巴巴集团的研究人员。
限制
如前所述,变换后的几何体不会“更新”NeRF 中尚未编辑的任何相关方面,也不会反映变形元素的次要后果,例如阴影。 研究人员提供了一个示例,其中 NeRF 中人物的下阴影保持不变,即使变形会改变照明:
实验
作者观察到,目前还没有直接干预 NeRF 几何的类似方法。 因此,为研究进行的实验更具探索性而非比较性。
研究人员在许多公共数据集上演示了 NeRF 编辑,包括 Mixamo 中的角色,以及原始 NeRF 中现在标志性的乐高推土机和椅子 履行。 他们还对从真实捕获的马雕像进行了实验 FVS数据集,以及他们自己的原始捕获。
对于未来的工作,作者打算在即时 (JIT) 编译的机器学习框架 Jittor 中开发他们的系统。
首次发布于 16 年 2022 月 XNUMX 日。