个基元的渲染不透明度是由它们在图像平面上的投影2D高斯和计算得出的:
然后,与NeRF类似,我们可以用到相机中心的距离来表示像素级深度:
3D高斯通过梯度下降在颜色监督下优化所有高斯的参数。...从这个角度来看,文章额外冻结了高斯中心(表示为)以避免中心移动造成的负面影响,并提出了软深度正则化来调整不透明度:
通过同时使用硬深度正则化和软深度正则化,文章约束最近的高斯保持在合适的位置并具有较高的不透明度...遵循之前工作使用的设置,对DTU和LLFF数据集使用相同的分割,在3个视图上训练模型,并在另一组图像上进行测试。为了消除背景噪声,专注于目标对象,文章在DTU评估时应用了与之前工作相同的对象掩码。...对于Blender,遵循DietNeRF和FreeNeRF的方式,使用相同的个视图进行训练,并在个未见图像上进行测试。与基线保持一致,我们对LLFF、DTU和Blender应用了倍、倍和倍的下采样率。...神经渲染器由一个具有个级别、分辨率范围为到、最大为的哈希编码器和一个层MLP(隐藏维度为)组成。文章使用DPT来预测所有输入视图的单目深度图。