首页
学习
活动
专区
圈层
工具
发布

本科生新算法打败NeRF,不用神经网络照片也能动起来,提速100倍|开源

我们从图(b)上可以看到,射线上的点有了颜色,每点的颜色c = (r, g, b)和密度(σ)就是输出向量。 接着NeRF使用体积渲染技术将得到的颜色与密度进行3D渲染。...体积渲染方程介绍过了,那么不需要神经网络的Plenoxels是如何表示图片的呢? Plenoxels首先重建了一个稀疏的体素表格,每个被占用的体素都带有不透明度和球谐系数。...我们的颜色信息就存储在这些球谐系数中,每个颜色通道需要9个系数表示,一共有三个颜色,那么每个体素就需要27个球谐系数来表示它的颜色。...相机射线经过的每个点的颜色和不透明度,就是通过其最近处的8个体素的三线性插值计算的。 接着与NeRF一样,使用体积渲染技术将得到的颜色与不透明度进行3D渲染。...Plenoxels通过对渲染的像素的平均平方误差 (MSE)进行最小化,来优化体素的不透明度和球谐系数,并且使用TV正则化帮助消除噪声。 我们可以看出,是否使用TV正则化的效果区别还是很大的!

1.7K30

最新综述:深度学习图像三维重建最新方法及未来趋势

其核心网络由3个卷积层(每个卷积层使用3D卷积滤波器)和3个全连接层组成。这种标准的普通架构已经被用于三维形状分类和检索,并用于从以体素网格表示的深度图中进行三维重建。...在这种表示中,物体的体素被设为1,没有物体占用的体素设为0。 概率占用栅格(Probabilistic occupancy grid)。在概率占用栅格中的每个体素编码了它属于物体的概率。...不用学习如何重建体积栅格,取而代之的是设计一个由全连接层构成的解码器去从隐层表示估计参数,恢复出完整的三维模型。可参考文献[12]。...然而不管是手动还是用传统三维重建算法来获取三维数据的真值都比较困难。因此最近一些算法尝试通过其他监督信号例如一致性通过列表最小化三维监督程度。...事实上,虽然获取RGB图像很容易,但获取其相应的真实3D数据却相当具有挑战性。因此,在训练过程中,与那些需要真实三维信息的算法相比,通常更倾向于需要较少或不需要三维监督的技术。

8.5K21
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    学界 | UC伯克利大学AI实验室用一张单色图像生成高质量3D几何结构

    伯克利人工智能研究中心的Christian Häne等人近日发表一篇论文「Hierarchical Surface Prediction for 3D Object Reconstruction」,论文中他们讨论如何从单张色彩图像重建出高质量的...于是问题就来了,我们人类是如何从单张图像推出物体的几何结构的呢?在人工智能这个方面,我们怎么才能教会机器掌握这个能力呢?...使用CNN来预测体素(Voxel Prediction) 最近Choy,Girdhar等人发表了他们关于3D重建的论文,在他们的工作中他们的“输出”是一个3D体积空间,这个3D体积被细分成体积元素(称为体素...,voxel),每个体素会有一个分配(被占据或自由空间),而物体形状的预测则表示为由体素组成的3D占据体积。...然后,将该低维表示解码成3D占用体积。其主要思想是通过预测低分辨率体素开始解码。关键之处在于,不同于标准的方法将体素分为占据/自由空间,HSP会将体素分为三类:自由空间、占据空间和边界。

    1.2K60

    解决3D重建难题,伯克利大学根据单张平面彩图重建高精度3D结构

    3D重建有许多应用,例如电影制作、视频游戏的内容制作、虚拟现实和增强现实、3D打印,等等。这篇文章探讨如何从单一的彩色图像重建高质量的3D几何图形,如下图所示: ?...在计算机视觉中,形状不是任意的这一事实允许我们将一个对象类或多个对象类的所有可能形状描述为一个低维的形状空间(low dimensional shape space),这是从大量示例形状获取的。...ECCV 2016]利用卷积神经网络(CNN)将物体的形状预测为一个3D体积。作为输出的3D体积被细分为体积元素,称为体素(voxel),每个体素被确定为被占用或空着(即,分别属于物体的内部或外部)。...网络被端到端地训练,并且由已知的真实占用体积进行监督,这些占用是从合成CAD模型数据集中获取的。使用这种3D表示和CNN,可以学习能够适用各种对象类的模型。 分层进行表面预测 ?...这些基线以相同的低分辨率32³进行预测,但训练数据的生成方式不同。LR hard 基线使用体素的二进制分配。如果相应的高分辨率体素中的至少一个被占用,则所有体素被标记为被占用。

    1.1K60

    3D重建算法综述

    3 基于消费级RGB-D相机 相机可以基于主动式、被动式不同原理,优点在于基于这些设备的算法更具备实用性。...因而,依据处理的数据形式不同我们将研究简要分为三部分:1)基于体素;2)基于点云;3)基于网格。而基于深度图的三维重建算法暂时还没有,因为它更多的是用来在2D图像中可视化具体的三维信息而非处理数据。...(1)基于体素 体素,作为最简单的形式,通过将2D卷积扩展到3D进行最简单的三维重建: Depth Map Prediction from a Single Image using a Multi-Scale...3D-R2N2模型使用Encoder-3DLSTM-Decoder的网络结构建立2D图形到3D体素模型的映射,完成了基于体素的单视图/多视图三维重建(多视图的输入会被当做一个序列输入到LSTM中,并输出多个结果...但这种基于体素的方法存在一个问题,提升精度即需要提升分辨率,而分辨率的增加将大幅增加计算耗时(3D卷积,立次方的计算量)。

    1.7K10

    SurroundOcc:用于自动驾驶的多摄像头3D占用网格预测

    通过对这些查询点进行投影,可以在对应的视图中采样 2D 特征,并使用可变形注意力机制对它们进行加权聚合。最终,使用 3D 卷积来交互相邻的 3D 体素特征,从而提高了三维场景重建的准确性。 图3....随后,我们使用Poisson Reconstruction来使点密度增加,并对生成的网格进行体素化,以获得密集的3D占用情况。最后,我们使用最近邻(NN)算法为密集体素分配语义标签。...多帧点云拼接与Poisson 重建 本文提出了一种可以将静态场景和可移动物体分别拼接,然后在体素化之前将它们合并成完整的场景。...首先对具有语义信息的点云进行体素化得到稀疏的占据标签,然后使用 NN 算法搜索每个体素最近的稀疏体素,并将其语义标签分配给该体素。 图5....不同占用标签的比较,与单帧LiDAR点和从多帧点转换而来的稀疏占用相比,稠密的体素能够提供更真实的占用网格标签。 实验 如表1所示,该方法实现了最先进的性能,还在图6和图7中展示了一些定性结果。

    1.6K20

    基于图像的三维物体重建:在深度学习时代的最新技术和趋势综述之训练

    1利用其他线索 前面几节讨论了直接从二维观测重建三维对象的方法。本节展示了如何使用附加提示,如中间表示和时间相关性来促进三维重建。...然后将它们串联并馈送到另一个编码器解码器中,该解码器回归完整的3D体积网格和一组完全连接的层,后者回归相机姿势,整个网络都是端到端训练的。...在运行时,通过从N(0,I)中采样不同的随机向量r,可以从给定的输入生成各种似乎合理的重建。 2.1.2二维监督训练 即使是在小规模的训练中,获取用于监督的三维真实数据也是一个昂贵而繁琐的过程。...然而,为了在没有梯度近似的情况下实现端到端的训练,投影算子应该是可微的。Gadelha[4]引入了一个可微投影算子P,定义为 ? 其中V是3D体素网格,这个运算符汇总沿每条视线的体素占用值。...然后将pose code用作2D投影模块的输入,该模块将估计的3D体积渲染到输入的视图上。有些方法只估计了相机的姿态,与同时进行重建的技术不同,这些方法只使用姿态注释进行训练。

    1.5K30

    RoadBEV:鸟瞰视图下的路面重建

    其中,RoadBEV-mono直接根据从图像视角查询的体素特征来拟合高程值,而RoadBEV-stereo则通过BEV体积来高效识别左右体素特征之间的差别以呈现道路高程的模式。...04 方法本节首先介绍了关于特征体素、视图变换和高程回归的一般设置,以及所提模型的详细结构。4.1 特征体素和高程回归在BEV感知范式中,首先定义三维体素以便于从透视视图到3D视图的变换和特征投影。...为了将特征填充到体素中,我们使用外参数和内参数将体素中心投影到图像平面,并索引相应的像素特征。我们在图像视图中可视化特征体素,如图4所示。相同水平位置上堆叠的体素的像素投影连接成一条线段。...特征体素被投影到两个图像平面,并从左右视角查询特征。因此,左右体素特征 和 具有相同的形状 。在立体匹配模型的架构中,通过相关操作建立了两个特征图的相似性的代价体积。...对于立体匹配,输入特征是3D的,并且视差维度是在体积构建过程中引入的。相反,我们提出的方法直接将4D体素特征作为输入,其建议维度在体积构建之前引入。

    1.1K10

    三维重建技术综述

    这种模型可以对如文物保护、游戏开发、建筑设计、临床医学等研究起到辅助的作用。 三维重建技术的重点在于如何获取目标场景或物体的深度信息。...每幅图像的存储形式是M × N的数组,M 行 N 列的图像中的每一个元素的数值代表的是图像点的灰度。这样的每个元素叫像素,像素坐标系就是以像素为单位的图像坐标系。 4....以Kinect传感器的初始位置为原点构造体积网格,网格把点云空间分割成极多的细小立方体,这种立方体叫做体素(Voxel)。...当SDF值大于零,表示该体素在表面前;当SDF小于零时,表示该体素在表面后;当SDF值越接近于零,表示该体素越贴近于场景的真实表面。...然后计算该体元中十二条棱和等值面的交点,并构造体元中的三角面片,所有的三角面片把体元分成了等值面内与等值面外两块区域。 最后连接此数据场中的所有体元的三角面片,构成等值面。

    3.3K12

    Image-based 3D Object Reconstruction: State-of-the-Art and Trends in the Deep Learning Era

    其核心网络由3个卷积层(每个卷积层使用3D卷积滤波器)和3个全连接层组成。这种标准的普通架构已经被用于三维形状分类和检索,并用于从以体素网格表示的深度图中进行三维重建。...在这种表示中,物体的体素被设为1,没有物体占用的体素设为0。 概率占用栅格(Probabilistic occupancy grid)。在概率占用栅格中的每个体素编码了它属于物体的概率。...不用学习如何重建体积栅格 VVV ,取而代之的是设计一个由全连接层构成的解码器去从隐层表示估计参数 αi\alpha_iαi​ ,恢复出完整的三维模型。可参考文献[12]。...然而不管是手动还是用传统三维重建算法来获取三维数据的真值都比较困难。因此最近一些算法尝试通过其他监督信号例如一致性通过列表最小化三维监督程度。...事实上,虽然获取RGB图像很容易,但获取其相应的真实3D数据却相当具有挑战性。因此,在训练过程中,与那些需要真实三维信息的算法相比,通常更倾向于需要较少或不需要三维监督的技术。

    2.3K40

    三维点云语义分割总览

    总体而言,密集化的体积表示天然保留了三维点云的邻域结构。其常规数据格式还允许直接应用标准3D卷积。这些因素导致了这一领域的性能稳步提高。然而,体素化步骤固有地引入了离散化伪影和信息丢失。...体积表示是稀疏的,因为非零值的数量只占很小的比例,,因此,在空间稀疏数据上应用密集卷积神经网络效率并不高。 密集的离散化表示 早期的方法通常将点云体素化为密集的网格,然后利用标准的3D卷积。...黄等人[195]首先将点云划分为一组占用体素,然后将这些中间数据馈送到全3D-CNN进行体素分割。最后,为体素内的所有点分配与体素相同的语义标签。...[200]提出了一个统一的基于点的框架,用于从点云中学习二维纹理外观、三维结构和全局上下文特征。该方法直接使用基于点的网络从稀疏采样点集中提取局部几何特征和全局上下文,而不需要进行任何体素化。...这固有地限制了这些方法的效率,最近提出的点-体素联合表示法[256]将是一个有趣的进一步研究方向。 从不平衡数据中学习仍然是点云分割中的一个具有挑战性的问题。

    3.2K41

    医学影像组学特征值(Radiomics Features)提取之Pyradiomics(一)理论篇

    ,其支持2D和3D中的特征提取,在2.0版开始,pyradiomics还实现了基于voxel-based体素的提取,但提取需要时间较长,输出为由参数映射的SimpleITK图像,而不是针对每个特征的float...字典中的每个键值对代表一个启用的特征类,其中特征类名称为键,而启用的特征名称列表为值。如果值为None或空列表,则启用该特征类中的所有特征。...GetTotalEnergyFeatureValue():总能量,是以体素的体积(以立方毫米为单位)为尺度的能量特征值。 ?...getVoxelVolumeFeatureValue():体素体积,由体素的个数乘以一个体素的体积得到。 GetSurfaceAreaFeatureValue():表面积。...:从图像中删除的离群值 2)Resampling the image图像重采样 ResamplePixelSpacing:设置重采样时的体素大小。

    25.5K57

    干货 | 平面图像的感知已经基本解决了,那三维数据的呢?

    体素网格(Voxel grids)源自于点云。「体素」就像 3D 空间中的像素,体素网格则可被看成是量化的、大小固定的点云。...多边形网格虽然最初因计算机图形而创建,它对于 3D 视觉,也非常有用。从点云中获取多边形网格的方法有多种,其中包括 KaZhand 这类泊松曲面重建方法。 d....由于体素网格与图像非常相似,它们采用的实际跨步卷积和池化操作,只是在 2D 像素上执行的这些操作对 3D 体素的细微适配。...卷积操作使用 d×d×d×c 核而非应用于 2D CNNs 中的 d×d×c 核,而池化操作则考虑非重叠的 3D 体素块,而不是 2D 像素块。...T-Net 由可学习的参数组成,这些参数使点云分割能够将输入点云转换为一个固定的、规范的空间,从而确保即使对于最细微的变化,整个网络也是稳定的。 ?

    1K51

    niftynet Demo分析 -- brain_parcellation

    brain_parcellation 论文详细介绍 通过从脑部MR图像中分割155个神经结构来验证该网络学习3D表示的效率 目标:设计一个高分辨率和紧凑的网络架构来分割体积图像中的精细结构 特点:...本论文提出了一种新的3D架构,它包含了整个层的高空间分辨率特征图,并且可以在广泛的接受领域中进行训练 验证:通过从T1加权MR图像中自动进行脑区分割成155个结构的任务来验证网络,验证了采用蒙特卡罗方法对实验中存在漏失的网络进行采样来对体素水平不确定度估计的可行性...结果:经过训练的网络实现了通用体积图像表示的第一步,为其他体积图像分割任务的迁移学习提供了一个初始模型 3D卷积网络的要素 卷积和扩张卷积 为了使用较小的参数,为所有的卷积选用小的3D卷积核,只拥有...前7层使用3 * 3 * 3的体素卷积,这些层用来捕获如边缘、拐角之类的低级图像特征。在随后的卷积层中,内核被放大两到四倍,这些具有扩展内核的深层编码中、高级图像特征。...由参数名从应用程序工厂中得到应用程序 使用参数初始化应用程序 重置数据分割器的所有字段,清空缓存的文件列表 设置数据的参数 初始化数据加载器 加载事件处理器实例 设置迭代器 *3

    67120

    常用的3种点云数据表示

    因此,本节介绍点云数据的表示形式。目前,常用的表示方式主要有 3 种:点表示形式、体素表示形式、图表示形式。 01 点表示形式 点云是指获取物体表面每个采样点的空间坐标形成的点的集合。...,从而保证全部的点都包含特征信息.最后基于这些点得到候选框。...▲ 图 1 点云数据示意图 02 体素表示形式 体素是体积元素的简称,是数字数据在三维空间分割上的最小单位,类似于二维空间的最小单位像素,数据表示形式如图2所示。...体素表示形式将点云转化为规则的体素形式,对点云进行处理。点云体素化首先需要设置参数,包括体素大小及每个体素可容纳的点云数量。...然后依次根据坐标得到每点在体素的索引,并根据索引判断此体素种类是否已达到设置的最大值。若达到,丢弃此点;未达到,保留。最后提取体素特征,进行回归预测。

    2.6K30

    3D 深度学习中基于体素和基于点云的方法哪种更优?

    这些是特征提取器,它们的目的只是直接从点云学习特征,不会用它进行 3D 对象检测或3D 跟踪,但可以将它们包含在 3D 对象检测器中。...获取体素点并应用 3D 卷积 所以,这是第二种方法,它很棒,因为当空间被体素化时,你可以使用 3D 卷积。您甚至可以实现 3D 卷积神经网络,并且基本上将您所知道的有关图像卷积的所有内容复制到点云。...输出如下所示: 所以你现在得到了两种类型的方法: 使用“PointNets”直接从点中学习 首先使用“体素化”过程,学习使用 3D 卷积 但哪一个更好呢?...但是体素使用卷积,我们非常清楚如何将卷积堆叠在一起,如何使其高效,如何在多尺度上使用金字塔架构,如何可视化所学到的特征,等等,我们拥有令人惊叹的众所周知的方法来使用体素创建令人惊叹的架构。...基于体素的方法首先将点云转换为体素网格,然后处理这些点,这次使用 3D 卷积。体素化在混乱中创建秩序,并允许在点云上使用 3D 卷积。

    1.8K10

    ICML 2024 | 基于体素网格的药物设计

    作者的方法将分子表示为3D原子密度网格,并利用3D体素去噪网络进行学习和生成。...SBDD生成模型通常将分子表示为离散的体素网格或原子点云。基于体素的方法将原子(或电子密度)表示为连续的密度,并将分子表示为3D空间的体素网格离散化(体素是体积的离散单位)。...基于点云的方法将原子视为3D欧几里得空间中的点,并依赖于图神经网络(GNN)架构。...模型通过最小化所有体素化配体的均方误差进行训练。 图 3 作者通过条件walk-jump采样(cWJS)从体素化的蛋白质口袋条件下采样体素化配体。图3展示了口袋条件下的行走跳跃采样链的过程。...首先,作者对一个给定的蛋白质结合口袋进行体素化。然后,作者用Langevin MCMC对噪声体素化配体(给定口袋)进行采样,并用估计器估计干净样本。最后,作者从体素网格中恢复原子坐标。

    48310

    深度学习新应用:在PyTorch中用单个2D图像创建3D模型

    栅格化形式(体素网格):可以直接应用 CNN ? 每个蓝色的盒子表示单个体素,大部分体素都是空的。 体素是体积像素(volumetric pixel)的简称,它直接将空间网格像素拓展为体积网格体素。...每一个体素的局部性共同定义了该体积数据独一无二的结构,因此 ConvNet 的局部性假设在立体形式中仍然成立。 ? 体素表征密度低 但这种表征既稀疏又浪费。有用体素的密度会随着分辨率的增加而降低。...椅子的点云表征 多边形网格:是三维空间中定义对象表面的顶点、边和面的集合。它可以在相当紧凑的表征中捕获粒度细节。 点云:3D 坐标(x,y,z)中点的集合,这些点一起形成了与 3D 对象形状类似的云。...将预测得到的 2D 投影融合到原生 3D 点云数据中。这是有可能实现的,因为这些预测值的视角是固定的,而且是已知的。 输入:预先设定视角的 2D 投影 输出:点云。 伪渲染 ?...最终结果:从单个 RGB 图像→3D 点云 ? 有了详细的点云表征,就可以用 MeshLab 将单个 RGB 图像转换为其它表征,比如与 3D 打印机兼容的体素或多边形网格。

    2.3K41

    利用消失点的单目3D语义占用预测:VPOcc

    (BFVF)模块,融合原始和缩放体素特征体积以创建信息平衡的特征体积。...这些策略使我们能够构建平衡的体素特征体,从而精确估计场景中包括远处目标在内的全深度范围内的三维语义体素。...设计了一个全新的 VPCA 模块,该模块在考虑相机透视几何的基础上提取朝向 VP 的采样点,从而聚合适用于三维体素查询的二维特征。...VP引导的跨注意力 为了解决传统跨注意力方法未充分考虑透视几何的问题,VPCA模块通过以消失点为参考的网格点采样,聚合2D图像特征至3D体素查询。...这些数据集包含带语义标签的体素网格,用于评估IoU和mIoU等指标。 B.性能比较 VPOcc在多个数据集上的性能超越了现有最新方法。

    48210

    Improving 3D Object Detection with Channel-wise Transformer

    为了应对这些挑战,许多方法对点云采用体素化或自定义离散化。 几种方法[28,15]将点云投影到鸟瞰图(BEV)表示并应用标准的2D卷积,然而,它不可避免地会牺牲某些对生成精确定位至关重要的几何细节。...然而,这些方法的缺点是涉及大量的手工设计,如邻近球的半径和网格大小。 另一类模型是基于体素的方法[33,27,39],它使用3D卷积核从相邻体素收集信息。...然而,类pointnet架构在为激光雷达数据捕获本地结构的能力仍然有限。 另一类方法旨在将非结构化点云体素化为常规的2D/3D网格,传统CNN可以很容易地应用于其上。...第二,[33]引入了三维稀疏卷积,实现高效的三维体素处理。 这些基于体素的方法仍然专注于体积的细分,而不是自适应建模局部几何结构。 此外,各种基于点体素的多尺度特征聚合方法也被提出。...SA-SSD在3D体素CNN的基础上提出了一个辅助网络。 PV-RCNN及其变体VoxelRCNN采用3D体素CNN作为RPN生成高质量的提案,然后利用PointNet聚合网格周围的体素特征。

    1.4K21
    领券