Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >一种高效的基于邻域空间聚合的点云语义分割不确定性估计方法(ICRA2021)

一种高效的基于邻域空间聚合的点云语义分割不确定性估计方法(ICRA2021)

作者头像
计算机视觉
发布于 2021-11-19 06:03:34
发布于 2021-11-19 06:03:34
6440
举报

Neighborhood Spatial Aggregation based Efficient Uncertainty Estimation for Point Cloud Semantic Segmentation (2021-ICRA)

代码地址:https://github.com/chaoqi7/Uncertainty_Estimation_PCSS.

点云语义分割(point cloud semantic segmentation,PCSS)的不确定性估计是指如何量化点的预测标签的置信度,这对于决策任务至关重要,例如机器人抓取、路径规划和自动驾驶。本文作者提出了一种基于邻域空间聚合的方法,NSA-MC dropout,可以高效的实现点云语义分割的不确定性估计。与传统的基于重复推理的不确定性估计方法 MC dropout不同,作者提出的 NSA-MC dropout 通过一次性推理实现了不确定性估计。具体而言,作者设计了一种空间相关的方法,通过仅执行一次随机前向传递模型来对模型进行多次采样,并且它近似于 MC dropout 中基于重复推理的采样过程。此外,称为 NSA 的邻域空间聚合模块聚合每个点的邻域的概率输出结果,并与空间相关采样一起建立输出分布。最后,作者提出了一个不确定性感知框架 NSAMC dropout,以实现有效捕获预测结果的不确定性。实验结果表明,作者的方法获得了与 MC dropout 相当的性能。更重要的是,NSA-MC dropout 对语义推理的效率几乎没有影响,比MC dropout快得多,并且推理时间与采样时间没有建立耦合关系。

本文主要贡献总结如下:

1) 在没有重复推断的情况下为每个点建立了输出分布。高效的分布建立依赖于一种新颖的空间相关采样方法,以空间换取时间,解决了传统MC dropout中采样耗时的问题。

2) 提出的 NSA-MC dropout 可以很容易地集成到现有的 PCSS 框架中进行不确定性感知推理,并且它通过仅执行一次随机前向传递模型来实现有效的不确定性估计。

图1 (a) 神经网络中的不确定性估计。网络中的所有权重都由可能值的后验分布表示,而不是由单个固定值推导。同样,每个点的输出都由分布表示。(b) 具有时间依赖性采样的 MC dropout。MC dropout 通过重复推理使用 dropout 对权重的后验分布进行采样。这种采样方法需要将模型随机转发 T 次,导致 T 倍减速。(c) NSA-MC dropout 与空间依赖采样。与 MC-dropout 不同,作者的方法通过执行一次随机前向对模型进行多次采样。不同点的语义推断是基于不同架构的网络。NSA 聚合概率信息并且为每个点生成输出分布。

点云语义分割的不确定性估计有助于我们了解可以信任点的预测标签的程度。这个能力对于决策应用任务来讲至关重要,例如机器人抓取、路径规划和自动驾驶。然而,不确定性估计依赖于输出分布的建立,需要大量的计算时间。大量时间消耗问题对于基于大规模点云的语义分割任务的不确定性估计来说非常具有挑战,特别是对于那些需要有高效率要求的任务。因此,作者探索了一种实现 PCSS 有效不确定性估计的方法。

基于神经网络 (Neural network,NN) 的 PCSS 方法广泛用于实际工程应用。虽然目前对 PCSS 不确定性估计的研究很少,但一般的神经网络不确定性估计方法已被广泛关注。NN 中的不确定性估计一般是通过推断分布从而为每个目标生成输出分布网络权重,如图1(a)所示。以前的方法使用高斯分布来逼近真实的后验分布,这导致模型参数和计算成本大幅增加。最近提出的Monte Carlo dropout(MC dropout)方法是一种是高斯过程的近似。由于其简单性,即只需在推理时将其集成到当前方法中,目前广受欢迎。MC dropout 可用于 PCSS 的不确定性估计,如图 1(b)所示。然而,传统的MC dropout面临着严重的耗时采样过程,难以用于具有高效率要求的PCSS。这促使相关学者相继探索 MC dropout 的改进版本,并基于快速采样方法实现 PCSS 的有效不确定性估计。

与图像等二维网格数据不同,点云是一组用于描述物体表面和结构的点。基于几何连续性的特性,可以很好地利用空间信息。通过对一个点的重复推理建立的高斯过程可以被通过对该点及其邻域的一次性推理建立的近似过程代替。这种近似高斯过程依赖于一种新颖的空间相关采样方法,它消除了对重复推理的依赖。

具体来说,作者设计了 NSA 用来估计基于空间相关采样方法的点预测结果的不确定性,如图 1(c)所示。NSA 将邻域的推理结果汇总到一个点,生成该点的概率分布,用于不确定性估计。空间相关采样方法保证了邻域点语义推断的模型随机性,并且整个过程只需要前传一次模型。

另外,作者结合NSA,扩展了基于PointNet(++)的点云语义分割框架来估计不确定性。探索了框架的特性,并将基于 NSA 的 MC dropout(NSAMC dropout)嵌入其中。NSA-MC dropout 在语义推理过程中实现空间相关采样,并快速估计点云分割结果的不确定性。

方法核心:

为了实现对 PCSS 的有效不确定性估计,作者提出了一种基于快速采样的不确定性感知框架。首先,设计了一个名为 NSA 的模块,使用新颖的空间相关采样为每个点生成输出分布。其次,作者将 NSA-MC dropout 嵌入到基于 PointNet (++) 的 PCSS 框架中,以进行有效的不确定性估计。

1、邻域空间聚合

基于采样的不确定性估计。以给定数据集为条件的网络权重的真实后验分布通常是通过使用权重 q(w)上的高斯分布的变分推理来估计的。此外,MC dropout可以用来模拟高斯过程,这些近似推论可以表示为:

其中 T 是总采样时间, y* 是 x* 的相应预测标签。w^ 是通过在权重上放置伯努利分布来生成的,这是 dropout 处理过程。

表 1 中给出了几个不同的可用于捕获不确定性概念的获取函数:预测熵 (PE)、贝叶斯主动学习分歧 (BALD) 和平均标准偏差(平均 STD)。

表1 基于采样的不确定性估计采集函数

NSA 与空间相关的采样。在传统的 MC dropout 中,T 次采样相当于对模型进行 T 次随机前向传递,需要花费大量时间。作者探索了一种基于点云的结构特征来解决采样耗时问题的方法。

点云用于描述物体的表面和结构。邻域 U 中相邻点的几何特征相似,相邻点的预测结果也很接近。因此为了在方程中找到更为精确的拟合表面函数。作者在每个点上预测一个逐点权重。然后,所有点通过主成分分析(PCA)转换到切线空间,并通过加权最小二乘(WLS)拟合问题求解表面系数:

x*及其 T-1 个相邻点 x*t 的平均输出近似于 T 次采样的 MC dropout结果。

这个过程就称为邻域空间聚合,它与空间相关的采样一起起作用以获得输出分布。如图 1(c) 所示,用于不同点语义推断的网络呈现随机架构。每个点聚合邻域推理的结果使用 NSA 生成输出分布。

2、不确定性感知 PCSS

作者探索了向 PCSS 框架添加主动 dropout 层的适当方案,以实现空间相关采样和不确定性估计。

不确定性的backbone。考虑到 PointNet 和 PointNet++ 在 PCSS 中的巨大成功,作者选择其作为backbone方法。PointNet(++)是一个encoder-decoder网络,如图2所示。编码部分提取全局特征或局部特征,解码部分将特征连接到点云中的每个点进行进一步分类。

图2 NSA-MC dropout 使用 PointNet(++) 作为backbone方法。在编码阶段,生成不同尺度的特征向量。在解码阶段,将生成的特征连接到点以进行进一步分类,并在 MLP 之后插入 dropout 以实现采样。NSA 通过总结邻域内点的推理结果实现有效地估计不确定性。

backbone中的 NSA-MC dropout。在先前的工作中已经讨论了在 NN 中应用 dropout 进行不确定性估计。一个完整的 BNN 应该在每个具有可学习参数的层之后使用 dropout 进行训练和测试。有学者发现这是一个强大的正则化器,导致训练过程中收敛速度缓慢。此外,许多仅在部分层之后插入dropout 的变体可以体显示出与完全 BNN 相似的不确定性输出。

作者的目标是找到一种在 PointNet(++) 中应用 dropout 层的合适方案,它不仅可以多次有效地对模型进行采样,而且对模型训练的影响很小。为此,应考虑以下问题。

一方面,如图 2 所示,多层感知器(MLP)包含几个权重共享的全连接层(FC), 而每个FC都对应着一个点。每个点在解码阶段与特征向量相连接,而FC则用于更新相应点的状态。通过随机丢弃MLP中的单元,MLP中的FC代表不同的结构。MLP代表不同的架构,这导致了用于不同点的语义推理的网络架构的随机性。通过NSA的功能作用,从而实现在一次语义推理中实现多次采样。

另一方面,PointNet(++) 将相同的编码信息连接到特定空间域中的点。假设我们在编码阶段加入了dropout层,空间域中不同点的编码信息仍然相同,这对用于采样的架构随机性贡献不大。此外,它会导致点云语义建模能力的损失,这将在实验中得到证明。

总之,dropout 层仅用于解码中的 MLP。

3、实验环节

A.数据集

作者选择数据集 S3DIS 来评估 NSA-MC dropout 的性能。数据集中的每个点云都是一个房间,Area-5中的点云作为测试数据,其他的作为训练数据。考虑到PointNet(++)很难直接处理单个房间的点云。因此,每个点云都被分成1mX1m 的块用于训练和测试。

B.实验细节

模型训练。PointNet(++) 使用反向传播和自适应矩估计 (Adam) 求解器进行端到端训练,学习率为 0.001。训练批次大小设置为 16。所有实验均在单个 GeForce GTX 1080 Ti 和 Intel(R) Core(TM) i7-6850K 3.60GHz 6 核 CPU 上进行。

不确定性估计。测试时保持 dropouts 打开以实现不确定性估计的采样,并且使用 KD-Tree 搜索算法在邻域空间聚合中并行搜索最近邻。

C.评价标准

NSA-MC dropout 是 MC dropout 的一种变体。因此,作者引入以下指标来全面比较所提方法与 MC dropout 的性能。

1.语义分割评价指标

oAcc, mAcc, 和 mIoU

2.不确定性估计评价指标

1)Precision-Recall curve (PR-curve)

2)Ranking IoU.

图3 误差排序序列是通过按预测误差的递增顺序对体素进行排序来创建的。不确定性排序序列是通过按平均不确定性的递增顺序对体素排序来创建的。

3.有效性评价指标

推理时间

D.实验对比

语义分割的定量分析。表2展示了 PointNet(++) 与 NSA-MC dropout 和 PointNet(++) 与 MC dropout 之间语义分割的比较。

表2 语义分割对比结果

不确定性估计的点级定量分析。这里作者使用 PR 曲线来量化不确定性和预测精度之间的相关性,如图 4 所示。通过PR曲线可以看出,一方面,随着不确定性的增加,改进的方法和对比方法生成的曲线都有明显的下降趋势。另一方面,无论使用哪种采集函数,得到的两条曲线都显示出高度的一致性。从而证明NSA-MC dropout 实现了基于空间相关采样的点的准确概率输出。

图4 基于不同采集函数和不同backbone方法的 PR 曲线。左列数字是使用PointNet作为backbon的结果,右列数字是使用PointNet++作为backbon的结果。oAcc 用作精度。PE、BALD 和平均 STD 用作采集函数。

不确定性估计的体素级定量分析。整个 S3DIS Area 5 被划分为 103 个体素,使用体素级度量 Ranking IoU 的评估结果如表 3 所示。通过改进方法获得的结果与通过 MC dropout 获得的结果相当。

表3 使用Ranking IOU 的评估结果

有效性分析。所提方法在推理时间上的分析如表4所示。可以看出采样计算的效率非常高。

表4 推理的平均计算时间

质量分析。图 5 显示了 S3DIS Area 5 中几个房间的语义分割、预测误差和不确定性图的可视化。为了进一步探索本文方法的准确性和不确定性之间的关系,作者计算了每个类别的测试数据集的平均不确定性和准确性并绘制图 6 中的关系。

图5 S3DIS Area 5上的可视化结果,选择PE作为获取函数,左边两列是使用PointNet作为backbone的可视化结果,而右边两列使用PointNet++作为backbone的可视化结果。

图6 测试数据集中的类准确率和平均不确定性之间的关系。左图使用PointNet作为backbone,右图使用PointNet++作为backbone。

4、总结

本文最大的优势在于推理时间显着减少,而不确定性估计性能却没有损失。因此这项工作可以促进不确定性估计在现实世界 PCSS 任务中的应用。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-11-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 计算机视觉工坊 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
CVPR2021 | PAConv:一种位置自适应卷积,点云分类、分割任务表现SOTA
由香港大学CVMI Lab和牛津大学合作提出了一种点云上具有动态内核组装的位置自适应卷积——PAConv: Position Adaptive Convolution with Dynamic Kernel Assembling on Point Clouds,论文已被CVPR2021接收。
计算机视觉
2021/04/26
1.2K0
CVPR2021 | PAConv:一种位置自适应卷积,点云分类、分割任务表现SOTA
可以估计不确定性的神经网络:SDE-Net
来源丨https://zhuanlan.zhihu.com/p/234834189
计算机视觉
2020/11/11
1.7K0
可以估计不确定性的神经网络:SDE-Net
JSNet:3D点云的联合实例和语义分割
在本文中,提出了一种新颖的联合实例和语义分割方法,称为JSNet,以同时解决3D点云的实例和语义分割问题。首先,建立有效的骨干网络,以从原始点云数据中提取鲁棒的特征。其次,为了获得更多的判别特征,提出了一种点云特征融合模块来融合骨干网的不同层特征。此外,开发了联合实例语义分割模块以将语义特征转换为实例嵌入空间,然后将转换后的特征进一步与实例特征融合以促进实例分割。同时,该模块还将实例特征聚合到语义特征空间中,以促进语义分割。最后,通过对实例嵌入应用简单的均值漂移聚类来生成实例预测。最后在大型3D室内点云数据集S3DIS和零件数据集ShapeNet上评估了该JSNet网络,并将其与现有方法进行了比较。实验结果表明,该方法在3D实例分割中的性能优于最新方法,在3D语义预测方面的有重大改进同时有利于零件分割。
点云PCL博主
2020/03/31
2.4K0
JSNet:3D点云的联合实例和语义分割
3D点云 | 基于深度学习处理点云数据入门经典:PointNet、PointNet++
不同于图像数据在计算机中的表示通常编码了像素点之间的空间关系,点云数据由无序的数据点构成一个集合来表示。因此,在使用图像识别任务的深度学习模型处理点云数据之前,需要对点云数据进行一些处理。目前采用的方式主要有两种:
AI算法修炼营
2020/06/09
10.1K0
基于超点图的大规模点云分割
本期介绍一篇基于大规模点云的语义分割相关论文《Large-scale Point Cloud Semantic Segmentation with Superpoint Graphs》
点云PCL博主
2019/12/03
3.2K0
基于超点图的大规模点云分割
CVPR 2020 | RandLA-Net:大场景三维点云语义分割新框架(已开源)
本文要介绍的是 CVPR 2020上被录用的文章《RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds》
AI科技评论
2020/03/05
4.6K0
CVPR 2020 | RandLA-Net:大场景三维点云语义分割新框架(已开源)
一种基于分层聚合的3D实例分割方法(ICCV 2021)
Hierarchical Aggregation for 3D Instance Segmentation (ICCV 2021)
3D视觉工坊
2022/03/11
1.1K0
一种基于分层聚合的3D实例分割方法(ICCV 2021)
自适应采样非局部神经网络的点云鲁棒操作
原始点云数据不可避免地从3D传感器或在重建算法中包含异常值。本文提出了一种用于鲁棒点云处理的新型端到端网络,称为 PointASNL,可以有效地处理带噪声的点云。我们方法中的关键部分是自适应采样(AS)模块。它首先从最远点采样点的周围对点的邻域加权,然后在整个点云中自适应的调整采样。AS模块不仅有益于点云的特征学习,而且缓解受异常值的影响。为了进一步捕捉邻域信息和长期依赖于采样点,我们从非局部操作的角度出发,提出了局部-非局部 (local-Nonlocal, L-NL) 模块。这种L-NL模块使学习过程对噪声不敏感。大量的实验证明了在分类和语义分割任务上,在合成数据,室内、室外数据,是否有噪声的数据,都有良好性能和鲁棒性。并且在有大量噪声的真实户外数据集SemanticKITTI上,明显优于以前的方法。代码发布在:
3D视觉工坊
2020/12/11
9860
自适应采样非局部神经网络的点云鲁棒操作
CVPR2021 | DyCo3D: 基于动态卷积的3D点云鲁棒实例分割
原文地址:CVPR2021 | DyCo3D: 基于动态卷积的3D点云鲁棒实例分割
一点人工一点智能
2023/01/19
1.5K0
CVPR2021 | DyCo3D: 基于动态卷积的3D点云鲁棒实例分割
结合局部与全局特征的点云语义分割卷积网络
点云语义分割在许多与点云相关的应用程序中具有重要作用,特别是对于机载激光点云,精确的注释可大大扩展其在各种应用中的用途。然而,受限于传感器噪声、复杂的对象结构、不完整的点和不均匀的点密度,准确而有效的语义分割仍是一项艰巨的任务。因此,提出了一种结合局部与全局特征的机载激光点云语义分割网络。
一点人工一点智能
2023/04/26
8500
结合局部与全局特征的点云语义分割卷积网络
三万字收藏 | 三维场景点云理解与重建技术
作者:龚靖渝, 楼雨京, 柳奉奇, 张志伟, 陈豪明, 张志忠, 谭鑫, 谢源, 马利庄
一点人工一点智能
2023/08/24
1.7K0
三万字收藏 | 三维场景点云理解与重建技术
麻省理工再出新作 ,不确定性感知下的物体实例分割 !
作者的目标是构建可以在包含先前未知物体的环境中运行的长期视野操作系统。对这些系统的一个关键步骤是,将RGB或RGB-d图像分割成待操作的目标候选体。这一步骤通常被称为“未知目标实例分割”(UOIS),已经出现了许多现有的深度学习模型来实现这一任务[1,2,3]。然而,这些模型的输出不可避免地不完善,因为存在模型的局限性,例如数据或计算能力的限制,或者存在图像的挑战,例如遮挡或照明,或者存在根本的歧义,例如一个玩具积木堆。在“实体化”操作环境中,有机器人可用,作者可以与场景互动,以获取额外的信息,例如推动某些目标并跟踪它们如何移动。此外,随着“提示性”分割模型的出现[4],作者也可以与模型互动,以获取额外的信息,例如从不同的提示中获取多个分割。在本文中,作者将这两种方法都用于改进分割结果:对分割模型的多次提示和对物体的主动机器人互动。特别地,作者通过对分割模型进行多次提示构建出分割的不确定性描述,并使用这个表示来指导物理交互。
AIGC 先锋科技
2024/08/27
1990
麻省理工再出新作 ,不确定性感知下的物体实例分割 !
大场景三维点云的语义分割综述
输入原始点云(x,y,z,intensity),得到每个三维点的语义类别。如图所示,不同颜色代表不同类别。
点云PCL博主
2020/01/17
4.8K0
大场景三维点云的语义分割综述
基于感知能力的点云实例分割
论文标题:Instance-Aware Embedding for Point Cloud Instance Seg
3D视觉工坊
2020/11/11
1K0
基于感知能力的点云实例分割
基于三维点云场景的语义及实例分割:RandLA-Net和3D-BoNet
公开课地址:https://www.shenlanxueyuan.com/open/course/53
深蓝学院
2020/09/09
3.5K0
基于三维点云场景的语义及实例分割:RandLA-Net和3D-BoNet
前沿丨基于深度学习的点云分割网络及点云分割数据集
众所周知,点云的有效分割是许多应用的前提,例如在三维重建领域,需要对场景内的物体首先进行分类处理,然后才能进行后期的识别和重建。传统的点云分割主要依赖聚类算法和基于随机采样一致性的分割算法,在很多技术上得到了广泛应用,但当点云规模不断增大时,传统的分割算法已经很难满足实际需要,这时就需要结合深度学习进行分割。因此,本文将重点介绍5种前沿的点云分割网络,包括PointNet/PointNet++、PCT、Cylinder以及JSNet网络,最后介绍5中常用的点云分割数据集。
计算机视觉
2022/05/24
6.3K0
前沿丨基于深度学习的点云分割网络及点云分割数据集
CVPR 2019 | 点云语义与实例分割相结合
今日导读:CVPR2019上发布了两篇语义和实例分割相结合的文章,这两篇文章有很多相似之处,因此可以放在一起来看。两篇文章目前都已开源代码。
点云乐课堂
2020/05/18
9300
NeruIPS2019 | 深圳大学提出点云语义分割框架ELGS,效果拔群(代码已开源)
标题:Exploiting Local and Global Structure for Point Cloud Semantic Segmentation with Contextual Point Representations
点云乐课堂
2020/05/18
6000
关联分割点云中的实例和语义
Xinlong Wang 1 Shu Liu 2 Xiaoyong Shen 2 Chunhua Shen 1 Jiaya Jia 2,3
点云PCL博主
2019/10/09
1.4K0
关联分割点云中的实例和语义
三维点云语义分割总览
三维点云分割既需要了解全局几何结构,又需要了解每个点的细粒度细节。根据分割粒度的不同,三维点云分割方法可以分为三类:语义分割(场景级)、实例分割(对象级)和部分分割(部分级)。
点云PCL博主
2020/09/24
2.8K0
三维点云语义分割总览
推荐阅读
相关推荐
CVPR2021 | PAConv:一种位置自适应卷积,点云分类、分割任务表现SOTA
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档