Loading [MathJax]/jax/element/mml/optable/GreekAndCoptic.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >P2C-自监督点云补全,只需用单一部分点云

P2C-自监督点云补全,只需用单一部分点云

作者头像
BBuf
发布于 2023-08-25 00:28:32
发布于 2023-08-25 00:28:32
1K0
举报
文章被收录于专栏:GiantPandaCVGiantPandaCV

ICCV2023论文精读:Self-Supervised Point Cloud Completion from Single Partial Clouds

A. 原文概要

点云补全是指根据部分点云恢复完整的点云形状。现有方法需要完整的点云或同一对象的多个部分点云来进行训练。与以前的方法形成对比,本论文提出的Partial2Complete (P2C)第一个仅需要每个对象的单个不完整点云就可以进行自监督学习的框架。具体而言,我们的框架将不完整点云分组为局部点云块作为输入,预测被遮挡的点云块,通过观察不同的局部对象学习先验信息。我们还提出了区域敏感Chamfer距离以正则化形状误匹配,不限制补全能力,并设计了法线一致性约束,鼓励恢复的形状表面连续完整。这样,P2C不再需要完整形状作为监督,而是从类别特定数据集中学习结构线索,补全部分点云。我们在人工ShapeNet数据和真实ScanNet数据上证明了我们方法的有效性,结果显示P2C产生了与完整形状训练方法可媲美的结果,并优于多视角训练的方法。

原文链接:https://arxiv.org/abs/2307.14726

B. 方案优势

本方法具有以下3个优势:

1)本方案消除了对完整样本的需求,从而减少了标注的困难和费用;

2)即使只有一个视角,也可以轻松地从真实世界中收集局部对象,大大扩展了训练数据的范围;

3)利用未知的不完整性假设,可以将部分样本、完整形状和弱监督线索统一到学习框架中,以改进补全质量。

下图展示了本方案与现有主要方案的区别。

C. 背景介绍

点云被广泛用于3D形状表示,在目标检测和目标跟踪等领域中发挥关键作用。然而,真实世界的原始点云通常来自激光扫描仪和深度摄像头等设备,由于遮挡和光照条件变化,往往是不完整和带有噪声的。因此,人们开始研究点云补全,以从部分点云获得完整点云。

监督学习是最直接的解决方案,但它需要部分点云和对应的完整点云进行训练。然而,收集完整点云是有挑战的。因此,训练数据对通常通过在ShapeNet等3D模型上模拟遮挡获得。由于真实数据和模拟数据之间的分布差异,这些方法在真实场景鲁棒性往往受到限制。

弱监督点云补全是监督点云补全的替代方案,它使用仅包含部分形状的点云和同一类别的完整样本实例进行训练,因此不需要成对的部分和完整点集。所以,这种方法支持使用大规模真实扫描的不完整点云和虚拟3D物体数据集。但是,获得大规模、完整且干净的3D点云数据集仍有挑战,比如人工成本、设备费用等。已提出弱监督方法,通过使用同一物体的多个未对齐观测构建弱监督线索进行训练。但是,这些方法的性能可能会严重受到对齐错误的影响;另外,由于硬件局限或视角限制,从多个视角收集观测点云也很困难。

为解决这些挑战,本文介绍了一种新的自监督点云补全方法,这种方法仅需要每个物体一个点云形状,该形状的不完整程度不受限制。

D. 理论介绍

上图展示了P2C的具体流程图。

本文介绍的Partial2Complete (P2C)是一个使用每个对象仅有的单个部分点云进行训练的点云补全网络。P2C将输入点分组为表示基础表面上一个小但可能连续区域的点云块,这些是希望网络可以预测的被遮挡的区域。本方法假设通过观察具有不同缺失部件的大量训练对象,可以学习出结构先验知识,指导严重不完整点云的重建。此外,本方案利用未配对图像平移构建循环约束,为框架提供潜在重构损失。这种正则化确保完成同一物体的不同局部区域生成相同的完整形状。

本方案还提出了两个新的组件来解决自监督设置所特有的问题。首先,传统的点云距离度量缺乏对补全任务中出现的完整或缺失区域的认识,导致补全能力受限或预测不匹配。为解这个问题,作者引入了区域敏感Chamfer距离(RCD),利用围绕动态生成的骨架点构建的局部区域估计点云对应关系。通过优化RCD,可能的异常点可以被拉向目标点集,不会受到补全缺失区域的限制。另一方面,受曲率基于表面几何的技术的启发,作者提出法线一致性约束(NCC),它计算附近点的法线方向相似度,并将相似度方差作为正则项计算,鼓励生成的点遵循不完整点云的局部2D表面流形。简单来说,NCC是一种生成平滑表面的策略。

E. 方法详析

P2C网络

Pp

为不完整点云,

Pc

Pp

的预测补全。我们的框架以

Pp

为输入,生成M个点云块,每个点云块表示底层表面的一个小但可能连续的区域,这些事希望网络可以预测的被遮挡的点云块。M个点云块被分割为三组{

Grec

Gcom

Glatent

}。

Grec

是网络可观测的区域,我们强制网络生成预测点云

Pc

,在

Grec

区域与输入相匹配,并引入重构损失

Lr

。尽管

Lr

有效地正则化预测形状与

Grec

中的观测区域匹配,仅凭此无法指导网络预测完整形状。为此,我们使用补全损失

Lc

来惩罚网络无法预测被遮挡组

。人工遮挡的部分和输入中缺失的部分对网络都是未见的,因此最小化

可以指导网络同时补全自然缺失和有意遮挡的区域。

第一个组

经过编码器产生潜在特征嵌入f,表示相应物体的编码,作为解码器的输入以产生形状预测

。为进一步正则化补全,我们引入潜在重构损失

,鼓励对象的两个不同局部区域集共享相同的物体潜在表示。特别是,我们利用第三组块

,这种块独立于

,不被编码器观察。通过对

中与

相同的空间位置进行重采样,我们收集另一组块

。然后,我们传递

给编码器,得到潜在特征f',

用来惩罚f和f'之间的差异。

点云块分区

我们从对象表面采样点云块,以提供局部区域的信息。为此,我们使用最远点抽样(FPS)在部分形状

上采样M个点作为块中心

,表示观察到的粗略形状。然后,我们根据欧几里德距离收集每个中心点的k近邻以获得块

,其中

表示

中c_i的k近邻集。此外,块被划分为三个分区:

,比例为

。一旦解码器产生预测形状

,我们对

中相应的区域进行重采样,采用与

相同的块中心,并在

中搜索k近邻。

区域敏感Chamfer距离

Chamfer距离(CD)和单向Chamfer距离(UCD)是度量具有不同点数的两个点云之间距离的常用方法。S1和S2两个点集之间的UCD定义如下:

通过UCD可以定义CD:

为一个具有某些缺失区域的部分点云,

为对应完整但可能有噪声形状的预测。在自监督补全中,我们没有访问完整形状作为真值,CD不考虑不完整性,而UCD对异常值没有正则化。对于

(

),与未见部分对应的预测点p∈

被估计为远离底层表面的。因此,如上图(a)所示,蓝框中的两个点位于物体的真实表面上,但它们会被位移以最小化CD。因此,CD阻止网络推断缺失的部分。此外,

(

)仅考虑预测中靠近

中的点的最近邻。我们在上图(b)中展示,尽管未见区域的补全不会受到限制,但红框中的异常点不太可能被选为目标集中点的最近邻,导致预测中的异常值没有距离度量。因此,使用UCD作为距离度量时,网络将学习在预测中避免异常值。

区域敏感Chamfer距离(RCD)通过围绕从部分形状

中动态采样的骨架点构建局部区域,解决见域/未见域的问题。具体地说,给定两个点集

,从

中通过最远点采样采样m个点作为骨架点

,表示观察到的粗略形状。然后,对每个骨架点收集每个点集中的k近邻,形成两个表示匹配区域的集合Rp和Rc。然后,RCD可通过UCD定义为:

其中,

中所有骨架点的k近邻的并集。

法线一致性约束

为进一步正则化补全,我们引入法线一致性约束(NCC)改进表面连续性。

给定点云P = {

}

,点pi的切平面法线方向的总最小二乘估计通过附近k个邻点

∈N

的协方差矩阵Cov的特征值分解获得,其中

对应最小特征值的特征向量是估计的法线方向

,并归一化为||

||=1。我们定义点

的法线一致性为:

其中点积用作相似度测量,

之间相似度的均值。nc(·)的值表示法线相似度的方差,估计局部表面曲率。随着局部表面接近分段平面,nc(·)减小到0,而随着曲率增加,nc(·)增加。进一步,NCC定义为:

如上图所示,当新点遵循底层表面时,方差更小,而当新点导致表面偏离现有表面曲率时,方差更大。因此,NCC正则化预测更平滑,延长边缘点以使预测更完整,从而获得更好的形状补全。

优化

重构损失和补全损失定义为

= dRCD(

)和

= dRCD(

)。我们将

中的

编码为潜在表示f'∈

,并通过潜在重构损失鼓励其与第一个潜在嵌入f∈

一致:

其中φ(·)是Huber损失。与NCC损失函数Lncc = NCC(

)一起,我们有:

其中

是权重参数。

F. 文章总结

本文提出了P2C方法,这是第一个仅需要每个对象的单个不完整点云进行训练的自监督点云补全方法。本方法采用新颖的区域敏感Chamfer距离来测量输入预测相似性,并设计了法线一致性约束以增强预测的完整性。实验结果表明,P2C在人工和真实补全任务上都展现出优秀的性能,甚至优于使用完整点云进行训练的模型。总的来说,该方法为仅给定缺失点云数据的点云补全提供了有效解决方案。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-08-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 GiantPandaCV 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
多项SOTA!SVDFormer-自增强自结构双生点云补全算法-ICCV2023论文详解
目前,点云补全任务只要存在以下两个挑战:利用不完整的点云中生成真实的全局形状,并生成高精度的局部结构。当前的方法要么仅使用3D坐标系,要么导入额外的标注好相机内部参数的图像,来指导模型补全缺失部分的几何。然而,这些方法并不总是完全利用可用于准确高质量点云补全的跨模态自结构信息。
BBuf
2023/09/08
1.3K0
多项SOTA!SVDFormer-自增强自结构双生点云补全算法-ICCV2023论文详解
多任务学习新篇章 | EMA-Net利用Cross-Task Affinity实现参数高效的高性能预测
现代AI研究正在迅速融入作者的日常生活。然而,大多数最先进模型庞大且依赖远程访问,因为它们无法轻松部署在边缘设备如移动电话、智能配件或可穿戴医疗设备上。对于许多应用,模型在本地运行且无需依赖网络的需求突显了在模型设计中平衡性能与参数效率的重要性。
集智书童公众号
2024/01/29
8320
多任务学习新篇章 | EMA-Net利用Cross-Task Affinity实现参数高效的高性能预测
nuscenes再创新高!EA-LSS:高效优化LSS方案,即插即用~
大家好,很开心能够受邀来到自动驾驶之心分享我们最近针对多模态BEV 3D目标检测的改进方案——EA-LSS。下面将会给大家详细介绍EA-LSS的设计思路与实验。
公众号-arXiv每日学术速递
2023/09/11
1.1K0
nuscenes再创新高!EA-LSS:高效优化LSS方案,即插即用~
​四大院校携手 GraphBEV | 将激光雷达和相机信息融合到BEV,比 BEVFusion性能高出8.3% !
三维目标检测是自动驾驶系统的一个关键组成部分,旨在准确识别和定位汽车、行人以及三维环境中的其他元素[49, 58]。为了鲁棒和高品质的检测,当前的实践主要遵循像BEVFusion[29, 34]这样的多模态融合范式。不同的模态通常提供互补的信息。例如,图像含有丰富的语义表示,但缺乏深度信息。相比之下,点云提供了几何和深度信息,但却是稀疏的且缺乏语义信息。因此,有效利用多模态数据的优势同时减轻其局限性,对于提高感知系统的鲁棒性和准确性至关重要[58]。
AIGC 先锋科技
2024/07/08
1.1K0
​四大院校携手 GraphBEV  |  将激光雷达和相机信息融合到BEV,比 BEVFusion性能高出8.3% !
三万字收藏 | 三维场景点云理解与重建技术
作者:龚靖渝, 楼雨京, 柳奉奇, 张志伟, 陈豪明, 张志忠, 谭鑫, 谢源, 马利庄
一点人工一点智能
2023/08/24
1.7K0
三万字收藏 | 三维场景点云理解与重建技术
厦门大学突破 SRKD框架 | 雨天无阻,显著提高了检测精度
近年来,利用点云数据进行三维目标检测的研究兴趣日益增长。为了在自动驾驶等领域广泛应用,这些模型必须在多种环境下展现出稳健的性能。尽管在基准数据集上的三维目标检测已经取得进展,但在恶劣天气条件(例如,雨天)下实现一致且可靠性能仍是一个开放的挑战。
集智书童公众号
2024/04/12
8660
厦门大学突破 SRKD框架 | 雨天无阻,显著提高了检测精度
AdaFit:一种对基于学习的点云法线估计方法的新思考(ICCV2021)
AdaFit: Rethinking Learning-based Normal Estimation on Point Clouds (2021-ICCV)
3D视觉工坊
2021/10/21
1.2K0
CVPR一次中66篇,大装置一天训练完GPT-3,商汤准备迎战未来
机器之心原创 作者:张倩 商汤的「既要…… 又要…… 还要……」 6 月 19 日,CVPR 2021 在线上拉开帷幕。作为计算机视觉三大顶会之一,本届 CVPR 大会一共接收了 7039 篇有效投稿,最终有1366 篇被接收为poster,295篇被接收为oral,接收率大概为 23.6%。 在前段时间公布的最佳论文候选名单中,我们发现,华人一作论文占据了半壁江山(16/32)。当然,这一现象并非偶然。其实,早在九年前,华人学者就已经凭借其创新精神在国际 CV 顶会上大放异彩,比如香港中文大学的汤晓鸥团
机器之心
2023/03/29
3930
CVPR一次中66篇,大装置一天训练完GPT-3,商汤准备迎战未来
14篇论文入选CVPR!快手视觉研究成果精华总结
机器之心发布 机器之心编辑部 在正在进行的 CVPR 2021 上,快手有多篇论文被接收,涵盖三维视觉、目标检测、视频目标分割、人脸伪造技术检测等热门研究领域。 计算机视觉和模式识别领域的顶级会议 CVPR 正在进行中,本次大会接收率为 23.7%,其中快手有 14 篇论文被接收,这也是快手在国际视觉技术相关领域顶级会议上中稿最多的一次,研究成果数量的阶段性爆发标志着快手产学研合作从探索期逐步进入成熟期。 此次快手的中稿论文,涵盖了三维视觉、目标检测、视频目标分割、人脸伪造技术检测等热门研究领域,部分研究成
机器之心
2023/03/29
5680
14篇论文入选CVPR!快手视觉研究成果精华总结
CVPR 2023 点云系列 | Point-NN无需训练的非参数、即插即用网络
项目代码:https://github.com/ZrrSkywalker/Point-NN
AiCharm
2023/05/15
7850
CVPR 2023 点云系列 | Point-NN无需训练的非参数、即插即用网络
小目标检测新方法SCTransNet | 空间通道交叉Transformer & 互补前馈达成完美语义信息传递
SCTransNet有效地编码了目标与背景之间的语义差异,从而提升了其内部表征,以准确检测小红外目标。 在三个公开数据集NUDT-SIRST、NUAA-SIRST和IRSTD-1k上的大量实验表明,所提出的SCTransNet优于现有的IRSTD方法。 代码:https://github.com/xdFai
集智书童公众号
2024/02/21
2.1K0
小目标检测新方法SCTransNet | 空间通道交叉Transformer & 互补前馈达成完美语义信息传递
点云压缩研究进展与趋势
以激光扫描为代表的主动采集装备在易操作性、机动灵活性、智能化、高效化等方面日益成熟,利用三维成像技术采集密集点的空间坐标、色彩纹理和反射强度等信息,可高保真且快速重建被测目标的三维实体,在工程测量、生物医学、智慧城市、虚拟现实(VR)、增强现实(AR)等科学与工程研究中发挥十分重要的作用[1-4]。
一点人工一点智能
2023/03/13
3.1K0
点云压缩研究进展与趋势
UADA3D 突破激光雷达难题 | 引领无监督域自适应新趋势,助力点云三维目标检测突破!
基于LiDAR的感知系统对于自动驾驶汽车[20]或移动机器人[41]的安全导航至关重要。一个关键挑战是在车辆环境中对物体进行可靠检测和分类[54]。最先进的(SOTA)三维目标检测方法在很大程度上依赖于用于训练的数据集的质量和多样性,同时也取决于这些数据集在推理过程中如何真实地反映现实世界条件。获取和标注此类数据仍然是一项重大的技术和实践挑战,既耗时又劳动密集。这在三维目标检测模型的大规模开发和部署中构成了一个主要障碍。
集智书童公众号
2024/05/10
9480
UADA3D 突破激光雷达难题 | 引领无监督域自适应新趋势,助力点云三维目标检测突破!
CPEM:通过身份一致性和表情独占约束实现精确的面部运动重定向
现有方法通常将该问题表述为三维人脸重建问题,该问题从人脸图像中估计人脸身份和表情等人脸属性。然而,由于缺乏身份和表情的ground-truth标签,大多数基于3d人脸重建的方法都不能准确地捕捉人脸的身份和表情。因此,这些方法可能无法实现预期的性能。
用户1324186
2024/05/11
3460
CPEM:通过身份一致性和表情独占约束实现精确的面部运动重定向
7 Papers & Radios | 上交、商汤致力高质量点云补全;伯克利等提出通用伪造图像检测方法
论文 1:Learning from Web Data with Memory Module
机器之心
2020/03/25
8450
一种基于分层聚合的3D实例分割方法(ICCV 2021)
Hierarchical Aggregation for 3D Instance Segmentation (ICCV 2021)
3D视觉工坊
2022/03/11
1.1K0
一种基于分层聚合的3D实例分割方法(ICCV 2021)
深度学习点云质量增强方法综述
随着三维探测技术的发展,点云逐渐成为最常用的三维物体/场景表征的数据类型之一,广泛应用于自动驾驶、虚拟/增强现实、文物修复以及虚拟导览等诸多场景。
一点人工一点智能
2024/04/09
1.9K0
深度学习点云质量增强方法综述
探索3D视觉中的Transformer架构:通用Backbone与自适应采样策略 !
计算机视觉中的一个基本问题是在三维空间中理解和识别场景与物体。它允许以紧凑的方式表达关系,并提供在现实世界中导航和操作的能力。3D视觉在各个领域都发挥着重要作用,包括自动驾驶、机器人技术、遥感、医疗、增强现实、设计行业等众多应用。
未来先知
2024/08/08
6680
探索3D视觉中的Transformer架构:通用Backbone与自适应采样策略  !
基于深度学习的RGBD深度图补全算法文章鉴赏
【GiantPandaCV导语】本文针对3维视觉中的深度图补全问题,介绍了一下近年基于深度学习的RGB-D深度图补全算法进展。深度图的质量对3维视觉至关重要,深度图的优劣极大地影响了后续的3d识别等工作,但目前较多研究聚焦于自动驾驶领域的Lidar深度图的补全,而对RGB-D相机涉猎较少,故本文介绍几篇基于consumer RGB-D cameras深度图补全的深度学习方法,以此来看看近期该领域的发展现状。
BBuf
2021/07/01
2.4K0
基于深度学习的RGBD深度图补全算法文章鉴赏
14篇论文入选CVPR!快手视觉研究成果精华总结
计算机视觉和模式识别领域的顶级会议 CVPR 正在进行中,本次大会接收率为 23.7%,其中快手有 14 篇论文被接收,这也是快手在国际视觉技术相关领域顶级会议上中稿最多的一次,研究成果数量的阶段性爆发标志着快手产学研合作从探索期逐步进入成熟期。
公众号-arXiv每日学术速递
2021/07/02
7800
14篇论文入选CVPR!快手视觉研究成果精华总结
推荐阅读
多项SOTA!SVDFormer-自增强自结构双生点云补全算法-ICCV2023论文详解
1.3K0
多任务学习新篇章 | EMA-Net利用Cross-Task Affinity实现参数高效的高性能预测
8320
nuscenes再创新高!EA-LSS:高效优化LSS方案,即插即用~
1.1K0
​四大院校携手 GraphBEV | 将激光雷达和相机信息融合到BEV,比 BEVFusion性能高出8.3% !
1.1K0
三万字收藏 | 三维场景点云理解与重建技术
1.7K0
厦门大学突破 SRKD框架 | 雨天无阻,显著提高了检测精度
8660
AdaFit:一种对基于学习的点云法线估计方法的新思考(ICCV2021)
1.2K0
CVPR一次中66篇,大装置一天训练完GPT-3,商汤准备迎战未来
3930
14篇论文入选CVPR!快手视觉研究成果精华总结
5680
CVPR 2023 点云系列 | Point-NN无需训练的非参数、即插即用网络
7850
小目标检测新方法SCTransNet | 空间通道交叉Transformer & 互补前馈达成完美语义信息传递
2.1K0
点云压缩研究进展与趋势
3.1K0
UADA3D 突破激光雷达难题 | 引领无监督域自适应新趋势,助力点云三维目标检测突破!
9480
CPEM:通过身份一致性和表情独占约束实现精确的面部运动重定向
3460
7 Papers & Radios | 上交、商汤致力高质量点云补全;伯克利等提出通用伪造图像检测方法
8450
一种基于分层聚合的3D实例分割方法(ICCV 2021)
1.1K0
深度学习点云质量增强方法综述
1.9K0
探索3D视觉中的Transformer架构:通用Backbone与自适应采样策略 !
6680
基于深度学习的RGBD深度图补全算法文章鉴赏
2.4K0
14篇论文入选CVPR!快手视觉研究成果精华总结
7800
相关推荐
多项SOTA!SVDFormer-自增强自结构双生点云补全算法-ICCV2023论文详解
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档