Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >CVPR2021 | PAConv:一种位置自适应卷积,点云分类、分割任务表现SOTA

CVPR2021 | PAConv:一种位置自适应卷积,点云分类、分割任务表现SOTA

作者头像
计算机视觉
发布于 2021-04-26 06:56:32
发布于 2021-04-26 06:56:32
1.2K0
举报

导读:

由香港大学CVMI Lab和牛津大学合作提出了一种点云上具有动态内核组装的位置自适应卷积——PAConv: Position Adaptive Convolution with Dynamic Kernel Assembling on Point Clouds,论文已被CVPR2021接收。

PAConv的卷积核由多个基本权重矩阵组装而成,而在组装过程中,这些权重矩阵的系数是通过点的位置关系自适应学习得到的。这种以数据驱动构建卷积核的方式赋予了PAConv很强的灵活性,以更好地处理不规则和无序的点云数据。此外,与现有点云卷积高度工程化的网络结构不同,作者将PAConv直接集成到基于MLP的经典点云网络架构中,而无需更改原有的网络配置。即使建立在简单的网络架构上,PAConv仍然以很高的效率在点云分类、部件分割和场景分割的任务中表现SOTA。目前全部的代码和模型都已开源,欢迎大家follow!

论文、代码地址:在公众号「计算机视觉工坊」,后台回复「PAConv」,即可直接下载。

一、引言

近年来,深度学习在三维点云处理上取得了显着进步,但鉴于点云的稀疏性、不规则性和无序性,这仍然是一项具有挑战性的任务。现有方法大致分为三类:第一类是对点云进行体素化以便可以采用三维网格卷积处理,然而重要的几何信息可能由于量化而丢失,体素化通常也会带来额外的存储和计算成本;第二类是用共享MLP处理所有点,这种方式难以表征点云空间复杂的变化关系;第三类则是设计可以直接处理点云的卷积核,现有方法亦受限于计算复杂度或灵活性,本文中也特别对现有的点云卷积与本文方法的关系和区别进行了详尽的讨论。

本文提出了一种即插即用的位置自适应卷积PAConv,通过动态组装基本权重矩阵来构造内核,这些权重矩阵的组合系数由ScoreNet自适应地学习点的相对位置关系得到。PAConv以数据驱动的方式灵活地对三维点云的复杂空间变化和几何结构进行建模,同时保持很高的效率。另外值得一提的是,最近的点云卷积工作大多采用其量身定制的复杂网络架构,使得我们难以评估到底是其自身卷积操作还是网络设计而带来性能的提升。所以,作者直接将PAConv集成到最简单的MLP点云网络中,旨在最大程度地降低网络结构的影响,以更好地评估PAConv本身的性能。

二、方法概述

接下来,作者设计了一个ScoreNet,根据点的位置关系学习一个系数向量以组合权重矩阵。具体地,ScoreNet的输入为点云中某一个局部区域的中心点pi和其相邻点pj之间的相对位置关系向量,作者在实验部分也探讨了不同的输入表征。输出为一个归一化的系数向量:

最终,通过将Weight Bank中的权重矩阵与ScoreNet预测出的相应系数进行组合,得出PAConv的卷积核函数:

PAConv以动态数据驱动的方式构造卷积核,其中权重矩阵的系数是从点的位置关系自适应学习的,该内核组装策略可以灵活地对点云的不规则几何结构进行建模。

此外,由于权重矩阵是随机初始化的并且可能会收敛为彼此非常相似,因此无法保证权重矩阵的多样性。为了避免这种情况,作者设计了一个权重正则化函数来惩罚不同权重矩阵之间的相关性,其定义为:

从而不同的权重矩阵将更分散和独立,进一步确保了所生成卷积核的多样性。

至此,本文还将PAConv与现有主流的几种点云卷积PointCNN,PointConv和KPConv进行了详细的对比论述。

三、简单的网络结构

虽然最近的点云网络结构差异较大,但是大多数可以视为经典的MLP点云网络的不同变体。为了评估PAConv的有效性并最大程度地减少复杂网络架构的影响,作者针对不同的点云任务采用了三个基于MLP的经典且简单的网络主干来集成我们的PAConv,而不修改原始的网络架构(如网络层数、特征通道数)。

对于物体分类和物体部件分割任务,作者直接使用PAConv替换了DGCNN中的EdgeConv 和PointNet编码器中的MLP。而对于室内场景分割任务,作者采用了PointNet++最简单的单尺度分组(SSG)版本,并用PAConv直接替换PointNet ++编码器中的MLP。

四、实验

对于物体分类任务,作者采用了ModelNet40数据集,取得了现有方法中最高的分类准确率,并且在不改变原始骨干网络PointNet和DGCNN的结构的情况下,分别带来了明显的提升。

其次,本文还在物体部件分割任务的数据集ShapeNet Part上对PAConv进行了评估,同样也给DGCNN带来了显著的提升。

最后,作者进一步在大规模室内场景分割数据集S3DIS上测试了PAConv的性能。值得一提的是,KPConv和PosPool都对输入点云进行了体素化(Grid-sampling)预处理以获得更规则的输入结构和更多的背景信息来提升性能,然而这种方式不可避免地带来更多的训练内存开销,所以作者直接参考PointNet++采用了更简单的块采样(Block-sampling)来进行数据预处理。PAConv依然为骨干网络PointNet++带来了明显的提升,并保持着较少的计算开销(FLOPs)。

此外,论文还可视化了ScoreNet学到的系数在空间中的分布。可以看出,对于每个权重矩阵,其系数的分布是不同的,表明不同的权重矩阵捕获了不同的点位置关系。

五、总结

本论文提出了PAConv,一种具有动态内核组装的位置自适应卷积,用于点云处理。PAConv通过结合Weight Bank中的基本权重矩阵以及通过ScoreNet从点位置学习的相关系数来构造卷积核。通过将PAConv集成到简单的MLP点云网络而无需修改网络配置时,它依然可以表现SOTA,并且保持着很高的模型效率。大量的实验和可视化证明了PAConv的有效性。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-04-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 计算机视觉工坊 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
基于三维点云的卷积运算综述
3D传感器(如激光雷达和深度相机)的普及引起了人们对3D视觉的广泛关注,这些传感器采集的3D数据可以提供丰富的几何结构和尺度细节,这也在许多领域得到了实际应用,包括自动驾驶技术[1]、机器人控制技术[2]等。
一点人工一点智能
2024/01/09
8111
基于三维点云的卷积运算综述
PAConv:基于点云动态核的自适应卷积
标题:PAConv: Position Adaptive Convolution with Dynamic Kernel Assembling on Point Clouds
点云PCL博主
2022/02/10
1K0
PAConv:基于点云动态核的自适应卷积
三万字收藏 | 三维场景点云理解与重建技术
作者:龚靖渝, 楼雨京, 柳奉奇, 张志伟, 陈豪明, 张志忠, 谭鑫, 谢源, 马利庄
一点人工一点智能
2023/08/24
1.7K0
三万字收藏 | 三维场景点云理解与重建技术
结合局部与全局特征的点云语义分割卷积网络
点云语义分割在许多与点云相关的应用程序中具有重要作用,特别是对于机载激光点云,精确的注释可大大扩展其在各种应用中的用途。然而,受限于传感器噪声、复杂的对象结构、不完整的点和不均匀的点密度,准确而有效的语义分割仍是一项艰巨的任务。因此,提出了一种结合局部与全局特征的机载激光点云语义分割网络。
一点人工一点智能
2023/04/26
8210
结合局部与全局特征的点云语义分割卷积网络
CVPR2021 | DyCo3D: 基于动态卷积的3D点云鲁棒实例分割
原文地址:CVPR2021 | DyCo3D: 基于动态卷积的3D点云鲁棒实例分割
一点人工一点智能
2023/01/19
1.5K0
CVPR2021 | DyCo3D: 基于动态卷积的3D点云鲁棒实例分割
三维点云语义分割总览
三维点云分割既需要了解全局几何结构,又需要了解每个点的细粒度细节。根据分割粒度的不同,三维点云分割方法可以分为三类:语义分割(场景级)、实例分割(对象级)和部分分割(部分级)。
点云PCL博主
2020/09/24
2.8K0
三维点云语义分割总览
基于三维点云场景的语义及实例分割:RandLA-Net和3D-BoNet
公开课地址:https://www.shenlanxueyuan.com/open/course/53
深蓝学院
2020/09/09
3.5K0
基于三维点云场景的语义及实例分割:RandLA-Net和3D-BoNet
NeurIPS2019 麻省理工与上海交大共同提出新型点云深度学习框架Point-Voxel CNN
论文:’Point-Voxel CNN for Efficient 3D Deep Learning’
点云乐课堂
2020/05/18
6970
激光点云语义分割深度神经网络
由于增强现实/虚拟现实的发展及其在计算机视觉、自动驾驶和机器人领域的广泛应用,点云学习最近备受关注。深度学习已成功地用于解决二维视觉问题,然而在点云上使用深度学习技术还处于起步阶段。语义分割的目标是将给定的点云根据点的语义含义分成几个子集。本文重点研究基于点的方法这一技术路线中最先进的语义分割技术。
用户5687508
2021/07/01
1.3K0
3D点云 | 基于深度学习处理点云数据入门经典:PointNet、PointNet++
不同于图像数据在计算机中的表示通常编码了像素点之间的空间关系,点云数据由无序的数据点构成一个集合来表示。因此,在使用图像识别任务的深度学习模型处理点云数据之前,需要对点云数据进行一些处理。目前采用的方式主要有两种:
AI算法修炼营
2020/06/09
10.1K0
PCM:一种新型点云学习模型、引入状态空间模型Mamba高效全局建模(天工AI开源)
https://github.com/SkyworkAI/PointCloudMamba
AI进修生
2024/12/02
5240
PCM:一种新型点云学习模型、引入状态空间模型Mamba高效全局建模(天工AI开源)
ECCV 2020 | 3D点云算子并无实质进步?微软亚研重新评估,提出极简算子PosPool
近些年涌现了很多不同的 3D 点云网络和算子,它们在常见基准评测集上的性能逐步提升,但是由于各种网络采用不同的局部算子、整体网络结构和实现细节,人们对该领域的实质进步一直缺乏准确地评估。
机器之心
2020/07/24
6360
ECCV 2020 | 3D点云算子并无实质进步?微软亚研重新评估,提出极简算子PosPool
一种高效的基于邻域空间聚合的点云语义分割不确定性估计方法(ICRA2021)
Neighborhood Spatial Aggregation based Efficient Uncertainty Estimation for Point Cloud Semantic Segmentation (2021-ICRA)
3D视觉工坊
2021/11/19
6340
一种高效的基于邻域空间聚合的点云语义分割不确定性估计方法(ICRA2021)
前沿丨基于深度学习的点云分割网络及点云分割数据集
众所周知,点云的有效分割是许多应用的前提,例如在三维重建领域,需要对场景内的物体首先进行分类处理,然后才能进行后期的识别和重建。传统的点云分割主要依赖聚类算法和基于随机采样一致性的分割算法,在很多技术上得到了广泛应用,但当点云规模不断增大时,传统的分割算法已经很难满足实际需要,这时就需要结合深度学习进行分割。因此,本文将重点介绍5种前沿的点云分割网络,包括PointNet/PointNet++、PCT、Cylinder以及JSNet网络,最后介绍5中常用的点云分割数据集。
计算机视觉
2022/05/24
5.8K0
前沿丨基于深度学习的点云分割网络及点云分割数据集
CVPR 2020 | 自适应的点云降采样,兼顾3D物体分类的准确性和效率
本文介绍的是 CVPR 2020 论文《Adaptive Hierarchical Down-Sampling for Point Cloud Classification》,作者来自华为诺亚方舟实验室认知车联网项目加研团队。
AI科技评论
2020/06/17
2K0
CVPR 2020 | 自适应的点云降采样,兼顾3D物体分类的准确性和效率
CVPR 2020 | RandLA-Net:大场景三维点云语义分割新框架(已开源)
本文要介绍的是 CVPR 2020上被录用的文章《RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds》
AI科技评论
2020/03/05
4.6K0
CVPR 2020 | RandLA-Net:大场景三维点云语义分割新框架(已开源)
三维深度学习中的目标分类与语义分割
在过去的几年中,基于RGB的深度学习已经在目标分类与语义分割方面取得了非常好的效果,也促进了很多技术的发展,深度学习在现实生活中的应用也越来越多。但是在很多实际应用中,例如自动驾驶中,只使用RGB信息是远远不够的,因为我们不仅仅想要知道周围有什么物体,还想要知道物体具体的三维信息(位置,运动状态等),因此,三维方面的深度学习也逐渐发展了起来并取得了不错的效果。
SIGAI学习与实践平台
2018/10/18
1.2K0
三维深度学习中的目标分类与语义分割
三维深度学习中的目标分类与语义分割
在过去的几年中,基于RGB的深度学习已经在目标分类与语义分割方面取得了非常好的效果,也促进了很多技术的发展,深度学习在现实生活中的应用也越来越多。但是在很多实际应用中,例如自动驾驶中,只使用RGB信息是远远不够的,因为我们不仅仅想要知道周围有什么物体,还想要知道物体具体的三维信息(位置,运动状态等),因此,三维方面的深度学习也逐渐发展了起来并取得了不错的效果。
SIGAI学习与实践平台
2018/10/14
4.3K0
三维深度学习中的目标分类与语义分割
3D 深度学习中基于体素和基于点云的方法哪种更优?
欢迎各位加入知识星球,获取PDF论文,欢迎转发朋友圈。文章仅做学术分享,如有侵权联系删文。
点云PCL博主
2024/11/25
6240
3D 深度学习中基于体素和基于点云的方法哪种更优?
智驾车技术栈 | 综述:自动驾驶中基于深度学习的LiDAR点云综述研究
本文为《Deep Learning for LiDAR Point Clouds in Autonomous Driving: A Review》译文,在原文的基础上译者会稍作修改提炼,方便大家学习理解。
小杨同学努力学习呀
2022/12/28
1.4K0
智驾车技术栈 | 综述:自动驾驶中基于深度学习的LiDAR点云综述研究
推荐阅读
相关推荐
基于三维点云的卷积运算综述
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档