文章:SuperPoint-SLAM3: Augmenting ORB-SLAM3 with Deep Features, Adaptive NMS, and Learning-Based Loop Closure
作者:Shahram Najam Syed , Ishir Roongta , Kavin Ravie , Gangadhar Nageswar
编辑:点云PCL
欢迎各位加入知识星球,获取PDF论文,欢迎转发朋友圈。文章仅做学术分享,如有侵权联系删文。
从技术角度观察行业发展,努力跟上时代的步伐。公众号致力于点云处理,SLAM,三维视觉,具身智能,自动驾驶等领域相关内容的干货分享,欢迎各位加入,有兴趣的可联系dianyunpcl@163.com。文章未申请原创,未经过本人允许请勿转载,有意转载联系微信920177957。
摘要
视觉同步定位与建图(Visual SLAM)系统是机器人自主导航和计算机视觉中的核心技术。这类系统的性能在很大程度上依赖于用于关键点检测和描述子的特征的鲁棒性和判别能力。ORB-SLAM3 是当前最先进的 SLAM 系统之一,采用的是传统的 ORB(Oriented FAST and Rotated BRIEF)特征,但在尺度、旋转和光照发生显著变化的情况下,这些特征可能存在一定局限性。本研究将 SuperPoint —— 一种基于深度学习的兴趣点检测与描述方法 —— 集成到 ORB-SLAM3 框架中,用以替代传统的 ORB 特征。此外引入了自适应非极大值抑制(ANMS)算法,以实现关键点在空间上的均匀分布。将这个改进后的系统称为“SuperPoint SLAM with ANMS”,并在 KITTI 里程计数据集和 EuRoC MAV 数据集上对其进行了评估。在 KITTI 数据集中,实验结果显示系统定位精度有了显著提升:平均平移误差从 4.15% 降至 0.34%,平均旋转误差从 0.0027 度/米 降至 0.001 度/米,六自由度位姿估计表现优于原始的 ORB-SLAM3。在更具挑战性的 EuRoC 数据集中,我们的系统在所有序列上也表现出显著的改进:平移误差从原来的 1.2%–1.6% 降至 0.5%–0.9%,旋转误差从 0.0035–0.0045 度/米 降至 0.0018–0.0028 度/米。这些结果表明,将 SuperPoint 特征与 ANMS 融入 SLAM 流程能够有效提升系统在多样化环境下的性能。源代码已开源,地址为:
https://github.com/shahram95/SuperPointSLAM3。
主要贡献
近年来,深度学习的发展催生了更为鲁棒的特征检测器与描述子。SuperPoint是一种自监督卷积神经网络,能够同时学习兴趣点的检测与描述。在具有显著几何和光照变换的场景中,SuperPoint 在重复性和匹配精度方面表现出色。此外关键点的空间分布在 SLAM 系统中也至关重要,均匀的分布有助于提升特征跟踪的稳定性和位姿估计的准确性。自适应非极大值抑制(ANMS) 是一种有效的方法,它根据局部特征强度动态调整抑制半径,从而实现关键点选择的空间均匀性。本研究提出将 SuperPoint 特征集成进 ORB-SLAM3,替代传统的 ORB 特征,并引入 ANMS 来优化关键点的空间分布。在 KITTI 里程计数据集上对改进后的系统进行了评估,该数据集包含具有真实位姿的具有挑战性的户外序列。实验结果表明所提出的改进在定位精度和鲁棒性方面均有显著提升,验证了将基于深度学习的特征与空间关键点分布策略整合进 SLAM 流程的有效性。
主要内容
这里将详细介绍为将 SuperPoint 特征和自适应非极大值抑制(ANMS)集成进 ORB-SLAM3 框架而进行的各项修改。将讨论算法层面的变更、数据处理结构上的调整,以及在实现过程中遇到的挑战。我们的目标是通过利用 SuperPoint 出色的特征检测与描述能力,并结合 ANMS 实现关键点的空间均匀分布,从而增强 SLAM 系统的鲁棒性与精度。系统架构的详细实现可以参考图 1 中所展示的内容。
图 1. SuperPoint-SLAM3 的系统架构,将 SuperPoint 和 ANMS 集成到 ORB-SLAM3 流程中。
A. ORB-SLAM3 概述
ORB-SLAM3 是一种基于特征的视觉 SLAM 系统,利用 ORB(定向 FAST 和旋转 BRIEF)特征进行关键点检测与描述,从而实现实时运行。该系统由三个主要线程组成:
尽管 ORB 特征在计算上高效,但由于其对尺度、旋转和光照变化较为敏感,在复杂视觉条件下可能限制系统性能。
B. SuperPoint 特征的集成
为了提升特征的鲁棒性,将 ORB 特征提取与描述模块替换为 SuperPoint,这是一种基于深度学习的方法,能够提供更具判别性和更具不变性的关键点与描述子。
1)SuperPoint 网络集成:
2)对 ORB-SLAM3 的修改:
C. 自适应非极大值抑制(ANMS)的实现
为了确保关键点在图像中的空间分布均匀,在 SuperPoint 初始关键点检测之后实现了 ANMS 方法。
1)算法描述:
ANMS 的工作原理是选择那些不仅响应强,而且在空间上分布均匀的关键点。对于每一个关键点,会根据其相对于邻近关键点的响应强度,计算一个“抑制半径”。
2)与 SuperPoint 的集成:
D. 描述子匹配与数据关联
1)描述子匹配算法:
2)对系统各模块的影响:
E. 兼容性问题的处理
1)描述子维度问题:
2)回环检测模块:
3)深度过滤策略:
F. 计算优化考虑
1)性能优化:
2)实时性运行:
G. 实现中的挑战
1)内存管理:
2)算法稳定性:
3)系统集成:
实验结果与讨论
在 KITTI 里程计数据集(序列 00 至 10)和 EuRoC MAV 数据集上对三种系统进行了评估。评估指标包括绝对轨迹误差(ATE)、相对位姿误差(RPE),以及二维和六维位姿下的平均平移误差和旋转误差。
A. 定量结果
轨迹可视化对比
我们绘制了所有序列(00 到 10)的二维投影轨迹(XZ 平面)和六自由度位姿轨迹。图中显示的是估计轨迹与 KITTI 数据集中提供的真实轨迹的对比叠加情况。
图 2. 序列 00 至 10 在二维轨迹(XZ 平面)上的对比分析,比较了 ORB-SLAM3、SuperPoint 及 SuperPoint + ANMS 的表现。
观察结果
1)ORB-SLAM3:
2)SuperPoint SLAM:
3)SuperPoint SLAM + ANMS:
图 3. ORB-SLAM3、SuperPoint 及 SuperPoint + ANMS 的六自由度位姿估计对比分析。
1)无回环检测的序列中的漂移:
2)垂直轴和俯仰角的抖动:
3)错误的回环检测尝试:
总结
通过将 SuperPoint 特征和 ANMS 集成到 ORB-SLAM3 中,取得了定位精度和鲁棒性的显著提升。初步结果表明,基于深度学习的特征能够有效增强传统的 SLAM 系统。回环检测模块:由于 SuperPoint 特征描述子是 256 维浮点向量,而 BoWV2 基于汉明距离运作,我们需要通过调整相似度度量和阈值,引入基于学习的回环检测机制,以解决当前的回环检测问题。计划在更多数据集上进行测试,包括多模态数据集,以评估系统在不同场景和传感模式下的性能表现。
相关阅读:2024年度历史文章大汇总