前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >SD-SLAM: 基于LiDAR点云的动态场景语义SLAM方法

SD-SLAM: 基于LiDAR点云的动态场景语义SLAM方法

作者头像
点云PCL博主
发布2024-05-20 16:57:08
3660
发布2024-05-20 16:57:08
举报
文章被收录于专栏:点云PCL点云PCL

文章:SD-SLAM: A Semantic SLAM Approach for Dynamic Scenes Based on LiDAR Point Clouds

作者:Feiya Li , Chunyun Fu, Dongye Sun , Jian Li , Jianwen Wang

编辑:点云PCL

欢迎各位加入知识星球,获取PDF论文,欢迎转发朋友圈。文章仅做学术分享,如有侵权联系删文。

摘要

通过激光雷达传感器生成的点云地图利用了大量的遥感数据,常用于自动驾驶车辆和机器人的定位和导航。然而,点云地图中包含的动态物体不仅降低了定位准确性和导航性能,还危及地图质量。针对这一挑战,本文提出了一种基于激光雷达点云的动态场景语义SLAM方法,后文简称为SD-SLAM。1)引入了专门针对动态场景的语义SLAM框架,基于激光雷达点云;2)利用语义和卡尔曼滤波有效区分动态和半静态地标;3)充分利用半静态和纯静态地标的语义信息,在SD-SLAM过程中改善定位和地图构建性能。为了评估所提出的SD-SLAM,我们使用了广泛采用的KITTI里程数据集进行了测试。结果表明,所提出的SD-SLAM有效地减轻了动态物体对SLAM的不利影响,在动态场景中改善了车辆定位和地图构建性能,并同时构建了具有多个语义类别的静态语义地图,从而增强了环境理解能力。

主要贡献

本研究提出了一种新颖的面向动态场景的语义LiDAR SLAM方法。我们的方法采用全卷积神经网络(FCN)进行语义分割,进而利用DBSCAN进行实例分割。为了准确区分动态和静止对象,我们将语义和卡尔曼滤波引入到我们的策略中,以区分地标的运动状态。通过这种方式,可以识别三种类型的地标,包括动态地标、半静态地标(在检测时静止,但随时间可能会发生运动)和纯静态地标。在此基础上,不仅可以消除动态地标对姿态估计的不利影响,还可以获得更多的地标(包括半静态和纯静态地标),以增强定位性能。然后,本研究再次利用我们先前提出的LiDAR里程计(L-LO)来提供姿态估计结果,并通过优化的粒子群优化算法解决其目标函数,以增强定位和地图精度。在闭环检测方面,本研究对BoW3D算法进行了改进,以纠正累积的定位误差。所提出的LiDAR SLAM方法有效地克服了对静态环境假设的过度依赖,并显著提升了动态场景中的定位性能。此外,所提出的方法同时构建了一个静态地图,其中地标被分类为多个语义类别,从而突显了其对环境的全面理解。本文的主要贡献包括:

  • 引入了一种新颖的面向动态场景的语义SLAM框架,基于LiDAR点云;
  • 整合语义和卡尔曼滤波,以有效区分场景中的动态和半静态地标;
  • 充分利用带有语义信息的半静态和纯静态地标,以增强SDSLAM过程中的定位和地图构建性能。

内容概述

本文提出了一种面向动态场景的新颖语义LiDAR SLAM框架,如图1所示。整体框架包括六个组件:

1)实例分割:该模块对点云原始数据进行分割,并赋予点云语义和实例属性。

2)初步姿态估计:该组件利用连续帧中的分割地标进行配准,从而产生车辆姿态的初始估计。

3)地标运动状态识别:利用初步姿态估计结果,可以基于卡尔曼滤波框架有效地预测和跟踪地标的运动状态(即位置和速度)。通过进一步利用地标的语义和运动状态,可以识别动态和半静态地标。

4)精确姿态估计:在此模块中,提出了一种更复杂的配准方法,以根据初步姿态估计和地标运动状态识别的结果实现更精确的六自由度(DOF)姿态估计。

5)闭环检测:为了确保定位和地图结果的全局一致性,采用了增强的BoW3D算法来纠正由于误差累积导致的轨迹漂移和地图重复。

6)纯静态语义映射:在此模块中,利用纯静态地标构建了一个精确、详细的具有基本纯静态属性的3D语义地图,用于导航和路径规划。

图1. 面向动态场景的提出的语义LiDAR SLAM框架

图2. 纯静态地标簇和具有未知运动状态的地标簇的点簇示意图

图3. 在连续帧中使用距离和语义标准进行地标配对。第k-1帧中的地标中心用蓝点表示,而第k帧中的地标中心用红点表示。虚线粉色线表示从两帧地标中心之间的距离的评估。实线表示满足距离标准和语义标准的地标

实验评估

提出的方法的有效性已通过全面的性能评估得到验证,包括三个不同的维度:车辆定位、动态地标检测和静态地图(使用纯静态地标和地面点)。这种多方面的评估是基于广泛认可的KITTI数据集进行的。所有实验均在配备16GB RAM(8GB×2)、512GB硬盘和NVIDIA GeForce MX150显卡的计算机上执行。评估所使用的操作系统是Ubuntu 18.04。

图5. 从鸟瞰视角看动态地标检测性能。动态地标以红色表示,而其他地标以灰色标记。右侧的三幅图像显示了三个放大区域的地面真实情况

图6. 使用KITTI里程数据集的纯静态地标和地面点进行的地图构建结果

总结

本研究提出了一种新颖的语义LiDAR SLAM框架,专门应对动态环境的挑战,提高定位精度,改善地图构建性能。该框架致力于将语义信息和卡尔曼滤波技术融入SLAM中,从而有效区分动态和半静态地标。此外,在SLAM过程中充分利用具有语义信息的半静态和纯静态地标,以增强定位和地图构建性能。在这种方法中,相同的优化PSO算法被用于初步姿态估计阶段和精确姿态估计阶段来解决目标函数。

对我们的SD-SLAM方法进行的比较评估跨越了各种不同的场景,清楚地表明了与现有方法相比,其出色的定位性能。通过解决传统上过度依赖静态环境假设的问题,所提出的SD-SLAM不仅显著提高了动态环境下的定位精度,而且有效缓解了长期困扰SLAM系统的移动物体的不利影响。此外,该方法不仅仅局限于定位,还同时构建了详细的静态地图,其中地标被归类为多个语义类别。这一特性突显了该方法提供全面环境认知的能力。这些特点共同展示了所提出的SD-SLAM方法的明显优势,展示了其在导航和绘制具有丰富动态物体的复杂、不断变化的环境中的卓越能力。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-05-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 点云PCL 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档