首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >在动态环境下滤除移动物体的视觉SLAM算法

在动态环境下滤除移动物体的视觉SLAM算法

作者头像
用户2423478
发布2025-10-28 13:23:19
发布2025-10-28 13:23:19
140
举报
文章被收录于专栏:具身小站具身小站

REF:动态环境下的视觉 SLAM 研究评述

环境中动态的物体之所以会影响到相机运动轨迹的估计,一方面是因为相机的运动轨迹与图像中静态像素点的运动轨迹是相反的,可以根据这种相对关系构建几何约束来求取相机位姿的变换矩阵,但动态物体的存在会使得最终求得的结果可能表述的是运动物体本身的运动轨迹;另一方面,动态物体运动引发的位置遮挡及像素周围环境的变化会使得特征匹配出现偏差,最终导致变换矩阵计算错误。

1. 基于相机运动的视觉算法

将原本的运动目标滤除问题转化为了,在未知状态路标点中求取相机自身的运动模型,并反过来作用于路标点以达到最终确定运动目标区域的目的。

f83cc9f0a250aaa5fc4753711fdf8c86.png
f83cc9f0a250aaa5fc4753711fdf8c86.png

1.1 通过传感器补偿进行动态目标滤除

环境的变化对相机获取的图像质量及后续静态特征点的匹配会产生一定的影响,致使利用图像求取的相机自身运动信息发生错误,但一些传感器如IMU 和轮式里程计等因为其获取的是传感器自身的内部属性,因此受外界环境影响较小.

通过特征点运动向量的方向来区分自身动态性时,对于相机平动的情况较为适用的.当相机存在一定的旋转时,图像中属于静态背景区域的特征点同样会产生不同方向的运动,将特征点运动向量的方向与大小结合起来形成完善的判断条件对动态区域的划分起到至关重要的作用

b4ded6fd0f1a107449c4b1bf17992990.png
b4ded6fd0f1a107449c4b1bf17992990.png

1.2 RANSAC 算法直接得到相机运动

当前流行的视觉 SLAM 系统,在计算相邻 2 帧图像之间的几何约束都运用到 RANSAC(随机抽样一致性)方法排除不满足模型的外点,以便更准确地计算相机之间的变换关系。在针对动态环境下的 SLAM 问题时,更多的是利用RANSAC 算法获取一个粗略的变换矩阵结果来判断环境中路标点的动态情况。

c656a2f045849baeccb57e867a8eeb86.png
c656a2f045849baeccb57e867a8eeb86.png

1.3 通过背景模型进行运动目标滤除 环境中运动的物体往往被人看作为前景,而静止不动的区域则称之为背景,如果能有效地分割出一幅图像的背景,利用背景区域的图像来求取相机自身的位姿将会得到更加可靠的结果.同理,若能提前构建前景的模型,那相当于直接分割出了运动的物体,继而将运动物体外的区域用于移动机器人的定位与建图将会明显改善视觉 SLAM 在动态环境下的表现.

1.4 通过语义信息进行运动目标滤除

相较于使用多视图几何约束或传统图像处理来解决动态环境下的相机自身运动估计,通过深度学习识别图像中的物体,利用先验的知识可以初步判断和分割环境中运动的物体,如室内的行人、街道上的车辆、各种各样的动物等,这些都是具有高运动可能性的目标,辅助求取相机自身的运动模型将更加简洁且可靠性更强。

c7fa916ac82dc7a12881d4fe7acf6109.png
c7fa916ac82dc7a12881d4fe7acf6109.png

2. 不依赖相机运动的动态环境下视觉 SLAM

一个动态环境中,直接利用全部的特征信息或光流信息来求取相机自身的运动模型并不容易,因为当前的 SLAM 系统框架都是在静态环境假设下设计的,即使有 RANSAC 策略的优化,也很难保证自身运动模型求取的准确性.因此,有尝试跳过相机自身运动估计这一步骤,直接利用语义信息或多视图几何约束来判别图像中的动态区域

0a5c4a781b0f24792be4b9fb61d15ab9.png
0a5c4a781b0f24792be4b9fb61d15ab9.png

2.1 基于几何约束的动态物体滤除

仅从图像处理、多视图几何的角度,直接对动态区域进行较快的判别,更容易满足人们对动态环境下SLAM 系统的期待。比如设计一种算法计算连接在一个特征点上的所有边中动态边的比例,动态边占比高于一个阈值,则判定该点属于动态的特征点,最终将留下的静态特征点输入到 ORB-SLAM2 系统中。或者通过在一个滑动窗口范围内进行评估计算, 对窗口的网格区域中正确匹配的特征点数目进行统计并建立相应的自适应阈值,筛选出属于静态背景区域的特征点。

d6a9edf8e97e2917b2903183f28e8ed9.png
d6a9edf8e97e2917b2903183f28e8ed9.png

2.2 基于语义信息的动态物体滤除

与前面语义滤除最大的不同是,算法在利用先验语义信息得到潜在的运动目标区域后(如人、动物、车等)并没有继续计算初始的相机自身运动,而是利用其他方式或者直接将潜在的运动区域进行滤除。

不利用相机自身运动信息,基于语义信息的动态环境下 SLAM 系统大多都非常依赖于先验的知识,直接判定室内环境下的人为动态目标,对于室内环境却不失为一种不错的选择.原因之一是可以很大程度上降低处理过程及算法的复杂性,其二是室内环境下的动态主体即为人,即使环境中存在一些动态性较为模糊的物体,如椅子、书籍和球类等,在经过一轮语义分割剔除掉主要运动目标后,占比较少的动态区域往往可以利用 RANSAC 等算法进行二次筛选并取得不错的效果。

虽然直接使用目标检测或语义分割来应对动态环境下的 SLAM 系统其过程要简洁很多,但对环境的要求也严格不少,因此还是需要对特定的环境作必要的调整.

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-10-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 具身小站 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 基于相机运动的视觉算法
  • 2. 不依赖相机运动的动态环境下视觉 SLAM
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档