超火的 SLAM 技术是什么?
它的核心任务又是什么?
点击下方视频,你对人工智能的了解就能轻松超过全世界 99% 的人类!
图文版本送给不方便打开的朋友 (°u°)」
SLAM 的中文名叫「同时定位与地图构建」,是帮助机器在进入一个陌生环境时,通过移动和观察快速了解周围环境,并绘制出环境地图的技术。
从名字也能看出,SLAM 包含两项核心任务:了解自己在哪儿,即定位(Localization);描绘自己所在的空间,即地图构建(Mapping)。
这两个任务需要机器对环境有三维感知,因此深度信息相当重要。为机器充当眼睛的一般是激光雷达、单目/双目相机或是RGB-D 深度相机。
激光雷达通过发射和接受反射回来的激光束,获得距离、速度等信息;
单目摄像头需要对比机器在移动过程中拍摄到的图像变化,来判断与物体之间的距离;
双目摄像头更像人眼,可以通过两只眼睛看到图像的不同,直接获取深度信息;
RGB-D 由于配备了红外发射器和接收器,利用结构光方法就能直接获得周围环境的深度信息,我们也将它称为深度相机。
有了周围环境的图像和深度信息,机器就能一边移动一边将这些图像拼接起来,绘制出环境地图,以便更好的移动或是完成更复杂的任务。
如果只有这么简单,人们为什么会在这个课题上花费超过三十年时间?
下一期我们将探讨 SLAM 的应用场景和面临的问题,敬请期待!
「知智一分钟」是由「KnowingAI知智」推出的,以人工智能基础知识为主的短视频栏目。
每次一分钟,轻松了解 AI 领域基础概念!
领取专属 10元无门槛券
私享最新 技术干货