首先,一个群是一个代数结构,包含一个集合和一种运算,这个组合需要满足四个条件:
例子: 所有整数和加法运算构成一个群,单位元是0,任何整数的逆元是它的相反数。
特殊正交群 SO(3): 所有3x3的正交矩阵(即 RᵀR = RRᵀ = I, det® = +1)组成的群,代表了所有可能的三维旋转。
反对称矩阵: 是一种特殊的方阵,其转置等于其负数,对于三维向量 θ=[θx,θy,θz]T,其反对称矩阵定义为:

在机器人和SLAM中,特殊欧氏群 SE(3),代表了所有可能的三维刚体变换(旋转 + 平移),也就是机器人的位姿。
它由一个旋转矩阵 R ∈ SO(3) 和一个平移向量 t ∈ R³ 构成,是所有合法的 4x4 变换矩阵 T:

它的运算是矩阵乘法,两个变换矩阵相乘 T₁ ◦ T₂ 表示先经过 T₂ 变换,再经过 T₁ 变换。SE(3)满足群的四个条件,因此SE(3) 中的变换满足 T₁ ◦ T₂ ∈ SE(3),T⁻¹ ∈ SE(3),完美代表了机器人的位姿(旋转+平移),所以,SE(3) 就是所有机器人位姿的集合, 每一个位姿都是这个群中的一个元素。
李群: 指连续且光滑的群,SO(3) 和 SE(3) 都是李群,SO(3)可以想象成一个光滑的球面或SE(3)想作一个光滑的高维曲面,可以在上面进行连续、光滑的运动。 关键点: 李群描述的是最终的、有限的变换结果。
李代数: 对应李群在单位元(即原点)处的切空间, 记为小写的so(3) / se(3),其中so(3)可以想象一个球体(李群SO(3)),在它的北极点(单位元,即无旋转)放一块平坦的纸板,这块纸板就是它的切空间(即李代数so(3))。这个切空间里的向量 φ(3维)或 ξ = [ρ, φ]ᵀ(6维)代表了瞬时运动:φ 的方向是旋转轴,模长是旋转速度;ρ 与线速度相关。同理,se(3): 对应 SE(3) 的李代数,其元素是一个6维向量 ξ = [ρ, φ]ᵀ。其中 φ 代表旋转,ρ 与平移相关。 关键点: 李代数描述的是“速度”或“瞬时运动”。
感性理解: 想象一个粒子在一条直线上运动:
这是最核心的一对操作,将瞬时运动和有限变换联系起来,选择指数映射的原因是指数映射的导数在单位元上是恒等映射,即

更一般的微分方程可以表示如下,其中X是常数矩阵:

指数映射: exp: se(3) → SE(3),物理意义是对瞬时速度进行积分,得到有限时间内的位置变化,比如一个恒定的角速度 ω(李代数 so(3) 中的一个向量),持续旋转 1 秒钟,最终得到的旋转矩阵 R(李群 SO(3))就是 exp(ω)。
对数映射: log: SE(3) → se(3),反过来的物理意义就是指数映射的逆过程,从一个有限的位置变化,求出其对应的瞬时运动,比如一个旋转矩阵 R,可以通过 log® 求出一个旋转向量 φ,它的方向是这次旋转的轴,模长是旋转的角度。
感性理解: 如果运动发生在复杂的空间里(比如在一个球面上旋转),就需要一个能推广前面例子这种积分关系的工具,想象一个更贴近的例子:复平面上的旋转。
通过指数映射可以连接它们,著名的欧拉公式:

这个公式完美地将一个“旋转速度”(iθ,以多快的速度绕原点旋转)积分为了一个“最终的旋转状态”(e^(iθ),一个具体的复数),所以,指数映射的第一个直观原因:它是在许多空间中,从“瞬时生成元”到“有限变换”的自然推广。 几何解释:复平面上的单位圆,eiθ 对应复平面上的点:

虚部
^
| e^{iθ} = (cosθ, sinθ)
| /|
| / |
| / | sinθ
| /θ |
|/____|____> 实部
cosθ优化算法的核心是求雅可比矩阵(残差对状态变量的导数),但是直接在 SE(3) 上定义导数非常困难。使用四元数时,定义残差关于四元数的导数非常复杂且不直观,而在李代数这个向量空间求导,则是简单、标准且自然,可以在李代数这个切空间里做所有熟悉的向量空间微积分。
这是李群李代数在SLAM中最关键的应用,回顾LIO-SAM的因子图优化,需要调整位姿估计 T 以最小化残差。
目标: 对一个位姿 T ∈ SE(3)(一个受约束的矩阵)进行求导和更新
错误做法(欧拉角/四元数加法):

直接对旋转矩阵的元素进行加法,会导致 T_new 不再是一个合法的变换矩阵(不满足正交性),或者四元数的四个数加法更新,则q_new 不再是一个单位四元数,不再满足单位范数约束,最终则破坏了位姿的约束。 如果对上面的变化进行处理,比如,在每次更新后,需要对旋转矩阵进行重新正交化(计算量大有误差),或对四元数进行重新归一化(虽然可行,但只是解决方案的一部分,没解决求导问题)
正确做法(李群李代数): 在切空间(李代数)中计算增量: 将优化问题转换到李代数空间 se(3) 中进行,在这里,增量是一个无约束的 6 维向量 δξ = [δρ, δφ]ᵀ,可以自由地对其加减,最后通过指数映射将增量作用回李群: 位姿的更新公式为:

这个操作的优势在于无论 δξ 这个增量是多少,exp(δξ^) 永远是一个合法的 SE(3) 变换,因为T^{(old)} 本身是合法的,两个合法变换相乘结果依然是合法的,这就保证了优化过程中位姿的合法性。
