首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >FLARES:基于LiDAR多范围语义分割的快速准确方法深度解析

FLARES:基于LiDAR多范围语义分割的快速准确方法深度解析

作者头像
一点人工一点智能
发布2025-02-25 10:17:36
发布2025-02-25 10:17:36
3281
举报

编辑:陈萍萍的公主@一点人工一点智能

论文地址:https://arxiv.org/abs/2502.09274

摘要

LiDAR作为自动驾驶感知系统的核心传感器,其点云数据的语义分割是实现3D场景理解的关键。然而,LiDAR点云的不规则性、稀疏性,以及大规模数据处理的实时性需求,使得高效且准确的语义分割成为技术难点。

现有方法主要分为点云、体素和投影(range-view)三类。其中,投影方法通过将点云转换为2D全景图像,利用成熟的2D卷积网络实现高效处理,但面临“多对一”问题(即多个3D点映射到同一2D像素导致信息丢失)。传统解决方案通过提高方位角(azimuth)分辨率以保留更多细节,但带来计算开销大、无效像素多等弊端。

本文提出FLARES(Fast and Accurate LiDAR Multi-Range Semantic Segmentation),通过系统性优化数据表示、训练策略、数据增强和后处理流程,显著提升了投影方法的性能。

其核心创新在于:

1)采用低分辨率投影结合子点云分割策略,在降低计算成本的同时提高投影有效性;

2)设计针对性的数据增强方法(如Multi-Cloud Fusion)以解决低分辨率下的类别不平衡与2D占用率下降问题;

3)提出自适应插值后处理算法NNRI,有效缓解“多对一”映射的负面影响。

实验表明,FLARES在SemanticKITTI和nuScenes数据集上显著优于现有基线模型,并在延迟与精度间取得更优平衡。

FLARES的核心技术

2.1 预处理与训练策略:子点云分割与低分辨率投影

1)问题背景

传统投影方法通过提高方位角分辨率(图像宽度W)以缓解“多对一”问题,但导致计算资源浪费(如空像素过多)和模型复杂度增加。作者通过实验发现,同时优化方位角与仰角(elevation)分辨率(即图像高度H)能更有效提升投影率(图2),但直接提高分辨率不可行。

2)FLARES的核心设计

· 子点云分割:将完整点云分割为多个子点云,每个子点云投影为低分辨率图像(例如,完整点云分辨率64×2048分割为3个子点云,各子点云投影为64×512)。

· 训练策略:训练时随机选择一个子点云投影进行优化,推理时处理所有子点云投影并融合结果。

· 投影有效性控制:通过设定最大分割组数

,确保子点云的平均2D占用率不低于高分辨率投影模式,即

3)优势分析

· 投影率提升:通过同时优化方位角与仰角分辨率,减少信息丢失。

· 计算效率优化:低分辨率图像降低内存占用,支持更大批次训练。

· 上下文完整性保留:子点云分割保留完整视场,避免局部信息割裂。

2.2 数据增强:解决类别不平衡与低占用率

1)挑战

低分辨率投影加剧了类别不平衡(如小物体像素更少)和2D占用率下降(子点云投影后空像素增多)。

2)解决方案

· Weighted Paste-Drop+(WPD+)

基于MaskRange的加权粘贴-丢弃策略改进,直接在3D空间进行数据增强:

a. 粘贴稀有类别:从其他帧或合成数据(如Carla仿真数据)中采样稀有类别点云,粘贴到当前帧。

b. 丢弃冗余类别:减少高频类别(如地面、植被)的像素数量。

相比原方法,WPD+通过多帧采样和合成数据引入,更有效平衡类别分布。

· Multi-Cloud Fusion(MCF)

针对子点云投影的2D占用率下降问题,提出多子点云融合策略:

a. 随机选择分割组数

,生成

个子点云投影。

b. 训练时随机选择一个投影,并用其他子点云的占用像素填充其空区域。

此方法在保持场景结构一致性的同时,显著提升单张投影的2D占用率(图5d)。

3)技术意义

WPD+和MCF分别从语义平衡和空间完整性角度优化低分辨率投影的输入质量,为模型提供更丰富的训练信号。

2.3 后处理:Nearest Neighbors Range Interpolation(NNRI)

1)问题背景

传统后处理方法(如KNN投票、最近邻分配NLA)依赖3D空间搜索,计算成本高且对低分辨率预测敏感。FLARES提出NNRI算法,结合2D与3D信息进行自适应插值。

2)算法流程

· 2D核化与邻域提取:对2D预测进行3×3核化处理,提取每个点的2D邻域信息。

· 深度自适应阈值:根据点与传感器的距离(range)动态设定邻域有效范围。近距离点密度高,采用较小阈值;远距离点稀疏,采用较大阈值。

· 加权插值:基于邻域点的深度差异计算权重,对软最大得分进行加权融合。

3)数学表达

设点p的深度为

,其邻域点q的深度为

,则权重计算为:

其中,

为根据预计算的距离-密度关系确定的自适应参数。

4)优势分析

· 效率提升:避免全局3D搜索,推理速度比KNN快16%。

· 精度优化:自适应阈值更符合LiDAR点云的距离-密度特性,减少边界误分类(图7)。

2.4 网络架构选择与适配

FLARES的通用性通过适配多种网络验证:

· 轻量级CNN:如FIDNet(全插值解码)、SalsaNext(U-Net+空洞卷积)、CENet(多尺度特征拼接)。

· Vision Transformer:如RangeViT,替换其3D细化模块为NNRI后处理。

实验与分析

本文主要介绍了在LiDAR语义分割任务中,使用FLARES方法对不同网络结构的提升效果,并进行了多个方面的对比实验。

首先,在标准模式下,作者将分辨率设置为64×512和32×480,将整个点云分成多个子云进行训练和推理。然后,他们比较了使用FLARES方法的四种网络结构(SalsaNext、FIDNet、CENet和RangeViT)与基线模型之间的性能差异。结果表明,这四个网络都获得了显著的提高,其中SalsaNext提高了5.3%,FIDNet提高了7.9%,CENet提高了3.3%,而RangeViT也取得了巨大的改进。此外,FLARES方法还可以改善小、动态和稀有的类别的分割精度。

其次,作者还与其他领域的技术进行了比较,包括数据增强技术和后处理技术。对于数据增强技术,他们尝试了多种方法,如WPD+、Mix3D、RangeAug等,并发现WPD+是最有效的。而对于后处理技术,他们比较了传统的KNN方法和其他几种方法,并发现他们的自适应距离权重方法可以显著提高准确率和速度。

最后,作者还研究了输入分辨率的影响,并发现在512和640的分辨率下可以获得最佳的效果。

总的来说,本文通过多个对比实验,证明了FLARES方法可以在LiDAR语义分割任务中显著提高不同网络结构的性能,并且该方法具有一定的普适性。

结论与展望

FLARES通过系统性优化数据表示、训练策略、增强与后处理,为投影LiDAR语义分割提供了高效且通用的解决方案。

其核心贡献在于:1)低分辨率投影与子点云分割:平衡效率与信息保留;2)针对性数据增强:3)缓解类别不平衡与低占用率问题;自适应插值后处理:显著改善“多对一”映射的精度损失。

局限性方面,极端类别不平衡(如“摩托车手”类)仍影响性能,未来可通过3D重建生成伪点云数据进一步优化。FLARES的框架设计为自动驾驶感知系统的实时性与准确性提供了新的技术路径。

最后,作者还研究了输入分辨率的影响,并发现在512和640的分辨率下可以获得最佳的效果。

总的来说,本文通过多个对比实验,证明了FLARES方法可以在LiDAR语义分割任务中显著提高不同网络结构的性能,并且该方法具有一定的普适性。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-02-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 一点人工一点智能 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档