第三十一届中国汽车工程学会年会暨展览会(SAECCE 2024)于2024年11月12日-14日在中国重庆·科学会堂隆重召开。
SAECCE 2024以“智能涌现,迈进加速变革新阶段”为主题,将聚焦汽车产业创新重大需求,瞄准未来的前沿性、颠覆性技术发展,重点突出汽车科技前沿、关键技术创新、工程技术研发与应用实践以及产业合作等,着力推动汽车科技进步、跨领域技术融合创新及产业合作,加速汽车人才发展,引领汽车产业高质量发展。
作为国内汽车产业技术体系最全、规模最大、层次最丰富的综合性学术交流年会。从官方获悉,本届年会征集了来自全国重点高校、科研机构、主机厂、高新企业等近1500篇有效论文投稿,经过组委会近半年的严格选拔,由轩辕智驾撰稿的《基于区域注意力的红外与可见光图像融合》论文被成功录用,并作为优秀论文在本次年会现场进行展示,本次入选充分体现了轩辕智驾在红外感知领域的技术能力和学术成果。
轩辕智驾科研论文《基于区域注意力的红外与可见光图像融合》,主题为通过区域注意力融合策略和多尺度卷积层(Multiscale convolutional layers),改善视觉感知融合效果。目的是为解决汽车单一传感器的局限性。例如,可见光摄像头在能见度较低(夜晚、雨雾天)和光线差(眩光)的情况下成像质量不佳,但在理想光线条件下擅长捕捉目标纹理信息。红外热成像能全天候、全气候运作,靠热辐射能捕捉人、车、动物等发热源,却无法提供丰富的纹理信息。在驾驶场景中,为了更好地进行后续的感知(检测、分割、预警)任务,需要更优质的图像信息,利用两种传感器的成像图像进行融合具有重要意义。而现有技术在融合两种图像时,存在融合效果不理想、算法稳定性和鲁棒性不足等问题,无法充分满足驾驶场景对视觉感知的需求。
为应对这一难题,轩辕智驾研发团队在论文中提到了一个新的观点:CSF算法依赖人为设计的融合策略,成为算法稳定性和鲁棒性的瓶颈。团队通过设计一组针对分类器的对比实验发现,随着迭代次数的增加,融合图像的视觉效果更差,相关系数(CC)和互信息(MI)等指标也变得更差,而分类器在 8000 次迭代之后就收敛了。
▲CSF训练-测试流程
通过消融实验,只在 CSF 的基础上将原先的融合模块替换成基于区域注意力的融合模块,进一步将编码器的卷积层替换成多尺度卷积层之后,融合效果得到进一步提升,所有指标均有所提高。
▲区域注意力融合模块的影响
实验结果
1
改善融合效果。多尺度卷积层能捕捉不同感受野的特征,更好地适应图像中不同区域的特征,提高编码器的语义表征能力。最终使得融合结果在细节保留、对比度、锐度等方面都有明显提升,可大幅改善现有融合算法中存在的融合图像细节丢失、对比度和锐度不足等问题,更好地满足了汽车驾驶场景对视觉感知的需求。
2
提升融合算法鲁棒性。基于区域注意力的融合策略能根据不同区域的特点合理分配权重,不再完全依赖分类器的结果,使得融合算法对分类器的敏感性降低,解决了 CSF 算法中因过度依赖分类器而导致的随着迭代次数增加融合效果变差的问题,提高了算法的稳定性和鲁棒性。
▲CSF不同迭代次数融合结果
分类器不同迭代次数融合结果客观指标
轩辕研发团队希望,通过区域注意力融合策略和多尺度卷积层的实验方法,改善融合图像的质量,提升算法的鲁棒性,满足可见光和双光图像融合的高标准视觉感知需求,为用户提供更安全的驾驶体验!
领取专属 10元无门槛券
私享最新 技术干货