首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【传感器融合】开源 | MinkLoc++:激光雷达和单目图像融合的位置识别方法,性能SOTA!

【传感器融合】开源 | MinkLoc++:激光雷达和单目图像融合的位置识别方法,性能SOTA!

作者头像
CNNer
发布2021-12-10 11:20:50
发布2021-12-10 11:20:50
1.1K0
举报
文章被收录于专栏:CNNerCNNer

论文地址: http://arxiv.org/pdf/2104.05327v2.pdf

来源: Warsaw University of Technology

论文名称:MinkLoc++: Lidar and Monocular Image Fusion for Place Recognition

原文作者:Jacek Komorowski

内容提要

我们提出了一个基于一对传感器读数的判别多模态描述符:一个来自激光雷达的点云和一个来自RGB相机的图像。描述符名为MinkLoc++,可以用于机器人或自动驾驶汽车应用程序中的位置识别、重新定位和环路闭合。我们使用晚期融合方法,其中每个模态被单独处理,并在处理步骤的最后部分融合。该方法在标准位置识别基准上实现了最先进的性能。在训练多模态描述符时,我们也发现了支配态问题。当网络聚焦于对训练数据有较大过拟合的模态时,问题就会显现出来。这会在训练期间降低损失,但会导致评估集中的表现不佳。在这项工作中,我们描述了如何检测和减轻这种风险,使用深度度量学习方法训练多模态神经网络。

主要框架及实验结果

声明:文章来自于网络,仅用于学习分享,版权归原作者所有,侵权请加上文微信联系删除。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-12-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CNNer 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档