Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >旋转目标检测 | SCRDet,适用于旋转、密集、小目标的检测器

旋转目标检测 | SCRDet,适用于旋转、密集、小目标的检测器

作者头像
Justlovesmile
发布于 2022-09-02 09:54:12
发布于 2022-09-02 09:54:12
1.4K00
代码可运行
举报
文章被收录于专栏:云+分享云+分享
运行总次数:0
代码可运行

1. 论文信息

论文标题:《SCRDet: Towards More Robust Detection for Small, Cluttered and Rotated Objects》

论文发表:ICCV2019 论文链接:https://openaccess.thecvf.com 论文代码:https://github.com/DetectionTeamUCAS

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
@inproceedings{yang2019scrdet,
  title={Scrdet: Towards more robust detection for small, cluttered and rotated objects},
  author={Yang, Xue and Yang, Jirui and Yan, Junchi and Zhang, Yue and Zhang, Tengfei and Guo, Zhi and Sun, Xian and Fu, Kun},
  booktitle={Proceedings of the IEEE/CVF International Conference on Computer Vision},
  pages={8232--8241},
  year={2019}
}

2. 归纳总结

标签

目的

方法

总结

#遥感 #注意力机制 #旋转目标检测

解决了遥感目标角度边界问题

IoU SmoothL1 Loss,多维注意力

从遥感目标的难点出发

3. 问题背景

遥感目标检测的难点:

  • 小目标(small size)
  • 密集(dense distribution)
  • 方向任意(arbitrary direction)

4. 主要工作

针对上述问题进行改进:

  • 对于小目标:通过特征融合和anchor采样角度出发设计了一个特征融合结构。
  • 对于密集排列问题:设计了一个有监督的多维注意力网络(supervised pixel attention network and the channel attention network)以减少背景噪声的不利影响。
  • 对于任意方向问题:通过添加IoU常数因子设计了一种改进的平滑L1损失,该因子专门用于解决旋转边界框回归的边界问题。

5. 相关工作

目标检测经典模型:

  • 两阶段:Fast R-CNN,Faster R-CNN,R-FCN
  • 单阶段:YOLO,SSD

针对小目标:RP-Faster R-CNN

6. 模型方法

整个框架基于Faster R-CNN based R2CNN实现,模型结构如下图:

主要包含三个部分:

  • SF-Net
  • MDA-Net
  • Rotation-Branch

6.1 SF-Net

针对小目标检测,作者认为特征融合有效采样是关键。对于anchor-based来说,anchor的铺设方式直接影响正样本采样率。经典的anchor铺设方式和特征图的分辩率有关,也就是anchor铺设的步长(C2-C5上的anchor步长分别是4,8,16,32)。随着网络加加深,特征图分辨率下降,anchor的步长扩大,常常会导致小目标的采样丢失,如下图所示:

文章通过resize的方式选取了一个合适的特征图分别率,尽可能保证小目标都被采样到,再加上简单的特征融合保证丰富的语义信息和位置信息。在这里之所以不使用C2,是因为遥感目标检测会设置较多的尺度和比例,那么在C2这个特征图上面的anchor就变得太多了,而且在遥感数据集中最小的目标一般也都在10像素以上(特指DOTA1.0DOTA1.5则给出了像素10以下的标注)。

6.2 MAD-Net

由于遥感图像背景的复杂性,RPN产生的建议区域可能引入大量噪声信息,如下图所示:

过多的噪音可能会混淆物体信息,物体之间的界限将变得模糊,导致漏检并增加虚警。因此,有必要增强物体特征并削弱非物体特征。为了更有效地捕捉复杂背景下小物体的特征,文章设计了一种有监督的多维注意力网络(MDA-Net),如下图所示。具体来说,在基于像素的注意网络中,特征图F3通过具有不同大小卷积核进行卷积运算,学习得到双通道的显著图(参见上图d)。这个显著图显示了前景和背景的分数。选择显著图中的一个通道与F3相乘,得到新的信息特征图A3(参见上图c)。需要注意的是,Softmax函数之后的显着图的值在[0,1]之间。换句话说,它可以降低噪声并相对的增强对象信息。由于显著图是连续的,因此不会完全消除背景信息,这有利于保留某些上下文信息并提高鲁棒性。

其实这个模块现在也是被用的比较烂了,就是空间注意力加通道注意力的组合。但在实际的应用过程中,空间注意力在遥感检测真的是非常有用的;

6.3 IoU-Smooth L1 Loss

首先我们要先了解一下两种旋转边界框的两种常见的方式,下图来自这篇文章的作者yangxue:

SCRDet是采用的opencv 表示法。在当前常用的旋转检测框的角度定义下,由于存在旋转角度的边界问题,会产生不必要的损失,如下图所示:

最理想的角度回归路线是由蓝色框逆时针旋转到红色框,但由于角度的周期性,导致按照这个回归方式的损失非常大(参见上图右边的Example)。此时模型必须以更复杂的形式回归(例如蓝色框顺时针旋转,同时缩放w和h),增加了回归的难度。为了更好地解决这个问题,我们在传统的smooth L1 损失函数中引入了IoU常数因子。在边界情况下,新的损失函数近似等于0,消除了损失的突增。新的回归损失可分为两部分,smooth L1回归损失函数取单位向量确定梯度传播的方向,而IoU表示梯度的大小,这样loss函数就变得连续。此外,使用IoU优化回归任务与评估方法的度量标准保持一致,这比坐标回归更直接和有效。IoU-Smooth L1 loss公式如下:

可以看一下两种loss在边界情况下的效果对比:

导致这种原因的根本原因是角度的预测超出了所定义范围。其实解决这种问题的方法并不唯一,RRPN和R-DFPN在论文的loss公式中就判断了是不是在定义范围内,通过加减k\pi来缓解这个问题,但这种做法明显不优美而且仍然存在问题,主要是较难判断超出预测范围几个角度周期。当然可以通过对角度部分的loss加一个周期性函数,比如tan、cos等三角函数来做,但是我在实际使用过程中常常出现不收敛的情况。对于边界问题,我其实还做了其他方法的研究,会在以后的文章中详细讨论。

7. 实验结果

消融实验:

对比实验:

8. 参考文献

旋转目标检测方法解读 (SCRDet, ICCV2019) - 知乎 (zhihu.com)

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
SCRDet:遥感旋转目标检测方法解读
作者:yangxue(论文一作) https://zhuanlan.zhihu.com/p/107400817 本文已由原作者授权,不得擅自二次转载
Amusi
2020/02/24
2.8K0
CVPR 2019 | 天秤座R-CNN:全面平衡的目标检测器
这是一篇浙江大学和香港中文大学发表于 CVPR 2019 的论文,这篇文章十分有趣,网友戏称:“无痛涨点,实现简单,良心 paper”,在我看来确实是这样的,没有太大的改造结构,不需增加计算成本的条件下,居然能涨两个点 mAP。
朱晓霞
2019/05/13
6340
CVPR 2019 | 天秤座R-CNN:全面平衡的目标检测器
CVPR 2019:精确目标检测的不确定边界框回归
大规模的目标检测数据集(例如MS-COCO)在进行Ground Truth框标注时仍然存在歧义。这篇论文提出了新的边界框回归损失针对目标框的移动以及位置方差进行学习,这种方法在几乎不增加计算量的基础上提高不同结构定位的准确性。另一个关键点是,由于学习了bounding box的分布,可以将其应用在NMS阶段合并相邻目标框,进一步提升定位的准确性。代码已开源。
AI科技评论
2019/09/17
1.6K0
CVPR 2019:精确目标检测的不确定边界框回归
[Intensive Reading]目标检测(object detection)系列(三) Fast R-CNN:end-to-end的愉快训练
目标检测系列: 目标检测(object detection)系列(一) R-CNN:CNN目标检测的开山之作 目标检测(object detection)系列(二) SPP-Net:让卷积计算可以共享 目标检测(object detection)系列(三) Fast R-CNN:end-to-end的愉快训练 目标检测(object detection)系列(四) Faster R-CNN:有RPN的Fast R-CNN 目标检测(object detection)系列(五) YOLO:目标检测的另一种打开方式 目标检测(object detection)系列(六) SSD:兼顾效率和准确性 目标检测(object detection)系列(七) R-FCN:位置敏感的Faster R-CNN 目标检测(object detection)系列(八) YOLOv2:更好,更快,更强 目标检测(object detection)系列(九) YOLOv3:取百家所长成一家之言 目标检测(object detection)系列(十) FPN:用特征金字塔引入多尺度 目标检测(object detection)系列(十一) RetinaNet:one-stage检测器巅峰之作 目标检测(object detection)系列(十二) CornerNet:anchor free的开端 目标检测(object detection)系列(十三) CenterNet:no Anchor,no NMS 目标检测(object detection)系列(十四)FCOS:用图像分割处理目标检测
chaibubble
2022/05/09
5240
[Intensive Reading]目标检测(object detection)系列(三) Fast R-CNN:end-to-end的愉快训练
任何方向都高度准确,上交、旷视联合提出最强旋转目标检测器R3Det
旋转目标检测是一项有挑战性的任务,因为难以定位多角度物体并且与背景准确和快速的分离。虽然已经取得了长足的进步,但在实际设置中,对于大宽高比,密集分布和类别不平衡的旋转目标检测仍然存在困难。
AI科技评论
2020/02/25
5.1K0
旋转目标检测 | IENet,单阶段Anchor-Free旋转目标检测模型
论文标题:《IENet: Interactive Embranchment Network Based One-Stage Anchor Free Detector for Orientational Aerial Object Detection》
Justlovesmile
2022/09/02
1.8K0
旋转目标检测 | IENet,单阶段Anchor-Free旋转目标检测模型
旋转目标检测 | R3Det,基于特征精炼的单阶段检测模型
对于边界框(x,y,w,h,\theta),其中x,y代表中心点坐标,w,h代表宽和高,\theta \in [-\frac{\pi}{2},0)代表角度,边界框回归的值为:
Justlovesmile
2022/04/11
3.3K0
旋转目标检测 | R3Det,基于特征精炼的单阶段检测模型
GWD:基于高斯Wasserstein距离的旋转目标检测 | ICML 2021
论文: Rethinking Rotated Object Detection with Gaussian Wasserstein Distance Loss
VincentLee
2022/06/29
1.5K0
GWD:基于高斯Wasserstein距离的旋转目标检测 | ICML 2021
RRC detection、CornerNet、M2Det、FOCS…你都掌握了吗?一文总结目标检测必备经典模型(三)
 机器之心专栏 本专栏由机器之心SOTA!模型资源站出品,每周日于机器之心公众号持续更新。 本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务,并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。 本文将分 3 期进行连载,共介绍 17 个在目标检测任务上曾取得 SOTA 的经典模型。 第 1 期:R-CNN、SPP-Net、Fast R-CNN、Faster R-C
机器之心
2023/03/29
1.2K0
RRC detection、CornerNet、M2Det、FOCS…你都掌握了吗?一文总结目标检测必备经典模型(三)
【深度学习】目标检测
目标检测(Object Detection)的任务是找出图像中所有感兴趣的目标(物体),确定它们的类别和位置,是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域最具有挑战性的问题。
杨丝儿
2022/03/01
2.9K0
【深度学习】目标检测
遥感旋转目标检测方法解读
说过,想设计一种没有边界问题的角度预测方法。这次我就来讲一下初步的进展,也是我最近的一个工作Circular Smooth Label (CSL)。简单来说,CSL总结了目前流行的基于回归方式的角度预测方法都有或多或少的边界问题,一个主要的原因是理想的预测结果超出了我们所定义的范围,导致产生一个较大的损失值,因此CSL通过将角度的回归问题转换成了一个分类问题,限制预测结果的范围来消除这一问题。
狼啸风云
2020/07/23
1.5K0
遥感旋转目标检测方法解读
YOLO 目标检测实战项目『原理篇』
在目标检测中,IoU 为预测框 (Prediction) 和真实框 (Ground truth) 的交并比。如下图所示,在关于小猫的目标检测中,紫线边框为预测框 (Prediction),红线边框为真实框 (Ground truth)。
机器视觉CV
2019/11/14
4K1
YOLO 目标检测实战项目『原理篇』
深度学习500问——Chapter08:目标检测(4)
我们将对单次目标检测器(包括SSD系列和YOLO系列等算法)进行综述。我们将分析FPN以理解多尺度特征图如何提高准确率,特别是小目标的检测,其在单次检测器中的检测效果通常很差。然后我们将分析Focal loss和RetinaNet,看看它们是如何解决训练过程中的类别不平衡问题的。
JOYCE_Leo16
2024/05/04
3470
深度学习500问——Chapter08:目标检测(4)
目标检测(Object Detection)
目标检测(Object Detection)的任务是找出图像中所有感兴趣的目标(物体),确定它们的类别和位置,是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域最具有挑战性的问题。
全栈程序员站长
2022/09/14
7.9K0
目标检测(Object Detection)
最全综述 | 图像目标检测
图片分类任务我们已经熟悉了,就是算法对其中的对象进行分类。而今天我们要了解构建神经网络的另一个问题,即目标检测问题。这意味着,我们不仅要用算法判断图片中是不是一辆汽车, 还要在图片中标记出它的位置, 用边框或红色方框把汽车圈起来, 这就是目标检测问题。其中“定位”的意思是判断汽车在图片中的具体位置。
AI算法与图像处理
2019/07/11
1.4K0
最全综述 | 图像目标检测
旋转目标检测 | FSDet,解决旋转特征不对齐与正负样本不均衡
论文标题:《Object Detection for Aerial Images With Feature Enhancement and Soft Label Assignment》
Justlovesmile
2022/11/01
1.7K0
旋转目标检测 | FSDet,解决旋转特征不对齐与正负样本不均衡
目标检测领域中的数据不均衡问题综述
paper链接:https://arxiv.org/abs/1909.00169.pdf
3D视觉工坊
2020/12/11
1.2K0
目标检测领域中的数据不均衡问题综述
目标检测算法之CVPR 2019 Guided Anchoring
看过前几天【CNN调参】目标检测算法优化技巧的同学应该知道,ASFF的作者在构建Stronger YOLOV3 BaseLine的时候就用到了Guided Anchoring这种Trick。这篇论文题目为《Region Proposal by Guided Anchoring》,中了CVPR 2019。这篇论文提出了一种新的Anchor生成方法Guided Anchoring,不同于以前的固定Anchor或者根据数据进行聚类Anchor的做法,通过Guided Anchoring可以预测Anchor的形状和位置得到稀疏的Anchor,另外作者提出了Feature Adaption模块使得Anchor和特征更加匹配。论文作者也在知乎上清晰的介绍了这项工作,感兴趣可以去看看作者是如何思考的。地址为:https://zhuanlan.zhihu.com/p/55854246。
BBuf
2020/04/01
6620
【TPAMI2020】目标检测中的不平衡问题:综述论文,34页pdf
作者:ChenJoya 知乎链接:https://zhuanlan.zhihu.com/p/82371629 本文已由作者授权转载,未经允许,不得二次转载。 本文介绍了一篇关于目标检测中不平衡的综述论
深度学习技术前沿公众号博主
2020/05/18
1.1K0
【TPAMI2020】目标检测中的不平衡问题:综述论文,34页pdf
深入浅出理解Faster R-CNN
。这个方法显然存在一些问题,比如当物体是不同大小有不同的宽高比,那训练一个效果很好的检测模型将会是非常复杂的(复杂的原因有两个,一个是如果整个图片很大,那么预测出的边界框坐标的绝对值变化很大,不容易拟合;第二个原因则是框的大小长宽都在变化,加大了我们的拟合难度)。另一个问题则是会存在一些无效的预测,比如当预测
CristianoC
2020/06/02
6420
推荐阅读
相关推荐
SCRDet:遥感旋转目标检测方法解读
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验