首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Dynamic Anchor Learning for Arbitrary-Oriented Object Detection

    任意方向的目标广泛出现在自然场景、航拍照片、遥感图像等,任意方向的目标检测受到了广泛的关注。目前许多旋转检测器使用大量不同方向的锚点来实现与ground truth框的空间对齐。然后应用交叉-联合(IoU)方法对正面和负面的候选样本进行训练。但是我们观察到,选择的正锚点回归后并不能总是保证准确的检测,而一些阴性样本可以实现准确的定位。这说明通过IoU对锚的质量进行评估是不恰当的,进而导致分类置信度与定位精度不一致。本文提出了一种动态锚学习(DAL)方法,利用新定义的匹配度综合评价锚的定位潜力,进行更有效的标签分配过程。这样,检测器可以动态选择高质量的锚点,实现对目标的准确检测,缓解分类与回归的分歧。在新引入的DAL中,我们只需要少量的水平锚点就可以实现对任意方向目标的优越检测性能。在三个遥感数据集HRSC2016、DOTA、UCAS-AOD以及一个场景文本数据集ICDAR 2015上的实验结果表明,与基线模型相比,我们的方法取得了实质性的改进。此外,我们的方法对于使用水平边界盒的目标检测也是通用的。

    01

    Rank & Sort Loss for Object Detection and Instance Segmentation

    我们提出了秩和排序损失,作为一个基于秩的损失函数来训练深度目标检测和实例分割方法(即视觉检测器)。RS损失监督分类器,一个子网络的这些方法,以排名每一个积极高于所有的消极,以及排序积极之间关于。它们的连续本地化质量。为了解决排序和排序的不可微性,我们将错误驱动的更新和反向传播的结合重新表述为身份更新,这使我们能够在肯定的排序错误中建模。有了RS Loss,我们大大简化了训练:(I)由于我们的分类目标,在没有额外辅助头的情况下,由分类器对阳性进行优先排序(例如,对于中心度、IoU、掩码-IoU),(ii)由于其基于排序的特性,RS Loss对类不平衡是鲁棒的,因此,不需要采样启发式,以及(iii)我们使用无调整任务平衡系数来解决视觉检测器的多任务特性。使用RS Loss,我们仅通过调整学习速率来训练七种不同的视觉检测器,并表明它始终优于基线:例如,我们的RS Loss在COCO数据集上提高了(I)Faster R-CNN约3框AP,在COCO数据集上提高了约2框AP的aLRP Loss(基于排名的基线),(ii)在LVIS数据集上用重复因子采样(RFS)Mask R-CNN约3.5个屏蔽AP(稀有类约7个AP);

    02

    Robust Data Augmentation Generative Adversarial Networkfor Object Detection

    基于生成对抗性网络(GAN)的数据扩充用于提高目标检测模型的性能。它包括两个阶段:训练GAN生成器以学习小目标数据集的分布,以及从训练的生成器中采样数据以提高模型性能。在本文中,我们提出了一种流程化的模型,称为鲁棒数据增强GAN(RDAGAN),旨在增强用于目标检测的小型数据集。首先,将干净的图像和包含来自不同域的图像的小数据集输入RDAGAN,然后RDAGAN生成与输入数据集中的图像相似的图像。然后,将图像生成任务划分为两个网络:目标生成网络和图像翻译网络。目标生成网络生成位于输入数据集的边界框内的目标的图像,并且图像转换网络将这些图像与干净的图像合并。 定量实验证实,生成的图像提高了YOLOv5模型的火灾检测性能。对比评价表明,RDAGAN能够保持输入图像的背景信息,定位目标生成位置。此外,消融研究表明,RDAGAN中包括的所有组件和物体都发挥着关键作用。

    02
    领券