Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >TTFNet | 提高训练效率的实时目标检测

TTFNet | 提高训练效率的实时目标检测

作者头像
计算机视觉研究院
发布于 2020-07-03 08:36:55
发布于 2020-07-03 08:36:55
1.1K0
举报

作者:Edison_G

在目标检测模型的training time, inference speed, 和accuracy之间寻找trade off,重点关注如何在保持另外两个指标的情况下,减少模型的训练时间。 启示: 1、单纯的数据扩增能增加数据数量,但也会降低数据质量,导致需更多的训练时间才会收敛; 2、根据Linear Scaling Rule,学习率与batchsize一般情况下呈线性正比,增加高质量的sample也能起到类似batchsize的作用,从而可以提高学习率,缩短模型训练时间; 3、在精度方面,实验显示res18下与CenterNet都在COCO上达到了28.1的mAP,但0.5的mAP比CenterNet低了1个点左右,0.75的mAP比CenterNet高了0.6个点,所以猜测TTFNet可能检测出的bbox更加紧凑,因此提高了mAP。

简要

现在目标检测器很少能同时实现训练时间短,推理速度快,精度高。为了达到平衡,作者就提出了Train-Friendly Network(TTFNet)。作者从light-head, single-stage, and anchor-free设计开始,这使得推理速度更快。然后作者重点缩短训练时间。

我们注意到,从注释框中编码更多的训练样本与增加批处理大小具有相似的作用,这有助于扩大学习速率和加速训练过程。为此作者就介绍了一种利用高斯核对训练样本进行编码的新方法。此外,为了更好地利用信息,还设计了主动样本权重。在MSCOCO上的实验表明,TTFNet在平衡训练时间、推理速度和精度方面具有很大的优势。它比以前的实时检测器减少了7倍以上的训练时间,同时保持了最先进的性能。此外,super-fast版本的TTFNet-18和TTFNet-53可以分别是SSD300和YOLOv3的训练时间不到十分之一。

历史回顾&背景

目标检测器的精度,推理速度,训练时间等方面都得到了广泛关注和不断提高。然而,很少工作可以在它们之间取得良好的平衡。直观地说,推理速度较快的检测器应该有较短的训练时间。然而,事实上大多数实时检测器比非实时检测器需要更长的训练时间。高精度检测器可以大致分为两种类型之——它们的推理速度慢,而且需要大量的训练时间。

第一类网络(Huang, L.; Yang, Y.; Deng, Y.; and Yu, Y. 2015. Densebox: Unifying landmark localization with end to end object detection.)一般依靠heavy检测头或复杂后处理。虽然这些设计有利于精度的提高和快速收敛,但它们显著降低了推理速度。因此,这种类型的网络通常不适合实时应用。

为了加快推理,研究人员努力简化检测头和后处理,同时保持准确性(Zoph, B., and Le, Q. V. 2017. Neural architecture search with reinforcement learning.)。在最近的一项名为CenterNet的研究中,推理时间进一步缩短,几乎与主干网络消耗的时间相同。然而,所有这些网络不可避免地需要很长的训练时间。这是因为这些网络由于简化而难以训练,使得它们在很大程度上依赖于数据增强和较长的训练时间。例如,CenterNet需要在公共数据集MSCOCO上进行140个epochs训练。相比之下,第一类网络通常需要12个epochs。

动机 根据Linear Scaling Rule,可以通过增大batchsize提高learning rate,然而仔细分析SGD的公式,我们也可以通过增加高质量的正样本个数来起到同样的作用。也就是不仅可以增大n,也可以增大m。

回顾随机梯度下降(SGD)的公式,权重更新表达式可以描述为:

至于目标检测,图像x可以包含多个注释框,这些框将被编码到训练样本s∈Sx。Mx=|Sx|表示图像x中所有框产生的样本数, 因此上公式可以表述为:

为了简化,假设mx对于小批量B中的每个图像x是相同的。关注个体训练样本s,上式可以改写为:

线性缩放规则是在经验中发现的,如果批处理大小乘以k,则学习速率应该乘以k,除非网络正在迅速变化,或者采用非常大的mini-batch批处理。也就是说,用小的mini-batch Bj和学习速率η执行k迭代基本上相当于用大的mini-batch ∪j∈[0,k)Bj和学习速率kη执行1迭代,只有当我们可以假设:

这个条件通常是在大规模的真实世界数据下满足的。

较大的学习速率不能帮助CenterNet更快地收敛,并且删除数据增强会导致性能变差。根据上面的结论,我认为这是因为CenterNet在训练过程中只在目标中心编码一个单一的回归样本。这种设计使得CenterNet在很大程度上依赖于数据增强和较长的训练时间,导致不友好的训练时间。

为了减少网络对数据增强的依赖,同时减少训练时间,我认为需要更好的编码回归样本的策略。在这一动机的指导下,作者提出新的方法,在 ablation研究中进行更全面的实验可以进一步验证新方法的优越性。

新方法

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-06-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 计算机视觉战队 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
提高训练效率的实时目标检测(附源码)
现在目标检测器很少能同时实现训练时间短,推理速度快,精度高。为了达到平衡,作者就提出了Train-Friendly Network(TTFNet)。作者从light-head, single-stage, and anchor-free设计开始,这使得推理速度更快。然后作者重点缩短训练时间。
计算机视觉研究院
2020/07/07
8900
提高训练效率的实时目标检测(附源码)
开源 | CVPR2020 | 实时目标检测TTFNet采取高斯核的方式,提高了训练的学习率,减少了模型训练时间
现有的目标检测很少能同时达到训练时间短、推理速度快、精度高等目的。为了在两者之间取得平衡,本文提出了训练时间友好网络(Training-Time-Friendly Network, TTFNet)。在这项工作中,首先从轻头、单级和无锚的设计开始,这使快速推理速度成为可能。然后,我们专注于缩短训练时间。在实验过程中发现,从带标注的盒子中编码更多的训练样本与增加批处理大小具有类似的作用,都有助于扩大学习率并加速训练过程。为此,本文提出了一种利用高斯核对训练样本进行编码的新方法。此外,为了更好地利用信息,设计了初始样本权值。在MS COCO上的实验表明,TTFNet在平衡训练时间、推理速度和准确性方面具有很大的优势。与以前的实时检测器相比,它减少了超过7倍的训练时间,同时表现SOTA。与此同时,TTFNet-18和TTFNet-53的超高速版本训练时间分别比SSD300和YOLOv3的训练时间少了1/10。
CNNer
2020/06/19
1.3K0
开源 | CVPR2020 | 实时目标检测TTFNet采取高斯核的方式,提高了训练的学习率,减少了模型训练时间
目标检测 | AP-Loss:提高单阶段目标检测性能的分类损失,超越Focal loss
论文地址:https://arxiv.org/pdf/1904.06373v3.pdf
AI算法修炼营
2020/05/26
3.9K0
目标检测 | AP-Loss:提高单阶段目标检测性能的分类损失,超越Focal loss
干货 | 深度学习时代的目标检测算法
AI 科技评论按:本文作者 Ronald,首发于作者的知乎专栏「炼丹师备忘录」,AI 科技评论获其授权转发。 目前目标检测领域的深度学习方法主要分为两类:two stage 的目标检测算法;one s
AI科技评论
2018/03/07
1.7K0
干货 | 深度学习时代的目标检测算法
YOLOv6:又快又准的目标检测框架开源啦
总第518篇 2022年 第035篇 近日,美团视觉智能部研发了一款致力于工业应用的目标检测框架 YOLOv6,能够同时专注于检测的精度和推理效率。在研发过程中,视觉智能部不断进行了探索和优化,同时吸取借鉴了学术界和工业界的一些前沿进展和科研成果。在目标检测权威数据集 COCO 上的实验结果显示,YOLOv6 在检测精度和速度方面均超越其他同体量的算法,同时支持多种不同平台的部署,极大简化工程部署时的适配工作。特此开源,希望能帮助到更多的同学。 1. 概述 精度与速度远超 YOLOv5 和 YOLOX 的
美团技术团队
2022/06/27
2.6K0
YOLOv6:又快又准的目标检测框架开源啦
目标检测算法YOLOv4详解
YOLOv4是精度速度最优平衡, 各种调优手段是真香,本文主要从以下几个方面进行阐述:
智能算法
2020/11/17
16.4K0
目标检测算法YOLOv4详解
详细解读 | Google与Waymo教你如何更好的训练目标检测模型!!!(附论文)
通过更好的模型架构、训练和推理方法的结合,目标检测系统的速度-精度Pareto曲线得到了改进。在本文中系统地评估了各种各样的技术,以理解现代检测系统的大多数改进来自哪里。
集智书童公众号
2021/07/30
1K0
二阶优化!训练ImageNet仅需35个Epoch
随着神经网络的尺寸和训练数据的持续增长,人们对分布式计算的需求也逐渐增大。在深度学习中实现分布式并行的常用方式是使用数据并行方法,其中数据被分配进不同进程中,而模型在这些进程中重复。当每个模型的 mini-batch 大小保持不变,以增加计算/通信比时,整个系统上的 mini-batch 大小会随着进程数量成比例增长。
机器之心
2018/12/21
1.1K0
干货 | 基于深度学习的目标检测算法综述(二)
目标检测(Object Detection)是计算机视觉领域的基本任务之一,学术界已有将近二十年的研究历史。近些年随着深度学习技术的火热发展,目标检测算法也从基于手工特征的传统算法转向了基于深度神经网络的检测技术。从最初 2013 年提出的 R-CNN、OverFeat,到后面的 Fast/Faster R-CNN、SSD、YOLO 系列,再到 2018 年最近的 Pelee。短短不到五年时间,基于深度学习的目标检测技术,在网络结构上,从 two stage 到 one stage,从 bottom-up only 到 Top-Down,从 single scale network 到 feature pyramid network,从面向 PC 端到面向手机端,都涌现出许多好的算法技术,这些算法在开放目标检测数据集上的检测效果和性能都很出色。
磐创AI
2018/09/20
1.5K0
干货 | 基于深度学习的目标检测算法综述(二)
PPDet:减少Anchor-free目标检测中的标签噪声,小目标检测提升明显
论文地址:https://arxiv.org/pdf/2008.01167.pdf
AI算法修炼营
2020/08/13
1.5K0
利用Transformer进行端到端的目标检测及跟踪(附源代码)
多目标跟踪(MOT)任务的关键挑战是跟踪目标下的时间建模。现存的用检测跟踪的方法采用简单的heuristics,如空间或外观相似性。这些方法,尽管其共性,但过于简单,不足以建模复杂的变化,如通过遮挡跟踪。所以现有的方法缺乏从数据中学习时间变化的能力。
计算机视觉研究院
2023/08/24
5970
利用Transformer进行端到端的目标检测及跟踪(附源代码)
YOLO v4:物体检测的最佳速度和精度
您只需看一次(YOLO)是快速、准确的单阶段目标检测器。最近发布的YOLO v4与其他目标检测器相比,显示出非常好的结果。
小白学视觉
2020/08/04
3.5K0
YOLO v4:物体检测的最佳速度和精度
地平线机器人Waymo Open Dataset Challenge中2D目标检测赛道第二名方案解析
论文地址:https://arxiv.org/pdf/2006.15507.pdf
AI算法修炼营
2020/07/03
1.2K0
目标检测系列之五(YOLO V4)
论文题目《YOLOv4: Optimal Speed and Accuracy of Object Detection》 论文地址:https://arxiv.org/abs/2004.10934 论文代码:https://github.com/AlexeyAB/darknet
Minerva
2020/05/25
1.6K0
现代目标检测故事 | 40+种网络架构大盘点!从基础架构ResNet到最强检测器Yolov7再到最新部署神器GhostNetV2
目标检测是指在图像或视频中分类和定位物体的任务。由于其广泛的应用,最近几年目标检测受到了越来越多的关注。本文概述了基于深度学习的目标检测器的最新发展。同时,还提供了目标检测任务的基准数据集和评估指标的简要概述,以及在识别任务中使用的一些高性能基础架构,其还涵盖了当前在边缘设备上使用的轻量级模型。在文章的最后,我们通过以图表的形式直观地在多个经典指标上比较了这些架构的性能。
AiCharm
2023/05/15
1.5K0
现代目标检测故事 | 40+种网络架构大盘点!从基础架构ResNet到最强检测器Yolov7再到最新部署神器GhostNetV2
ICCV最佳检测之一:主动学习框架较大提升目标检测精度(附论文下载)
点击上方蓝字关注我们 计算机视觉研究院专栏 作者:Edison_G 新框架优于基于单模型的方法,并且以一小部分计算成本与基于多模型的方法相媲美! 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 论文下载|后台回复“主动学习”获取链接 关注并星标 从此不迷路 计算机视觉研究院 1 概括 主动学习旨在通过仅选择数据集上信息量最大的样本来降低标记成本。现有的工作很少涉及对象检测的主动学习。这些方法中的大多数基于多个模型或者是分类方法的直接扩展,因此仅使用分类头来估计图像
计算机视觉研究院
2022/05/18
4010
ICCV最佳检测之一:主动学习框架较大提升目标检测精度(附论文下载)
[Extensive Reading]目标检测(object detection)系列(十六)YOLOv4:平衡速度与精度
YOLOv4是YOLO之父Joseph Redmon宣布退出计算机视觉的研究之后推出的YOLO系列算法,其作者Alexey Bochkovskiy也参与了YOLO之前系列算法,《YOLOV4: Optimal Speed and Accuracy of Object Detection》,其主要贡献在于对近些年CNN领域中最优秀的优化策略,从数据处理、主干网络、网络训练、激活函数、损失函数等各个方面都有着不同程度的优化,组合出一个精度与速度兼备的结构。
chaibubble
2021/12/07
4850
[Extensive Reading]目标检测(object detection)系列(十六)YOLOv4:平衡速度与精度
一文总结目标检测
如有排版问题,可知乎查看:zhihu.com/column/c_1255545721723191296
枫桦
2022/08/02
8591
一文总结目标检测
无需NMS的目标检测,OneNet
目标检测是计算机视觉领域的基础性任务之一,并且赋能大量的下游应用。当前目标检测器存在的一大挑战是标签分配问题。特别地,如何定义每个目标的正样本和背景的负样本始终是一个悬而未决的难题。数十年来,目标检测中的正样本一直是候选框,它与真值框的 IoU 大于阈值。现代检测器在图像网格上预定义数千个锚框,并在这些候选框上执行分类和回归任务。这种基于框的标签分配方法被称为「框分配」。
计算机视觉
2021/01/12
8410
无需NMS的目标检测,OneNet
目标检测 | 丰富特征导向Refinement Network用于目标检测(附github源码)
研究者提出了一个单阶段检测框架,该框架解决了多尺度目标检测和类不平衡的问题。没有设计更深层的网络,而是引入了一种简单而有效的特征丰富化方案来生成多尺度的上下文特征。进一步引入了一种级联的优化(精炼)方案,该方案首先将多尺度的上下文特征注入到一阶段检测器的预测层中,以增强其进行多尺度检测的判别能力。其次,级联精炼方案通过细化anchors和丰富的特征以改善分类和回归来解决类不平衡问题。对于MS COCO测试上的320×320输入,新的检测器在单尺度推理的情况下以33.2的COCO AP达到了最先进的一阶段检测精度,操作是在一个Titan XP GPU上以21毫秒运行的 。对于MS COCO测试上的512×512输入,与最佳的单阶段结果相比,就COCO AP而言,新方法获得了一个明显的增加(增加了1.6%)。
计算机视觉研究院
2021/05/31
5860
目标检测 | 丰富特征导向Refinement Network用于目标检测(附github源码)
推荐阅读
提高训练效率的实时目标检测(附源码)
8900
开源 | CVPR2020 | 实时目标检测TTFNet采取高斯核的方式,提高了训练的学习率,减少了模型训练时间
1.3K0
目标检测 | AP-Loss:提高单阶段目标检测性能的分类损失,超越Focal loss
3.9K0
干货 | 深度学习时代的目标检测算法
1.7K0
YOLOv6:又快又准的目标检测框架开源啦
2.6K0
目标检测算法YOLOv4详解
16.4K0
详细解读 | Google与Waymo教你如何更好的训练目标检测模型!!!(附论文)
1K0
二阶优化!训练ImageNet仅需35个Epoch
1.1K0
干货 | 基于深度学习的目标检测算法综述(二)
1.5K0
PPDet:减少Anchor-free目标检测中的标签噪声,小目标检测提升明显
1.5K0
利用Transformer进行端到端的目标检测及跟踪(附源代码)
5970
YOLO v4:物体检测的最佳速度和精度
3.5K0
地平线机器人Waymo Open Dataset Challenge中2D目标检测赛道第二名方案解析
1.2K0
目标检测系列之五(YOLO V4)
1.6K0
现代目标检测故事 | 40+种网络架构大盘点!从基础架构ResNet到最强检测器Yolov7再到最新部署神器GhostNetV2
1.5K0
ICCV最佳检测之一:主动学习框架较大提升目标检测精度(附论文下载)
4010
[Extensive Reading]目标检测(object detection)系列(十六)YOLOv4:平衡速度与精度
4850
一文总结目标检测
8591
无需NMS的目标检测,OneNet
8410
目标检测 | 丰富特征导向Refinement Network用于目标检测(附github源码)
5860
相关推荐
提高训练效率的实时目标检测(附源码)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档