Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >干货!关于目标检测你需要看的9篇论文

干货!关于目标检测你需要看的9篇论文

作者头像
马上科普尚尚
发布于 2020-05-11 07:11:32
发布于 2020-05-11 07:11:32
9120
举报

关注文章公众号 回复"目标检测"获取本主题精选论文

目标检测是计算机视觉的核心任务之一。本期SFFAI15邀请了两位目标检测的一线科研人员,已有多篇顶会一作的张士峰和开源PyTorchCV的尤安升,同大家一起探讨目标检测的研究前沿以及一系列经典方法的实现细节。

您可以先仔细阅读,并带着问题来现场交流呦。

1

?????

推荐理由:微软亚研代季峰老师组的文章,可形变卷积网络的加强版。可变形卷积网络的特征支持空间比常规的卷积网络更符合目标结构,但这种支持远远超出感兴趣的区域,导致特征受到不相关图像内容的影响。为了解决这个问题,DCNv2对网络中可变形卷积进行更全面的集成,引入一种扩展变形建模范围的调制机制,增强了建模能力。为了有效地利用这种丰富的建模能力,其通过提出的特征模拟方案指导网络训练,该方案帮助网络学习特征,这些特征反应目标焦点和R-CNN网络分类能力的特征。

推荐理由来自:张士峰

2

?????

推荐理由:Larry S. Davis老师组继SNIP和SNIPER后又一力作,保持检测精度基本不掉的情况下,提高检测速度。该文章提出了一种高效的多尺度目标检测算法用于高效检测物体。这种算法使用了由粗到精的策略,只在那些可能有小物体存在的区域使用细粒度的检测。为了得到这些区域,其提出了一种称为FocusPixels的方法来预测小区域。同时为了配合FocusPixels高效的使用,设计了FocusChip来涵盖FocusPixels区域,以减少计算量。

推荐理由来自:张士峰

3

?????

推荐理由:该文章巧妙地利用关键点来表示物体方形包围框,即一个目标框可以由两个点(左上角和右下角)来表示,这样一个目标物体在预测的时候就可以直接预测两个类别的关键点,然后对两个类别的关键点进行组合即可生成对应的目标框,是One-Stage检测算法中一个较为有意思的尝试。

推荐理由来自:尤安升

4

?????

推荐理由:One-Stage算法中的经典算法,在既保证速度,又要保证精度的情况下 ,提出了一种在多尺度特征图上直接回归目标类别和位置的One-Stage检测框架。相比较于其他单阶段检测模型(YOLO),SSD通过设置Anchor Boxes和使用多尺度特征图,使得在取得了较高的精度的同时能保持较高的速度;相对于那些需要 object proposals 的两阶段检测模型(Faster R-CNN),SSD 完全取消了 proposals generation、pixel resampling或者 feature resampling这些阶段,更易于训练优化。后续One-Stage相关改进工作多基于该算法进行。

推荐理由来自:尤安升

推荐理由:SSD是一步法检测器的集大成者,达到跟接近二步法模型精度的同时,拥有比两阶段模型快一个数量级的速度。后续的单阶段模型工作大多基于SSD改进展开。SSD相当于多尺度的RPN来做物体检测,它利用多个尺度的检测层,分别关联大小合适的anchor box,使得不同尺度的物体在合适的特征层上被检测。同时不依靠逐区域操作的子网络,一次分类和回归得到最终的结果,取得了不错的检测精度以及较快的检测速度。

推荐理由来自:张士峰

5

???

推荐理由:Faster R-CNN是二步法检测器的奠基性工作,提出的RPN网络取代Selective Search算法使得检测任务可以由神经网络端到端地完成。Faster R-CNN = RPN + Fast R-CNN,跟RCNN共享卷积计算的特性使得RPN引入的计算量很小,使得Faster R-CNN可以在单个GPU上以5fps的速度运行,在当时到达了SOTA的精度。Faster R-CNN的成功之处在于用RPN网络完成了检测任务的深度化。使用滑动窗口生成anchor box的思想也在后来的工作中越来越多地被采用。这项工作奠定了"RPN+RCNN"的两阶段方法元结构,影响了大部分后续工作。

推荐理由来自:张士峰

推荐理由:Two-Stage算法中的经典算法,通过区域候选网络代替传统方法生成region proposals,极大地提高了Two-Stage检测算法的速度,至此Two-Stage检测算法基本确定, 后续相关工作多基于该算法进行改进,如FPN、R-FCN等目标检测算法。

推荐理由来自:尤安升

6

???

推荐理由:一步法检测器的网络结构,位置框和物体的类是在同一个特征提取层来做回归和分类预测的,这种的网络运算速度虽然快但是准确度不够高。RefineDet是基于SSD的改进算法,该算法主要是利用特征金字塔的上半部分来回归粗略位置参数来调整anchor的位置以及框的二分类(是否是物体的位置)任务,用下半部分相对于调整的anchor的参数来回归精细物体位置和框内物体的分类任务,从而保持一步法检测器的速度下,达到二步法的检测精度。

推荐理由来自:张士峰

7

???

推荐理由:人脸检测中存在着召回效率不够高,回归结果不够准的问题。为了解决这个问题,SRN选择性地在特征金字塔浅层使用二阶段分类,在特征金字塔深层使用二阶段回归,有效地提高了回归结果的准度以及召回效率。同时,为了引入多样化的感受野信息,有助于SRN检出极端尺度、姿态下的人脸,进一步设计了RFE模块。发表时,SRN在AFW、PASCAL face、FDDB、WIDER FACE上取得了最好的结果。

推荐理由来自:张士峰

8

???

推荐理由:类似于Faster R-CNN、FPN等,其Proposal网络对于正样本只设置了一个阈值,只做了一次较为宽松的约束,得到的Proposals结果较为粗糙,当对检测框的定位结果要求更为精确的时候就稍显不足。而Cascade R-CNN在获取Proposals的时候也采用逐步求精的策略,前一步生成的Proposals作为后一步的输入,通过控制正样本的交并比阈值不断提高Proposals的质量。

推荐理由来自:尤安升

9

???

推荐理由:该算法提出了IOU-Guided NMS,通过一个子网络获取每个Proposals的IOU得分,然后以IOU(交并比)得分作为NMS的排序依据,因为IOU得分直接反应了对应框的定位精确程度,优先考虑定位精度较高的框,防止定位精度较低但是其他得分较高的框被误排序到前面。

推荐理由来自:尤安升

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-12-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 人工智能前沿讲习 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
中星微夺冠国际人工智能算法竞赛,目标检测一步法精度速度双赢
---- 新智元推荐 来源:Pascal2 【新智元导读】日前,中星微把实际安防项目经验应用到PASCAL VOC数据集,并成功在一步法(one-stage)算法中取得了第一名的好成绩。中星微人工智能芯片技术公司董事长兼总经理张韵东表示:“中星微首次将安防监控应用经验与国际算法竞赛数据集相结合,使得嵌入式前端设备也能达到与云端智能相媲美的效果,取得了可喜可贺的成绩,但这只是一个的开始,相信未来会带来更多更精彩的内容。” 目标检测是机器视觉中一个最重要和最早研究领域之一,也是一切机器视觉任务基础,因此
新智元
2018/05/29
6690
最全综述 | 图像目标检测
图片分类任务我们已经熟悉了,就是算法对其中的对象进行分类。而今天我们要了解构建神经网络的另一个问题,即目标检测问题。这意味着,我们不仅要用算法判断图片中是不是一辆汽车, 还要在图片中标记出它的位置, 用边框或红色方框把汽车圈起来, 这就是目标检测问题。其中“定位”的意思是判断汽车在图片中的具体位置。
AI算法与图像处理
2019/07/11
1.4K0
最全综述 | 图像目标检测
干货 | 基于深度学习的目标检测算法综述(二)
目标检测(Object Detection)是计算机视觉领域的基本任务之一,学术界已有将近二十年的研究历史。近些年随着深度学习技术的火热发展,目标检测算法也从基于手工特征的传统算法转向了基于深度神经网络的检测技术。从最初 2013 年提出的 R-CNN、OverFeat,到后面的 Fast/Faster R-CNN、SSD、YOLO 系列,再到 2018 年最近的 Pelee。短短不到五年时间,基于深度学习的目标检测技术,在网络结构上,从 two stage 到 one stage,从 bottom-up only 到 Top-Down,从 single scale network 到 feature pyramid network,从面向 PC 端到面向手机端,都涌现出许多好的算法技术,这些算法在开放目标检测数据集上的检测效果和性能都很出色。
AI科技评论
2018/09/21
9670
干货 | 基于深度学习的目标检测算法综述(二)
目标检测最新总结与前沿展望
从 2006 年以来,在 Hilton、Bengio、LeChun 等人的引领下,大量深度神经网络的论文被发表,尤其是 2012 年,Hinton课题组首次参加 ImageNet图像识别比赛,其通过构建的 CNN 网络AlexNet[1]一举夺得冠军,从此神经网络开始受到广泛的关注。深度学习利用多层计算模型来学习抽象的数据表示,能够发现大数据中的复杂结构,目前,这项技术已成功地应用在包括计算机视觉领域在内的多种模式分类问题上。计算机视觉对于目标运动的分析可以大致分为三个层次:运动分割,目标检测;目标跟踪;动作识别,行为描述[2]。其中,目标检测既是计算机视觉领域要解决的基础任务之一,同时它也是视频监控技术的基本任务。由于视频中的目标具有不同姿态且经常出现遮挡、其运动具有不规则性,同时考虑到监控视频的景深、分辨率、天气、光照等条件和场景的多样性,而且目标检测算法的结果将直接影响后续的跟踪、动作识别和行为描述的效果。故即使在技术发展的今天,目标检测这一基本任务仍然是非常具有挑战性的课题,存在很大的提升潜力和空间。
SIGAI学习与实践平台
2018/10/12
5.1K0
目标检测最新总结与前沿展望
深度学习目标检测从入门到精通:第一篇
【导读】近日,CV-Tricks.com发布一篇文章,总结了近年来目标检测的各种方法。目标检测可谓是近年来计算机视觉领域热门的研究领域,也具有广阔的应用前景,如自动驾驶等。本文首先系统解释了图像分类和
WZEARW
2018/04/12
2.7K0
深度学习目标检测从入门到精通:第一篇
目标检测综述
这篇综述是我统计信号处理的作业,在这里分享一下,将介绍计算机视觉中的目标检测任务,论述自深度学习以来目标检测的常见方法,着重讲yolo算法,并且将yolo算法与其他的one-stage以及two-stage方法进行比较。
努力努力再努力F
2019/03/11
1.1K0
目标检测综述
干货 | 目标检测入门,看这篇就够了(上)
作者 | 李家丞( 同济大学数学系本科在读,现格灵深瞳算法部实习生) 近年来,深度学习模型逐渐取代传统机器视觉方法而成为目标检测领域的主流算法,本系列文章将回顾早期的经典工作,并对较新的趋势做一个全景式的介绍,帮助读者对这一领域建立基本的认识。(营长注:因本文篇幅较长,营长将其分为上、下两部分。) 导言:目标检测的任务表述 如何从图像中解析出可供计算机理解的信息,是机器视觉的中心问题。深度学习模型由于其强大的表示能力,加之数据量的积累和计算力的进步,成为机器视觉的热点研究方向。 那么,如何理解一张图片?
刘盼
2018/04/08
1.4K0
干货 | 目标检测入门,看这篇就够了(上)
[Intensive Reading]目标检测(object detection)系列(五)YOLO:目标检测的另一种打开方式
目标检测系列: 目标检测(object detection)系列(一) R-CNN:CNN目标检测的开山之作 目标检测(object detection)系列(二) SPP-Net:让卷积计算可以共享 目标检测(object detection)系列(三) Fast R-CNN:end-to-end的愉快训练 目标检测(object detection)系列(四) Faster R-CNN:有RPN的Fast R-CNN 目标检测(object detection)系列(五) YOLO:目标检测的另一种打开方式 目标检测(object detection)系列(六) SSD:兼顾效率和准确性 目标检测(object detection)系列(七) R-FCN:位置敏感的Faster R-CNN 目标检测(object detection)系列(八) YOLOv2:更好,更快,更强 目标检测(object detection)系列(九) YOLOv3:取百家所长成一家之言 目标检测(object detection)系列(十) FPN:用特征金字塔引入多尺度 目标检测(object detection)系列(十一) RetinaNet:one-stage检测器巅峰之作 目标检测(object detection)系列(十二) CornerNet:anchor free的开端 目标检测(object detection)系列(十三) CenterNet:no Anchor,no NMS 目标检测(object detection)系列(十四)FCOS:用图像分割处理目标检测
chaibubble
2022/05/09
3430
[Intensive Reading]目标检测(object detection)系列(五)YOLO:目标检测的另一种打开方式
强烈推荐 | 基于飞桨的五大目标检测模型实战详解
机器视觉领域的核心问题之一就是目标检测(object detection),它的任务是找出图像当中所有感兴趣的目标(物体),确定其位置和大小。对于人类来说,目标检测是一个非常简单的任务。然而,计算机能够“看到”的是图像被编码之后的数字,很难解图像或是视频帧中出现了人或是物体这样的高层语义概念,也就更加难以定位目标出现在图像中哪个区域。
用户1386409
2019/06/21
1.6K0
干货 | 基于深度学习的目标检测算法综述(一)
目标检测(Object Detection)是计算机视觉领域的基本任务之一,学术界已有将近二十年的研究历史。近些年随着深度学习技术的火热发展,目标检测算法也从基于手工特征的传统算法转向了基于深度神经网络的检测技术。从最初 2013 年提出的 R-CNN、OverFeat,到后面的 Fast/Faster R-CNN、SSD、YOLO 系列,再到 2018 年最近的 Pelee。短短不到五年时间,基于深度学习的目标检测技术,在网络结构上,从 two stage 到 one stage,从 bottom-up only 到 Top-Down,从 single scale network 到 feature pyramid network,从面向 PC 端到面向手机端,都涌现出许多好的算法技术,这些算法在开放目标检测数据集上的检测效果和性能都很出色。
AI科技评论
2018/08/21
8390
干货 | 基于深度学习的目标检测算法综述(一)
【TPAMI2020】目标检测中的不平衡问题:综述论文,34页pdf
作者:ChenJoya 知乎链接:https://zhuanlan.zhihu.com/p/82371629 本文已由作者授权转载,未经允许,不得二次转载。 本文介绍了一篇关于目标检测中不平衡的综述论
深度学习技术前沿公众号博主
2020/05/18
1.1K0
【TPAMI2020】目标检测中的不平衡问题:综述论文,34页pdf
目标检测领域不容错过的50篇论文简读
【GiantPandaCV导读】用深度学习网络来完成实际场景的检测任务已经是现在很多公司的常规做法了,但是检测网络是怎么来的,又是怎么一步步发展的呢?在检测网络不断迭代的过程中,学者们的改进都是基于什么思路提出并最终被证实其优越性的呢?
BBuf
2020/11/09
1.1K0
目标检测领域不容错过的50篇论文简读
[Intensive Reading]目标检测(object detection)系列(十) FPN:用特征金字塔引入多尺度
目标检测系列: 目标检测(object detection)系列(一) R-CNN:CNN目标检测的开山之作 目标检测(object detection)系列(二) SPP-Net:让卷积计算可以共享 目标检测(object detection)系列(三) Fast R-CNN:end-to-end的愉快训练 目标检测(object detection)系列(四) Faster R-CNN:有RPN的Fast R-CNN 目标检测(object detection)系列(五) YOLO:目标检测的另一种打开方式 目标检测(object detection)系列(六) SSD:兼顾效率和准确性 目标检测(object detection)系列(七) R-FCN:位置敏感的Faster R-CNN 目标检测(object detection)系列(八) YOLOv2:更好,更快,更强 目标检测(object detection)系列(九) YOLOv3:取百家所长成一家之言 目标检测(object detection)系列(十) FPN:用特征金字塔引入多尺度 目标检测(object detection)系列(十一) RetinaNet:one-stage检测器巅峰之作 目标检测(object detection)系列(十二) CornerNet:anchor free的开端 目标检测(object detection)系列(十三) CenterNet:no Anchor,no NMS 目标检测(object detection)系列(十四)FCOS:用图像分割处理目标检测
chaibubble
2022/05/10
4280
[Intensive Reading]目标检测(object detection)系列(十) FPN:用特征金字塔引入多尺度
目标检测算法之CVPR 2018 RefineDet
今天为大家介绍一篇CVPR 2018的一篇目标检测论文《Single-Shot Refinement Neural Network for Object Detection》,简称为RefineDet。RefineDet从网络结构入手,结合了one-stage目标检测算法和two-stage目标检测算法的优点重新设计了一个在精度和速度均为SOTA的目标检测网络。论文的思想值得仔细推敲,我们下面来一起看看。论文源码和一作开源的代码链接见附录。
BBuf
2019/12/24
8020
目标检测近年综述(文末有下载论文包)
发展论述:对于Overfeat、R-CNN方法,只是利用卷积神经网络进行特征提取,并没有改变搜索框提取目标区域的策略,算法的在速度上仍存在瓶颈。
计算机视觉研究院
2020/03/04
1K0
[Intensive Reading]目标检测(object detection)系列(十一) RetinaNet:one-stage检测器巅峰之作
目标检测系列: 目标检测(object detection)系列(一) R-CNN:CNN目标检测的开山之作 目标检测(object detection)系列(二) SPP-Net:让卷积计算可以共享 目标检测(object detection)系列(三) Fast R-CNN:end-to-end的愉快训练 目标检测(object detection)系列(四) Faster R-CNN:有RPN的Fast R-CNN 目标检测(object detection)系列(五) YOLO:目标检测的另一种打开方式 目标检测(object detection)系列(六) SSD:兼顾效率和准确性 目标检测(object detection)系列(七) R-FCN:位置敏感的Faster R-CNN 目标检测(object detection)系列(八) YOLOv2:更好,更快,更强 目标检测(object detection)系列(九) YOLOv3:取百家所长成一家之言 目标检测(object detection)系列(十) FPN:用特征金字塔引入多尺度 目标检测(object detection)系列(十一) RetinaNet:one-stage检测器巅峰之作 目标检测(object detection)系列(十二) CornerNet:anchor free的开端 目标检测(object detection)系列(十三) CenterNet:no Anchor,no NMS 目标检测(object detection)系列(十四)FCOS:用图像分割处理目标检测
chaibubble
2022/05/10
3810
[Intensive Reading]目标检测(object detection)系列(十一) RetinaNet:one-stage检测器巅峰之作
入门分享 | 12篇深度学习目标检测必读论文
本文梳理了目标检测领域2013年至2019年的12篇必读论文,为希望学习相关知识的新手提供了很好的入门路径。同时,作者还提供了一个附加论文列表。作为拓展阅读的内容,它们或为目标检测提供了新的视角,或用更强大的功能扩展了这个领域。
AI算法修炼营
2020/08/25
3.8K0
入门分享 | 12篇深度学习目标检测必读论文
目标检测资源总结
blog.csdn.net/l7H9JA4/article/details/79620247
用户3578099
2019/08/15
8770
角网络——目标检测(文后有paper地址及源码)
【导读】今天分享的技术提出了一种新目标检测方法,用单个卷积网络将目标边界框检测为一对关键点(即边界框的左上角和右下角)。通过将目标检测为成对关键点,消除现有的one stage检测器设计中对一组anchors的需要。除此之外,还引入了corner pooling,一种新型的池化层,可以帮助网络更好的定位边界框的角点。最终CornerNet在MS COCO上实现了42.1%的AP,优于所有现有的one stage检测器。
计算机视觉研究院
2019/06/14
5330
角网络——目标检测(文后有paper地址及源码)
干货 | 深度学习时代的目标检测算法
AI 科技评论按:本文作者 Ronald,首发于作者的知乎专栏「炼丹师备忘录」,AI 科技评论获其授权转发。 目前目标检测领域的深度学习方法主要分为两类:two stage 的目标检测算法;one s
AI科技评论
2018/03/07
1.7K0
干货 | 深度学习时代的目标检测算法
推荐阅读
相关推荐
中星微夺冠国际人工智能算法竞赛,目标检测一步法精度速度双赢
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档