Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >论文阅读学习 - Faster R-CNN

论文阅读学习 - Faster R-CNN

作者头像
AIHGF
修改于 2020-06-12 03:20:07
修改于 2020-06-12 03:20:07
5100
举报
文章被收录于专栏:AIUAIAIUAI

Faster R-CNN

[Paper - Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks]

[Code-Caffe]

摘要: 目标检测依赖于 region proposal 算法. Faster R-CNN 提出 Region Proposal Network(RPN),与检测网络共享整张图片的卷积特征,region proposal 计算量几乎很少. RPN 是全卷积网络,能够同时预测 object 边界和每个位置 object 的 score. RPNs 是 end-to-end 训练的,以生成高质量的 region proposals. Fast R-CNN 利用 region proposals 来进行目标检测. 基于 VGG-16,检测速率在 GPU 上是 5帧/秒.

Faster R-CNN 的基本结构

其大致可以包括四部分:

  • Conv Layers - 输入是 image,输出是提取的图片的 feature maps,被用作 RPN 和全连接层的共享特征;
  • RPN - 基于 feature maps 来生成 region proposals. 主要是对 anchors 采用 softmax 来确定其是 foreground 或 background,并对 anchors 进行 bounding box 回归,进而获得理想的 proposals;
  • RoI Pooling - 输入是 feature map 和 proposals,输出是提取的 proposal feature maps,被用于全连接层对类别判定;
  • Classifier - 基于 proposal feature maps 来对 proposal 的类别进行计算,并再次进行 bounding box 回归,以得到准确的 object 检测框位置.

1. Region Proposal Networks(RPN)

region-based 检测器(如 Fast R-CNN)用到的卷积特征图(feature maps),也可以用来生成 region proposals.

RPN 采用任意尺寸的图片作为输入,并输出 object proposals 的矩形框集合,每个矩形框都有一个 object score.

生成 region proposals 的过程:

  • 针对最后一个共享卷积层输出的 conv feature map,采用一个小网络对其平滑. 该小网络全连接到输入 conv feature map 的一个 n×n 的空间窗口(spatial window). 这里 n=3. n×n 的卷积层后接 ReLUs 层.
  • 每个滑窗被映射为一个低维向量(256-d/ZF,512-d/VGG).
  • 低维向量被输入到两个并列 1×1 的卷积层——边界框回归层(reg) 和边界框分类层(cls).

在实际网络中的 RPN 结构(VGG16-test.prototxt):

1.3 优化

  • RPN,全卷积网络,可以利用 SGD 和 BP 进行 end-to-end 的训练;
  • image-centric 的采样策略;
  • 每个 mini-batch 由包含许多 positive 和 negative anchors 的单张图片构成;
  • 随机采样一张图片的 256 个 anchors 来计算 mini-batch 的 loss,采样的 positive anchors 和 negative anchors 的比例为 1:1;如果一张图片的 positive anchors 少于 128,则用 negative anchors 来补全 mini-batch.
  • 采用均值为 0,方差为0.01 的 Gaussian 分布来初始化网络新加入的层;
  • 采用 ImageNet 分类任务的预训练模型来初始化其它网络层;
  • PASCAL 数据集上,前 60K 次 mini-batches,learning_rate=0.001,后 20K 次迭代,learning_rate=0.0001;
  • momentum=0.9,weight_decay=0.0005. ​

1.4 Region Proposal 和目标检测共享卷积层特征

4-step 训练算法,以通过交替优化来学习共享特征:

  • [1] - 训练 RPN;采用 ImageNet 训练模型进行网络初始化,并针对 region proposal 任务进行 end-to-end 的 fine-tuned.
  • [2] - 基于 RPN 生成的 proposals,采用 Fast R-CNN 来训练一个单独的检测网络;检测网络也是采用 ImageNet 训练模型初始化;此时,两个网络是不共享卷积层的.
  • [3] - 采用检测网络来初始化 RPN 的训练,但固定共享卷积层,只 fine-tune RPN 的网络层;现在,两个网络共享卷积层.
  • [4] - 固定共享卷积层,fine-tune Fast R-CNN 的 FC 层.

至此,两个网络共享了相同的卷积层,形成了统一网络.

2. 训练网络

3. 测试网络

Reference

[1] - 机器学习随笔 - Faster R-CNN

[2] - 机器视觉目标检测补习贴之R-CNN系列 — R-CNN, Fast R-CNN, Faster R-CNN

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2017年12月01日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
经典神经网络 | Faster R-CNN 论文解析
Faster R-CNN是为了改进Fast R-CNN而提出来的。因为在Fast R-CNN文章中的测试时间是不包括search selective时间的,而在测试时很大的一部分时间要耗费在候选区域的提取上。所以作者提出了RPN来提取候选框,使时间大大的减少了。
墨明棋妙27
2022/09/23
7440
经典论文解读 : Faster R-CNN,RPN网络的诞生
《Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks》,该论文由CV领域大牛RGB和何凯明于2016年发表,此篇论文堪称经典论文之一。
唐国梁Tommy
2021/05/28
5.6K0
经典论文解读 :  Faster R-CNN,RPN网络的诞生
02. OCR学习路径之文本检测(上)Faster R-CNN算法简介
由于目前已经几乎不再使用传统的方法来做OCR,后续我们主要分享基于深度学习的OCR算法。该算法一般需要训练两个模型,一个是文本检测模型,一个是文字识别模型。
Aalto
2019/10/21
3.2K0
02. OCR学习路径之文本检测(上)Faster R-CNN算法简介
Faster R-CNN算法
  Faster R-CNN算法是作者Ross Girshick对Fast R-CNN算法的一种改进。Fast R-CNN在速度和精度上都有了不错的结果,但仍有一些不足之处。Faster R-CNN算法同样使用VGG-16网络结构,检测速度在GPU上达到5fps(包括候选区域的生成),准确率也有进一步的提升。在ILSVRC和COCO 2015竞赛中获得多个项目的第一名。在Faster R-CNN中提出了区域生成网络(Region Proposal Network,RPN),将候选区域的提取和Fast R-CNN中的目标检测网络融合到一起,这样可以在同一个网络中实现目标检测。Faster R-CNN主要是解决Fast R-CNN存在的问题:
全栈程序员站长
2022/10/04
6370
Faster R-CNN算法
Faster R-CNN
Fast-RCNN基本实现端对端(除了proposal阶段外),下一步自然就是要把proposal阶段也用CNN实现(放到GPU上)。这就出现了Faster-RCNN,一个完全end-to-end的CNN对象检测模型。
CreateAMind
2018/07/24
5340
Faster R-CNN
目标检测系列之二(R-CNN、Fast R-CNN、Faster R-CNN、Mask R-CNN)
目标检测系列之二(R-CNN、Fast R-CNN、Faster R-CNN、Mask R-CNN)
Minerva
2020/05/25
1.3K0
R-CNN目标检测第三弹(Faster R-CNN)
今天,重看了 R-CNN 的终极改进版本 Faster R-CNN(NIPS 版)-本文提到的paper,若为特别指明,说的就是此版本。 先说一个学术趣事吧,R-CNN 的 一作是RGB大神,大神的导师也是DPM检测方法的作者;受到微软亚研院 Kaiming HeRGB博士SPP-Net工作的启发,RGB大神博士毕业后在微软 redmond 研究院做出了 Fast R-CNN;而本篇paper,则是Kaiming 和 RGB的合作产生;今年CVPR17 的mask R-CNN也是两位大神的大作。大神们的合
用户1332428
2018/03/09
9050
论文阅读学习 - Fast R-CNN
R-CNN 采用深度网络来对 object proposals 分类以进行目标检测,其缺点如下:
AIHGF
2019/02/18
4690
重温目标检测--Faster R-CNN
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks NIPS2015 https://github.com/ShaoqingRen/faster_rcnn
用户1148525
2019/05/27
6540
RCNN学习笔记(7):Faster R-CNN 英文论文翻译笔记
reference link:http://blog.csdn.net/liumaolincycle/article/details/48804687
CreateAMind
2018/07/24
1.5K0
RCNN学习笔记(7):Faster R-CNN 英文论文翻译笔记
【深度学习】从R-CNN到Mask R-CNN的思维跃迁
发现之前写R-CNN系列的文章,侧重于结构设计层面的,比较零散,我写一个侧重于从R-CNN到Mask R-CNN设计思路是如何演变的,对R-CNN、Fast R-CNN、Faster R-CNN和Mask R-CNN四篇巨作有一个宏观上的认知,R-CNN系列的思维跃迁堪称科研教科书,希望大家能从中得到一些如何做研究的启发。
黄博的机器学习圈子
2021/07/07
6460
【深度学习】从R-CNN到Mask R-CNN的思维跃迁
MMDetection学习系列(1)——Faster RCNN深度探索与实战指南
目标检测是当前计算机视觉领域内研究的一个热点,与图像分类不一样的是,目标检测不仅要准确地识别出图像中目标的类别,还要准确的定位该目标的位置,并用边界框把目标框起来。
CoovallyAIHub
2025/01/15
3130
MMDetection学习系列(1)——Faster RCNN深度探索与实战指南
一文读懂Faster RCNN
来源:信息网络工程研究中心 本文约7500字,建议阅读10+分钟 本文从四个切入点为你介绍Faster R-CNN网络。 经过R-CNN和Fast RCNN的积淀,Ross B. Girshick在2016年提出了新的Faster RCNN,在结构上,Faster RCNN已经将特征抽取(feature extraction),proposal提取,bounding box regression(rect refine),classification都整合在了一个网络中,使得综合性能有较大提高,在检测速度方
数据派THU
2023/03/29
1.1K0
一文读懂Faster RCNN
目标检测--Faster R-CNN
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
用户1148525
2019/05/26
5170
论文阅读学习 - CTPN-Detecting Text in Natural Image with Connectionist Text Proposal Network
CTPN(Connectionist Text Proposal Network),end-to-end 框架:
AIHGF
2019/02/18
9960
Object Detection系列(四) Faster R-CNN
本文介绍了Faster R-CNN目标检测算法及其实现,重点讲解了Faster R-CNN的算法原理和具体实现。
chaibubble
2018/01/08
9960
Object Detection系列(四) Faster R-CNN
[Intensive Reading]目标检测(object detection)系列(四) Faster R-CNN:有RPN的Fast R-CNN
目标检测系列: 目标检测(object detection)系列(一) R-CNN:CNN目标检测的开山之作 目标检测(object detection)系列(二) SPP-Net:让卷积计算可以共享 目标检测(object detection)系列(三) Fast R-CNN:end-to-end的愉快训练 目标检测(object detection)系列(四) Faster R-CNN:有RPN的Fast R-CNN 目标检测(object detection)系列(五) YOLO:目标检测的另一种打开方式 目标检测(object detection)系列(六) SSD:兼顾效率和准确性 目标检测(object detection)系列(七) R-FCN:位置敏感的Faster R-CNN 目标检测(object detection)系列(八) YOLOv2:更好,更快,更强 目标检测(object detection)系列(九) YOLOv3:取百家所长成一家之言 目标检测(object detection)系列(十) FPN:用特征金字塔引入多尺度 目标检测(object detection)系列(十一) RetinaNet:one-stage检测器巅峰之作 目标检测(object detection)系列(十二) CornerNet:anchor free的开端 目标检测(object detection)系列(十三) CenterNet:no Anchor,no NMS 目标检测(object detection)系列(十四)FCOS:用图像分割处理目标检测
chaibubble
2022/05/09
4460
[Intensive Reading]目标检测(object detection)系列(四) Faster R-CNN:有RPN的Fast R-CNN
PaddlePaddle实战 | 经典目标检测方法Faster R-CNN和Mask R-CNN
机器视觉领域的核心问题之一就是目标检测(objectdetection),它的任务是找出图像当中所有感兴趣的目标(物体),确定其位置和大小。作为经典的目标检测框架FasterR-CNN,虽然是2015年的论文,但是它至今仍然是许多目标检测算法的基础,这在飞速发展的深度学习领域十分难得。而在FasterR-CNN的基础上改进的MaskR-CNN在2018年被提出,并斩获了ICCV2017年的最佳论文。Mask R-CNN可以应用到人体姿势识别,并且在实例分割、目标检测、人体关键点检测三个任务都取得了很好的效果。因此,百度深度学习框架PaddlePaddle开源了用于目标检测的RCNN模型,从而可以快速构建强大的应用,满足各种场景的应用,包括但不仅限于安防监控、医学图像识别、交通车辆检测、信号灯识别、食品检测等等。
用户1386409
2019/06/10
2.4K0
PaddlePaddle实战 | 经典目标检测方法Faster R-CNN和Mask R-CNN
faster rcnn 详解
经过R-CNN和Fast RCNN的积淀,Ross B. Girshick在2016年提出了新的Faster RCNN,在结构上,Faster RCNN已经将特征抽取(feature extraction),proposal提取,bounding box regression(rect refine),classification都整合在了一个网络中,使得综合性能有较大提高,在检测速度方面尤为明显。
全栈程序员站长
2021/06/17
8040
faster rcnn 详解
fasterrcnn详解_faster RCNN
paper:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks Tensorflow-faster r-cnn github:Tensorflow Faster RCNN for Object Detection
全栈程序员站长
2022/11/10
1K0
fasterrcnn详解_faster RCNN
推荐阅读
相关推荐
经典神经网络 | Faster R-CNN 论文解析
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档