前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【CV中的特征金字塔】六,ECCV 2018 PFPNet

【CV中的特征金字塔】六,ECCV 2018 PFPNet

作者头像
BBuf
发布2020-03-21 11:24:41
6880
发布2020-03-21 11:24:41
举报
文章被收录于专栏:GiantPandaCV

论文全称:Parallel Feature Pyramid Network for Object Detection 论文链接:http://openaccess.thecvf.com/content_ECCV_2018/papers/Seung-Wook_Kim_Parallel_Feature_Pyramid_ECCV_2018_paper.pdf

1. 前言

今天来学习一下这篇ECCV 2018的网络PFPNet,它借鉴了SPP的思想并通过MSCA(多尺度语义融合)模块来进行特征融合,进而提出了PFPNet来提升目标检测算法的效果。PFPNet在结构上借鉴了SSD,而在特征融合上借鉴了SPP思想加宽了网络,同时这里提出的MSCA模块完成了类似于FPN的特征融合,最后基于融合后的特征再进行检测,最终PFPNet在多个BenchMark上获得了和CVPR 2018 RefineDet相似的性能。

2. 网络结构上的改进

下面的Figure1展示了目标检测算法在网络结构上经历的一些优化过程(注意这是截至到PFPNet以前)。

标检测算法在网络结构方面的优化历程

Figure1(a)上半部分的结构是直接通过一个网络结构得到特征,并基于该特征进行预测。而下半部分的结构则引入了特征金字塔,基于多个特征层进行预测,这和SSD的思想类似。

Figure1(b)中的2个网络则是引入了top-down结构和融合操作,也就是从高层到浅层的特征融合过程(Hourglass网络),这样预测层既有浅层的目标的位置信息(有利于定位)又有高层的目标的语义信息(有利于目标的识别),因此能有效提高目标的检测效果(尤其是小目标) 。然后这两个网络的区别是第一个是单级预测,第二个是多级预测类似FPN。

Figure1(c)展示了SPP网络。即对同一个特征图进行不同尺寸的池化操作获得不同尺度的特征图,将不同尺度的特征图concate之后再做预测,这样融合了多个尺度的特征也可以对检测效果有所提升。

Figure1(d)展示了这篇文章提出的PFPNet的结构示意图。首先也是通过SPP得到不同尺度的特征图,然后基于这些特征图通过MSCA模块得到融合后的特征,最后基于融合后的多层特征做预测。

3. PFPNet的整体结构

下面的Figure3展示了PFPNet的整体结构。

Figure 3

对于原始的输入图片,先通过一个BackBone网络提取特征,假设提取到的特征通道数是,然后将提取到的特征送入SPP网络获得不同尺度的特征图,用表示尺度的数量这里为3,得到的特征图通道数用表示,当然。然后再通过一个通道缩减操作将(b)中的特征图的通道缩减,也即是Bottleneck操作,缩减后的通道数用表示,公式是:。然后再通过MSCA操作得到融合后的特征图(对应(d)操作),得到的特征通道数是,最后基于融合后的多个特征图进行预测。

4. MSCA模块

下面的Figure4是MSCA模块的结构示意图。MSCA主要是基于特征通道的concate操作,但是输入特征有些特殊。

MSCA模块

在Figure4中,当得到P1这个融合后的特征时是用、下采样后的、上采样后的进行concate后得到的。

这个地方有个问题,为什么是使用而不是呢?

论文说的是相同尺度的特征信息要足够多,而部分得到的特征是未经过通道缩减的,因此在得到某一个尺度的预测层特征时,被融合的对应尺度特征都是采用部分的输出特征,而不是部分的输出特征。相比之下,不同尺度的待融合特征采用部分的输出特征,相当于补充信息。

5. 实验结果

下面的Table3展示了PFPNet在VOC数据集上的测试结果,需要说明的是PFPNet-S300表示anchor的初始化和SSD算法一样,PFPNet-R320表示初始anchor采用RefineDet算法的ARM模块得到的refine后的anchor来初始化。关于RefineDet请看:目标检测算法之CVPR 2018 RefineDet

可以看到PFPNet-S300和PFPNet-S512的性能和RefineDet差不多。

下面的Table4则展示了PFPNet在COCO数据集上的测试结果。

Table4

6. 参考

  • https://blog.csdn.net/u014380165/article/details/82468725

7. 推荐阅读

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-03-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 GiantPandaCV 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 前言
  • 2. 网络结构上的改进
  • 3. PFPNet的整体结构
  • 4. MSCA模块
  • 5. 实验结果
  • 6. 参考
  • 7. 推荐阅读
相关产品与服务
对象存储
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档