Object Detection via Aspect Ratio and Context Aware Region-based Convolutional Networks
https://arxiv.org/abs/1612.00534
本文针对目标检测问题在 R-FCN基础上提出了 ARC-RCNN,主要改进是使用了Aspect Ratio 和 Context 这两个信息。 通过增加计算量来提升性能。
我们要解决的问题如下图所示:
不管是一开始的 image warp 还是后来的 feature warp 都会引入artifacts,这里我们引入Aspect Ratio 和 Context 来修正。
整个系统流程图如下所示:
首先使用 CNN Backbone 提取卷积特征,计算Global Context 和 Local Context 特征图,使用 RPN 提取候选区域,对每个 RoI ,我们使用 m 个 Aspect ratio,每个 Aspect ratio 分布计算 roi,local global position-sensitive maps ,综合这三个特征,使用 Soft-MAX进行分类,并进行坐标回归。最后结合 m个 Aspect ratio 检测结果,取最好的作为输出。