从RCNN到更快RCNN,再到最近的FPN和获得ICC Best Paper的面具RCNN,深度学习在物体检测中以绝对优势从众多机器学习算法中脱引而出。大家对Facebook的计算机视觉研究项目的开源期盼已久,经过1年多的漫长等待,今天Facebook终于开源了Detectron,Detectron开源项目使用caffe2和python接口。实现了10多篇计算机视觉最新的成果。下面我们简单介绍一下Detectron所实现的论文。并且对Detectron进行初次测试,我们会在随后的博客中更新我们自己测试得到的Detectron训练模型和速度标准。
快速的RCNN,更快的RCNN,RFCN,FPN,RetinaNet
Detectron实现了物体检测的标准模型,并且添加了功能金字塔网络和RetinaNet等最先进的物体检测模型.FPN是两阶段检测的最先进的,RetinaNet是一个阶段最好的模型,并且也是ICC最好的学生论文。
RESNET,ResNeXt
Detectron实现了Residual Network和ResNeXt等基础的神经网络结构.ResNext使用深度卷积的技术大大降低了参数,并且保证了分类结果。
人物交互检测
物体检测可以得到包围盒如图(a)所示,人与刀之间的关系如图(a)所示,人与物之间的相互作用通过预测不同的包围盒之间的关系。是切(切断)。
掩码RCNN
Mask RCNN通过改进更快RCNN可以实现7 FPS的实例分割和关键点检测,并且超过当前的所有方法.Mask RCNN在COCO和CITYSCAPES数据集上面取得了好的结果.Mask RCNN的示意图如下。
在一个小时内训练Imagenet
本文论文发现了大批量可以大量提升分类网络的收敛速度,通过把批量大小从256提升到8192,将训练时间从几周降低到了1个小时,大大提升了神将网络的训练速度。
CPR 2018投稿论文:学习分割一切
收集掩模rcnn的标注十分昂贵,在cityscapes上面一张图的标注需要1个小时。这篇论文提出了重量的办法来分割所有的物体,免去了收集分割数据的巨大时间和金钱耗费。本篇论文使用包围盒检测分支的权重来预测掩码分支的权重来实现此目的。
非局部神经卷积
卷积神经网络只能够传递邻域的信息,本篇论文参照非本地方法和自我注意的方法设计出了非本地卷积,从而能够捕捉到非邻域的信息。如下图,中心点可以捕捉到非邻域的重要信息。
Detectron框架初探
要使用Detectron框架需要安装caffe2,caffe2的安装请参照caffe2官网。然后参照INSTALL.md安装Detectron,Detectron提供了方便的测试和添加op功能。添加op具体参照test_zero_een_op.py。
Detectron框架包含config,demo,lib,tests和tools等文件夹.Config包含着各个模型的训练和测试参数,lib是detectron的核心文件夹,例如data loader,model builder,operator definition和utils(学习率等非核心函数)。
领取专属 10元无门槛券
私享最新 技术干货