这篇有关Focal Loss的paper是何恺明大神提出的又一经典paper,除了提出Focal Loss还提出了RetinaNet,这里就先不对RetinaNet做介绍,单纯讲讲Focal Loss
two-stage和one-stage。前者的代表算法是R-CNN系列,可以达到很高的准确率,但是速度较慢。后者是指像YOLO这样直接回归的检测算法,这类算法速度很快,但是准确率不如前者。作者提出Focal Loss的出发点也是希望one-stage的算法可以达到two-stage算法的准确率,同时不影响原有的速度。(1) training is inefficient as most locations are easy negatives that contribute no useful learning signal; (2) en masse, the easy negatives can overwhelm training and lead to degenerate models.
Focal Loss,这个损失函数是在标准交叉熵损失基础上修改得到的。这个函数可以通过减少易分类样本的权重,使得模型在训练时更专注于优化难分类的样本。为了证明Focal Loss的有效,作者设计了一个新的检测网络:RetinaNet,并且在训练时采用Focal Loss训练。实验证明RetinaNet不仅可以达到one-stage detector的速度,也能有two-stage detector的准确率。

[https://arxiv.org/abs/1708.02002](https://arxiv.org/abs/1708.02002)