现在的实时目标检测算法,比如YOLO、SSD在GPU上已经可以跑的很快了,比如YOLOv2可以在GPU上跑到224fps,但在便携式笔记本甚至手机终端,这些算法还不能达到实时。
来自Georgia Institute of Technology、The Cooper Union、UNC Wilmington的研究人员日前发表的一篇文章,旨在解决在CPU上实时的目标检测,甚至其提出的YOLO-LITE 算法在网页上也能接近实时(10fps)。
下图展示了该文提出的算法的测试示例:
下图是现有的一些实时目标检测算法的计算量比较,这些算法都无法在仅有CPU的笔记本上实时。
那如何设计新的算法呢?作者的方法就是在Tiny-YOLOv2上进行各种调整和尝试,包括调整图像大小、层数、加不加BN层。
下图展示了调整得到的不同结构的性能和计算量:
下图是对上面各种调整后算法的解释:
最后选择的Trial3(NB)即是YOLO-LITE。
论文中实验的各种算法MAP和FPS的比较:
下图是YOLO-LITE与原始Tiny-YOLOv2的网络结构比较,主要的变换是,卷积层个数变少了(网络变窄),同时去除了BN层。
下图是YOLO-LITE在COCO上的测试结果,性能下降了不少,但fps达到Tiny-YOLOv2 十倍,SSD MobilenetV1的3.6倍。测试机器是Dell XPS 13笔记本。
作者又把算法移植到了网页中,达到10fps。
论文地址:
https://arxiv.org/abs/1811.05588v1
项目地址:
https://github.com/reu2018dl/yolo-lite