首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何用Python快速实现YOLO目标检测?

1. 什么是目标检测?

拿上图 (用YOLOv3检测) 来说,目标检测 (Object Detection) 就是将图片中的物体用一个个矩形框框出来,并且识别出每个框中的物体是啥,而且最好的话是能够将图片的所有物体都框出来。

再来看下YOLOv3在视频上的效果:

总之,目标检测本质上包含两个任务:物体识别物体定位

2. 目标检测技术的概述

目前,基于深度学习(deep learning)的目标检测技术效果是最好的,这些技术模型可以分成三类:

R-CNN系列,包括R-CNN,Fast R-CNN,以及Faster R-CNN

Single Shot Detector (SSD)

You Only Look Once (YOLO)系列,其中YOLOv3是今天的主角

下面来简单说一下这些模型,SSD这里就不介绍了,感兴趣的话可自行去了解。

R-CNN系列

上图是Faster R-CNN模型的原理简图,技术细节可参考下面所提及的相关文章。

R-CNN系列的演化路径为:R-CNN Fast R-CNN Faster R-CNN

R-CNN 是第一个基于深度学习的目标检测模型,它属于two-stage方法,即将物体识别和物体定位分为两个步骤,分别完成。 详情见Girshick等人的第一篇相关文章:https://arxiv.org/abs/1311.2524,其原理大概为:(1) 预先找出图中物体可能出现的位置,即候选区域 (Region Proposal) 。利用图像中的纹理、边缘、颜色等信息,可以保证在选取较少窗口 (几千甚至几百) 的情况下保持较高的召回率 (Recall) 。(2) 然后将这些候选框送入CNN网络中进行识别分类。

R-CNN 方法的缺点是它太慢了;由于它采用外部的候选框算法,它也不是一个完整的端到端 (end-to-end) 检测器。

Girshick等人于2015年发表了第二篇论文Fast R-CNN,链接为:https://arxiv.org/abs/1504.08083。相对R-CNN,Fast R-CNN算法有了很大改进,即提高了精确度,并减少了执行前向网络计算所需的时间;然而,该模型仍然依赖于外部的候选框算法。

直到2015年的后续模型Faster R-CNN的出现,链接为:https://arxiv.org/abs/1506.01497。通过使用区域生成网络 (Region Proposal Network, RPN)来取代候选框算法,Faster R-CNN 最终成为真正的端到端目标检测器。

虽然R-CNN系列的精确度不断提高,但是R-CNN系列最大的问题是它的速度,即使使用GPU也只能达到5 FPS.

YOLO系列

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190815A0DDOV00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券