开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

为什么要在为YOLO和SSD模型创建数据集时进行注记

在为YOLO和SSD模型创建数据集时进行注记的目的是为了标注和标识图像中的目标物体，以便训练模型能够准确地识别和定位这些目标。

注记是指在图像上绘制边界框或者进行像素级的标记，用于指示目标物体的位置和类别。通过注记数据集，可以为模型提供有监督的训练样本，使其能够学习到目标物体的特征和属性。

具体来说，注记数据集的重要性体现在以下几个方面：

目标定位：注记可以精确地标记出图像中的目标物体的位置和边界框，使模型能够准确地定位和识别目标。这对于目标检测任务非常关键，因为模型需要知道目标物体在图像中的具体位置。
目标分类：注记可以为每个目标物体分配一个类别标签，使模型能够学习到不同类别目标的特征和属性。这对于目标分类任务非常重要，因为模型需要能够识别不同类别的目标。
数据增强：注记数据集还可以用于进行数据增强，通过在注记的基础上进行一些变换和扩充，生成更多的训练样本。这有助于提高模型的泛化能力和鲁棒性。
模型评估：注记数据集可以用于评估模型的性能和准确度。通过将注记应用于测试集上的图像，可以计算出模型的精确度、召回率等指标，从而评估模型的性能。

在为YOLO和SSD模型创建数据集时进行注记是非常重要的，因为这两种模型都是基于目标检测的算法，需要准确地定位和识别图像中的目标物体。通过注记数据集，可以为模型提供有监督的训练样本，使其能够学习到目标物体的特征和属性，从而提高模型的准确性和性能。

腾讯云提供了一系列与图像识别和目标检测相关的产品和服务，例如腾讯云图像识别（https://cloud.tencent.com/product/imagerecognition）、腾讯云视觉智能（https://cloud.tencent.com/product/visionai）等，可以帮助用户进行图像注记和目标检测任务。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

目标检测|YOLOv2原理与实现(附YOLOv3)

在前面的一篇文章中，我们详细介绍了YOLOv1的原理以及实现过程。这篇文章接着介绍YOLOv2的原理以及实现，YOLOv2的论文全名为YOLO9000: Better, Faster, Stronger，它斩获了CVPR 2017 Best Paper Honorable Mention。在这篇文章中，作者首先在YOLOv1的基础上提出了改进的YOLOv2，然后提出了一种检测与分类联合训练方法，使用这种联合训练方法在COCO检测数据集和ImageNet分类数据集上训练出了YOLO9000模型，其可以检测超过9000多类物体。所以，这篇文章其实包含两个模型：YOLOv2和YOLO9000，不过后者是在前者基础上提出的，两者模型主体结构是一致的。YOLOv2相比YOLOv1做了很多方面的改进，这也使得YOLOv2的mAP有显著的提升，并且YOLOv2的速度依然很快，保持着自己作为one-stage方法的优势，YOLOv2和Faster R-CNN, SSD等模型的对比如图1所示。这里将首先介绍YOLOv2的改进策略，并给出YOLOv2的TensorFlow实现过程，然后介绍YOLO9000的训练方法。近期，YOLOv3也放出来了，YOLOv3也在YOLOv2的基础上做了一部分改进，我们在最后也会简单谈谈YOLOv3所做的改进工作。

04

重磅！YOLO-LITE来了（含论文精读和开源代码）

看名字，就知道属于YOLO系列。这篇文章于2018年11月15日首发在arXiv上，考虑到该work开源了，于是Amusi就特意深挖一下推荐给大家。

02

面部识别算法是如何工作的？

过去十年，深度学习领域出现了许多先进的新算法和突破性的研究，并且引入了新的计算机视觉算法。

02

CVPR 2019 | 京东AI研究院提出 ScratchDet：随机初始化训练SSD目标检测器

使用 ImageNet 预训练的网络模型能够帮助目标任务（物体检测、语义分割、细粒度识别等）快速收敛，然而使用预训练模型会带来诸多限制，其中一个问题就是改动特征提取网络的结构成本相对较高，需要耗时巨大的重新预训练来适应不同需求的任务。那么，如果不使用预训练模型，进行随机初始化训练，达到较高准确率的某些必要条件是什么？

02

2019 年的目标检测指南

目标检测在视频监控、自动驾驶汽车、目标/人跟踪等领域得到了广泛的应用。在本文中，我们将了解目标检测的基础知识，并回顾一些最常用的算法和一些全新的方法。

03

基于深度学习的计算机视觉应用之目标检测

目标检测作为图像处理和计算机视觉领域中的经典课题,在交通监控、图像检索、人机交互等方面有着广泛的应用。它旨在一个静态图像(或动态视频)中检测出人们感兴趣的目标对象。传统的目标检测算法中特征提取和分类决策分开进行，对特征选取的要求就更加严格，在面对复杂场景的时候很难得到理想效果。自Hinton教授提出深度学习理论，越来越多的研究人员发现在目标检测领域应用深度学习，可以有效提高检测效果和性能，于是深度学习在实时视频的目标检测开始获得大规模的应用。时至今日，其检测效率和精度已经有了极大提高。传统检测算法传

07

前Twitter资深工程师详解YOLO 2与YOLO 9000目标检测系统

AI研习社按：YOLO是Joseph Redmon和Ali Farhadi等人于2015年提出的第一个基于单个神经网络的目标检测系统。在今年CVPR上，Joseph Redmon和Ali Farhadi发表的YOLO 2进一步提高了检测的精度和速度。这次讲座的主讲人为王东，前硅谷资深工程师。讲解顺序和论文结构类似，先讲YOLO 2的网络结构，重点分析如何产生目标边框和分类，以及相关的损失函数。训练YOLO 2的第一步是在ImageNet上预先学习darknet-19，在224x224图像上，它仅需5.58

06

深度 | 详解CVPR2017最佳论文提名的 YOLO 2与 YOLO 9000物体检测系统

AI 科技评论按：YOLO是Joseph Redmon和Ali Farhadi等人于2015年提出的第一个基于单个神经网络的目标检测系统。在今年CVPR上，Joseph Redmon和Ali Farhadi发表的YOLO 2进一步提高了检测的精度和速度。这次 AI 科技评论邀请到了前硅谷资深工程师王东为大家详细解读 YOLO 2和 YOLO 9000的技术细节。讲解顺序和论文结构类似，先讲YOLO 2的网络结构，重点分析如何产生目标边框和分类，以及相关的损失函数。训练YOLO 2的第一步是在ImageNe

07

目标检测干货 | 多级特征重复使用大幅度提升检测精度

近年来，在利用深度卷积网络检测目标方面取得了显著进展。然而，很少有目标检测器实现高精度和低计算成本。今天分享的干货，就有研究者提出了一种新的轻量级框架，即多级特性重用检测器(MFRDet)，它可以比两阶段的方法达到更好的精度。它还可以保持单阶段方法的高效率，而且不使用非常深的卷积神经网络。该框架适用于深度和浅层特征图中包含的信息的重复利用，具有较高的检测精度。

03

口罩、安全帽识别比赛踩坑记（二）比赛流程及 SSD / YOLO V3 两版本实现[通俗易懂]

本篇文章主要对比赛流程中的各个环节进行展开说明，并对笔者践行过的代码及更改的地方进行记录。如哪里有侵权请联系笔者进行删除。另外在这里对比赛举办方表示感谢 ~ ~

02

深度学习——目标检测（3）YOLO1SSD

前言：RCNN系列一般都是分为两个步骤，下面介绍one-stage方法，SSD和yolo算法目标检测近年来已经取得了很重要的进展，主流的算法主要分为两个类型：（1）two-stage方法，如R-CNN系算法，其主要思路是先通过启发式方法（selective search）或者CNN网络（RPN)产生一系列稀疏的候选框，然后对这些候选框进行分类与回归，two-stage方法的优势是准确度高；（2）one-stage方法，如Yolo和SSD，其主要思路是均匀地在图片的不同位置进行密集抽样，抽样时可以采用不同尺度和长宽比，然后利用CNN提取特征后直接进行分类与回归，整个过程只需要一步，所以其优势是速度快，但是均匀的密集采样的一个重要缺点是训练比较困难，这主要是因为正样本与负样本（背景）极其不均衡（参见Focal Loss），导致模型准确度稍低。各种方法速度如下：

01

计算机视觉之SSD目标检测

SSD是一种单阶段目标检测算法，通过卷积神经网络进行特征提取，并在不同的特征层进行检测输出，实现多尺度检测。它采用了anchor的策略，预设不同长宽比例的anchor，并在每个输出特征层上预测多个检测框。SSD框架包括了多尺度检测方法，浅层用于检测小目标，深层用于检测大目标。

01

MMDetection | 它来了它来了！两款轻量级检测模型上线了！

首先鸣谢 @hokmund、@ElectronicElephant 等社区同学为本文提及的技术点做出的卓越贡献！期待更多社区伙伴加入算法优化工作中来~

02

目标检测干货 | 多级特征重复使用大幅度提升检测精度（文末附论文下载）

计算机视觉研究院专栏作者：Edison_G 近年来，在利用深度卷积网络检测目标方面取得了显著进展。然而，很少有目标检测器实现高精度和低计算成本。公众号ID｜ComputerVisionGzq 学习群｜扫码在主页获取加入方式一、简要近年来，在利用深度卷积网络检测目标方面取得了显著进展。然而，很少有目标检测器实现高精度和低计算成本。今天分享的干货，就有研究者提出了一种新的轻量级框架，即多级特性重用检测器(MFRDet)，它可以比两阶段的方法达到更好的精度。它还可以保持单阶段方法的高效率，而且不使用非

03

YOLO v4 : 基于数据集BCCD，从头开始配置文件，训练一个模型

哈喽，大家好，今天我将手把手教大家如何基于一个新的数据集BCCD(血细胞数据集)，训练一个YOLO v4目标检测与识别模型。

02

深度学习算法优化系列十五 | OpenVINO Int8量化前的数据集转换和精度检查工具文档

可以看到在用Calibaration Tool进行Int8量化之前需要先解决如何将我们的原始数据集转为Annotations文件以及我们如何用精度检查工具(Accuracy Checker Tool)去评估我们的量化后模型的表现。其中将原始数据集转换为Annotations文件的时候用命令是比较方便，如果懒得写配置文件的话。而要使用精度检查工具，则必须写配置文件了，具体见本文后面的详细介绍。

01

教程 | 单级式目标检测方法概述：YOLO与SSD

在这篇文章中，我将概述用于基于卷积神经网络（CNN）的目标检测的深度学习技术。目标检测是很有价值的，可用于理解图像内容、描述图像中的事物以及确定目标在图像中的位置。

01

深度学习与CV教程(13) | 目标检测 (SSD,YOLO系列)

本系列为斯坦福CS231n 《深度学习与计算机视觉(Deep Learning for Computer Vision)》的全套学习笔记，对应的课程视频可以在这里查看。更多资料获取方式见文末。

06

目标检测：速度和准确性比较（Fater R-CNN，R-FCN，SSD，FPN，RetinaNet和YOLOv3）

文章来源：https://zhuanlan.zhihu.com/p/91719437

01

汇总 | OpenCV DNN支持的对象检测模型

OpenCV DNN不光支持图像分类，对象检测作为计算机视觉主要任务之一，OpenCV DNN支持多种对象检测模型，可以快速实现基于COCO数据集与Pascal VOC数据集的对象检测。此外基于自定义数据集，通过tensorflow对象检测框架或者pytorch的ONNX格式还可以支持自定义对象检测模型训练导出与部署。本文总结了OpenCV DNN支持的各种对象检测模型与它们的输入输出。

02

我用深度学习分析 LoL 小地图，自制数据集 DeepLeague 开源（上）

本文为雷锋字幕组编译的技术博客，原标题 DeepLeague: leveraging computer vision and deep learning on the League of Legends mini map + giving away a dataset of over 100,000 labeled images to further esports analytics research，作者Farza。翻译 | 曹永胜校对 | 李振整理 | 凡江深度联盟（DeepLea

06

SSD+caffe︱Single Shot MultiBox Detector 目标检测（一）

本文介绍了单次多框检测（Single Shot MultiBox Detector, SSD）算法，该算法是一种基于深度学习的目标检测算法，主要应用于计算机视觉领域。SSD算法可以同时检测多个目标，并且能够在不增加计算量的情况下提高检测精度。该算法具有速度快、精度高的特点，是当前比较流行的物体检测算法之一。

06

做目标检测，这一篇就够了！2019最全目标检测指南

计算机视觉是一门研究如何对数字图像或视频进行高层语义理解的交叉学科，它赋予机器“看”的智能，需要实现人的大脑中（主要是视觉皮层区）的视觉能力。

03

做目标检测，这一篇就够了！2019最全目标检测指南

计算机视觉是一门研究如何对数字图像或视频进行高层语义理解的交叉学科，它赋予机器“看”的智能，需要实现人的大脑中（主要是视觉皮层区）的视觉能力。

03

从YOLOv1到YOLOv3，目标检测的进化之路

这是继 RCNN，fast-RCNN 和 faster-RCNN之后，Ross Girshick 针对 DL 目标检测速度问题提出的另外一种框架。YOLO V1 其增强版本在 GPU 上能跑45fps，简化版本155fps。

03

YOLO—实时对象检测的新视角

近几年，在深入学习的帮助下, 目标检测领域取得了巨大的进步。对象检测是标识图像中的对象并在其周围绘制边界框的任务, 也就是定位它们。在计算机视觉由于其众多的应用从自动驾驶汽车到安全和跟踪是一个非常重要的问题。以前的对象检测方法通常是让管道按序分段。这会导致每一段完成的任务和最终目标之间的脱节, 最终的目标是在一个图像的对象周围绘制一个紧密的边界框。一个充分利用在联合的方式中侦测错误的终端框架将是一个更好的解决方案，不仅是为了更好地训练模型, 还要提高检测速度。这就需要YOLO发挥作用。Varun Agr

05

干货 | 目标检测入门，看这篇就够了（上）

作者 | 李家丞（同济大学数学系本科在读，现格灵深瞳算法部实习生）近年来，深度学习模型逐渐取代传统机器视觉方法而成为目标检测领域的主流算法，本系列文章将回顾早期的经典工作，并对较新的趋势做一个全景式的介绍，帮助读者对这一领域建立基本的认识。（营长注：因本文篇幅较长，营长将其分为上、下两部分。）导言：目标检测的任务表述如何从图像中解析出可供计算机理解的信息，是机器视觉的中心问题。深度学习模型由于其强大的表示能力，加之数据量的积累和计算力的进步，成为机器视觉的热点研究方向。那么，如何理解一张图片？

干货 | 目标检测入门，看这篇就够了（上）

作者 | 李家丞（同济大学数学系本科在读，现格灵深瞳算法部实习生）近年来，深度学习模型逐渐取代传统机器视觉方法而成为目标检测领域的主流算法，本系列文章将回顾早期的经典工作，并对较新的趋势做一个全景式的介绍，帮助读者对这一领域建立基本的认识。（营长注：因本文篇幅较长，营长将其分为上、下两部分。）导言：目标检测的任务表述如何从图像中解析出可供计算机理解的信息，是机器视觉的中心问题。深度学习模型由于其强大的表示能力，加之数据量的积累和计算力的进步，成为机器视觉的热点研究方向。那么，如何理解一张图片？

干货 | 目标检测入门，看这篇就够了（上）

作者 | 李家丞（同济大学数学系本科在读，现格灵深瞳算法部实习生）近年来，深度学习模型逐渐取代传统机器视觉方法而成为目标检测领域的主流算法，本系列文章将回顾早期的经典工作，并对较新的趋势做一个全景式的介绍，帮助读者对这一领域建立基本的认识。（营长注：因本文篇幅较长，营长将其分为上、下两部分。）导言：目标检测的任务表述如何从图像中解析出可供计算机理解的信息，是机器视觉的中心问题。深度学习模型由于其强大的表示能力，加之数据量的积累和计算力的进步，成为机器视觉的热点研究方向。那么，如何理解一张图片？

04

干货 | 基于深度学习的目标检测算法综述（一）

目标检测（Object Detection）是计算机视觉领域的基本任务之一，学术界已有将近二十年的研究历史。近些年随着深度学习技术的火热发展，目标检测算法也从基于手工特征的传统算法转向了基于深度神经网络的检测技术。从最初 2013 年提出的 R-CNN、OverFeat，到后面的 Fast/Faster R-CNN、SSD、YOLO 系列，再到 2018 年最近的 Pelee。短短不到五年时间，基于深度学习的目标检测技术，在网络结构上，从 two stage 到 one stage，从 bottom-up only 到 Top-Down，从 single scale network 到 feature pyramid network，从面向 PC 端到面向手机端，都涌现出许多好的算法技术，这些算法在开放目标检测数据集上的检测效果和性能都很出色。

02

综述 | 基于深度学习的目标检测算法

导读：目标检测（Object Detection）是计算机视觉领域的基本任务之一，学术界已有将近二十年的研究历史。近些年随着深度学习技术的火热发展，目标检测算法也从基于手工特征的传统算法转向了基于深度神经网络的检测技术。从最初 2013 年提出的 R-CNN、OverFeat，到后面的 Fast/Faster R-CNN、SSD、YOLO 系列，再到 2018 年最近的 Pelee。短短不到五年时间，基于深度学习的目标检测技术，在网络结构上，从 two stage 到 one stage，从 bottom-up only 到 Top-Down，从 single scale network 到 feature pyramid network，从面向 PC 端到面向手机端，都涌现出许多好的算法技术，这些算法在开放目标检测数据集上的检测效果和性能都很出色。

02

干货 | 基于深度学习的目标检测算法综述（一）

目标检测（Object Detection）是计算机视觉领域的基本任务之一，学术界已有将近二十年的研究历史。近些年随着深度学习技术的火热发展，目标检测算法也从基于手工特征的传统算法转向了基于深度神经网络的检测技术。从最初 2013 年提出的 R-CNN、OverFeat，到后面的 Fast/Faster R-CNN、SSD、YOLO 系列，再到 2018 年最近的 Pelee。短短不到五年时间，基于深度学习的目标检测技术，在网络结构上，从 two stage 到 one stage，从 bottom-up only 到 Top-Down，从 single scale network 到 feature pyramid network，从面向 PC 端到面向手机端，都涌现出许多好的算法技术，这些算法在开放目标检测数据集上的检测效果和性能都很出色。

02

速递 | 人脸口罩检测数据+模型+代码+在线网页体验，通通都开源了

众志成城，抗击疫情。首先，我们向在一线抗击疫情的医护人员和各行各业的从业者致敬。祝愿我们早日战胜疫情，早日迎接春暖花开的那一天。

06

YOLO v2

相对于YOLOv1，改进后的v2版使用一种新的、多尺度的训练方法，相同的YOLOv2模型可以在不同的尺寸运行，在速度和准确性之间达到简单的折中。这个模型由于可以对9000类目标进行分类，因此称为YOLO9000，但是依然能实时的运行。文章的最后提出了一种联合训练目标检测与分类的方法。这种方法同时在COCO检测数据集和ImageNet分类数据集同时训练YOLO9000。这种联合训练可使YOLO9000预测没有标记检测数据的对象。

05

YOLO V2的10个改进技巧（上篇）

YOLO V2的原始论文是，《YOLO9000: Better, Faster, Stronger 》，新的YOLO版本论文全名叫“YOLO9000: Better, Faster, Stronger”，主要有两个大方面的改进：

04

训练目标检测模型只需要这 6 行代码

原标题 | Train Object Detection AI with 6 lines of code

06

10分钟学会使用YOLO及Opencv实现目标检测（下）|附源码

在上一节内容中，介绍了如何将YOLO应用于图像目标检测中，那么在学会检测单张图像后，我们也可以利用YOLO算法实现视频流中的目标检测。

03

【个人整理】一文看尽YOLO V2的10个改进技巧（下篇）

YOLO V1 问世已久，风头很快就被SSD盖过，原作者rbg（Ross Girshick）大神自然不甘心，于是又在yolo v1的基础之上提出了YOLO v2 ，根据论文中的总结，yolo v2在yolo v1的基础之上一共有10个主要的改进点，本文是结合网上的众多博客文章，用自己习惯的方式做了一个简单地整理。

04

CRAS-YOLO：多类别船舶检测与分类模型

在今天分享中，我们团队在FUSAR船舶数据集和SimpleCopyPaste方法的基础上生成了一个新的Artificial-SAR-Vessel数据集中。我们进一步提出了一种新的多类船检测，称为CRAS-YOLO，它由卷积块注意力模块（CBAM）、感受野块（RFB）和基于YOLOv5s的自适应空间特征融合（ASFF）组成。CRAS-YOLO改进了基于路径聚合网络（PANet）的特征金字塔网络，该网络集成了RFB特征增强模块和ASFF特征融合策略，以获得更丰富的特征信息，并实现多尺度特征的自适应融合。同时，在骨干中增加了CBAM，以准确定位船只位置，提高检测能力。

02

目标检测算法上手实战

从广义上说，计算机视觉就是“赋予机器自然视觉能力”的学科。计算机视觉与人工智能有密切联系，但也有本质的不同。人工智能更强调推理和决策，但至少计算机视觉目前还主要停留在图像信息表达和物体识别阶段。计算机视觉的研究内容，大体可以分为物体视觉（object vision）和空间视觉（spatial vision）二大部分. 物体视觉在于对物体进行精细分类和鉴别，而空间视觉在于确定物体的位置和形状，为“动作（action）” 服务。基于学习的视觉，是指以机器学习为主要技术手段的计算机视觉研究。基于学习的视觉研究

06

X射线图像中的目标检测

每天有数百万人乘坐地铁、民航飞机等公共交通工具，因此行李的安全检测将保护公共场所免受恐怖主义等影响，在安全防范中扮演着重要角色。但随着城市人口的增长，使用公共交通工具的人数逐渐增多，在获得便利的同时带来很大的不安全性，因此设计一种可以帮助加快安全检查过程并提高其效率的系统非常重要。卷积神经网络等深度学习算法不断发展，也在各种不同领域（例如机器翻译和图像处理）发挥了很大作用，而目标检测作为一项基本的计算机视觉问题，能为图像和视频理解提供有价值的信息，并与图像分类、机器人技术、人脸识别和自动驾驶等相关。在本项目中，我们将一起探索几个基于深度学习的目标检测模型，以对X射线图像中的违禁物体进行定位和分类为基础，并比较这几个模型在不同指标上的表现。

02

魔都AI圣战者联盟第二次分享会圆满召开

魔都AI圣战者联盟（League of AI Mujahideen in Shanghai）是由上海的AI行业从业者发起的民间组织。目前联盟主要成员为从事AI行业cv或nlp方向的算法工程师或主管、总监，多数为毕业于国内985高校或海外知名高校的硕博。

03

检测9000类物体的YOLO9000 更好更快更强

多尺度训练YOLOv2；权衡速度和准确率，运行在不同大小图像上。YOLOv2测试VOC 2007 数据集：67FPS时，76.8mAP；40FPS时，78.6mAP。

04

YOLO再战大雾天气 | IA-YOLO数据增强+感知损失，做到大雾天气无痛即可完成YOLO检测器的场景升级

基于图像增强的技术试图生成无雾图像。然而，从有雾图像中恢复无雾图像比在雾天图像中检测物体要困难得多。另一方面，基于领域适应的方法并不使用目标领域中的标记数据集。这两类方法都在尝试解决一个更难的问题版本。 FogGuard特别设计用来补偿场景中存在的雾天条件，确保即使在雾天也能保持稳健的性能。作者采用YOLOv3作为基准目标检测算法，并引入了一种新颖的“教师-学生”感知损失，以提高雾天图像中的目标检测准确度。在如PASCAL VOC和RTTS等常见数据集上的广泛评估中，作者展示了作者网络性能的提升。作者证明，FogGuard在RTTS数据集上达到了69.43%的mAP，而YOLOv3为57.78%。此外，作者表明，尽管作者的训练方法增加了时间复杂度，但在推理过程中与常规的YOLO网络相比，它并没有引入任何额外的开销。

01

收藏 | YOLO系列综述：从V1到V4

这是继RCNN，fast-RCNN和faster-RCNN之后，rbg（RossGirshick）针对DL目标检测速度问题提出的另外一种框架。YOLO V1其增强版本GPU中能跑45fps，简化版本155fps。

03

SSD7-FFAM | 对嵌入式友好的目标检测网络

对计算和内存的高需求是将现有目标检测网络部署到嵌入式设备中的最大挑战。现有的轻量级目标检测器直接使用轻量级神经网络架构，如MobileNet或在大尺度分类数据集上预先训练，导致网络结构灵活性差，不适用于某些特定场景。

03

目标检测算法之SSD

作者：叶虎编辑：祝鑫泉前言目标检测近年来已经取得了很重要的进展，主流的算法主要分为两个类型：（1）two-stage方法，如R-CNN系算法，其主要思路是先通过启发式方法（selective search）或者CNN网络（RPN)产生一系列稀疏的候选框，然后对这些候选框进行分类与回归，two-stage方法的优势是准确度高；（2）one-stage方法，如Yolo和SSD，其主要思路是均匀地在图片的不同位置进行密集抽样，抽样时可以采用不同尺度和长宽比，然后利用CNN提取特征后直接进行分类与回归

09

目标检测综述

这篇综述是我统计信号处理的作业，在这里分享一下，将介绍计算机视觉中的目标检测任务，论述自深度学习以来目标检测的常见方法，着重讲yolo算法，并且将yolo算法与其他的one-stage以及two-stage方法进行比较。

03

【论文详解】目标检测算法之SSD 深入详解

目标检测近年来已经取得了很重要的进展，主流的算法主要分为两个类型：（1）two-stage方法，如R-CNN系算法，其主要思路是先通过启发式方法（selective search）或者CNN网络（RPN)产生一系列稀疏的候选框，然后对这些候选框进行分类与回归，two-stage方法的优势是准确度高；（2）one-stage方法，如Yolo和SSD，其主要思路是均匀地在图片的不同位置进行密集抽样，抽样时可以采用不同尺度和长宽比，然后利用CNN提取特征后直接进行分类与回归，整个过程只需要一步，所以其优势是速度快，但是均匀的密集采样的一个重要缺点是训练比较困难，这主要是因为正样本与负样本（背景）极其不均衡（参见Focal Loss，https://arxiv.org/abs/1708.02002），导致模型准确度稍低。不同算法的性能如图1所示，可以看到两类方法在准确度和速度上的差异。

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭