开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

改进FCN和R-CNN深度学习模型的改进思路

改进FCN和R-CNN深度学习模型的思路可以从以下几个方面考虑：

FCN（Fully Convolutional Network）改进思路：
- 使用更深的网络结构：可以尝试使用更深的网络结构，如ResNet、VGG等，以提高模型的表达能力和特征提取能力。
- 引入注意力机制：通过引入注意力机制，可以使模型更加关注重要的特征区域，提高模型的准确性和鲁棒性。
- 融合多尺度信息：通过融合多尺度的特征图，可以提高模型对不同尺度目标的检测和分割能力。
- 结合语义信息：可以结合语义分割的方法，引入语义信息，提高模型对目标的理解和分割效果。

R-CNN（Region-based Convolutional Neural Network）改进思路：
- 更快的目标检测算法：可以尝试使用一些更快的目标检测算法，如YOLO、SSD等，以提高检测速度和实时性。
- 引入注意力机制：通过引入注意力机制，可以使模型更加关注重要的目标区域，提高检测的准确性和鲁棒性。
- 融合多尺度信息：通过融合多尺度的特征图，可以提高模型对不同尺度目标的检测能力。
- 结合语义信息：可以结合语义分割的方法，引入语义信息，提高模型对目标的理解和检测效果。

以上是改进FCN和R-CNN深度学习模型的一些思路，具体的改进方法可以根据实际问题和需求进行选择和调整。

腾讯云相关产品和产品介绍链接地址：

腾讯云AI开放平台：https://cloud.tencent.com/product/ai
腾讯云机器学习平台：https://cloud.tencent.com/product/tiia
腾讯云图像识别：https://cloud.tencent.com/product/imagerecognition
腾讯云视频智能分析：https://cloud.tencent.com/product/vca
腾讯云语音识别：https://cloud.tencent.com/product/asr
腾讯云自然语言处理：https://cloud.tencent.com/product/nlp
腾讯云物联网平台：https://cloud.tencent.com/product/iotexplorer
腾讯云移动应用开发：https://cloud.tencent.com/product/mad
腾讯云对象存储：https://cloud.tencent.com/product/cos
腾讯云区块链服务：https://cloud.tencent.com/product/tbaas
腾讯云游戏多媒体处理：https://cloud.tencent.com/product/gmp

相关搜索:如何改进FCN32的学习以进行语义分割？改进和调整这些模型的好方法Sklearn 如何使用改进为呼叫和响应设置不同的模型随着用户选择和训练数据而改进的线性回归模型广度优先搜索(BFS)和深度优先搜索(DFS)代码-需要关于如何进一步改进它的建议我的残差神经网络给出了一个非常奇怪的深度图作为输出.I不知道如何改进我的模型？在特征重要性和特征选择之后重建和训练新的深度学习Python模型以减少特征量？linux操作系统选择 linux操作系统平台 linux系列操作系统

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

基于深度学习的图像目标检测（上）

本文介绍了如何从单张图像中预测出多个物体的边界框和类别，并分析了在预测过程中各种因素对结果的影响。同时，文章还对一系列现有方法进行了评估和比较，并提供了改进方向。

09

最全整理 | 万字长文综述目标检测领域，您要的，都在这里！

目标检测是计算机视觉中的一个重要问题，近年来传统检测方法已难以满足人们对目标检测效果的要求，随着深度学习在图像分类任务上取得巨大进展，基于深度学习的目标检测算法逐渐成为主流。总体上站长我都做了summary，先上图为敬：

01

深度学习近期总结分析

希望想认真阅读的你可以听着这首悦耳的歌O(∩_∩)O 一、背景介绍普通的深度学习监督算法主要是用来做分类，如图1(1)所示，分类的目标是要识别出图中所示是一只猫。而在ILSVRC（ImageNet Large Scale Visual Recognition Challenge)竞赛以及实际的应用中，还包括目标定位和目标检测等任务。其中目标定位是不仅仅要识别出来是什么物体（即分类），而且还要预测物体的位置，位置一般用边框（bounding box）标记，如图1(2)所示。而目标检测实质是多目标的定位，即要

08

基于深度学习的图像目标检测（下）

依然要感激如此美丽的封面图片。在“基于深度学习的图像目标检测(上)”里面，我们详细介绍了R-CNN走到端到端模型的Faster R-CNN的进化流程。这里，我们介绍，后续如何变得更快、更强！前言天下武功唯快不破！所以在如何让检测更快？主要有两种思路： 1. 把好的方法改进的更快！前面我们提到了从R-CNN到Faster R-CNN主要的技术思想就是避免特征计算浪费。所以要把ConvNet特征计算前移，只做一次计算。而把区域操作后移。我们也提到Faster R-CNN在RoI之

09

深度学习目标检测模型全面综述：Faster R-CNN、R-FCN和SSD

选自medium 机器之心编译机器之心编辑部 Faster R-CNN、R-FCN 和 SSD 是三种目前最优且应用最广泛的目标检测模型，其他流行的模型通常与这三者类似。本文介绍了深度学习目标检测的

07

综述：深度学习时代的目标检测算法

来源：https://zhuanlan.zhihu.com/p/33277354 目前目标检测领域的深度学习方法主要分为两类：two stage的目标检测算法；one stage的目标检测算法。前者是

05

基于深度学习的目标检测算法综述

目标检测的任务是找出图像中所有感兴趣的目标（物体），确定它们的位置和大小，是机器视觉领域的核心问题之一。由于各类物体有不同的外观，形状，姿态，加上成像时光照，遮挡等因素的干扰，目标检测一直是机器视觉领域最具有挑战性的问题。本文将针对目标检测（Object Detection）这个机器视觉中的经典任务进行解析，抛砖引玉。如对文中的内容持不同观点，欢迎到SIGAI公众号发消息给我们，一起探讨！

02

综述 | 基于深度学习的目标检测算法

导读：目标检测（Object Detection）是计算机视觉领域的基本任务之一，学术界已有将近二十年的研究历史。近些年随着深度学习技术的火热发展，目标检测算法也从基于手工特征的传统算法转向了基于深度神经网络的检测技术。从最初 2013 年提出的 R-CNN、OverFeat，到后面的 Fast/Faster R-CNN、SSD、YOLO 系列，再到 2018 年最近的 Pelee。短短不到五年时间，基于深度学习的目标检测技术，在网络结构上，从 two stage 到 one stage，从 bottom-up only 到 Top-Down，从 single scale network 到 feature pyramid network，从面向 PC 端到面向手机端，都涌现出许多好的算法技术，这些算法在开放目标检测数据集上的检测效果和性能都很出色。

02

图像分割综述

这一大部分我们将要介绍的是深度学习大火之前人们利用数字图像处理、拓扑学、数学等方面的只是来进行图像分割的方法。当然现在随着算力的增加以及深度学习的不断发展，一些传统的分割方法在效果上已经不能与基于深度学习的分割方法相比较了，但是有些天才的思想还是非常值得我们去学习的。 1.基于阈值的分割方法阈值法的基本思想是基于图像的灰度特征来计算一个或多个灰度阈值，并将图像中每个像素的灰度值与阈值作比较，最后将像素根据比较结果分到合适的类别中。因此，该方法最为关键的一步就是按照某个准则函数来求解最佳灰度阈值。阈值法特别适用于目标和背景占据不同灰度级范围的图。图像若只有目标和背景两大类，那么只需要选取一个阈值进行分割，此方法成为单阈值分割；但是如果图像中有多个目标需要提取，单一阈值的分割就会出现作物，在这种情况下就需要选取多个阈值将每个目标分隔开，这种分割方法相应的成为多阈值分割。

04

干货 | 基于深度学习的目标检测算法综述（一）

目标检测（Object Detection）是计算机视觉领域的基本任务之一，学术界已有将近二十年的研究历史。近些年随着深度学习技术的火热发展，目标检测算法也从基于手工特征的传统算法转向了基于深度神经网络的检测技术。从最初 2013 年提出的 R-CNN、OverFeat，到后面的 Fast/Faster R-CNN、SSD、YOLO 系列，再到 2018 年最近的 Pelee。短短不到五年时间，基于深度学习的目标检测技术，在网络结构上，从 two stage 到 one stage，从 bottom-up only 到 Top-Down，从 single scale network 到 feature pyramid network，从面向 PC 端到面向手机端，都涌现出许多好的算法技术，这些算法在开放目标检测数据集上的检测效果和性能都很出色。

02

干货 | 基于深度学习的目标检测算法综述（一）

目标检测（Object Detection）是计算机视觉领域的基本任务之一，学术界已有将近二十年的研究历史。近些年随着深度学习技术的火热发展，目标检测算法也从基于手工特征的传统算法转向了基于深度神经网络的检测技术。从最初 2013 年提出的 R-CNN、OverFeat，到后面的 Fast/Faster R-CNN、SSD、YOLO 系列，再到 2018 年最近的 Pelee。短短不到五年时间，基于深度学习的目标检测技术，在网络结构上，从 two stage 到 one stage，从 bottom-up only 到 Top-Down，从 single scale network 到 feature pyramid network，从面向 PC 端到面向手机端，都涌现出许多好的算法技术，这些算法在开放目标检测数据集上的检测效果和性能都很出色。

02

深度学习时代的目标检测综述

更新算法至2017.12.31 目前目标检测领域的深度学习方法主要分为两类：two stage的目标检测算法；one stage的目标检测算法。前者是先由算法生成一系列作为样本的候选框，再通过卷积神经

01

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

作者：张皓【新智元导读】本文作者来自南京大学计算机系机器学习与数据挖掘所（LAMDA），本文直观系统地梳理了深度学习在计算机视觉领域四大基本任务中的应用，包括图像分类、定位、检测、语义分割和实例分割

06

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

【导读】本文作者来自南京大学计算机系机器学习与数据挖掘所（LAMDA），本文直观系统地梳理了深度学习在计算机视觉领域四大基本任务中的应用，包括图像分类、定位、检测、语义分割和实例分割。本文旨在介绍深度学习在计算机视觉领域四大基本任务中的应用，包括分类(图a)、定位、检测(图b)、语义分割(图c)、和实例分割(图d)。图像分类(image classification) 给定一张输入图像，图像分类任务旨在判断该图像所属类别。 (1) 图像分类常用数据集以下是几种常用分类数据集，难度依次递增。h

08

干货 | 深度学习时代的目标检测算法

AI 科技评论按：本文作者 Ronald，首发于作者的知乎专栏「炼丹师备忘录」，AI 科技评论获其授权转发。目前目标检测领域的深度学习方法主要分为两类：two stage 的目标检测算法；one s

07

OCR技术简介

同时在本微信公众号中，回复“SIGAI”+日期，如“SIGAI0515”，即可获取本期文章的全文下载地址（仅供个人学习使用，未经允许，不得用于商业目的）。

05

一文梳理缺陷检测方法

近年来，随着深度学习的快速发展，基于卷积神经网络(CNN)的计算机视觉技术在工业领域得到了广泛的应用。目前，机器视觉表面缺陷检测是CNN在工业上最成熟的应用之一。接下来我们将介绍深度学习在表面缺陷检测领域的概述。

02

长文干货！走近人脸检测：从VJ到深度学习（下）

深度学习给目标检测带来的变革人脸检测作为一种特定类型目标的检测任务，一方面具有其自己鲜明的特点，需要考虑人脸这一目标的特殊性，另一方面其也和其它类型目标的检测任务具有一定的共性，能够直接借鉴在通用目标检测方法上的研究经验。目标检测任务作为一个分类问题，其不仅受益于计算机视觉领域相关技术的不断发展，在机器学习领域的研究进展同样也对目标检测任务具有推波助澜的作用。事实上，从2006年开始逐步蔓延开的深度学习大爆发给目标检测的研究带来了强劲的助推力,使得通用的目标检测以及各种特定类型目标的检

08

入门分享 | 12篇深度学习目标检测必读论文

本文梳理了目标检测领域2013年至2019年的12篇必读论文，为希望学习相关知识的新手提供了很好的入门路径。同时，作者还提供了一个附加论文列表。作为拓展阅读的内容，它们或为目标检测提供了新的视角，或用更强大的功能扩展了这个领域。

04

【文本检测与识别-白皮书-3.1】第一节：常用的文本检测与识别方法

随着深度学习的快速发展，图像分类、目标检测、语义分割以及实例分割都取得了突破性的进展，这些方法成为自然场景文本检测的基础。基于深度学习的自然场景文本检测方法在检测精度和泛化性能上远优于传统方法，逐渐成为了主流。图1 列举了文本检测方法近几年来的发展历程。

03

图像分类、检测，语义分割等方法梳理

本文旨在介绍深度学习在计算机视觉领域四大基本任务中的应用，包括分类(图a)、定位、检测(图b)、语义分割(图c)、和实例分割(图d)。

01

干货 | 目标检测入门，看这篇就够了（下）

作者 | 李家丞（同济大学数学系本科在读，现格灵深瞳算法部实习生）近年来，深度学习模型逐渐取代传统机器视觉方法而成为目标检测领域的主流算法，本系列文章将回顾早期的经典工作，并对较新的趋势做一个全景式的介绍，帮助读者对这一领域建立基本的认识。（营长注：因本文篇幅较长，营长将其分为上（点击查看）、下两部分。）导言：目标检测的任务表述如何从图像中解析出可供计算机理解的信息，是机器视觉的中心问题。深度学习模型由于其强大的表示能力，加之数据量的积累和计算力的进步，成为机器视觉的热点研究方向。那么，如何

08

干货 | 目标检测入门，看这篇就够了（下）

作者 | 李家丞（同济大学数学系本科在读，现格灵深瞳算法部实习生）近年来，深度学习模型逐渐取代传统机器视觉方法而成为目标检测领域的主流算法，本系列文章将回顾早期的经典工作，并对较新的趋势做一个全景

08

干货 | 目标检测入门，看这篇就够了（下）

作者 | 李家丞（同济大学数学系本科在读，现格灵深瞳算法部实习生）近年来，深度学习模型逐渐取代传统机器视觉方法而成为目标检测领域的主流算法，本系列文章将回顾早期的经典工作，并对较新的趋势做一个全景式的介绍，帮助读者对这一领域建立基本的认识。（因本文篇幅较长，营长将其分为上（点击查看）、下两部分。）导言：目标检测的任务表述如何从图像中解析出可供计算机理解的信息，是机器视觉的中心问题。深度学习模型由于其强大的表示能力，加之数据量的积累和计算力的进步，成为机器视觉的热点研究方向。那么，如何理解一张图片？

04

深度学习与CV教程(14) | 图像分割 (FCN,SegNet,U-Net,PSPNet,DeepLab,RefineNet)

本系列为斯坦福CS231n 《深度学习与计算机视觉(Deep Learning for Computer Vision)》的全套学习笔记，对应的课程视频可以在这里查看。更多资料获取方式见文末。

04

这5种计算机视觉技术，刷新你的世界观

计算机视觉是目前深度学习领域最热门的研究领域之一。它位于许多学术科目的交汇点，如计算机科学（图形学，算法，理论，系统，建筑），数学（信息检索，机器学习），工程学（机器人学，语音，自然语言处理，图像处理），物理学（光学），生物学（神经科学）和心理学（认知科学）。由于计算机视觉代表了对视觉环境及其背景的相对理解，许多科学家认为，该领域由于其跨域掌握为人工智能铺平了道路。

03

一文总结目标检测

如有排版问题，可知乎查看：zhihu.com/column/c_1255545721723191296

02

目标检测最新总结与前沿展望

从 2006 年以来，在 Hilton、Bengio、LeChun 等人的引领下，大量深度神经网络的论文被发表，尤其是 2012 年，Hinton课题组首次参加 ImageNet图像识别比赛，其通过构建的 CNN 网络AlexNet[1]一举夺得冠军，从此神经网络开始受到广泛的关注。深度学习利用多层计算模型来学习抽象的数据表示，能够发现大数据中的复杂结构，目前，这项技术已成功地应用在包括计算机视觉领域在内的多种模式分类问题上。计算机视觉对于目标运动的分析可以大致分为三个层次:运动分割，目标检测；目标跟踪；动作识别，行为描述[2]。其中，目标检测既是计算机视觉领域要解决的基础任务之一，同时它也是视频监控技术的基本任务。由于视频中的目标具有不同姿态且经常出现遮挡、其运动具有不规则性，同时考虑到监控视频的景深、分辨率、天气、光照等条件和场景的多样性，而且目标检测算法的结果将直接影响后续的跟踪、动作识别和行为描述的效果。故即使在技术发展的今天，目标检测这一基本任务仍然是非常具有挑战性的课题，存在很大的提升潜力和空间。

02

Object Detection系列（五） R-FCN

本文介绍了从FCN到Mask R-CNN的四个发展版本，重点介绍了Mask R-CNN并分析了其各版本之间的差异，对于Mask R-CNN的改进方向，作者从损失函数、训练策略和模型结构三个方面入手，提出了基于多任务学习的Mask R-CNN，并进行了详细的介绍与实验，结果表明基于多任务学习的Mask R-CNN在COCO数据集上大幅超越了之前的Mask R-CNN版本，实现了目标检测算法的重要突破。

06

实例分割算法_实例分割数据集制作

大家好，又见面了，我是你们的朋友全栈君。 http://cocodataset.org/#detection-leaderboard

02

终极指南：构建用于检测汽车损坏的Mask R-CNN模型（附Python演练）

【磐创AI导读】：本文分享了一个mask rcnn实战项目。想要学习更多的机器学习、深度学习知识

03

目标检测入门（三）：基础网络演进、分类与定位的权衡

从此篇开始，我们对近几年检测领域的工作提供一个概览，并试图从中归纳出一些趋势。由于篇幅和视野所限，文章不会求全，相对注重思路的演进，淡化实验结果的报告。事实上，我们并没有看到这一任务上的"The Best Paper"和"The Final Paper"，现阶段的工作远远没有到解决这一问题的程度，深度学习模型也仍然是非常年轻的研究领域。

03

深度学习目标检测(object detection)系列（五） R-FCN

版权声明：本文为博主原创文章，转载请注明出处。 https://blog.csdn.net/chaipp0607/article/details/78525483

03

【CV】图像分割详解！

这一大部分我们将要介绍的是深度学习大火之前人们利用数字图像处理、拓扑学、数学等方面的只是来进行图像分割的方法。当然现在随着算力的增加以及深度学习的不断发展，一些传统的分割方法在效果上已经不能与基于深度学习的分割方法相比较了，但是有些天才的思想还是非常值得我们去学习的。

02

详解计算机视觉五大技术：图像分类、对象检测、目标跟踪、语义分割和实例分割

译者 | 王柯凝【 AI 科技大本营导读】目前，计算机视觉是深度学习领域最热门的研究领域之一。计算机视觉实际上是一个跨领域的交叉学科，包括计算机科学（图形、算法、理论、系统、体系结构），数学（信息检索、机器学习），工程学（机器人、语音、自然语言处理、图像处理），物理学（光学），生物学（神经科学）和心理学（认知科学）等等。许多科学家认为，计算机视觉为人工智能的发展开拓了道路。那么什么是计算机视觉呢？这里给出了几个比较严谨的定义： ✦ “对图像中的客观对象构建明确而有意义的描述”（Ballard＆B

07

详解计算机视觉五大技术：图像分类、对象检测、目标跟踪、语义分割和实例分割

目前，计算机视觉是深度学习领域最热门的研究领域之一。计算机视觉实际上是一个跨领域的交叉学科，包括计算机科学（图形、算法、理论、系统、体系结构），数学（信息检索、机器学习），工程学（机器人、语音、自然语言处理、图像处理），物理学（光学），生物学（神经科学）和心理学（认知科学）等等。许多科学家认为，计算机视觉为人工智能的发展开拓了道路。

02

OCR技术简介

光学字符识别（Optical Character Recognition, OCR）是指对文本资料的图像文件进行分析识别处理，获取文字及版面信息的过程。亦即将图像中的文字进行识别，并以文本的形式返回。

02

目标检测资源总结

blog.csdn.net/l7H9JA4/article/details/79620247

03

Object Detection系列（一）R-FCN

作者：张旭编辑：祝鑫泉 Object Detection系列（一） R-FCN R-FCN简介上面这张图在这个系列文章中都会出现，可以看到，在时间轴上R-FCN并不应该出现在第五篇中，但是

03

农林业遥感图像分类研究[通俗易懂]

遥感图像处理是数字图像处理技术中的一个重要组成部分，长期以来被广泛应用于农林业的遥感测绘，防灾减灾等领域。本文旨在通过深度学习技术从遥感影像中分类出农田和林业地块。手工从遥感图像中分类出农田和林业区域分类虽然准确但是效率低下，并且很多采用传统图像分割技术的方法泛化性能差，不适合场景复杂的遥感图像。经实践证明，使用深度学习技术在各种计算机视觉任务中都取得了良好的效果，因此本文首先使用先进的深度学习框架进行分类实验，例如使用PSPNet,UNet等作为分割网络对遥感图像数据集进行分类与分割训练。这些框架在ImageNet，COCO，VOC等数据集上表现很好，但是由于遥感图像数据集相对于ImageNet，COCO等数据集，不仅检测对象相对较小而且可供学习的数据集样本较少，需要针对这一特点进行优化。本文经过多次实验将高分辨率的图像切割成合适大小分辨率的图像以减小神经网络的输入，同时进行图片的预处理和数据增强来丰富学习样本。同时在真实情况下，农林区域易受到拍摄视角，光照等造成分割对象重叠，因此本文提出一种处理分割对象重叠的处理策略，来优化边界预测不准确的情况，使用该方法后准确率有明显提升。经实验证明，本文所提出的基于深度学习的农林业遥感影像分割在开源遥感图像数据集上的取得了94.08%的准确率，具有较高的研究价值农林业遥感图像数据（图1）对于许多与农林业相关的应用至关重要。例如作物类型和产量监测，防灾减灾以及对粮食安全工作的研究和决策支持。最初，这些数据主要由政府机构使用。如今，蓬勃发展的农林业技术也需要在农场管理，产量预测和林业规划等各种应用领域进行革新。以往农林业地块的高质量遥感图像数据主要是手动在高分辨率图像中分割出来的，即通过土地功能不同引起的颜色，亮度或纹理的差异与周围区域亮度或纹理的差异与周围区域区分开来。尽管农林业遥感图像的手动分类可以非常准确，但是非常耗时耗力。图1.1：农田的遥感图像分割定期更新农林业遥感图像数据的需求日益增加扩大了自动化分割农林业遥感图像的需求。与ImageNet、VOC2007、COCO等目标检测/分类数据集中的大多数图像相比，农林业遥感图像中的对象相对简单。例如，人体的图像数据看起来要复杂得多，因为它包含各种不同纹理和形状的子对象（面部，手部，衣服等）。因此，优化传统的图像分割以及深度学习技术来设计用于农林业遥感图像分割的算法是非常重要的。该模型需要正确地排除不需要进行分割的对象（房屋，工厂，停车场等），区分具有几乎相似的光谱特性的相邻区域和可见度差的边界区域，并且正确地分割出所需的对象。 1.2 选题来源与经费支持本研究课题来源于计算机与信息工程学院随着传感器技术，航空航天技术，图像处理技术快速的发展，利用卫星遥感图像进行深度学习处理广泛应用于生产实际中。由于农林业遥感图像场景复杂，使用传统图像处理分割算法效果差且泛化性能弱，本文使用深度学习方法，在现有的的深度学习模型上训练，优化，最终提出一种一种优化后的深度学习模型，经测试，该模型在收集的农林业遥感图像数据集上可以准确的分割出所需的对象，本文提出的模型主要解决如下几个难点：

02

深度学习与CV教程(12) | 目标检测 (两阶段,R-CNN系列)

本系列为斯坦福CS231n 《深度学习与计算机视觉(Deep Learning for Computer Vision)》的全套学习笔记，对应的课程视频可以在这里查看。更多资料获取方式见文末。

03

R-FCN、Mask RCNN、YoLo、SSD、FPN、RetinaNet…你都掌握了吗？一文总结目标识别必备经典模型（二）

机器之心专栏本专栏由机器之心SOTA！模型资源站出品，每周日于机器之心公众号持续更新。本专栏将逐一盘点自然语言处理、计算机视觉等领域下的常见任务，并对在这些任务上取得过 SOTA 的经典模型逐一详解。前往 SOTA！模型资源站（sota.jiqizhixin.com）即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。本文将分 3 期进行连载，共介绍 17 个在目标检测任务上曾取得 SOTA 的经典模型。第 1 期：R-CNN、SPP-Net、Fast R-CNN、Faster R-C

02

深度学习目标检测概览

本文是翻译自Object detection: an overview in the age of Deep Learning - Tryolabs Blog (http://t.cn/RNf1Ap9)。这篇文章主要是对深度学习目标检测进行概览，并不深入，适合那些想了解深度学习目标检测方向的读者。从简单的图像分类到3D姿势识别，计算机视觉领域从来不缺乏有趣的问题。其中，我们最感兴趣的，也投入精力去研究的领域之一就是目标检测。就像许多其他计算机视觉问题，该领域还缺乏一个显而易见或者“做好的”方法，这意味着目

06

深度学习之基础网络演进、分类与定位的权衡|牛喀技研

深度学习，目标检测，图像，智能驾驶编译：牛喀网-钱伟前言本篇关注基础网络架构的演进和处理分类、定位这一矛盾问题上的进展。基础网络结构的演进基础网络（Backbone network）作为特征提取器，对检测模型的性能有着至关重要的影响。在分类任务的权威评测集ImageNet上，基于卷积网络的方法已经取得超越人类水平的进步，并也促使ImageNet完成了她的历史使命。这也是机器视觉领域的整体进步，优秀的特征、深刻的解释都为其他任务的应用提供了良好的基础。在本节中，我们选取了几个在检测任务

07

见微知著：细粒度图像分析进展

作者简介：魏秀参，南京大学计算机系机器学习与数据挖掘所（LAMDA）博士生，专攻计算机视觉和机器学习。曾在国际顶级期刊和会议发表多篇学术论文，并两次获得国际计算机视觉相关竞赛冠亚军。责编：何永灿，欢迎人工智能领域技术投稿、约稿、给文章纠错，请发送邮件至heyc@csdn.net 本文为《程序员》原创文章，未经允许不得转载，更多精彩文章请订阅2017年《程序员》有别于通用图像分析任务，细粒度图像分析的所属类别和粒度更为精细，它不仅能在更细分的类别下对物体进行识别，就连相似度极高的同一物种也能区别开来。

04

一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

object detection，就是在给定的图片中精确找到物体所在位置，并标注出物体的类别。所以，object detection要解决的问题就是物体在哪里以及是什么的整个流程问题。

02

热门公开课总结文：中国香港中文大学陈恺解读物体检测算法的近期发展及开源框架

AI 科技评论按：物体检测是计算机视觉的基础任务之一。香港中文大学多媒体实验室博士生陈恺在 AI 研习社的公开课上，为大家总结了深度学习背景下物体检测算法的发展，分享 COCO 比赛冠军团队所使用的算法，并介绍由港中大多媒体实验室开源的物体检测算法框架 mmdetection。

02

干货｜深度学习目标检测的主要问题和挑战！

就像许多其他计算机视觉问题，该领域还缺乏一个显而易见或者“做好的”方法，这意味着目标检测仍然有很大的进步空间。

02

目标检测综述

这张图清楚说明了image classification, object detection, semantic segmentation, instance segmentation之间的关系. 摘自COCO dataset (https://arxiv.org/pdf/1405.0312.pdf)

01

PaddlePaddle实战 | 经典目标检测方法Faster R-CNN和Mask R-CNN

机器视觉领域的核心问题之一就是目标检测（objectdetection），它的任务是找出图像当中所有感兴趣的目标（物体），确定其位置和大小。作为经典的目标检测框架FasterR-CNN，虽然是2015年的论文，但是它至今仍然是许多目标检测算法的基础，这在飞速发展的深度学习领域十分难得。而在FasterR-CNN的基础上改进的MaskR-CNN在2018年被提出，并斩获了ICCV2017年的最佳论文。Mask R-CNN可以应用到人体姿势识别，并且在实例分割、目标检测、人体关键点检测三个任务都取得了很好的效果。因此，百度深度学习框架PaddlePaddle开源了用于目标检测的RCNN模型，从而可以快速构建强大的应用，满足各种场景的应用，包括但不仅限于安防监控、医学图像识别、交通车辆检测、信号灯识别、食品检测等等。

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭