前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >目标检测 | YOLOv1,经典单阶段Anchor-Free目标检测模型

目标检测 | YOLOv1,经典单阶段Anchor-Free目标检测模型

作者头像
Justlovesmile
发布于 2022-03-30 07:30:55
发布于 2022-03-30 07:30:55
1.2K00
代码可运行
举报
文章被收录于专栏:云+分享云+分享
运行总次数:0
代码可运行

PS:参考YOLO官网的配色和logo做的封面图,感觉还挺好看的,hhhh

You Only Look Once: Unified, Real-Time Object Detection

论文发表:CVPR 2016 论文链接:You Only Look Once: Unified, Real-Time Object Detection (cv-foundation.org) 论文官网:YOLO: Real-Time Object Detection (pjreddie.com)

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
@inproceedings{redmon2016you,
  title={You only look once: Unified, real-time object detection},
  author={Redmon, Joseph and Divvala, Santosh and Girshick, Ross and Farhadi, Ali},
  booktitle={Proceedings of the IEEE conference on computer vision and pattern recognition},
  pages={779--788},
  year={2016}
}

1. 归纳总结

标签

目的

方法

总结

#Anchor-Free

解决两阶段算法检测慢的问题

将目标检测(cls和reg)都视为回归问题

经典单阶段算法

2. 问题背景

随着深度学习的大火,在YOLO提出那一年,主流的目标检测算法框架主要分为两类:

  • 两阶段算法:基于Region Proposal的RCNN系列算法,先生成Proposal,再分类回归
  • 单阶段算法:直接预测不同目标的类别和位置 这两种算法各有优点,一般而言,两阶段算法准确度高,但速度慢;单阶段算法速度快,但准确度相对低。

作者认为人可以一眼看到目标在哪,并且能立即知道是什么,并且对于很多实际场景而言,如自动驾驶,实时性和准确性都是非常重要的。

3. 主要工作

针对上述问题,作者提出了经典的YOLO算法,它是一个统一的,端到端的单阶段目标检测算法。YOLO具体做法是,首先将输入图片缩放到448x448,然后送入CNN网络,最后使用NMS过滤网络预测结果得到检测的目标。

而在CNN网络里,它首先将图片划分为S×S大小的网格,然后每个单元格负责检测中心点落在该格子的目标,如下图,每个单元格会输出B个边界框(每个边界框输出5个预测值:x, y, w, h, confidence)以及边界框类别概率C,例如:作者在PASCAL VOC的检测实验里使用S=7,B=2,C=类别数量20,一共预测7×7×(2×5+20)个向量。同时这里的confidence代表边界框置信度,它的定义为:

Pr(object)\times IoU_{pred}^{truth}

其中边界框包含目标时,Pr(object)=1,否则为0。而C代表每个类别的置信度,即:

Pr(Class_i|Object)\times Pr(objec) \times IoU_{pred}^{truth}=Pr(class_i)\times IoU_{pred}^{truth}

3.1 模型结构

YOLO采用卷积网络来提取特征,然后使用全连接层来得到预测值。网络结构参考GooLeNet模型,包含24个卷积层和2个全连接层。对于卷积层,主要使用1x1卷积来做channle reduction,然后紧跟3x3卷积。对于卷积层和全连接层,采用Leaky ReLU激活函数max(x,0.1x),但是最后一层却采用线性激活函数。

3.2 模型训练

在训练之前,先在ImageNet上进行了预训练,其预训练的分类模型采用图8中前20个卷积层,然后添加一个average-pool层和全连接层。预训练之后,在预训练得到的20层卷积层之上加上随机初始化的4个卷积层和2个全连接层。由于检测任务一般需要更高清的图片,所以将网络的输入从224x224增加到了448x448。

3.3 模型损失

Yolo算法将目标检测看成回归问题,所以采用的是均方差损失函数。但是对不同的部分采用了不同的权重值。首先区分定位误差和分类误差。对于定位误差,即边界框坐标预测误差,采用较大的权重 \lambda_{coord}=5 。然后其区分不包含目标的边界框与含有目标的边界框的置信度,对于前者,采用较小的权重值 \lambda_{noobj}=0.5 。其它权重值均设为1。然后采用均方误差,其同等对待大小不同的边界框,但是实际上较小的边界框的坐标误差应该要比较大的边界框要更敏感。为了保证这一点,将网络的边界框的宽与高预测改为对其平方根的预测,即预测值变为(x,y,\sqrt{w},\sqrt{h})

损失函数中,第一项为边界框中心坐标的误差项,\mathbb{1} _ {ij}^{obj} 是指第 i 个单元格存在目标,且该单元格中的第 j 个边界框负责预测该目标,第二项是边界框的高与宽的误差项。第三项是包含目标的边界框的置信度误差项。第四项是不包含目标的边界框的置信度误差项。最后一项是包含目标的单元格的分类误差项,\mathbb{1} _ {i}^{obj}值是指第 i 个单元格存在目标。

4. 实验结果

5. 参考文献

目标检测|YOLO原理与实现 - 知乎 (zhihu.com)

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队
在向OpenAI投资100多亿美元之后,微软才获得了GPT-3.5/GPT-4先进模型的使用权,但终究不是长久之计。
新智元
2024/05/14
1160
挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队
微软甩开OpenAI自研大模型,还计划用DeepSeek
众所周知,微软是 OpenAI 的主要支持者,为其投入了巨资,而且在自家系统与服务中广泛部署了 GPT 系列大模型。
机器之心
2025/03/10
960
微软甩开OpenAI自研大模型,还计划用DeepSeek
OpenAI 又贵又“黑”,微软对供应商亮起“红灯”:曝出自研大模型,DeepSeek 或成救星?
3 月 7 日,据外媒报道,微软正在筹谋没有 OpenAI 的新未来。微软 AI 部门负责人 Mustafa Suleyman 正将目光投向一个大胆的目标:减少公司对于 OpenAI 的依赖。目前,微软已经采取了一系列措施。值得注意的是,其背后的 AI 市场变化似乎更具警惕性:当模型供应商开始受制于售卖 token 的盈利模式、向下攫取应用层的价值,可能会发生什么?
深度学习与Python
2025/03/10
940
OpenAI 又贵又“黑”,微软对供应商亮起“红灯”:曝出自研大模型,DeepSeek 或成救星?
融资15亿美元却被挖走创始人,微软正在将这家创企生吞活剥?
本周二,微软宣布任命 DeepMind 联合创始人 Mustafa Suleyman 为新成立的消费者人工智能部门的负责人,并聘请了其 Inflection AI 人工智能初创公司的几名员工,以保持其领先地位。
机器之心
2024/03/26
1130
融资15亿美元却被挖走创始人,微软正在将这家创企生吞活剥?
微软一夜吞噬估值40亿美金AI初创!2位联创加盟重点打造Copilot,还带走多数员工
疯狂融资15亿美元,三人创立的初创公司Inflection,如今被微软一夜「掏空」了。
新智元
2024/03/25
1490
微软一夜吞噬估值40亿美金AI初创!2位联创加盟重点打造Copilot,还带走多数员工
OpenAI 忙着“宫斗”,手握 2.2 万块 H100 的竞争对手趁机发布新款大模型:1750 亿参数,性能仅次于 GPT-4
OpenAI 事变余波未平,竞争对手 Inflection AI 乘机发布新模型。
深度学习与Python
2023/11/27
2320
OpenAI 忙着“宫斗”,手握 2.2 万块 H100 的竞争对手趁机发布新款大模型:1750 亿参数,性能仅次于 GPT-4
创业也抱团!LinkedIn和DeepMind两位创始人合办了一家AI公司
---- 新智元报道   编辑:David 拉燕 【新智元导读】两位科技圈大佬联合创业了!一位是LinkedIn 联合创始人 Reid Hoffman,另一位则是前一段离任谷歌副总裁的 DeepMind 联合创始人 Mustafa Suleyman,新公司名为 Inflection AI,旨在开发  科技界大佬抱团创业,是什么体验? 近日,LinkedIn 联合创始人 Reid Hoffman 与 DeepMind 联合创始人 Mustafa Suleyman 和前 DeepMind 研究员 Karé
新智元
2022/03/15
5370
2022年,26位谷歌AI专家出走:大部分下海创业,最高融资15亿
机器之心报道 编辑:蛋酱、小舟 只从 2022 年算起,谷歌就向社会输送了至少 26 位高端 AI 人才。 2022 年,人工智能在 AIGC、AI for science 等领域持续发展,一些工作也在知识型模型方面做出了探索。除了这些研究成果,我们还会发现这一年人工智能从业者的工作情况也有比较大的变化。 例如,Meta 等大型科技公司进行了大规模的裁员,让很多 AI 从业者考虑新的就业方向。另一方面,多位 AI 专家选择离开大型科技公司,投身 AI 创业。 根据 Business Insider 的一项调
机器之心
2023/03/29
2460
2022年,26位谷歌AI专家出走:大部分下海创业,最高融资15亿
新火种AI|大模型公司纷纷被收编!创始人们逐渐变成了“最讨厌的自己”?
最近,国内大模型公司的融资潮正在如火如荼的进行着,各大公司纷纷收获了融资,正在携手迈进“200亿估值”的门槛。
新火种
2024/08/21
1490
新火种AI|大模型公司纷纷被收编!创始人们逐渐变成了“最讨厌的自己”?
奥特曼百万年薪挖角谷歌TPU人才,欲砸7万亿实现「芯片自由」?OpenAI自研芯片最新进展曝光
目睹了近年来PC和AI行业两次重大的半导体供应危机之后,Sam Altman似乎认为台积电、三星代工和英特尔代工这些传统的芯片制造商没有足够的产能,不能满足全球对AI芯片迅猛增长的需求。
新智元
2024/06/17
1110
奥特曼百万年薪挖角谷歌TPU人才,欲砸7万亿实现「芯片自由」?OpenAI自研芯片最新进展曝光
OpenAI竞对再被谷歌加注!4.5亿美元新融资到位,累计已吸金14.5亿美元
研发出ChatGPT最强竞品Claude的Anthropic公司,在谷歌投资之后,再次官宣获得了4.5亿美元C轮融资。
量子位
2023/08/03
2450
OpenAI竞对再被谷歌加注!4.5亿美元新融资到位,累计已吸金14.5亿美元
终极合体!谷歌大脑&DeepMind正式联姻,1+1>OpenAI?
---- 新智元报道   编辑:桃子 拉燕 【新智元导读】陷入被动的谷歌做出了一个重大决定:谷歌大脑和DeepMind正式合并,强强联合能否打赢OpenAI? 今天,谷歌终于放大招了! CEO劈柴正式宣布,Google DeepMind成立,谷歌大脑和DeepMind两个世界级AI团队正式合体了。 合并后的Google DeepMind将由DeepMind首席执行官Demis Hassabis领导,前谷歌AI负责人Jeff Dean接任首席科学家一职。 新版必应、GPT-4装进办公全家桶,微软接连
新智元
2023/05/09
2280
终极合体!谷歌大脑&DeepMind正式联姻,1+1>OpenAI?
大模型111人:谷歌和OpenAI的人才战争
衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 当我们围观ChatGPT炸开的多场激战时,还有什么是暗流下激战的? 今天要关注的,不是违背“非盈利”初心的OpenAI,也不是商业模式面临颠覆的谷歌搜索。把目光从公司层面挪开,看向另一场已经白热化的战争—— 借着的ChatGPT燎原之势,2月中旬同一天的30分钟内,就有2位谷歌大脑大模型人才先后官宣入职OpenAI,其中之一Jason Wei是思维链(chain-of-thought,CoT)的最早一作。 大模型交锋背后,谷歌和OpenAI的人才战争打得
量子位
2023/03/07
5520
大模型111人:谷歌和OpenAI的人才战争
从大厂离职后,AI 大神们选择加入 AI 初创公司
近两年,从国内外科技大公司离职的科学家们有两条发展路径:一是从工业界回到学术界,二是从大厂离开、自己创业,担任CEO或CTO等要职,并持续从风险投资人处成功获得融资。出于好奇心,AI科技评论盘点了部分有技术大牛坐镇的AI初创企业,或可一窥目前领域的技术落地走向。 作者 | 黄楠 编辑 | 陈彩娴 思谋科技 思谋科技是由香港中文大学终身教授、IEEE Fellow贾佳亚和沈小勇联合创立,公司的主要方向为工业检测与高清视频。 贾佳亚本科就读于复旦大学计算机系、香港科技大学计算机科学博士,曾在微软亚洲研究院做过一
AI科技评论
2022/06/20
2.3K0
从大厂离职后,AI 大神们选择加入 AI 初创公司
2.2万张H100造全球最大超算,ChatGPT劲敌融资13亿美元!微软英伟达领投,Inflection一年撼动OpenAI霸权
这家由DeepMind创始人之一创立的人工智能初创公司,从微软、英伟达、和3位亿万富翁(Reid Hoffman、盖茨和Eric Schmidt)获得了融资。
新智元
2023/08/07
1960
2.2万张H100造全球最大超算,ChatGPT劲敌融资13亿美元!微软英伟达领投,Inflection一年撼动OpenAI霸权
GPT-5来了?OpenAI被曝加急训练多模态大模型Gobi,一举狙杀谷歌Gimini!
而OpenAI,当然不会坐以待毙。他们正在争分夺秒地把多模态功能整合进GPT-4里,争取推出功能与Gemini类似的多模态大模型,一举击杀谷歌。
新智元
2023/09/22
3290
GPT-5来了?OpenAI被曝加急训练多模态大模型Gobi,一举狙杀谷歌Gimini!
微软OpenAI决裂/Stability AI倒闭,新架构终结Transformer?福布斯2024年AI十大终极预测
据说Stability AI将会倒闭?而「情同父子」的微软和OpenAI将会出现裂痕?
新智元
2024/01/04
2550
微软OpenAI决裂/Stability AI倒闭,新架构终结Transformer?福布斯2024年AI十大终极预测
OpenAI工程师曝出开发ChatGPT只用8天!长文揭秘谷歌DeepMind等硅谷顶流如何诞生
众所周知,从GPT-2到GPT-3,用了很多年,为什么ChatGPT的诞生却只要8天?
新智元
2023/12/20
2280
OpenAI工程师曝出开发ChatGPT只用8天!长文揭秘谷歌DeepMind等硅谷顶流如何诞生
新火种AI|VC对大模型望而生畏?2023,资本投资AI的风向标有哪些
2023年是AI实现大爆发的元年,特别是大模型赛道,因为ChatGPT的横空出世,在全世界范围内掀起了一波浪潮。
新火种
2023/11/28
2600
AI日报|微软Copilot全家桶造福十亿打工人,李开复称大模型狂降价是双输...
AI晚报|微软推出Copilot+PC,通义主模型大幅降价,文心两大模型全面免费...
可信AI进展
2024/05/23
1130
推荐阅读
挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队
1160
微软甩开OpenAI自研大模型,还计划用DeepSeek
960
OpenAI 又贵又“黑”,微软对供应商亮起“红灯”:曝出自研大模型,DeepSeek 或成救星?
940
融资15亿美元却被挖走创始人,微软正在将这家创企生吞活剥?
1130
微软一夜吞噬估值40亿美金AI初创!2位联创加盟重点打造Copilot,还带走多数员工
1490
OpenAI 忙着“宫斗”,手握 2.2 万块 H100 的竞争对手趁机发布新款大模型:1750 亿参数,性能仅次于 GPT-4
2320
创业也抱团!LinkedIn和DeepMind两位创始人合办了一家AI公司
5370
2022年,26位谷歌AI专家出走:大部分下海创业,最高融资15亿
2460
新火种AI|大模型公司纷纷被收编!创始人们逐渐变成了“最讨厌的自己”?
1490
奥特曼百万年薪挖角谷歌TPU人才,欲砸7万亿实现「芯片自由」?OpenAI自研芯片最新进展曝光
1110
OpenAI竞对再被谷歌加注!4.5亿美元新融资到位,累计已吸金14.5亿美元
2450
终极合体!谷歌大脑&DeepMind正式联姻,1+1>OpenAI?
2280
大模型111人:谷歌和OpenAI的人才战争
5520
从大厂离职后,AI 大神们选择加入 AI 初创公司
2.3K0
2.2万张H100造全球最大超算,ChatGPT劲敌融资13亿美元!微软英伟达领投,Inflection一年撼动OpenAI霸权
1960
GPT-5来了?OpenAI被曝加急训练多模态大模型Gobi,一举狙杀谷歌Gimini!
3290
微软OpenAI决裂/Stability AI倒闭,新架构终结Transformer?福布斯2024年AI十大终极预测
2550
OpenAI工程师曝出开发ChatGPT只用8天!长文揭秘谷歌DeepMind等硅谷顶流如何诞生
2280
新火种AI|VC对大模型望而生畏?2023,资本投资AI的风向标有哪些
2600
AI日报|微软Copilot全家桶造福十亿打工人,李开复称大模型狂降价是双输...
1130
相关推荐
挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队
更多 >
LV.4
这个人很懒,什么都没有留下~
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档