Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >yolov8 模型架构轻量化,极致降低参数量

yolov8 模型架构轻量化,极致降低参数量

作者头像
机器学习AI算法工程
发布于 2024-05-29 10:44:59
发布于 2024-05-29 10:44:59
2.5K0
举报
向AI转型的程序员都关注了这个号👇👇👇

模型轻量化加速是深度学习领域的重要研究方向,旨在减小模型的体积和计算复杂度,从而提高在资源受限设备上的运行效率,模型参数量在轻量化加速中扮演着至关重要的角色。

首先,模型参数量直接决定了模型的复杂度和存储空间需求。随着深度学习技术的不断发展,模型参数数量急剧增加,导致模型体积庞大,给存储和传输带来了巨大挑战。通过减少模型参数量,可以有效降低模型的体积,从而减小存储空间需求,使模型更容易在嵌入式设备和移动设备上部署。

其次,模型参数量对计算资源的需求有显著影响。在模型训练和推理过程中,参数量的大小直接决定了所需的计算量。减少模型参数量可以降低计算资源的消耗,提高计算效率,使得模型在资源受限设备上能够更快地完成训练和推理任务。

此外,模型参数量还影响着模型的泛化能力和鲁棒性。过多的参数可能导致模型过拟合,降低其泛化能力;而减少参数量则有助于防止过拟合,提高模型的鲁棒性。因此,在模型轻量化加速过程中,通过合理减少参数量,可以在保持模型性能的同时,实现模型的轻量化。

为了降低模型参数量,研究人员采用了多种方法,如剪枝、量化、蒸馏等。这些方法可以有效地移除模型中的冗余参数,降低模型的复杂度和存储空间需求。在剪枝过程中,研究人员会识别并移除模型中的冗余连接和权重较小的参数;在量化过程中,会将模型中的高精度参数转换为低精度参数,从而减少参数数量并降低计算复杂度;在蒸馏过程中,则会将大模型的知识转移到小模型中,使小模型在保持一定性能的同时减少参数量。

本文将从另外一个角度,即模型的结构设计方面,实现参数量的最小,并以YOLOV8为例子,通过模型结构的轻量化设计,在保证模型性能稳定不变的前提下极致的压缩参数量

一、设计思路

从模型结构看V8主要有两个大的模块构成,就是backbone和head模块,因此降低参数量我们就从这两模块开始

二、bakebone模块轻量化参数

1.CSPPC替换c2f卷积块

论文地址:https://arxiv.org/pdf/2303.03667.pdf

如上图,其中利用了PConv模块大量降低参数量

其中

PConv(部分卷积)的基本原理是利用特征图的冗余,从而减少计算和内存访问。具体来说,PConv 只在输入通道的一部分上应用常规卷积进行空间特征提取,而保留剩余通道不变。这种设计的优势在于:

1.减少计算复杂度:PConv 通过在较少的通道上进行计算,降低了浮点操作(FLOPs)的数量。例如,如果部分率设置为 1/4,则PConv的计算量只有常规卷积的 1/16.

2.降低内存访问:与常规卷积相比,PConv减少了内存访问量,这对于输入输出(/0)受限的设备尤其有益

3.保持特征信息流:尽管只对输入通道的一部分进行计算,但保留的通道在后续的逐点卷积(PWConv)层中仍然有用,允许特征信息在所有通道中流动

2.Down_wt替换backbone下采样模块

上图是ADown,其是在202402021最新发布的yolov9模型结构中提出的

检测头轻量化参数

论文地址:https://arxiv.org/pdf/2306.15988.pdf

主要改进机制:

1.底层特征融合: AFPN通过引入底层特征的逐步融合,首先融合底层特征,接着深层特征,最后整合顶层特征。这种层级融合的方式有助于更好地利用不同层次的语义信息,提高检测性能。

2,自适应空间融合;引入自适应空间融合机制(ASFF),在多级特征融合过程中引入变化的空间权重,加强关键级别的重要性,同时抑制来自不同对象的矛盾信息的影响。这有助于提高检测性能,尤其在处理矛盾信息时更为有效。

3.底层特征对齐: AFPN采用渐近融合的思想,使得不同层次的特征在融合过程中逐渐接近,减小它们之间的语义差距。通过底层特征的

逐步整合,提高了特征融合的效果,使得模型更能理解和利用不同层次的信息。个人总结:AFPN的灵感就像是搭积木一样,它不是一下子把所有的积木都放到一起,而是逐步地将不同层次的积木慢慢整合在一起。这样一来,我们可以更好地理解和利用每一层次的积木,从而构建一个更牢固的目标检测系统。同时,引入了一种智能的机制,能够根据不同情况调整注意力,更好地处理矛盾信息。

模型结构轻量化参数对比

原yolov8参数:3011043

轻量化后参数:1436977

通过以上模块的替换使得模型参数降低至原来的一半不到,且精度不变,这是通过剪枝、蒸馏都没办到的

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-05-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习AI算法工程 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
智慧矿区分享|面向边缘计算的改进YOLOv8矿区障碍检测模型研究
近年来,随着矿用卡车自动驾驶技术的兴起,使得矿区道路行车障碍物检测变得至关重要,基于深度学习的目标检测模型应用于矿区道路障碍检测取得了显著的效果,为矿用卡车自动驾驶技术的完善提供了可能。为解决现有模型应用于矿区障碍物检测,往往存在算法庞大与部署成本较高的问题,提出一种面向边缘计算平台的改进YOLOv8矿区道路障碍检测模型,该模型针对资源有限的边缘计算设备进行优化部署,以实现对障碍物的快速、精准检测。该模型在特征提取阶段,引入深度可分离卷积和通道注意力机制,提高模型对障碍物整体特征提取能力,从而提升对不同尺寸障碍物的检测精度;特征融合阶段采用 BiFPN网络结构,轻量化颈部网络并自适应地调整融合权重,减少冗余信息,提高特征的表达能力;使用局部卷积PConv对检测头进行重新设计,减少网络参数量以提高检测效率;最后,通过引入Inner-CIoU函数对边界框损失进行优化,加快模型收敛速度并提升边界框定位效果。实验结果显示,该网络在所使用的矿区障碍物数据集上,mAP@0.5仅下降0.05的前提下,模型参数减少了44%,推理时间缩短了34%。相比其他轻量型检测网络,该模型在实验硬件设备上的检测速度更快,且在精度和轻量化之间实现了更好的平衡,为障碍物检测模型的实际部署提供了可行方案。
CoovallyAIHub
2025/01/02
2020
智慧矿区分享|面向边缘计算的改进YOLOv8矿区障碍检测模型研究
机场安全项目|基于改进 YOLOv8 的机场飞鸟实时目标检测方法
《科学技术与工程》2024年第24卷第32期刊载了中国民用航空飞行学院空中交通管理学院孔建国, 张向伟, 赵志伟, 梁海军的论文——“基于改进 YOLOv8 的机场飞鸟实时目标检测方法”。
CoovallyAIHub
2025/01/02
2100
机场安全项目|基于改进 YOLOv8 的机场飞鸟实时目标检测方法
【YOLOv8】YOLOv8结构解读
YOLOv8是YOLO(You Only Look Once)系列目标检测算法的最新版本,由Ultralytics团队开发。YOLOv8在YOLOv5的基础上进行了多项改进,进一步提升了检测精度和速度。
HABuo
2025/02/18
4.8K0
【YOLOv8】YOLOv8结构解读
基于YOLOv8的无人机图像目标检测算法
在无人机(UAV)目标检测任务中,存在因检测目标尺度小、检测图像背景复杂等原因导致的漏检、误检问题。针对上述问题,提出改进YOLOv8s的无人机图像目标检测算法。
一点人工一点智能
2024/05/21
2.1K0
基于YOLOv8的无人机图像目标检测算法
RCS-YOLO | 比YOLOv7精度提高了2.6%,推理速度提高了60%
本文首发于 【集智书童】,白名单账号转载请自觉植入本公众号名片并注明来源,非白名单账号请先申请权限,违者必究。
集智书童公众号
2023/09/04
1.6K0
RCS-YOLO | 比YOLOv7精度提高了2.6%,推理速度提高了60%
讲解YOLOv5模型剪枝压缩
目前,深度学习模型的部署和应用已经成为了各个领域的热门话题。然而,随着深度学习模型的不断发展,模型的复杂性和计算需求也越来越高,限制了模型在资源受限的设备上的应用。为了解决这个问题,模型剪枝压缩成为了一种常用的方法。在本文中,我们将讲解如何使用YOLOv5模型进行剪枝压缩,以实现模型的高效部署。
大盘鸡拌面
2023/12/08
9350
YoloV8改进策略:主干网络改进|CAS-ViT在YoloV8中的创新应用与显著性能提升
在深度学习与计算机视觉领域,模型效率与性能之间的平衡一直是研究者和开发者关注的焦点。特别是在实时检测与识别任务中,如YoloV8这类高效的目标检测模型,其主干网络的选择对整体性能具有决定性作用。近期,我们通过将CAS-ViT(卷积加性自注意力视觉Transformer)创新性地引入到YoloV8中,替换其原有的主干网络,实现了令人瞩目的性能提升,这一改进不仅彰显了CAS-ViT的强大潜力,也为YoloV8的进一步优化开辟了新路径。
AI浩
2024/10/22
4470
YoloV8改进策略:主干网络改进|CAS-ViT在YoloV8中的创新应用与显著性能提升
YOLO进化史:YOLOv5、YOLOv8 与 YOLOv10 的性能分析与边缘部署探讨!
AI模型部署落地实战👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」
集智书童公众号
2024/07/11
20.3K0
YOLO进化史:YOLOv5、YOLOv8 与 YOLOv10 的性能分析与边缘部署探讨!
FA-YOLO:高效轻量级检测模型,94.6%参数减少,88倍速度提升!
作为一种突发性和极其破坏性的灾害[1,2,3],火长期以来对人类社会和自然环境构成了严重威胁。随着城市化和工业化的加速,建筑结构的复杂性以及人口的密集度逐渐增加,火灾的频率和危害也在逐年上升[4,5,6,7]。根据国际消防组织(IFPO)的统计数据,每年全球发生数百万起火灾事故,导致了大量的行人伤亡和财产损失,同时对生态环境造成了不可逆转的破坏。在森林区域,火势的蔓延通常会导致大片森林资源的破坏,进而加剧土壤侵蚀和空气污染等生态问题。
未来先知
2024/10/15
3400
FA-YOLO:高效轻量级检测模型,94.6%参数减少,88倍速度提升!
YOLO11性能飞跃的背后:从C3k2到C2PSA,技术细节全解析!
总说YOLO11强大,可强大在何处呢?一篇文章让你看懂YOLO11模型架构如何超越前者。
CoovallyAIHub
2025/02/12
2.1K0
YOLO11性能飞跃的背后:从C3k2到C2PSA,技术细节全解析!
YoloV8改进策略:卷积篇|CGAFusion,增强模型对特征的提取能力|附代码|即插即用
量化是提升卷积神经网络(CNNs)速度并降低其内存使用量的常用方法。当存在已标记的训练数据时,网络权重和激活已成功量化到l位。然而,对于没有已标记训练数据的场景(例如,在量化预训练模型时),则不能这样说。目前的方法显示,在8位量化时,最佳情况下不会损失精度。
AI浩
2024/12/24
4000
YoloV8改进策略:卷积篇|CGAFusion,增强模型对特征的提取能力|附代码|即插即用
基于改进 YOLOv10 的自助结算系统 !
受到数字革命的推动,传统零售商店面临着众多转型挑战与机遇。随着消费者需求的多样化以及购物行为的快速演变,传统零售店结账流程的低效率问题日益凸显,常常导致客户体验不佳。尤其是在高峰时段,顾客可能需要长时间等待支付,这负面影响了他们的购物体验,并限制了商店的容量和销售增长潜力。
未来先知
2024/08/13
3360
基于改进 YOLOv10 的自助结算系统 !
超越Yolov8/Yolov9,用Hyper图方法释放YOLO系列的所有潜能 !
YOLO系列是目标检测领域的主流方法,为各种应用场景提供了多种优势。YOLO的架构包括两个主要部分:backbone 和 neck 。尽管backbone主要用于特征提取,但已经取得了广泛的研究成果,而neck负责多尺度特征的融合,为各种大小的目标的检测提供了强大的基础。本文特别关注的是neck,这对于提升模型在检测不同尺度物体方面的能力至关重要。
未来先知
2024/08/20
6590
超越Yolov8/Yolov9,用Hyper图方法释放YOLO系列的所有潜能 !
YoloV8改进策略:RefConv打造轻量化YoloV8利器
REFCONV是一种用于构建强大卷积神经网络的重新参数化的重新聚焦卷积(re-parameterized refocusing convolution)。它是一种特殊的卷积层,旨在通过重新参数化输入特征图来增强卷积神经网络的能力。
AI浩
2024/10/22
2260
YoloV8改进策略:RefConv打造轻量化YoloV8利器
最新轻量化Backbone | FalconNet汇聚所有轻量化模块的优点,成就最强最轻Backbone
为了解决这些问题,本文将轻量化CNNs的4个重要组成部分从粗到细分解并重新设计:
集智书童公众号
2023/09/04
1.1K0
最新轻量化Backbone | FalconNet汇聚所有轻量化模块的优点,成就最强最轻Backbone
YOLO落地部署 | 一文全览YOLOv5最新的剪枝、量化的进展【必读】
本文首发于 【集智书童】,白名单账号转载请自觉植入本公众号名片并注明来源,非白名单账号请先申请权限,违者必究。
集智书童公众号
2023/09/04
7.1K0
YOLO落地部署 | 一文全览YOLOv5最新的剪枝、量化的进展【必读】
YOLOv8小目标检测介绍
Yolo小目标检测,独家首发创新(原创),适用于Yolov5、Yolov7、Yolov8等各个Yolo系列,专栏文章提供每一步步骤和源码,带你轻松实现小目标检测涨点
AI小怪兽
2023/11/11
4.1K0
ADA-YOLO | YOLOv8+注意力+Adaptive Head,相对YOLOv8,mAP提升3%+118FPS
近年来,目标检测技术取得了显著的进展,使得可以实现对解剖结构、病变或异常的自动识别和定位。多年来,目标检测方法取得了重大的进步,这是由于大规模的带有标注的数据集的出现和深度学习技术的开发所驱动的。这些技术在改善医疗诊断和治疗结果方面展示出巨大的潜力。
集智书童公众号
2024/01/17
1.2K0
ADA-YOLO | YOLOv8+注意力+Adaptive Head,相对YOLOv8,mAP提升3%+118FPS
YOLOv10开源|清华用端到端YOLOv10在速度精度上都生吃YOLOv8和YOLOv9
实时目标检测一直是计算机视觉研究领域的一个重点,旨在在低延迟下准确预测图像中物体的类别和位置。它被广泛应用于各种实际应用中,包括自动驾驶,机器人导航,物体跟踪等。近年来,研究行人一直致力于设计基于CNN的目标检测器以实现实时检测。其中,YOLOs因其性能和效率之间的巧妙平衡而越来越受欢迎。YOLOs的检测流程包括两部分:模型前向过程和NMS后处理。然而,这两者仍存在不足,导致次优的准确度-延迟边界。
集智书童公众号
2024/05/28
3.4K0
YOLOv10开源|清华用端到端YOLOv10在速度精度上都生吃YOLOv8和YOLOv9
DeepSeek模型轻量化:模型压缩与知识蒸馏技术解析
近年来,深度学习模型在自然语言处理、计算机视觉等领域取得了突破性进展,模型参数量从百万级迅速增长至千亿甚至万亿级别。以GPT-4、PaLM-2为代表的大规模预训练模型虽然在任务性能上表现卓越,但其庞大的计算需求和存储开销严重制约了实际应用。例如,部署一个千亿参数的模型需要数百GB的显存和极高的算力支持,这在移动设备或实时系统中几乎无法实现。此外,高能耗与长推理延迟也阻碍了AI技术在工业场景的普及。 DeepSeek作为领先的人工智能研究机构,致力于通过模型压缩与知识蒸馏技术解决上述问题。其目标是在尽可能保留模型性能的前提下,显著降低计算成本和内存占用,使大模型能够高效运行于资源受限的环境。模型压缩通过量化、剪枝、低秩分解等技术减少模型冗余,而知识蒸馏则通过迁移大模型的知识提升小模型的性能。两者的结合为模型轻量化提供了系统化解决方案,并在边缘计算、实时服务等领域展现了巨大潜力。 模型压缩技术原理
用户7353950
2025/02/05
1.9K0
DeepSeek模型轻量化:模型压缩与知识蒸馏技术解析
推荐阅读
相关推荐
智慧矿区分享|面向边缘计算的改进YOLOv8矿区障碍检测模型研究
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档