Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >FA-YOLO:高效轻量级检测模型,94.6%参数减少,88倍速度提升!

FA-YOLO:高效轻量级检测模型,94.6%参数减少,88倍速度提升!

作者头像
未来先知
发布于 2024-10-15 04:49:47
发布于 2024-10-15 04:49:47
3320
举报
文章被收录于专栏:未来先知未来先知

由于其突发性高和破坏力巨大,火灾长期以来已对人类社会和生态环境构成严重威胁。近年来,随着智慧城市物联网(IoT)技术的飞速发展,基于深度学习的火灾检测系统逐渐成为应对火灾关键手段。 然而,现有火灾检测模型在复杂环境中的检测准确性和实时性能方面仍然存在许多挑战。 为了解决这些问题,作者提出了两个关键模块:EAConv(Efficient Attention Convolution)和EADown(Efficient Attention Downsampling)。 其中,EAConv模块通过将高效注意力机制与深层分离卷积相结合,显著提高了特征提取效率; 而EADown模块则通过利用空间和通道注意力机制以及池化操作,增强了特征下采样准确性和效率。 基于这两者模块,作者设计了一种高效轻量级火焰检测模型EFA-YOLO(Efficient Feature Attention YOLO)。 实验结果显示,EFA-YOLO具有仅为1.4M的模型参数量,4.6 GFLOPs的计算量,和CPU上每张图像的推理时间仅为22.19 ms。 与现有主流模型(如YOLOv5、YOLOv8、YOLOv9和YOLOv10)相比,EFA-YOLO在检测准确率(mAP)和推理速度方面显著提高了约94.6%的检测准确率和约88倍的推理速度提升。

1 Introduction

作为一种突发性和极其破坏性的灾害[1,2,3],火长期以来对人类社会和自然环境构成了严重威胁。随着城市化和工业化的加速,建筑结构的复杂性以及人口的密集度逐渐增加,火灾的频率和危害也在逐年上升[4,5,6,7]。根据国际消防组织(IFPO)的统计数据,每年全球发生数百万起火灾事故,导致了大量的行人伤亡和财产损失,同时对生态环境造成了不可逆转的破坏。在森林区域,火势的蔓延通常会导致大片森林资源的破坏,进而加剧土壤侵蚀和空气污染等生态问题。

火灾风险的多样性和复杂性使得火灾的预防和控制变得尤为重要。火灾风险可以源于各种来源,如建筑结构、电子设备、易燃材料的错误储存和处理等,通常是隐性和突然发生的。传统的火警检测技术依赖于诸如烟雾传感器和温度报警器等设备,尽管这些设备能够检测到火灾的发生,但在开放空间、户外环境或火灾初期的反应效率和精确度往往受到限制。尤其是在火灾的初期,火焰体积较小,难被传统传感器捕获,这增加了预防控制火灾风险的困难。

因此,开发新的火警检测技术,特别是在图像处理和深度学习基础上构建的智能火警检测系统[10,11,12],具有极度实际的重要性。这些技术可以利用火焰的视觉特性实现早期的火灾预警,并通过精确定位和快速响应减少火灾带来的危害。随着智能城市和物联网(IoT)技术的发展,基于视觉的火警检测系统将能提供更有效的现代火灾风险的监测和管理解决方案。

近年来,随着防火控制需求的增加,不同场景下的火警检测研究逐渐深入。研究行人提出各种改进方法来解决现有火警检测技术的局限性,特别是在复杂背景下的火焰检测,高实时要求的城区火警监控,以及小目标火焰检测等方面,出现了各种创新的算法。为了解决这些问题,研究行人不仅优化了检测模型的结构,而且还采用了诸如数据增强、多尺度特征提取和注意力机制等技术手段。下面的部分详细介绍了一些研究行人在火警检测方面的研究成果。

王等人提出了一种名为YOLOv5s-ACE的算法,以解决复杂森林火警中的低检测精度、慢检测和粗糙特征提取问题。该算法首先通过 Copy-Paste 数据增强将小目标样本集扩展,以减少在模型训练过程中过拟合的风险。其次,选择一个空的空间金字塔池化(ASPP)模块来替代YOLOv5中的SPP模块,从而扩大了传感范围并提高了小目标森林火焰的精确定位。最后,添加了卷积块注意力模块(CBAM)以进一步过滤关键特征并减少背景干扰。孙等人等提出了一种面向移动场景的基于深度学习的边缘智能火灾检测系统[27]。

[24] 提出了一种基于图像的非接触式火警检测技术,用于接触型火警传感器,该传感器易受到非火粒子的干扰。他们的研究通过对比八个现有的目标检测模型,证明了YOLOv5在mAP和FPS上的优势,并通过引入CBAM模块、BiFPN结构和反卷积,进一步优化了YOLOv5的网络,这显著提高了模型的检测准确性和处理速度。Wang等人[25] 针对YOLOv7在小,密集火烟目标上的识别优势,以及其在对小密集火烟目标识别上的局限性,提出了FS-YOLO模型。该模型通过增强Swin Transformer模块和引入高效的通道注意力机制,降低火警检测中的误报率。此外,该研究开发了一个包含真实火场场景和火烟图像的双数据集,模拟复杂的条件,如 Mask 和透镜模糊。

Wang等人[26] 提出了一个改进的YOLOX多尺度火警检测方法,以解决传统火警检测方法在大范围火焰和烟雾目标上的无效果问题。该方法通过设计一个新型的特征金字塔模型(HC-FPN)减少了高层特征图的信息损失,并增强特征表示能力。此外,采用小目标数据增益策略扩展了森林火数据集,使模型更适用于真实森林火场景。

虽然研究行人通过引入注意力机制、轻量级 Backbone 网络和多尺度特征提取,提高了检测准确性和速度,但在高实时要求的火警监控中,仍然存在模型参数数量大和计算复杂度高等问题。为了解决这些问题,作者提出了一种创新的火焰检测模型EFA-YOLO(Efficient Feature Attention YOLO)。该模型通过两个关键模块:EAConv(Efficient Attention Convolution)和EADown(Efficient Attention Downsampling)实现高效特征提取和降采样。EAConv模块将高效注意机制与深度可分离卷积相结合,而EADown模块通过融合空间和通道注意机制以及池化操作,增强了特征降采样的准确性和效率。

总的来说,本文的贡献如下:

  • 提出了两个关键模块:EAConv和EADown,其中EAConv模块通过高效注意机制和深度可分离卷积显著提高特征提取的效率和准确性;EADown模块通过融合空间和通道注意机制以及池化操作,增强了特征降采样的性能。
  • 设计和实现了高效、轻量级的火焰火警检测模型EFA-YOLO,该模型在降低模型参数数量和计算复杂度的同时,维持了高的检测准确性,特别适合实时火警检测应用。EFA-YOLO 通过有效的多尺度特征融合,改善了复杂背景下的检测。与主流模型(如YOLOv5、YOLOv8、YOLOv9和YOLOv10)相比,EFA-YOLO在检测准确性(mAP)和推理速度上都有显著提升。实验结果表明,EFA-YOLO将模型参数数量减少94.6%,并将推理时间加快88倍,从而大大提升了实时检测的性能。

提供了一种有效轻量级解决方案,适用于嵌入式设备和智慧城市场景:由于其轻量级的设计,EFA-YOLO能够高效地在资源受限的设备上运行,适用于智能城市的火警监控系统,并为未来的火警检测技术提供了一种灵活可扩展的模型架构。

2 Methods

在本节中,作者将对提出的模型进行全面解释,并就网络模型中的每个模块提供详细的描述,阐明它们各自的功能。首先,作者将给出整个模型的解释,然后将详细解释涉及的模块,包括EAConv(高效的关注卷积)模块,EADown(高效的关注下采样)模块。

Overview

EFA-YOLO(有效特征注意力YOLO)模型被提出,以应对当前火警检测技术在复杂场景中面临的多个挑战,特别是实时火焰检测的需求以及复杂背景中小目标检测的问题。

EFA-YOLO的设计概念基于两个关键模块 - EAConv(有效注意力卷积)和EADown(有效注意力下采样)。EAConv模块通过一个高效的特征提取机制,改善了对复杂目标(如火焰)的感知,而EADown模块通过结合注意力机制([27])和池化操作,有效地实现了特征下采样。该模型架构全面考虑了火警检测中对多尺度特征提取的需求,同时考虑了模型的轻巧和计算效率。

这使EFA-YOLO不仅能够在复杂场景中实现高精度检测,而且显著缩短了推理时间,满足了实时需求。通过全面优化,EFA-YOLO在模型参数、推理时间和检测精度上取得了显著改进,证明了它在火警检测领域具有广阔的应用前景。

其中,SPPF的公式如下。

SPPF模块通常是SPP(空间金字塔池化)的一个增强版,允许对相同的输入使用不同的池化核大小,然后进行连接。下面解释SPPF的公式:

输入特征图,其中、和分别表示高度、宽度和通道。

SPPF的操作步骤如下:

  1. 对输入特征图进行不同核大小的最大池化:

重复此操作,例如:

  1. 将最大池化的特征图连接起来:
  2. 通过一个1x1卷积层(通常)对连接的特征图进行处理:

卷积层应用滤波器压缩并细化连接的特征图。

其中,CBS的公式如下。

最后,经过一个SiLU激活函数和批量归一化(BN)层(通常为1x1卷积层)的卷积进行处理。

EAConv

EAConv模块是EFA-YOLO的核心部分,最初设计是为了应对传统卷积在处理复杂场景和动态目标(如火焰)时的局限性。传统卷积层在特征提取阶段往往无法准确捕捉到像火焰这样的小目标的空间和通道信息,这使得模型在复杂背景下的检测能力变得力不从心。

为此,EAConv模块通过引入高效的时空和通道注意力机制,使模型能够智能地关注图像中的关键特征区域,从而在提高了火焰检测的准确性和鲁棒性的同时。EAConv模块如图2所示。

与此同时,EAConv模块还包括深层可分卷积[28],这是一种可以显著降低计算量,同时保持特征提取有效性的卷积技术。这样,EAConv不仅实现了检测准确度的突破,还大大降低了模型的计算复杂度,使得它可以轻松部署在资源受限的设备(如边缘设备和嵌入式系统)上。

EAConv模块已在EFA-YOLO的多个层中多次使用,确保了每个尺度的特征都能得到充分表示和处理,最终EAConv不仅是对卷积模块的简单优化,更是特征提取的创新,使得EFA-YOLO能够在结合注意力和轻量级卷积的同时,保持高计算效率和强大的特征捕获能力。这样的设计使EAConv成为提高检测准确度和加速推理的关键因素。

EADown

EADown模块专注于高效的特征降采样过程,这是EFA-YOLO中的另一个重要模块。在火焰检测场景中,尤其是处理小火焰或长距离火时,由于特征图大小的减小,模型在进行降采样时往往丢失了重要细节信息,可能导致误判或漏检。EADown模块通过引入时空注意力和通道注意力机制以及最大池化和平均池化策略,在降采样过程中保持和增强关键信息,从而确保模型在降采样阶段仍能对火焰目标保持敏感,并有效地防止特征损失。EADown模块如图3所示。

EADown模块不仅仅是一个降采样操作,而是通过注意力机制智能地过滤重要特征,从而在减小特征图大小的同时,确保模型仍然对火焰等目标保持足够关注。这使得模型在提取高级语义特征时,仍能保留低级特征,尤其是小目标火焰的细节。此外,EADown模块的多尺度特征提取能力增强了模型对不同尺度目标的适应性,确保了EFA-YOLO在处理不同大小火焰目标时表现良好。

通过优化EADown模块,EFA-YOLO在处理小目标火焰和复杂场景中的性能得到了显著提升。该模块与EAConv模块配合使用,确保模型在保持轻量的同时,仍具有强大的特征表示和计算效率。

这使得EFA-YOLO能够在实际应用中同时满足实时性、高精度、轻量化的需求,为火焰检测提供了一种实际可行的解决方案。

3 Experimental Details

Dataset

消防数据集[29]涵盖了广泛的火情场景,包括建筑物火、草原火、森林火以及不同物体如汽车(如汽车、卡车、摩托车和机动车辆)的火灾,火势从大到小不等。该数据集还区分了白天和夜晚、室内和室外两种火环境,以确保模型能够适应不同的照明和空间条件。

此外,每个火情场景中的烟雾特性都与火相符,反映了不同火型、大小和环境之间的差异。总共包含2060个标注数据集,作者将其随机分为8:2的训练和测试集。该数据集可用于训练消防检测和烟雾识别模型,这些模型可以应用于智能场景如消防监测和预警系统。

Experimental environment

实验程序在Linux操作系统上执行,使用NVIDIA GeForce RTX 4090D 24G显卡驱动。深度学习框架选择Pytorch+cu版本11.8,版本为2.0.1,Jupyter Notebook用作编译器,指定的编程语言为Python 3.8,所有比较分析中使用的算法在相同的计算设置中标操一致运行。图像尺寸调整为6406403,批量大小为8,优化器选择SGD,学习率设置为0.001,训练周期为300。使用AMD EPYC 9754处理器计算推理时间。

评估指标

在本研究中,使用四个关键指标:精确度、召回率、mAP50和mAP50:95对检测模型的性能进行评估。精确度衡量模型预测阳性类别时的准确性,而召回率评估模型检测到的阳性类别的全面性。而mAP50和mAP50:95分别表示在IOU阈值为0.5时的平均准确率,并从0.5变化到0.95时,用于全面评估模型在不同条件下的检测性能[30]。

图4:数据集样本的部分显示。

为了进一步评估模型的复杂性和效率,本研究还使用Params(M)(模型中的参数数量)、GFLOPs(每秒浮点运算数)和Model Size(MB)(模型大小)以及Inference Time(ms)来衡量模型。Params(M)表示模型中的总参数数量,参数数量越少,模型越轻便,更适合在资源受限的环境中部署。Params(M)表示模型中的总参数数量,参数数量越小,模型越轻便,更适合在资源受限的环境中部署。

GFLOPs代表模型的计算复杂度,计算复杂度越低,模型的计算需求越低,效率更高。Model Size(MB)衡量模型的存储需求,模型越小,部署在嵌入设备上的难度越小。

通过对这些指标的综合评估,本研究有效地衡量了模型在检测准确性、计算复杂度和实时性能方面的性能,为优化和实际应用火警检测模型提供了科学依据。

4 Experimental Results and Discussion Analysis

为了验证本文提出的EFA-YOLO目标检测模型的高性能,作者对该数据集进行了多项验证,并使用了上述提及的多种评价指标进行评估和分析。

首先,本文介绍了当前主流的目标检测模型,并与本文提出的模型EFA-YOLO进行了比较实验,以证明提出在本篇中模型的高性能。然后,作者对本文提出的模型进行评估,包括比较实验结果的分析,比较实验模型的识别结果分析。

最后,通过消融实验验证了本文设计的模块和结构的有效性。

Comparative Experiment

为了验证所提出模型的性能,作者将使用训练集训练的EFA-YOLO与YOLOv5、YOLOv8、YOLOv9和YOLOv10等目标检测模型进行了比较。通过对这些实验的比较,证明了该模型的优越性能。与YOLOv5m、YOLOv8m和YOLOv10m相比,EFA-YOLO的mAP50分别提高了0.8%、1.2%和3.9%(见表1)。

  • 精确度(P)与召回率(R)分析: 在精确度和召回率两个方面,EFA-YOLO都取得了显著的改进。与YOLOv5m相比,EFA-YOLO通过提高精确度0.5%、召回率提高3.5%来取得领先。这意味着EFA-YOLO不仅在降低假阳性(即提高精确度)方面优于主流模型如YOLOv5m和YOLOv8m,而且在提高检测全面性(即提高召回率)方面也优于主流模型。与YOLOv10m相比,EFA-YOLO的精确度和召回率分别提高了1.7%和1.0%,进一步说明了模型在检测准确性和全面性方面的改进。
  • mAP50和mAP50-95分析: mAP50是评价模型检测准确性的重要指标。实验结果显示,与YOLOv5m相比,EFA-YOLO的mAP50提高了0.8%(见表1),与YOLOv8m相比提高了1.2%(见表1),与YOLOv10m相比提高了4.1%(见表1)。这显著的改进表明,EFA-YOLO在复杂场景中进行目标检测的能力更强,尤其是在火焰检测任务中,其高精度检测的优势得到了充分发挥。另外,EFA-YOLO在mAP50-95指标上的表现也相当稳健。尽管提高幅度较小,但这微小的增加意味着EFA-YOLO能够在更广泛的IoU阈值范围内维持高检测精确度。
  • 模型参数(Params)、浮点运算(GFLOPs)和模型大小(Model Size)分析: 在模型参数(Params)和计算复杂度(GFLOPs)方面,EFA-YOLO表现尤为出色。与YOLOv5m、YOLOv8m和YOLOv9m相比,EFA-YOLO的参数(Params)减少到仅1.4M,GFLOPs减少到4.6,在模型大小(Model Size)方面,EFA-YOLO的模型大小仅为3.3MB(比YOLOv5m少47.2MB)。

Detection Result

图5:比较实验模型的检测结果。

  • 火焰定位和检测帧的稳定性:如图5所示,EFA-YOLO的检测帧更接近实际标签(绿色框),尤其是在复杂背景中检测小目标火焰时,EFA-YOLO可以更准确地识别火焰区域,边界框更紧凑,更贴近实际火焰区域。例如,在左侧汽车旁的火焰场景中,YOLOv5m和YOLOv8m都检测到了小火焰目标,但它们的检测帧存在一些偏差,无法准确覆盖火焰区域;而EFA-YOLO更准确地校准了火焰,这显示了它在处理小目标的优势。此外,YOLOv9m和YOLOv10m在某些场景中表现良好,但对于具有复杂背景或严重遮挡的场景,检测帧较大,导致火焰目标被检测为大面积区域,无法有效抑制背景噪声。而EFA-YOLO由于结合了EAConv和EADown模块,可通过注意力机制有效地关注火焰区域,提高模型在面对复杂背景时的鲁棒性。
  • 模型置信度分析:从每个模型的置信度得分可以看出,EFA-YOLO的检测置信度通常较高,特别是在火焰目标较小且火焰区域边缘不明显的情况下,EFA-YOLO仍能保持较高的置信度。同时,在某些极端照明条件下,EFA-YOLO能够保持较高的检测置信度,而其他YOLO模型的置信度则降低。这表明,EFA-YOLO的注意力机制可以有效地增强对火焰目标的关注,提高模型在处理复杂照明条件时的鲁棒性。
  • 遮挡和烟雾背景的处理:在遮挡和烟雾场景中,EFA-YOLO表现良好。图5的最后一列显示了火焰场景中的大火烟背景,其他模型(如YOLOv9m和YOLOv10m)在烟雾环境中的检测结果被部分误分类为火焰目标,导致检测框较大,影响火焰目标的准确检测。相比之下,EFA-YOLO得益于EADown模块通过空间和通道注意力机制进行特征降采样,可以更好地抑制背景噪声,准确检测火焰的真实位置。
  • 多目标检测能力:与YOLOv5m和YOLOv8m只检测到火焰目标的一部分并存在大小和位置偏移的检测框不同,EFA-YOLO不仅识别了所有火焰目标,而且校准了每个火焰区域更准确。在多目标检测任务中,EFA-YOLO表现出明显优势,具有较强的适应性,能够应对小目标和复杂背景的挑战。
  • 与真实标签的比较:将每个模型的检测结果与真实标签(绿色框)进行比较,可以发现EFA-YOLO生成的边界框最接近真实标签,且EFA-YOLO在识别小火焰目标和检测复杂场景中的目标方面表现出更高的准确性和稳定性。这一结果表明,在不同的条件和场景下,EFA-YOLO具有更强的泛化能力,能够在不同的场景下稳定地输出高质量的检测结果。

Ablation Study

在本消融实验中,作者通过逐步引入EAConv和EADown模块,对YOLOv8m基准模型的性能指标进行了深入分析,并评估了这些模块对模型性能的影响。实验结果如图2所示,展示了模型在多个指标上的性能,如精确度(P)、召回率(R)、mAP50、mAP50-95、模型参数(M)、计算复杂度(GFLOPs)和模型大小(MB)。消融实验的结果如图2所示。

  • 仅引入EAConv模块的性能分析: 当仅引入EAConv模块时,模型的精确度显著提高了8.6%,这表明EAConv模块通过有效特征提取和注意力机制提高了模型检测正类别的准确度。然而,召回率降低了2.6%,表示模型在检测全面性方面略有牺牲,可能导致注意力机制过于关注局部关键特征,导致一些边缘或非显著火焰目标不被捕获。从mAP50和mAP50-95来看,EAConv模块对模型的检测精度影响较小,mAP50提高了0.2%,而mAP50-95略有提高0.2%,表示模块的检测精度在特定阈值上更加稳定。从模型复杂度来看,EAConv模块将模型的参数数量从25M减少到1.8M,从而证明EAConv模块极大地优化了模型的轻量化,同时保持了高检测精度。GFLOPs减少了91.6%,计算复杂度显著降低。模型大小也减少了从50.5MB到4.0MB,减少了46.5MB,证明EAConv模块极大地有助于模型的轻量化。
  • 仅针对EADown模块的性能分析:随着EADown模块的引入,模型精度提高了0.7%,召回率降低了2.2%。尽管精度提高了,但召回率略微降低了,这意味着在精度增加的同时,EADown模块可能会略微影响模型捕捉目标的能力。虽然精度提高了,但召回率稍低,特别是在检测一些细节特征较少的火焰目标时,模型可能错过了检测。在mAP50上,模型正确率降低了0.7%,而在mAP50-95上提高了1.3%。这表明,在特定IoU阈值(例如0.5)上,EADown模块不会对整体检测性能做出太大贡献,但在更广泛的IoU范围内(例如mAP50-95)表现良好,并能更好地应对不同尺度的火焰目标检测。EADown模块在模型轻量化方面表现良好。模型参数数量从25M减少到2.6M的89.6%,GFLOPs减少到88.3%。模型大小从50.5MB减少到5.5MB,说明EADown在优化计算效率和减少模型存储要求方面起着重要作用。
  • 同时引入EAConv和EADown模块进行性能分析:当同时引入EAConv和EADown模块时,模型整体性能得到了提高和优化。精度提高了0.5%至65.3%,表示两个模块的结合在保证检测精度方面表现良好。召回率提高了3.5%至62.8%,与引入单个模块相比,召回率的显著提高表示该结合能力更全面地检测火焰目标。在mAP50上,检测精度提高了0.8%,而mAP50-95略微降低了(0.4%)。这个结果表明,尽管模型在更高IoU阈值上的检测性能降低,但模型在mAP50的中等IoU范围内表现出更强的检测鲁棒性。在模型轻量化方面,参数数量进一步减少到1.4M,降低了23.6%,表明同时引入两个模块大大优化了模型参数数量。GFLOPs也显著减少了92.8%,计算复杂性得到了显著优化。模型大小减少到3.3MB,意味着该模型适用于资源受限的设备,并实现了快速高效的推理。

总结

本文提出了一种高效的轻量级模型EFA-YOLO进行火焰火焰检测,该模型通过引入两个关键模块EAConv和EADown,实现了高效特征提取和降采样,从而提高了火焰检测任务的检测准确性、计算效率和实时性能。实验结果显示,EFA-YOLO在模型参数数量、计算复杂度和推理速度等方面表现良好,与主流YOLO系列模型相比,模型参数数量减少了94.6%,推理时间提高了88倍,从而显著提高了模型的轻量化与实时性能。

尽管EFA-YOLO在火焰检测任务中表现出色,但仍有一些改进的空间。

首先,尽管模型在检测准确性和计算效率之间取得了良好的平衡,但在处理非常密集的场景时,仍可能出现漏检或误报。这主要是因为模型在处理微小火焰目标或复杂背景(例如,烟雾,光反射)时仍存在一定的局限性。

未来的工作将通过引入局部信息感知来优化对密集小目标的检测,进一步优化多尺度特征融合策略,并引入时间信息来提高模型在视频检测中的性能。

作者将提供更实时火焰检测和复杂场景自适应的技术支持。

参考

[1].EFA-YOLO: An Efficient Feature Attention Model for Fire and Flame Detection.

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-10-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 未来先知 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
YOLO-TLA也来了 | 重新设计C3模块为Backbone引入轻量化注意力,诞生高效的小目标检测YOLO模型
近年来深度学习的快速发展导致了计算机视觉各个方面的重要突破,尤其是在目标检测领域。这个计算机视觉的关键方面旨在识别和分类图像中的目标(例如,行人、动物、车辆),这对于目标追踪和目标分割等任务是一个基础性的要素。其在工业应用中非常广泛,范围从缺陷检测到自动驾驶。
集智书童公众号
2024/03/01
1.7K0
YOLO-TLA也来了 | 重新设计C3模块为Backbone引入轻量化注意力,诞生高效的小目标检测YOLO模型
SCC-YOLO:集成 SCConv 到YOLOv9,脑肿瘤检测mAP提升,代码开源!
磁共振成像(MRI)是可视化大脑和识别肿瘤最有效的成像技术[1]。然而,由于脑肿瘤图像形态多样且边缘特征相对模糊[2],通过磁共振成像(MRI)诊断脑肿瘤的过程对于临床医生来说既复杂又低效,导致误诊和漏诊的风险增加。研究行人已将机器学习技术应用于脑肿瘤图像的分割和分类[3-10]。在脑肿瘤的自动检测和辅助诊断中,相关研究行人应用了无监督学习[11]、卷积神经网络(CNN)[12]、深度堆叠自编码器(DSAE)[15]以及You Only Look Once(YOLO)[13]、[14-18]等技术。Maibam Mangalleibi Chanu等人将YOLOv3[19]模型应用于脑肿瘤的计算机辅助检测和分类,代表了YOLO系列模型在脑肿瘤检测中的重要研究[16]。Kang等人基于YOLOv8[20]创新性地提出了RCS-YOLO[17]和BGF-YOLO[18]模型,在Br35H数据集上实现了良好的准确率和速度[25],展示了YOLO系列在脑肿瘤图像检测中的高度可行性。
未来先知
2025/04/04
1010
SCC-YOLO:集成 SCConv 到YOLOv9,脑肿瘤检测mAP提升,代码开源!
FFCA-YOLO:突破小物体检测瓶颈,提升遥感应用中的精度与效率
由于在遥感应用中的小目标检测面临着特征表示不足、背景混淆以及在有限的硬件条件下优化速度和精度的挑战。
CoovallyAIHub
2025/02/18
2610
FFCA-YOLO:突破小物体检测瓶颈,提升遥感应用中的精度与效率
YOLO-ELA 高效的局部注意建模,用于高性能实时缺陷检测 !
确保输电线路基础设施的可靠运行对保证稳定供电,满足个人和企业能源需求至关重要。因此,对输电塔组件(如绝缘子)的缺陷进行检查和维护对于确保电网系统安全运行至关重要。绝缘子为导体和支撑电缆提供绝缘,容易受到恶劣天气条件或电磁应力的损坏(Sanyal等人,2020年)。这可能扰乱输电网络的顺畅运行,因此需要定期检查和维护以识别并更换损坏的绝缘子。
未来先知
2024/10/29
4230
YOLO-ELA 高效的局部注意建模,用于高性能实时缺陷检测 !
RepVGG-GELAN | 融合 VGG、ShuffleNet 与 YOLO 图像检测的准确性及效率再上一层!
鉴于高发病率和死亡率,脑肿瘤是全球健康关注的重点问题。通过利用深度学习算法等最先进技术,自动化检测技术可以有效解决脑肿瘤识别的挑战。将自动化检测融入医疗流程,有望通过革新脑肿瘤的管理方式显著提高患者疗效和医疗服务,尤其是随着技术的发展。最先进的目标检测方法YOLO在估算每个网格单元的类别概率和边界框时,将输入图像划分为网格。
集智书童公众号
2024/05/17
7470
RepVGG-GELAN | 融合 VGG、ShuffleNet 与 YOLO 图像检测的准确性及效率再上一层!
YOLO算法改进 | YOLO11改进揭秘,前沿论文精华预览
众所周知,YOLO系列一直是计算机视觉领域的研究热点。作为其最新力作,YOLO11在2025年无疑将成为各大顶级会议的焦点。原因在于,一方面,YOLO系列的其他版本改进空间已趋于饱和,而YOLO11问世不久,尚有广阔的创新空间。另一方面,YOLO11在保持高准确度的同时,计算效率得到了显著提升,尤其在资源受限的环境中表现出色。然而,它也面临着模型复杂度较高、对标注数据质量和数量的依赖等问题,这也为进行学术创新提供了契机。
CoovallyAIHub
2025/02/05
1.1K0
YOLO算法改进 | YOLO11改进揭秘,前沿论文精华预览
【YOLO算法改进】ALSS-YOLO:无人机热红外图像|野生动物小目标检测
作者提出了一个新颖的ALSS模块,该模块采用自适应通道分割策略来优化特征提取,并集成了通道洗牌机制以增强通道间信息交换。这一改进提高了对模糊目标的检测准确性,尤其是在处理由抖动引起的模糊和重叠目标时。
CoovallyAIHub
2024/12/31
2300
【YOLO算法改进】ALSS-YOLO:无人机热红外图像|野生动物小目标检测
基于YOLOv8的遥感小目标车辆检测,加入一种基于内容引导注意力(CGA)+SPDConv卷积魔改,助力遥感检测
💡💡💡本文主要内容:详细介绍了遥感小目标车辆检测整个过程,从数据集到训练模型到结果可视化分析,以及如何优化提升检测性能。
AI小怪兽
2024/07/23
7550
基于YOLOv8的工业油污缺陷检测,多种优化方法---DCNV4_SPPF助力涨点,mAP@0.5提升近四个点(一)
💡💡💡本文主要内容:详细介绍了工业油污缺陷检测整个过程,从数据集到训练模型到结果可视化分析,以及如何优化提升检测性能。
AI小怪兽
2024/02/03
5730
基于YOLOv8的工业油污缺陷检测,多种优化方法---自研注意力CPMS基于CBAM优化, mAP@0.5提升近五个点(二)
💡💡💡本文主要内容:详细介绍了工业油污缺陷检测整个过程,从数据集到训练模型到结果可视化分析,以及如何优化提升检测性能。
AI小怪兽
2024/02/04
4030
YOLO新成员 | CRAS-YOLO:基于 YOLOv5s 算法的多类别船舶检测与分类模型
基于卫星图像的多类别船舶检测和分类由于在军事和民用领域的重要应用而备受关注。在本研究中,团队在FUSAR船舶数据集和SimpleCopyPaste方法的基础上生成了一个新的Artificial-SAR-Vessel数据集中。我们进一步提出了一种新的多类船检测,称为CRAS-YOLO,它由卷积块注意力模块(CBAM)、感受野块(RFB)和基于YOLOv5s的自适应空间特征融合(ASFF)组成。CRAS-YOLO改进了基于路径聚合网络(PANet)的特征金字塔网络,该网络集成了RFB特征增强模块和ASFF特征融合策略,以获得更丰富的特征信息,并实现多尺度特征的自适应融合。同时,在骨干中增加了CBAM,以准确定位船只位置,提高检测能力。结果证实,CRAS-YOLO模型的准确度、召回率和平均准确度(mAP)(0.5)分别高达90.4%、88.6%和92.1%。所提出的模型在另一个Sar船舶检测(SSDD)数据集中的精度、召回率和mAP得分分别高达97.3%、95.5%和98.7%,也优于先前的研究结果。
CoovallyAIHub
2025/01/06
1620
YOLO新成员 | CRAS-YOLO:基于 YOLOv5s 算法的多类别船舶检测与分类模型
YOLO进化史:YOLOv5、YOLOv8 与 YOLOv10 的性能分析与边缘部署探讨!
AI模型部署落地实战👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」
集智书童公众号
2024/07/11
20.1K0
YOLO进化史:YOLOv5、YOLOv8 与 YOLOv10 的性能分析与边缘部署探讨!
CEH-YOLO:基于 YOLO 的水下目标检测复合增强模型
相关研究提出一种基于 YOLO 的水下图像目标检测方法,引入一种改进的无锚点 YOLO 检测方法,将检测特征与识别特征分离,以减少特征间的相互干扰,提高检测精度。还提出一种基于 Retinex 的图像增强算法用于水下图像增强,并通过在水下数据集上的相关实验,验证了增强型 YOLO 检测方法的有效性。
计算机视觉研究院
2025/02/07
2920
CEH-YOLO:基于 YOLO 的水下目标检测复合增强模型
基于YOLOv9的NEU-DET缺陷检测算法,具有切片操作的SimAM注意力,魔改SimAM
💡💡💡本文内容:针对基基于YOLOv9的NEU-DET缺陷检测算法进行性能提升,加入各个创新点做验证性试验。
AI小怪兽
2024/09/24
2950
炸裂 !轻量化YOLO | ShuffleNetv2与Transformer结合,重塑YOLOv7成就超轻超快YOLO
随着计算机视觉领域的迅速发展,目标检测在各种应用中变得至关重要,这些应用范围包括但不限于安全监控、自动驾驶和智慧医疗。尽管传统目标检测方法存在计算复杂度高和实时性能不足的问题,但基于深度学习算法已在准确性和实时性能方面取得了重大突破。其中,YOLO已成为一种经典的实时目标检测算法,它在计算速度和检测精度之间取得了平衡。然而,移动设备通常在计算能力、内存容量和能源消耗方面受限,这复杂化了深度学习模型的部署。
集智书童公众号
2024/03/11
3K0
炸裂 !轻量化YOLO | ShuffleNetv2与Transformer结合,重塑YOLOv7成就超轻超快YOLO
基于改进 YOLOv10 的自助结算系统 !
受到数字革命的推动,传统零售商店面临着众多转型挑战与机遇。随着消费者需求的多样化以及购物行为的快速演变,传统零售店结账流程的低效率问题日益凸显,常常导致客户体验不佳。尤其是在高峰时段,顾客可能需要长时间等待支付,这负面影响了他们的购物体验,并限制了商店的容量和销售增长潜力。
未来先知
2024/08/13
3340
基于改进 YOLOv10 的自助结算系统 !
基于YOLOv8的水下生物检测,多种优化方法---DCNv4结合SPPF,效果秒杀DCNv3,涨点两个点
💡💡💡本文主要内容:详细介绍了水下生物检测整个过程,从数据集到训练模型到结果可视化分析,以及如何优化提升检测性能。
AI小怪兽
2024/02/05
8480
YOLOV8原创改进:一种新型轻量级实时检测算法
💡💡💡本文独家改进:本文提出了一种新型轻量级的实时监测算法,通过MobileViT魔改整个backbone,最后提出两个改进版本,YOLOv8_MobileViT和YOLOv8_MobileViT-p2两个版本
AI小怪兽
2024/01/27
9870
基于YOLOv8的暗光低光环境下(ExDark数据集)检测,加入多种优化方式---DCNv4结合SPPF ,助力自动驾驶(一)
💡💡💡本文主要内容:详细介绍了暗光低光数据集检测整个过程,从数据集到训练模型到结果可视化分析,以及如何优化提升检测性能。
AI小怪兽
2024/02/06
8030
YoloV8改进策略:Gold-YOLO高效目标检测器与YoloV8激情碰撞
在过去的几年中,YOLO系列模型已经成为实时目标检测领域的领先方法。许多研究通过修改结构、增加数据和设计新的损失,将基线推高到更高的水平。然而,我们发现以前的模型仍然存在信息融合问题,尽管特征金字塔网络(FPN)和路径聚合网络(PANet)缓解了这一问题。因此,本研究提供了一种先进的GD机制,该机制通过卷积和自注意力操作来实现。这种新设计的模型被命名为Gold-YOLO,它提高了多尺度特征融合能力,并在所有模型尺度上实现了延迟和准确性之间的理想平衡。此外,我们首次在YOLO系列中实现了MAE风格的预训练,使得YOLO系列模型可以从无监督的预训练中受益。Gold-YOLO-N在COCO val2017数据集上获得了39.9%的AP,在T4 GPU上获得了1030 FPS,比之前的SOTA型号YOLOv6-3.0-N的FPS高+2.4%。PyTorch代码可在https://github.com/huawei-noah/EfficientComputing/tree/master/Detection/Gold-YOLO获得,MindSpore代码可在https://gitee.com/mindspore/models/tree/master/research/cv/Gold_YOLO获得。
AI浩
2024/10/22
1980
YoloV8改进策略:Gold-YOLO高效目标检测器与YoloV8激情碰撞
推荐阅读
YOLO-TLA也来了 | 重新设计C3模块为Backbone引入轻量化注意力,诞生高效的小目标检测YOLO模型
1.7K0
SCC-YOLO:集成 SCConv 到YOLOv9,脑肿瘤检测mAP提升,代码开源!
1010
FFCA-YOLO:突破小物体检测瓶颈,提升遥感应用中的精度与效率
2610
YOLO-ELA 高效的局部注意建模,用于高性能实时缺陷检测 !
4230
RepVGG-GELAN | 融合 VGG、ShuffleNet 与 YOLO 图像检测的准确性及效率再上一层!
7470
YOLO算法改进 | YOLO11改进揭秘,前沿论文精华预览
1.1K0
【YOLO算法改进】ALSS-YOLO:无人机热红外图像|野生动物小目标检测
2300
基于YOLOv8的遥感小目标车辆检测,加入一种基于内容引导注意力(CGA)+SPDConv卷积魔改,助力遥感检测
7550
基于YOLOv8的工业油污缺陷检测,多种优化方法---DCNV4_SPPF助力涨点,mAP@0.5提升近四个点(一)
5730
基于YOLOv8的工业油污缺陷检测,多种优化方法---自研注意力CPMS基于CBAM优化, mAP@0.5提升近五个点(二)
4030
YOLO新成员 | CRAS-YOLO:基于 YOLOv5s 算法的多类别船舶检测与分类模型
1620
YOLO进化史:YOLOv5、YOLOv8 与 YOLOv10 的性能分析与边缘部署探讨!
20.1K0
CEH-YOLO:基于 YOLO 的水下目标检测复合增强模型
2920
基于YOLOv9的NEU-DET缺陷检测算法,具有切片操作的SimAM注意力,魔改SimAM
2950
炸裂 !轻量化YOLO | ShuffleNetv2与Transformer结合,重塑YOLOv7成就超轻超快YOLO
3K0
基于改进 YOLOv10 的自助结算系统 !
3340
基于YOLOv8的水下生物检测,多种优化方法---DCNv4结合SPPF,效果秒杀DCNv3,涨点两个点
8480
YOLOV8原创改进:一种新型轻量级实时检测算法
9870
基于YOLOv8的暗光低光环境下(ExDark数据集)检测,加入多种优化方式---DCNv4结合SPPF ,助力自动驾驶(一)
8030
YoloV8改进策略:Gold-YOLO高效目标检测器与YoloV8激情碰撞
1980
相关推荐
YOLO-TLA也来了 | 重新设计C3模块为Backbone引入轻量化注意力,诞生高效的小目标检测YOLO模型
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档