前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >YOLO11-CBAM集成:提升商业苹果园树干与树枝分割的精准度

YOLO11-CBAM集成:提升商业苹果园树干与树枝分割的精准度

原创
作者头像
CoovallyAIHub
发布2025-03-07 09:34:40
发布2025-03-07 09:34:40
630
举报

论文题目:Integrating YOLO11 and Convolution Block Attention Module for Multi-Season Segmentation of Tree Trunks and Branches in Commercial Apple Orchards 论文链接:https://arxiv.org/pdf/2412.05728


一、摘要

在本研究中,我们通过将卷积块注意力模块(CBAM)与YOLO11架构相结合,开发了一种定制的实例分割模型。该模型在休眠期和树冠期苹果园图像的混合数据集上进行了训练,旨在提高全年不同季节条件下树干和树枝的分割能力。在两个季节收集的混合数据集上训练YOLO11-CBAM后,在休眠期和树冠期图像上对模型进行了单独验证。此外,还在开花前、开花期、疏果期和收获期对模型进行了测试。YOLO11x-seg-CBAM和YOLO11m-seg-CBAM 的召回率和精确度分别最高。特别是,使用CBAM的YOLO11m-seg在树干类的训练中显示出最高的精确度(0.83),而不使用CBAM的YOLO11m-seg 在树干类的精确度为0.80。同样,对于树枝类,使用CBAM的YOLO11m-seg的精确度最高,达到0.75,而不使用CBAM的YOLO11m-seg的精确度为0.73。在休眠期验证中,YOLO11x-seg的精确度最高,为0.91。树冠季节验证凸显了YOLO11s-seg在所有类别中的卓越精度,树枝精度达到0.516,树干精度达到0.64。该建模方法在休眠期和冠层期两个季节的数据集上进行了训练,证明了YOLO11-CBAM集成在全年所有季节变化中有效检测和分割树干和树枝的潜力。


二、引言

劳动力挑战对农业部门产生了重大影响,已成为一个令人严重关切的问题。根据美国农业部经济研究局的报告,2022年该行业的劳动力成本达到425.7亿美元,占总生产成本的近10%。具体而言,美国苹果园正面临着严重的劳动力短缺问题,自COVID-19大流行以来,这种情况愈演愈烈。

目前,商业苹果园的大部分作物负载管理操作都是人工完成的。例如,在美国华盛顿州普罗瑟的一个商业果园观察到的情况,图2a描述了商业苹果园的休眠期(12月/1月),此时果树无叶,树枝和树干完全裸露。休眠期修剪至关重要,原因有几个。首先,它能促进伤口愈合,最大限度地降低病害传播风险,因为病原体在这一时期不太活跃。它还有助于塑造树木的最佳结构,并通过将树木储存的能量导向选定的枝条,促进新的结果枝的生长。

同样,图2b显示的是花期(3月/4月)的果园,果农们沿着棚架线训练新梢,以保持理想的树形,促进商业生产。训练苹果树的新梢附着在棚架钢丝结构上对优化果实产量、改善透光性和保持理想树形至关重要。这一过程可促进花芽的形成,让阳光照射到树冠的更多部分,并为果树提供结构强度。这种做法需要繁重的劳动,因为它涉及精心挑选、定位、将单个嫩枝绑在棚架线上,以及定期修剪和维护,以保持理想的树形。

同样,图2c显示了另一项作物负载管理操作,即投入大量人力疏除超出树体承受能力的青果。这一操作至关重要,因为它可以通过减少对资源的竞争,确保剩余的果实生长到最佳大小和质量。这一过程有助于最大限度地减少两年生果实,促进稳定的周年种植,提高果园的长期盈利能力。此外,有效疏果还能提高回花率,这对于在随后的季节保持苹果树的高产至关重要。

同样,图2d显示了蔬果后8月份的额外修剪阶段,此时果园被浓密的树冠叶片覆盖。这种修剪也称为夏季修剪,主要是为了改善树冠的空气流通和阳光穿透。通过疏剪浓密的叶片,夏季修剪可以改善光照分布,最大限度地提高树木阴影区域的光合作用。此外,夏季修剪还能减少树枝拥挤,促进空气流通,降低湿度,提高杀虫剂等保护剂的覆盖率。夏季修剪还有助于控制树木的活力,因为它是一个脱叶过程,通过去除光合叶面积来减少碳水化合物的生产。

此外,图2e显示了采摘成熟苹果的收获季节,这是另一个需要大量人力的劳动密集型时期。手工采摘是收获新鲜上市苹果的主要方法,要求工人仔细挑选并从苹果树上摘下成熟的果实。

从树上摘下成熟的果实。这一过程需要体力、灵活性和现场评估果实质量的能力。在传统的果园里,采摘者通常要使用梯子才能摘到较高树上的苹果,这不仅增加了劳动强度,还带来了安全问题。


三、方法

本研究采用了一种独特的建模方法,将休眠期(图3a)和树冠期(图3b)两个不同季节的图像合并使用。对这些图像进行注释,标注所有可见的树干和树枝,不论季节如何,并将其划分为树干和树枝类别。随后,将CBAM与YOLO11模型的五个配置相结合,训练系统在两个季节背景下进行实例分割。如图3c所示,这些数据集包括休眠期的78张图像和树冠期78张图像。每幅图像之前都已标注,这些标注是验证的基础。该模型首先通过一个数据集进行验证,该数据集结合了两个不同季节的图像。然后,在生长周期的不同阶段对模型进行测试,从开花前的季节开始,接着是开花季节,然后是疏果季节,最后是收获季节。

研究地点和数据采集

本研究在美国华盛顿州普罗瑟市由Allan Brothers Fruit Company拥有和经营的商业苹果园中进行。果园于2009年种植了Scilate苹果品种,行距为9.0英尺,株距为3.0英尺,采用V型棚架结构。使用安装在UR5e机械臂上的Microsoft Azure摄像机收集图像,如图3所示。2023年1月,采集了休眠期图像,如图3a所示。随后,在2024年6月,采集了冠层季节图像,如图3b所示。

模型训练的数据准备

本研究收集了859张综合图像,其中553张来自冠层季节,其余来自休眠季节。所有图像都被合并到一个文件夹中,以简化数据准备过程。为了增强数据集并为有效的模型训练做好准备,我们应用了一系列图像增强技术。这种增强不仅丰富了视觉数据,还模拟了各种摄影条件,以便对分割模型进行稳健的训练。应用增强技术后,每个训练实例都会输出三次,从而有效增加了训练图像的数量。具体的转换包括90°旋转,将图像倒置,引入新的方向挑战。水平剪切保持在0°,以保持对齐,而垂直剪切的变化幅度为±15°,以模拟观察苹果树的不同角度。图像的色调在-15°和+15°之间调整,略微改变色彩感知,以模拟不同的光照条件。

此外,饱和度的调整范围为-25%到+25%,通过改变颜色强度来反映不同的天气条件。亮度和曝光度的调整范围在-20%到+20%之间,以模拟一天中的不同时段和云层覆盖情况。这些增强措施将初始数据集扩展到总共2070张指定用于训练的图像,其中84张图像用于验证,85张用于测试。

将CBAM与YOLO11集成并进行深度学习训练

两个融合模型概述如下:

  • CBAM:CBAM的设计目的是通过集中图像中信息量最大的部分来增强卷积神经网络(CNN)的特征敏感性。CBAM通过两个核心组件运行:通道注意模块(CAM)和空间注意模块(SAM)。通道注意模块利用全局平均和最大集合来确定特征图中每个通道的重要性,并通过多层感知器进行处理,以生成特定通道的注意图。这有助于模型强调信息量更大的特征。在CAM之后,SAM通过跨信道的池化操作来识别关键的空间区域,从而加强模型对相关空间区域的关注。这些注意力机制通过元素相乘来完善特征图,通过对重要特征的选择性强调来优化网络在各种任务中的表现。这种选择性关注不仅能提高性能,还能增强CNN的可解释性,使CBAM成为任何CNN架构的多功能有效补充。
  • YOLO11:YOLO11代表了YOLO系列的前沿发展,因其在实时计算机视觉任务中的高效和强大性能而闻名。YOLO11在前几代产品的基础上,增强了特征提取功能,大大提高了对不同尺度和方向物体的检测和分割能力。该模型拥有优化的架构,可确保高效处理,使其能够有效处理复杂的任务,如姿态分割和姿态估计。与前代产品相比,YOLO11的平均精度(mAP)得分高,参数数量少,在保持较快的处理速度的同时大幅提高了精度。这使得YOLO11特别适合需要实时分析的应用,如监控和农业监测,在这些应用中,及时准确地识别物体至关重要。YOLO11的增强功能凸显了它在应对各种基于视觉的挑战方面的适应性和潜力。
  • YOLO11-CBAM融合: 整合工作从定义CBAM的两个关键组件开始:通道注意模块(CAM)和空间注意模块(SAM)。CAM的设计目的是利用全局平均池化和全局最大池化,对信道特征进行优先排序。然后通过多层感知器对这些汇集输出进行处理,生成通道关注图,显示哪些通道包含更多相关信息。这一过程有助于模型关注对更准确地识别树结构至关重要的特征。在CAM之后,SAM被用来确定图像中的关键空间区域。它通过在通道维度上应用平均和最大池化来实现这一目的,然后对这些结果进行合并。然后,卷积层对这些组合特征进行处理,生成空间注意力图。该图可引导模型关注重要的空间细节,从而增强其有效分割树干和树枝的能力。

然后对YOLO11模型,特别是YOLO11n配置进行了修改,以纳入这些CBAM 增强功能。整合工作包括在每个卷积模块之后嵌入CBAM模块。

模块嵌入YOLO11架构中的每个卷积层之后。这一结构修改系统地应用于所有其他YOLO11配置(s、m、l、x),以保持性能提升的一致性。训练参数的设置是为了优化学习过程,在由休眠期和冠层期混合图像组成的数据集上进行了 500 epochs的训练。该数据集专门为YOLO11进行了注释和格式化,确保模型在不同的季节表征上得到训练。然后通过一系列指标对每种配置的性能进行了细致评估:精确度、召回率、平均精确度 (mAP@50) 以及处理速度(预处理、后处理和推理)。

性能指标评估

在训练阶段,根据精确度、召回率和mAP@50全面评估了每个模型配置的性能。这些指标由以下基本方程得出:

FP表示错误预测的数量,即非目标对象被错误地识别为树干或树枝。

FN表示模型遗漏了图像中实际存在的树干或树枝的情况。

精确度量化了正面预测的准确性,而召回率则衡量了模型识别所有有效实例的能力。mAP@50提供了模型在50%“交叉重叠”(IOU)阈值下的整体有效性,反映了模型在不同季节区分树干和树枝类别的能力。

此外,还对模型的预处理、后处理和推理速度进行了评估,以衡量运行效率。此外,还对卷积层总数、每种配置的训练时间和每秒千兆浮点运算次数(GFLOPs)进行了细致计算,以深入了解树干和树枝混合季节图像训练过程中的计算需求和效率。GFLOPs可以衡量推理阶段的计算负荷,从而了解模型的效率和处理速度。

准备验证数据集并评估模型在每个季节的性能

为了进行验证,我们精心准备了由休眠期和冠层期各78张图像组成的数据集。这些图像使用Roboflow在线标注平台进行人工标注,该平台专为YOLO11格式量身定制,以方便对模型进行精确验证。注释经过精心制作,以确保准确呈现两个季节阶段的树干和树枝。注释完成后,两个不同的文件夹被组织起来,根据各自的季节--休眠期和树冠期--将图像分开。这种分离对于评估模型在不同季节条件下的性能至关重要,有助于深入了解其全年的适应性和准确性。对每组季节图像都对模型的性能进行了严格评估。计算了掩膜精度、掩膜召回率和平均精度(mAP@50)等指标,以确定模型在正确识别和分割树结构方面的功效。此外,还对预处理、后处理和推理的速度进行了细致的测量。这些评估对于了解模型的运行动态、检查其处理时间效率和处理实时应用的能力至关重要。

跨季节测试

在对YOLO11-CBAM模型进行培训和验证后,在四个不同的季节条件下进行了广泛的测试,如图5a、5b、5c和5d所示。这些测试是有策略地进行的,涵盖了苹果园周期中的一系列发展阶段,包括开花前、开花期、疏果期和采收期。图5a捕捉到了开花前的早期季节,在这个季节,机器视觉系统在果园中收集视觉数据。左图显示了在果园周期的这一初期阶段收集图像的设置,其特点是枝条上长出了小叶子,花蕾尚未绽放。右图提供了在休眠期和树冠期正确识别对象(树干和树枝)的数量。右图提供了这一初步阶段的枝条近景,突出显示了新生植被的生长。在图5b所示的花开季节,我们进行了进一步的图像采集,以记录授粉和疏花这一关键阶段。图5b中的左图展示了为捕捉这一阶段而进行的实地设置,而右图则提供了果园盛花期的详细视图,强调了精确授粉和选择性疏花对调节作物产量的必要性。

同样,5c展示了青果疏果期的情况,利用配备机器视觉系统的机器人系统进行图像采集。左边的图像显示了果园的操作设置,右边的图像则密切关注需要疏果的早季青果群,以确保最佳的果实发育和果园生产率。此外,图5d显示的是收获季节,左图说明了机器视觉系统在果园中的使用情况,此时成熟的苹果正准备采摘上市。图5d中对应的右图显示了使用机器视觉相机采集的成熟苹果的清晰场景。


四、Coovally AI模型训练与应用平台

如果你也想要进行模型改进或模型训练,Coovally平台满足你的要求!

Coovally平台整合了国内外开源社区1000+模型算法各类公开识别数据集,无论是YOLO系列模型还是Transformer系列视觉模型算法,平台全部包含,均可一键下载助力实验研究与产业应用。

而且在该平台上,无需配置环境、修改配置文件等繁琐操作,一键上传数据集,使用模型进行训练与结果预测,全程高速零代码

动图封面
动图封面

具体操作步骤可参考:从YOLOv5到训练实战:易用性和扩展性的加强

平台链接:https://www.coovally.com

如果你想要另外的模型算法数据集,欢迎后台或评论区留言,我们找到后会第一时间与您分享!


五、结果

图6展示了使用YOLO11n-seg算法在商业苹果园的休眠期和树冠期对树干和树枝进行检测和分割的结果。该模型利用包含两个季节图像的训练集,熟练地划分了树干和树枝结构,展示了YOLO11算法的熟练程度。

例如,图6a、图6b、图6c、图6d 和图6e。例如,图6a、6b和6c展示了休眠期验证图像的分段结果,训练、测试和验证比例为8:1:1。相反,图6d、6e和6f展示了冠层季节的结果。

图6a中的红色箭头表示YOLO11模型在综合数据集上训练后,在果园的复杂性中准确识别出了一个树枝。与此相反,黄色箭头则表示尽管能见度很高,但还是漏检了树枝。图6b右侧的红色箭头说明了模型的辨别力,它没有将果园训练杆误认为树干,这是一种常见的视觉混淆。此外,在图像左侧,红色箭头标志着一次成功的树干识别,模型准确无误地分割了相交的树干。相比之下,图6c中的黄色箭头指向模型未能检测到的两个突出树枝,尽管它们明显位于前景位置。为了提高准确性,增加训练示例的数量并确保对所有可见树枝和树干进行全面标注可能会有所帮助。省略图像帧中的任何元素,尤其是直接位于摄像机视图中的元素,也能提高检测能力。尽管存在这些挑战,但所展示的结果揭示了该模型在适应果园环境中不同季节条件方面的强大潜力。

同样,图6d展示了一个树冠季节场景,在该场景中,YOLO11模型很好地检测并分割了大部分可见树干和树枝。不过,黄色箭头指出了检测和分割不足的区域。具体来说,左上方的黄色箭头表示模型忽略的树枝,而右边的两个黄色箭头则表示训练模型未识别的可见树干。继续分析,图6e强调了模型在树冠枝叶茂密的复杂场景中的有效性。图中的红色箭头体现了模型在准确识别和分割树枝方面的精确性。图6e中的三个红色箭头分别代表YOLO11成功分割树枝的实例,显示了该模型在树冠季典型的挑战性环境中的强大性能。图6f中的其他精确分割实例进一步证实了该模型的能力。在这里,最左边的红色箭头指向模型正确区分训练杆和树干的场景,避免了常见的错误识别。中间的红色箭头突出显示了成功的树干分割,最右边的箭头显示了模型巧妙地分割了被茂密树叶和树冠遮挡的树干。

YOLO11-CBAM 训练结果

  • 模型训练期间YOLO11In-stance Segmentation算法的性能指标评估:YOLO11实例分割模型在不同的配置和类别中表现出不同的性能。在 “所有 ”类别中,YOLO11m-seg的精确度最高,为0.74,而YOLO11x-seg的再呼叫最高,为0.61。YOLO11l-seg的mAP@50最高,达到0.64。在 “树枝 ”类别中,YOLO11m-seg的掩码精确度为0.66,优于其他竞争对手;YOLO11x-seg的掩码召回率为0.50,居于首位;YOLO11m-seg的mAP@50为0.52,再次领先于其他竞争对手。在 “树干 ”分割方面,YOLO11m-seg在复杂的树冠覆盖范围(红色)中提供了最高的在复杂的树冠覆盖中(红色箭头)。掩码精度为0.83,YOLO11x-seg的召回率最高,为0.72,YOLO11l-seg以0.77高居mAP@50榜首。YOLO11的所有五个配置:YOLO11n、YOLO11s、YOLO11m、YOLO11l和YOLO11x的精确度、召回率和mAP@50的详细性能指标系统地显示在表 1中,展示了“所有”、“分支 ”和 “主干 ”类别的结果。

图7显示了 YOLO11五种配置的分段算法训练后的精度-召回置信度曲线。具体来说,图7a描述了YOLO11n-seg配置的曲线,7b描述了YOLO11s-seg配置的曲线,7c描述了YOLO11m-seg配置的曲线,7d描述了YOLO11l-seg配置的曲线,7e展示了YOLO11x-seg配置的曲线。同样,图8显示了YOLO11五种配置的分割算法在训练后的F1置信度曲线。具体来说,图8a展示了YOLO11n-seg的曲线,8b展示了YOLO11s-seg的曲线,8c展示了YOLO11m-seg的曲线,8d展示了YOLO11l-seg的曲线,8e展示了YOLO11x-seg的曲线。

  • 模型训练期间YOLO11实例分割算法的图像处理速度评估:对五种 YOLO11配置的图像处理速度进行评估后发现,其性能差异很大,详见图 9a。
  • 卷积层、参数、训练时间和GFLOPs评估: 对YOLO11配置的评估显示,不同模型的卷积层、参数和计算需求存在显著差异,如图9b和9c所示。
  • 早期停止和模型大小: 在YOLO11配置的训练阶段,设定了最多500个epochs,并采用了提前停止标准,以防止过度拟合并优化计算资源。具体来说,YOLO11n-seg在485个epochs时停止训练,YOLO11s-seg 在427个历时时停止训练,YOLO11l-seg在417个epochs时停止训练,这表明在达到最大epochs时之前已经充分收敛。相比之下,YOLO11m-seg和YOLO11x-seg用了500个epochs,这表明需要延长训练时间才能达到最佳模型性能。训练完成后,模型大小如下:YOLO11n-seg为6.1 MB,YOLO11s-seg为20.6 MB,YOLO11m-seg为45.2 MB,YOLO11l-seg为55.9 MB,YOLO11x-seg为124.8 MB。

YOLO11-CBAM 模型在休眠季节数据集中的验证结果

图10展示了YOLO11-CBAM模型在由78张图像组成的休眠季节数据集上的验证结果。在图10a中,模型展示了有效的检测和分割能力,准确识别了绿色虚线矩形角内的大部分树干和树枝区域。不过,在粉色虚线矩形区域内,模型忽略了位于前景突出位置的树枝部分。该图包括来自Microsoft Azure Kinect视觉相机的原始RGB图像、图像下方的分割结果以及右侧提取的树干和树枝遮罩的热图表示。同样,图10b提供了模型在休眠期验证中表现的另一个实例。在这里,绿色虚线矩形表示模型准确分割了树干和树枝的区域,区分了实际的树木成分和果园训练杆,由于其物理属性不同,模型正确地没有将其归类为树干。相反,在粉色矩形中,模型虽然成功识别了树干,但却未能识别附近的另外三个树枝。这些情况表明了模型训练中可能需要改进的地方。加强训练数据集,特别是通过增加样本数量(目前有859张图像,涵盖休眠期和树冠期),可以显著减少此类检测误差。

性能指标验证:在完全休眠季节图像的验证过程中,YOLO11-CBAM模型在不同类别中表现出明显的性能差异。在“所有”类别中,YOLO11x-seg的掩蔽精度最高,达到0.91。YOLO11m-seg在掩码召回率和mAP@50方面表现出色,分别为0.84 和0.88。在 “分支 ”类别中,YOLO11x-seg再次以0.87的掩码精确度遥遥领先,而YOLO11m-seg的掩码召回率为0.75,mAP@50为0.81。在 “干线 ”类别中,YOLO11m-seg和YOLO11x-seg的掩码精确度(0.94)和掩码召回率(0.92)并列最高,YOLO11m-seg的mAP@50也高达0.96。这些指标凸显了每种配置在处理休眠期图像带来的特定挑战方面的微妙能力。表2列出了与CBAM集成的所有五种YOLO11配置的方框和掩码指标的全面详情,强调了每种模型配置在这一专门验证环境中的不同优势。

树冠季数据集的验证结果

图12展示了YOLO11-CBAM模型在树冠季节分割树木结构的能力,尽管浓密的树叶造成了极具挑战性的能见度条件。在这一时期,树冠的体积最大,长满了茂密的绿叶,然后过渡到树叶变黄、密度较低的状态。图12a展示了分割效果,其中左上方的图像代表成像系统捕捉到的原始场景,左下方的图像显示 YOLO11n配置实现的分割结果。在这些结果中,模型熟练地识别了树干,鉴于场景的复杂性,这是一项至关重要的任务。值得注意的是,该模型能够区分实际树干和外观相似的物体,如训练杆和训练电线的金属支撑,在较大的绿色虚线矩形中分别用黄色和红色箭头表示。该区域凸显了模型在RGB图像空间中区分真正的树干和其他具有类似颜色特征的元素的精确度。此外,较小的虚线矩形和粉红色虚线区域显示,模型成功提取了一些树枝级细节,突出表明YOLO11-CBAM融合技术在处理枝繁叶茂时期精确农业分割所需的复杂细节方面的有效性。

图12b进一步证明了YOLO11-CBAM模型在树冠期分割树干和树枝的能力。该图显示了分割的准确性,模型不仅能识别前景中突出的树干,还能识别树枝区域。左上方的原始图像是在商业无患子果园中使用消费级相机拍摄的,与左下方的图像形成鲜明对比,说明了分割结果。图的右侧显示了提取的RGB热图,尽管背景是复杂的浓密树叶,但仍能突出显示树干和树枝检测的精确度。在绿色和粉色的虚线矩形中,模型展示了其检测关键枝干区域的能力,这对自动作物负载管理决策至关重要。虽然模型成功捕捉到了机器人操作所需的重要区域,但也存在一些细小的细分挑战,例如黄色研究带的存在会带来轻微的误差。这些细分输出对于开发无碰撞机器人运动规划等高级应用至关重要。此外,提取的详细枝条数据还可用于自动决策,如利用枝条横截面积(LCSA)计算进行青果疏剪,Ahmed等人(2023 年)曾对这一技术进行过探索。

性能指标验证:在树冠季节数据集的验证过程中,对“全部”、“树枝 ”和 “树干 ”类别的分割性能指标进行了细致分析。在“全部 ”类别中,YOLO11s-seg显示出了卓越的精确度,达到了0.579。该配置在 “分支 ”类中也处于领先地位,精确度最高,达到0.516,在 “主干 ”类中继续保持优势,精确度达到0.643。在召回率方面,YOLO11n-seg和YOLO11s-seg在 “所有 ”类别中的联合召回率最高,为0.416。相比之下,YOLO11x-seg在 “分支 ”类中表现出色,召回率为0.52,而YOLO11n-seg在 “主干 ”类中遥遥领先,召回率为0.50。该模型在50%阈值下精确映射交集与联合的曲线下面积(mAP@50)的能力也值得一提。YOLO11s-seg在 “全部 ”类中的mAP@50为0.43,在 “分支 ”类中保持领先,为0.34,而在 “主干 ”类中得分最高,为0.52。这些结果证明了YOLO11配置与CBAM集成后的有效性,特别是在复杂的树冠环境中,准确的分割至关重要。表3详细记录了所有五种YOLO11配置的方框和掩膜指标的详细评估,全面概述了该模型在树冠季不同树木类别中的表现。


六、讨论

在训练过程中,YOLO11m-seg模型配置的精确度得分最高,尤其是在躯干类中的得分高达0.83。这一优异表现突出表明了该模型在树干分割方面的能力,而这正是精准农业应用的一项关键能力。图14详细比较了YOLO11m-seg在使用和未使用卷积块注意力模块(CBAM)时的性能。该图直观地展示了CBAM对精度的提升,突出了其在提高特定类别模型精度方面的价值。

如图15所示,与未集成CBAM的同类产品相比,使用CBAM训练的 YOLO11xseg 配置的召回率置信度曲线显示出更高的召回率值。具体来说,在 “所有 ”类别中,YOLO11x-seg在未使用CBAM的情况下的箱体召回率为0.66,而在使用CBAM的情况下则略微提高到0.67。在 “分支 ”类中也观察到了这种改进,方框召回率从0.57提高到了0.59,这表明树的不同结构元素的性能都得到了一致的提高。同样,掩码召回指标也在CBAM集成后有明显改善,掩码召回指标可提供分割准确性的内视角。在 “全部 ”类中,CBAM的掩码召回率从0.60提高到0.61;在 “分支 ”类中,CBAM的掩码召回率从0.49提高到0.50;在 “主干 ”类中,CBAM的掩码召回率从0.71提高到0.72。

该模型还进一步在四个不同的季节变化中进行了测试,这些季节变化是以前在训练过程中没有遇到过的。这包括 2023年2月的花前盛开期,如图16a所示,其特点是叶片刚刚发育;2023年4月的盛花期,如图16b所示;2024年6月的关键青果疏果期,如图17a所示,是直径小于25毫米的最佳决策期;以及 2024年10月的收获季节,如图17b所示。


七、结论与未来

在这项研究中,我们评估了YOLO11模型与CBAM集成后在商业苹果园多个季节条件下的能力。我们的目标不仅仅是评估该模型的单独性能,而是验证其在农业周期各个阶段的有效性,包括休眠期、花前期、花期、疏果期和收获期。通过这种方法,我们展示了该模型在不同环境条件下处理复杂农业分割任务的能力。YOLO11-CBAM模型使用了一个混合数据集,其中包括休眠期和树冠期的图像,该模型在检测和分割准确性方面有显著提高,尤其是在识别对机器人农业作业至关重要的树干和树枝方面。YOLO11x-seg CBAM和 YOLO11m-seg CBAM的召回率和精确度指标分别最高。

和YOLO11m-seg CBAM的召回率和精确率分别最高,突出了其实时应用的效率和潜力。验证结果肯定了该模型在精确分割方面的能力,这对提高果园机器人系统的运行效率至关重要。例如,在树冠季,该模型能有效地穿过茂密的树叶,证明了它在疏果和采摘导航等任务中不可或缺的作用,在这些任务中,准确定位树木的结构元素至关重要。本实验的具体结论如下

  • 训练性能:在混合数据集训练阶段,YOLO11x-seg的召回值最高,方框召回得分分别为0.67(所有类)、0.59(枝干类)和0.75(树干类)。同样,掩码的召回分数分别0.61(所有类别)、0.50(分支类别)和0.72(树干类别),显示了其在不同季节条件下的有效性。
  • 季节适应性:该模型在休眠期和树冠期均表现出色,成功识别并分割了树干和树枝。这种适应性对于全年农业文化机器人作业至关重要。
  • 休眠期性能:在休眠期验证中,YOLO11x-seg表现出了显著的精确度,尤其是在树干类别中,它的掩码精确度达到了0.94,掩码召回率达到了0.92,为可靠的休眠期修剪应用提供了便利。
  • 树冠季功效:在树冠季,该模型能熟练处理浓密的树叶,这对分割来说是一个挑战。YOLO11x-seg的掩膜精度为0.615(树干类),召回率为0.523(树枝类),证明了其在绿果疏剪等精准农业任务中的实用性。

作为未来的发展方向,要提高YOLO11-CBAM模型在复杂果园环境中的鲁棒性,就必须大幅扩展训练数据集。这项研究的初始阶段使用了一个相对适中的数据集,其中包括859张不同季节条件下的图像。要想将模型的能力提升到工业水平,就必须整理和注释一个更大、更多样化的数据集。这一扩展将使模型能够从更广泛的视觉输入中学习,从而提高其在实际应用中的准确性和可靠性。此外,在树冠茂密的季节解决树枝的可见度限制对于全年的运行效率至关重要。一种可行的方法是采用精确的图像年龄登记技术,将每棵树的休眠期图像与树冠期图像进行拼接或映射。这种方法可以使树枝和树干等关键树木结构在不同季节保持一致的可见度。通过确保这些关键要素全年可见并准确分割,该模型可为自动化农业流程提供更可靠的数据。将先进的图像处理方法与机器学习算法相结合,为提高农业机器人的精度提供了重要机会。这种方法不仅有助于开发更自主、更高效的机器人系统,还有助于实现可持续发展和技术先进的农业这一更广泛的目标。未来的研究应重点关注这些领域,以确保农业机器人技术的发展跟上现代果园管理日益增长的需求。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、摘要
  • 二、引言
  • 三、方法
    • 研究地点和数据采集
    • 模型训练的数据准备
    • 将CBAM与YOLO11集成并进行深度学习训练
    • 性能指标评估
    • 准备验证数据集并评估模型在每个季节的性能
    • 跨季节测试
  • 四、Coovally AI模型训练与应用平台
  • 五、结果
    • YOLO11-CBAM 训练结果
    • YOLO11-CBAM 模型在休眠季节数据集中的验证结果
    • 树冠季数据集的验证结果
  • 六、讨论
  • 七、结论与未来
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档