💡💡💡叶片病害问题点:特征颜色、纹理及形态的多样性,加之光照条件变化,导致检测难度变大
💡💡💡解决方案:1)引入了一种多维联合注意力模块,该模块利用扩张卷积来捕捉不同尺度的特征信息,从而增强了模型的感受野和多尺度处理能力;2)引入了切片操作,当特征图被切成不同的块后,大目标由于其纹理特征明显会影响所在块的平均值,导致其获得的额外加权减少,而合并特征图后,大目标依然可以保持高可识别度甚至获得进一步增强;
💡💡💡一种基于YOLO11的高精度病害检测算法,mAP50从原始的0.528提升至 0.558
消融实验:
Conv_SWS | mAP50从原始的0.528提升至 0.538
MDJA加入backbone | mAP50从原始的0.528提升至 0.536
原来的数据集包含 1899 个疾病标记,分布在潜叶蝇(540 个)、锈病(621 个)、壳针孢(464 个)和褐斑病(274 个)这几个类别中,未考虑健康叶片的标记。然而,在一位专家审查并修改了标注后,标记的总数显著增加,达到了 8226 个。其中,潜叶蝇、锈病、壳针孢和褐斑病分别有 341、6013、1671 和 201 个标记。标记数量的增加反映了在提高受疾病影响区域的代表性方面所做的努力,并确保了更准确的真实情况,从而使得该数据库在训练和评估模型方面更加稳健。
数据集大小:
1213 images for training
351 Images for validation
180 Images for testing
类别4类:
nc: 4
names: ['Cercospora', 'Miner', 'Phoma', 'Rust']
细节图:
标签可视化分析
原文链接:
https://blog.csdn.net/m0_63774211/article/details/148229475
1)引入了一种多维联合注意力模块,该模块利用扩张卷积来捕捉不同尺度的特征信息,从而增强了模型的感受野和多尺度处理能力;2)引入了切片操作,当特征图被切成不同的块后,大目标由于其纹理特征明显会影响所在块的平均值,导致其获得的额外加权减少,而合并特征图后,大目标依然可以保持高可识别度甚至获得进一步增强;
结构图如下:
引入了一种多维联合注意力模块(MDJA),该模块利用扩张卷积来捕捉不同尺度的病灶信息,从而增强了模型的感受野和多尺度处理能力。
摘要:SimAM是一个无神经网络的特征增强模块,具有轻量级的优点,且在提升识别性能方面有潜力,基于此我们设计了新模块sws,之所以加入切片操作是因为SimAM计算整张特征图的像素差平均值时加权可能会忽略小目标的重要性,小目标在航拍图像中占比比较小,与整体平均值相比可能和背景信息相似,导致加权增强较弱,进而使得SimAM对小目标的增强能力较差。
因此我们引入了切片操作,当特征图被切成不同的块后,大目标由于其纹理特征明显会影响所在块的平均值,导致其获得的额外加权减少,而合并特征图后,大目标依然可以保持高可识别度甚至获得进一步增强;而小目标的特征与局部平均值差距更大,从而获得更多加权,小目标特征得到增强,即sws模块保证了大、小目标都获得了公正的关注和增强。
实验结果如下:
原始mAP50为0.528
YOLO11 summary (fused): 238 layers, 2,582,932 parameters, 0 gradients, 6.3 GFLOPs
Class Images Instances Box(P R mAP50 mAP50-95): 100%|██████████| 11/11 [00:10<00:00, 1.01it/s]
all 351 1580 0.513 0.56 0.528 0.281
Cercospora 25 39 0.352 0.205 0.228 0.125
Miner 69 111 0.577 0.892 0.784 0.521
Phoma 134 254 0.58 0.591 0.612 0.321
Rust 144 1176 0.544 0.552 0.487 0.155
mAP50从原始的0.528提升至 0.538
YOLO11-Conv_SWS summary (fused): 311 layers, 2,618,724 parameters, 0 gradients, 7.1 GFLOPs
Class Images Instances Box(P R mAP50 mAP50-95): 100%|██████████| 11/11 [00:11<00:00, 1.09s/it]
all 351 1580 0.528 0.554 0.538 0.28
Cercospora 25 39 0.337 0.205 0.237 0.122
Miner 69 111 0.65 0.847 0.778 0.509
Phoma 134 254 0.563 0.622 0.609 0.319
Rust 144 1176 0.562 0.543 0.526 0.17
mAP50从原始的0.528提升至 0.558
YOLO11-MDJA-Conv_SWS summary: 346 layers, 5,100,644 parameters, 0 gradients, 9.1 GFLOPs
Class Images Instances Box(P R mAP50 mAP50-95): 100%|██████████| 11/11 [00:13<00:00, 1.19s/it]
all 351 1580 0.577 0.547 0.558 0.291
Cercospora 25 39 0.436 0.308 0.309 0.153
Miner 69 111 0.709 0.766 0.769 0.519
Phoma 134 254 0.554 0.598 0.616 0.325
Rust 144 1176 0.61 0.516 0.537 0.168
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。