💡💡💡GL-CRM是为了更好地处理多尺度变化而设计的。它包括两个主要组件:可控感受野模块(CRM)和全局到局部设计(GL)。CRM灵活地提取和整合具有多个尺度和粒度的特征,而GL架构具有从全局上下文到子块区域再到局部语义信息的层次感知过程。
💡💡💡如何使用:替换YOLO11 C3k2,实现二次创新,具备多尺度能力
💡💡💡Mask mAP50 从原始的0.926 提升至0.934
改进结构图如下:
Ultralytics YOLO11是一款尖端的、最先进的模型,它在之前YOLO版本成功的基础上进行了构建,并引入了新功能和改进,以进一步提升性能和灵活性。YOLO11设计快速、准确且易于使用,使其成为各种物体检测和跟踪、实例分割、图像分类以及姿态估计任务的绝佳选择。
Segmentation 官方在COCO数据集上做了更多测试:
包裹分割数据集是一个精选的图片集合,专门为计算机视觉领域中与包裹分割相关的任务量身定制。这个数据集旨在帮助研究人员、开发者和爱好者们进行与包裹识别、分类和处理相关的项目。
该数据集包含了一系列展示不同背景和环境下各种包裹的多样化图片,是训练和评估分割模型的宝贵资源。无论您从事的是物流、仓库自动化还是任何需要精确包裹分析的应用,包裹分割数据集都提供了一个针对性强且全面的图片集,以提高您的计算机视觉算法的性能。
数据集结构
包装分割数据集的数据分布结构如下:
应用
由包装分割数据集(Package Segmentation Dataset)推动的包装分割对于优化物流、加强最后一英里配送、改进制造质量控制以及促进智能城市解决方案至关重要。从电子商务到安全应用,该数据集是一项关键资源,促进了计算机视觉领域的创新,实现了多样化和高效的包装分析应用。
标签可视化:
YOLO11-seg summary (fused): 265 layers, 2,834,763 parameters, 0 gradients, 10.2 GFLOPs
Class Images Instances Box(P R mAP50 mAP50-95) Mask(P R mAP50 mAP50-95): 100%|██████████| 6/6 [00:10<00:00, 1.79s/it]
all 188 693 0.875 0.921 0.925 0.839 0.9 0.902 0.926 0.809
Mask mAP50 为0.926
MaskPR_curve.png
预测结果如下:
GL-CRM 全局到局部可控感受野模块的工作原理
GL-CRM(Global-to-Local Controllable Receptive Module)是为了更好地处理文档中不同元素的多尺度变化而设计的。它包括两个主要组件:可控感受野模块(CRM)和全局到局部设计(GL)。CRM灵活地提取和整合具有多个尺度和粒度的特征,而GL架构具有从全局上下文(整页规模)到子块区域(中等规模)再到局部语义信息的层次感知过程。
CRM:对于每一层的特征X,首先使用权重共享的卷积层w和核大小k提取特征。通过使用一组不同的扩张率d=[d1, d2, ..., dn]来捕获不同粒度的特征。然后,将这些特征融合,并允许网络自主学习如何融合不同的特征组件。
GL设计:全局级别使用较大的核和扩张率来捕获整页元素的更多纹理细节和保存局部模式。在中间阶段,特征图被下采样,纹理特征减少,此时使用较小的核和扩张率来感知中等规模的元素,如文档子块。在深层阶段,语义信息占主导地位,使用基本的瓶颈作为轻量级模块,专注于局部语义信息。
结合YOLO11结构图:
Mask mAP50 从原始的0.926 提升至0.934
YOLO11-seg-G2L_CRM summary: 271 layers, 2,797,515 parameters, 0 gradients, 10.3 GFLOPs
Class Images Instances Box(P R mAP50 mAP50-95) Mask(P R mAP50 mAP50-95): 100%|██████████| 6/6 [00:08<00:00, 1.35s/it]
all 188 693 0.883 0.913 0.934 0.847 0.887 0.918 0.934 0.828
4) 原创自研 | 一种新颖的跨通道交互的高效率通道注意力EMCA
5) SPPF原创自研 | SPPF_attention,能够在不同尺度上更好的、更多的关注注意力特征信息
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。