Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >YOLO半自动标注技术助力铁路检测,人工标注时间骤降80%!

YOLO半自动标注技术助力铁路检测,人工标注时间骤降80%!

原创
作者头像
CoovallyAIHub
发布于 2025-04-11 01:20:27
发布于 2025-04-11 01:20:27
1090
举报

论文题目: A YOLO-Based Semi-Automated Labeling Approach to Improve Fault Detection Efficiency in Railroad Videos 论文链接: https://arxiv.org/pdf/2504.01010v1


一、摘要

大规模图像和视频数据集的人工标注通常耗时、易错且成本高昂,这成为铁路视频故障检测中机器学习工作流的主要瓶颈。本研究提出一种半自动化标注方法,利用预训练的YOLO(You Only Look Once)模型优化标注流程,提升铁路视频故障检测精度。通过以小规模人工标注数据为起点,该方法通过迭代训练YOLO模型,利用每轮输出提升模型精度,逐步减少人工干预需求。

为便于修正模型预测结果,我们开发了将YOLO检测数据导出为可编辑文本文件的系统,可在检测结果需要优化时快速调整。该方法将单张图像标注时间从平均2-4分钟缩短至30秒-2分钟,显著降低人工成本与标注错误。与付费平台的高成本AI标注方案不同,本方法为故障检测及其他基于检测的机器学习应用提供了经济高效的大规模数据处理方案。


二、引言

YOLO等基于检测的模型发展迅速且精度不断提升,但其训练过程仍存在耗时费力、数据准备阶段易引入人工误差等问题。现有AI辅助功能虽能加速训练,但成本高昂限制了资源有限的研究者的使用。研究表明,引入辅助标注可显著提升精度——Gregorio等通过半自动化标注实现了15%的准确率提升。本研究提出一种经济高效的替代方案,并应用于铁路系统故障检测,重点关注道砟不足(铁轨间碎石缺失)和植物侵限两类隐患,这些故障可能引发铁路运营中断与安全隐患。

铁路故障检测研究随AI技术进步不断发展。轨道结构失效是铁路系统故障的主因,现有检测流程已从人工转向自动化系统,但多数研究集中于钢轨裂纹或结构缺陷检测。道砟不足与植物侵限因视觉特征复杂且细微,检测面临独特挑战。在初期模型训练中,我们遇到标注与训练流程冗长的问题。为此开发的算法在提升精度的同时大幅缩短训练时间。本文通过对比纯人工标注数据集与采用新算法的数据集验证效果,并阐述该方法对铁路故障检测及其他领域的应用价值。


三、问题描述

YOLO作为实时目标检测模型,通过单次卷积神经网络前向传播实现多目标分类。训练YOLO模型需要大规模多样化数据集以确保高精度与鲁棒性。例如使用超10,000张图像成功训练模型,体现了数据规模的重要性。

但数据集准备面临标注工作的重大挑战——每张图像需标注边界框和类别标签,该过程既耗时又易受人工误差影响。标注不一致会降低YOLO模型的F1分数与平均精度(mAP)。当检测目标定义存在主观性(如"道砟不足")时,标注难度进一步加剧。

辅助标注技术通过算法工具减少人工误差、提升标注一致性,不仅能加速数据准备,还能提高标注质量。我们在实验室训练YOLO模型时发现,初始模型的F1分数与mAP值不理想,促使我们探索辅助标注算法。该算法通过确保初始标注准确性,使模型能用更少数据提取更优特征。

本研究选用YOLOv8模型,因其在轨道检测中表现优异。该方法的适用性不仅限于铁路领域,有效的辅助标注算法可推动工业检测、实时目标检测等广泛应用的模型训练效率。


四、标签提取

训练完成的模型会读取指定目录图像并输出标签文件。标签文件包含每个检测框的中心坐标(x,y)、宽高及类别ID。我们开发了代码将检测结果转换为标注软件可编辑的格式,并创建包含类别ID与名称的标签映射文件。模型标注100张未标注图像仅需5秒。

标注软件中可便捷调整标签,修改结果自动保存为YOLO兼容格式。标签提取流程集成于每轮未标注图像检测中,形成高效工作流。


五、算法设计

获取数据集后,需要由人工标注者对数据集中的一小部分图像进行人工标注。在训练基础 YOLO模型时,这一初始步骤至关重要,因为它提供了启动学习过程所需的基础标记数据。标注数据是模型理解输入图像与其相应输出(如边界框和类标签)之间关系的基本事实。

在对图像进行标记后,YOLO模型就可以使用这个注释子集进行训练。在这一阶段,模型学会识别模式、提取特征,并预测训练图像中对象的标签。训练完成后,模型将被部署到数据集中,为下一批图像贴标签。这一标注过程是渐进式的,确保模型在越来越大的数据集上逐步完善其性能。通过迭代改进模型的预测,减少了后续周期中需要的人工调整,最终提高了效率。

每次迭代时,都会使用标注软件对模型对新一批图像的预测进行审核和修正。然后将这些修正后的标签整合到现有的标注数据集中,从而扩展训练集,为模型提供更多的改进实例。更新后的标注数据集用于重新训练YOLO模型,进一步提高其准确性和鲁棒性。

随着数据集的增长,模型接触到的样本范围越来越广,其检测能力也会显著提高。这种渐进式增强对于像YOLO这样的深度学习模型来说至关重要,因为这种模型需要大量的、有良好注释的数据集才能茁壮成长。这种渐进式训练方法不仅减少了人工审核所需的时间,还确保模型能够更好地处理数据中的边缘情况和异常值。

如果你也想要感受辅助标注或者进行模型训练,Coovally平台满足你的要求!

支持自动根据已标注样本训练模型和辅助标注;并且还提供了多种快捷标注,如:粘贴标注、预标注等。用户可以使用本人已部署的模型预标样本集图片、可以批量粘贴标注框到图片、预标部分标签物体也统统可以实现。

动图封面
动图封面

Coovally平台整合了国内外开源社区1000+模型算法各类公开识别数据集,无论是YOLO系列模型还是Transformer系列视觉模型算法,平台全部包含,均可一键下载助力实验研究与产业应用。

而且在该平台上,无需配置环境、修改配置文件等繁琐操作,一键上传数据集,使用模型进行训练与结果预测,全程高速零代码

动图封面
动图封面

具体操作步骤可参考:YOLO11全解析:从原理到实战,全流程体验下一代目标检测

平台链接:https://www.coovally.com

如果你想要另外的模型算法数据集,欢迎后台或评论区留言,我们找到后会第一时间与您分享!


六、实验结果

数据集

采用开源铁路轨道数据集,含400张俯视角图像,检测目标为道砟不足与植物侵限。通过翻转(水平)、旋转(±15°)、剪切(±10°)等数据增强技术(表1),将原始图像从100张扩增至1018张(表2)。

从表2中可以看出,通过数据扩增,我们可以大量增加训练中使用的图像数量。将其与算法1和图1中的算法相结合,我们就能优化训练模型的效率和准确性。

结果评估

YOLOv8模型可以通过mAP值和F1分数进行客观评估。mAP(平均精度)将边界框与模型检测进行比较,并返回一个分数,准确的模型具有较高的mAP值是至关重要的。mAP值使用公式 (1) 计算。F1分数是一种更全面的评估方法,由精确度和召回率计算得出。F1分数通过公式 (2) 计算得出。

0.5时的mAP是0.5个阈值时的平均精确度,0.9时的mAP是0.9个阈值时的平均精确度。在等式 (1) 中,N代表类的数量,PA是召回率和精度绘制曲线时曲线下面积的数值。召回率是指模型识别假阳性检测的能力。一个准确的模型必须具有较高的召回率。因此,有了精确度和召回率,F1分数将成为模型的主要评估方法。

比较模型得分与辅助标注

100张图像集是没有辅助标注的初始集。如图2所示,由于数据量小且没有辅助标注,F1分数并不理想。从图2中还可以看出,得分有些不稳定。

如图3所示,在第一次实施辅助标注后,模型的得分和稳定性有了初步提高。辅助标注额外增加的100张标注图像所花费的时间也大大减少。

从图4和图5中可以看出,每增加100张图像也是如此。我们还可以看到,曲线的稳定性随着每次辅助标注的实施而提高,这表明随着算法的不断改进,模型的准确性也在不断提高。将100幅图像集与400幅图像集进行比较,总得分从0.81提高到0.87。随着数据量的增加,模型也会不断改进。

与无辅助标记模型的结果比较

在另一项比较中,我们将把该模型与另一个无辅助标记的模型进行比较。该模型共有400幅图像,应用了与表1相同的增强功能。如图6所示,该模型的F1分数为0.71,明显不稳定。与无辅助模型相比,辅助模型的质量有了显著提高。必须指出的是,无辅助模型在标注过程中可能存在相当程度的人为错误。不过,这也凸显了该算法的另一个重要特点,即辅助标注的早期实施有助于从早期阶段就减少训练中的人为错误。辅助标注效果的一个难点在于模型的训练时间。手动标注每张图像需要花费大量时间。完全标注无辅助模型大约需要10个小时。而训练辅助模型大约需要4-5个小时。这表明训练过程大大减少了时间和人力。

图7显示了使用400图像模型检测未标记图像的输出示例。就我们使用该模型的目的而言,这是一个可以接受的输出结果。然而,图7显示了识别压载不足的复杂性。我们很难准确定义什么是压载不足。不过,模型的输出结果与初始标注数据非常相似,这意味着检测结果是准确的。表3是模型及其各自F1分数的汇总。

辅助标注方法的有效性

F1分数是评估模型效能的关键指标。如表III所示,随着数据集的扩展,辅助标注算法在每次迭代中都能提升准确率。这种渐进式改进源于模型通过增加训练数据不断优化预测结果。F1分数的上升也意味着人工错误的减少,因为错误标注数据会损害模型性能。

在涉及YOLO模型训练的大多数研究中,人工标注是标准技术。虽然这种方法能保证高质量的标注,但其耗时耗力成本高昂。本研究提出的算法虽然保留了人工标注环节,但与全数据集标注相比,所需劳动力显著降低。

尽管实验结果证明了该方法对模型训练的积极意义,但算法性能依赖于初始标注图像的质量。若起始数据存在错误标注,模型准确率将受到负面影响。


七、结论

本研究提出了一种前景广阔的辅助标注技术,可同时提升机器学习模型的训练速度和精度。通过采用该算法,我们观察到每次训练迭代中F1分数持续提升,同时标注流程效率逐步提高。该方法能更准确高效地检测各类铁路故障,并可无缝集成至任何YOLO检测框架。

未来工作将重点开发置信度调节系统,使模型能根据迭代过程中精度的提升动态减少人工干预需求。此项改进将大幅降低人力成本并进一步缩短训练时间。此外,我们将通过获取针对性更强的道砟缺失专业数据集来优化模型,预计此举将推动性能指标的进一步突破。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
SCC-YOLO:集成 SCConv 到YOLOv9,脑肿瘤检测mAP提升,代码开源!
磁共振成像(MRI)是可视化大脑和识别肿瘤最有效的成像技术[1]。然而,由于脑肿瘤图像形态多样且边缘特征相对模糊[2],通过磁共振成像(MRI)诊断脑肿瘤的过程对于临床医生来说既复杂又低效,导致误诊和漏诊的风险增加。研究行人已将机器学习技术应用于脑肿瘤图像的分割和分类[3-10]。在脑肿瘤的自动检测和辅助诊断中,相关研究行人应用了无监督学习[11]、卷积神经网络(CNN)[12]、深度堆叠自编码器(DSAE)[15]以及You Only Look Once(YOLO)[13]、[14-18]等技术。Maibam Mangalleibi Chanu等人将YOLOv3[19]模型应用于脑肿瘤的计算机辅助检测和分类,代表了YOLO系列模型在脑肿瘤检测中的重要研究[16]。Kang等人基于YOLOv8[20]创新性地提出了RCS-YOLO[17]和BGF-YOLO[18]模型,在Br35H数据集上实现了良好的准确率和速度[25],展示了YOLO系列在脑肿瘤图像检测中的高度可行性。
未来先知
2025/04/04
950
SCC-YOLO:集成 SCConv 到YOLOv9,脑肿瘤检测mAP提升,代码开源!
RF-DETR vs YOLOv12实测:复杂果园青果识别准确率高达94.6%
本研究全面比较了RF-DETR目标检测模型和YOLOv12目标检测模型在复杂果园环境中识别绿色水果的能力,果园环境的特点是标签模糊、遮挡和背景伪装。为评估模型在真实世界条件下的性能,开发了一个自定义数据集,其中包括单类(绿色水果)和多类(遮挡和非遮挡绿色水果)注释。RF-DETR目标检测模型利用 DINOv2 骨干和可变形注意力机制,在全局上下文建模方面表现出色,在识别部分遮挡或视觉模糊的绿色水果方面尤其有效。与此相反,YOLOv12 模型采用了基于CNN的注意力机制来加强局部特征提取,优化了计算效率和边缘部署的适用性。在单类检测场景中,RF-DETR的平均精度(mAP@50)最高,达到0.9464,显示了其在杂乱场景中准确定位绿色水果的强大能力。尽管YOLOv12N的mAP@50:95 达到了0.7620的最高值,但RF-DETR目标检测模型在管理复杂空间场景方面的表现始终优于YOLOv12N。在多类检测中,RF-DETR以0.8298的mAP@50再次领先,表明其在区分遮挡和非遮挡水果方面的有效性,而YOLOv12L则以0.6622高居mAP@50:95 指标榜首,表明其在详细遮挡条件下的分类能力更胜一筹。对模型训练动态的分析表明,RF-DETR的收敛速度很快,尤其是在单类场景中,不到10个epoch就达到了平稳状态,这凸显了基于transformer-based的架构对动态视觉数据的效率和适应性。这些结果证实了RF-DETR适用于对准确性要求极高的农业任务,而YOLOv12仍然是对速度敏感的部署的理想选择。
CoovallyAIHub
2025/04/23
1490
RF-DETR vs YOLOv12实测:复杂果园青果识别准确率高达94.6%
夜间行车黑科技!中国团队全新YOLO-LLTS低光交通标志检测算法,实时识别精准度提升2.7%
低光照条件下交通标志的有效检测仍是一项重大挑战。为解决这一问题,我们提出YOLO-LLTS算法,这是一种专为低光环境设计的端到端实时交通标志检测方法。首先,我们引入高分辨率小目标特征检测模块(HRFM-TOD)以解决低光场景中小目标特征模糊的问题。该模块通过利用高分辨率特征图,有效缓解传统PANet框架中的特征稀释现象,从而同时提升检测精度与推理速度。其次,我们开发了多分支特征交互注意力模块(MFIA),该模块通过在通道和空间维度上实现多感受野的深层特征交互,显著增强了模型的信息提取能力。最后,我们提出先验引导增强模块(PGFE)以应对低光环境中常见的图像质量问题(如噪声、低对比度和模糊)。该模块利用先验知识丰富图像细节并提升可视性,大幅改善检测性能。为支撑本研究,我们构建了新型数据集CNTSSS(中国夜间交通标志样本集),涵盖城市、高速公路、乡村等多种夜间场景及不同天气条件。实验评估表明,YOLO-LLTS在TT100K-night数据集上mAP50和mAP50:95分别超越现有最佳方法2.7%和1.6%,在CNTSSS数据集上分别提升1.3%和1.9%,并在CCTSDB2021数据集上取得最优结果。边缘设备部署实验进一步验证了该方法的实时性与有效性。
CoovallyAIHub
2025/04/16
1460
夜间行车黑科技!中国团队全新YOLO-LLTS低光交通标志检测算法,实时识别精准度提升2.7%
YOLO算法改进 | YOLO11改进揭秘,前沿论文精华预览
众所周知,YOLO系列一直是计算机视觉领域的研究热点。作为其最新力作,YOLO11在2025年无疑将成为各大顶级会议的焦点。原因在于,一方面,YOLO系列的其他版本改进空间已趋于饱和,而YOLO11问世不久,尚有广阔的创新空间。另一方面,YOLO11在保持高准确度的同时,计算效率得到了显著提升,尤其在资源受限的环境中表现出色。然而,它也面临着模型复杂度较高、对标注数据质量和数量的依赖等问题,这也为进行学术创新提供了契机。
CoovallyAIHub
2025/02/05
1.1K0
YOLO算法改进 | YOLO11改进揭秘,前沿论文精华预览
YOLO11改进 | DGNN-YOLO:基于YOLO11的动态图神经网络用于小目标检测及跟踪
检测和跟踪城市交通中的行人、自行车和摩托车等小物体对交通监控系统构成了重大挑战,因为它们的运动轨迹多变、经常被遮挡,并且在动态的城市环境中可见度低。传统的检测方法,如YOLO11,虽然擅长提取空间特征进行精确检测,但往往难以应对这些小而动态的物体,尤其是在处理实时数据更新和资源效率方面。
CoovallyAIHub
2025/01/23
2950
YOLO11改进 | DGNN-YOLO:基于YOLO11的动态图神经网络用于小目标检测及跟踪
YOLO新成员 | CRAS-YOLO:基于 YOLOv5s 算法的多类别船舶检测与分类模型
基于卫星图像的多类别船舶检测和分类由于在军事和民用领域的重要应用而备受关注。在本研究中,团队在FUSAR船舶数据集和SimpleCopyPaste方法的基础上生成了一个新的Artificial-SAR-Vessel数据集中。我们进一步提出了一种新的多类船检测,称为CRAS-YOLO,它由卷积块注意力模块(CBAM)、感受野块(RFB)和基于YOLOv5s的自适应空间特征融合(ASFF)组成。CRAS-YOLO改进了基于路径聚合网络(PANet)的特征金字塔网络,该网络集成了RFB特征增强模块和ASFF特征融合策略,以获得更丰富的特征信息,并实现多尺度特征的自适应融合。同时,在骨干中增加了CBAM,以准确定位船只位置,提高检测能力。结果证实,CRAS-YOLO模型的准确度、召回率和平均准确度(mAP)(0.5)分别高达90.4%、88.6%和92.1%。所提出的模型在另一个Sar船舶检测(SSDD)数据集中的精度、召回率和mAP得分分别高达97.3%、95.5%和98.7%,也优于先前的研究结果。
CoovallyAIHub
2025/01/06
1530
YOLO新成员 | CRAS-YOLO:基于 YOLOv5s 算法的多类别船舶检测与分类模型
基于YOLO11的课堂点名检测(Python源码+pyside6界面+数据集)
💡💡💡本文主要内容:详细介绍了课堂点名检测系统,在介绍算法原理的同时,给出Pytorch的源码、训练数据集以及PyQt6的UI界面。在界面中可以选择各种图片、视频进行检测识别,可进行置信度、Iou阈值设定,结果可视化等。
AI小怪兽
2024/12/13
2770
YOLO系列的落地 | YOLOv7+注意力机制在农业上的应用
随着技术的发展,监控设备在农业中发挥着巨大的作用。有多种方法可以监测个体动物的行为,例如插入芯片记录生理数据、使用可穿戴传感器和(热)成像技术。一些方法使用附着在鸟类脚上的可穿戴传感器来测量它们的活动,但这可能会对受监测的动物产生额外影响。特别是,在商业环境中,技术限制和高成本导致这种方法的可行性低。
集智书童公众号
2023/02/26
2.7K0
YOLO系列的落地 | YOLOv7+注意力机制在农业上的应用
炸裂 !轻量化YOLO | ShuffleNetv2与Transformer结合,重塑YOLOv7成就超轻超快YOLO
随着计算机视觉领域的迅速发展,目标检测在各种应用中变得至关重要,这些应用范围包括但不限于安全监控、自动驾驶和智慧医疗。尽管传统目标检测方法存在计算复杂度高和实时性能不足的问题,但基于深度学习算法已在准确性和实时性能方面取得了重大突破。其中,YOLO已成为一种经典的实时目标检测算法,它在计算速度和检测精度之间取得了平衡。然而,移动设备通常在计算能力、内存容量和能源消耗方面受限,这复杂化了深度学习模型的部署。
集智书童公众号
2024/03/11
3K0
炸裂 !轻量化YOLO | ShuffleNetv2与Transformer结合,重塑YOLOv7成就超轻超快YOLO
YOLOv5:道路损伤检测
GRDDC'2020 数据集是从印度、日本和捷克收集的道路图像。包括三个部分:Train, Test1, Test2。训练集包括带有 PASCAL VOC 格式 XML 文件标注的道路图像。在给参赛者的数据Test1 和 Test2 中是没有标注。train则包含标注。
机器学习AI算法工程
2021/07/14
1.9K0
YOLOv11助力结肠镜检查:精准息肉检测新突破
直肠癌(CRC)是全世界最常见的癌症之一。它始于结肠内壁的息肉。要预防 CRC,就必须及早发现息肉。结肠镜用于检查结肠。一般来说,内窥镜顶端的摄像头拍摄的图像由专家手动分析。随着机器学习的兴起,各种传统的机器学习模型已被广泛使用。最近,深度学习模型因其在泛化和学习小特征方面的优势,在息肉检测中显示出更大的有效性。这些用于物体检测的深度学习模型可分为两种不同类型:单级和两级。一般来说,两阶段模型比单阶段模型具有更高的准确性,但单阶段模型的推理时间较短。因此,单级模型易于用于快速物体检测。YOLO是成功用于息肉检测的单级模型之一。由于其推理时间较短,它引起了研究人员的关注。迄今为止,研究人员已经使用了不同版本的 YOLO,随着版本的更新,模型的准确性也在不断提高。本文旨在了解最近发布的YOLOv11在检测息肉方面的有效性。我们分析了YOLOv11所有五个模型(YOLO11n、YOLO11s、YOLO11m、YOLO11l、YOLO11x)的性能,并使用Kvasir数据集进行了训练和测试。使用了两个不同版本的数据集。第一个版本是原始数据集,另一个版本是使用增强技术创建的。分析了使用这两个版本数据集的所有模型的性能。
CoovallyAIHub
2025/03/06
1110
YOLOv11助力结肠镜检查:精准息肉检测新突破
基于YOLO11的术中超声实时脑肿瘤检测:从模型训练到手术室部署
胶质瘤是原发性脑肿瘤中最常见的一种,其浸润性特征通常会导致预后不良和重大的治疗挑战。根据世界卫生组织(WHO)对中枢神经系统肿瘤的最新分类,胶质瘤包括各种亚型,每种亚型都由组织病理学和分子特征定义,这些特征直接影响其侵袭性、管理和预后。
CoovallyAIHub
2025/02/11
1710
基于YOLO11的术中超声实时脑肿瘤检测:从模型训练到手术室部署
基于YOLOv8、v9、v11及混合模型的头盔检测深度解析
这一问题的陈述转化为一项物体检测任务。因此,本文从可靠性和计算负荷的角度对头盔检测中的最新YOLO模型进行了比较。具体来说,本文使用了YOLOv8、YOLOv9和最新发布的YOLOv11。此外,本手稿还提出了一种经过改进的架构流水线,可显著提高整体性能。这种混合YOLO模型(h-YOLO)与独立模型进行了对比分析,证明h-YOLO在头盔检测方面优于普通YOLO模型。
CoovallyAIHub
2025/02/19
2580
基于YOLOv8、v9、v11及混合模型的头盔检测深度解析
YOLOv12深度测评:从创新到部署,硬件适配与YOLOv11性能全对比(附无代码流程)
作为YOLO系列的最新版本,YOLOv12引发了广泛关注。那关于YOLOv12的使用具体怎么样吗?今天小编就详细带你体验一下YOLOv12的使用细节,以及它和YOLO11的性能比较吧(附代码讲解)
CoovallyAIHub
2025/02/26
1.6K0
YOLOv12深度测评:从创新到部署,硬件适配与YOLOv11性能全对比(附无代码流程)
干货 | 目标检测入门,看这篇就够了(上)
作者 | 李家丞( 同济大学数学系本科在读,现格灵深瞳算法部实习生) 近年来,深度学习模型逐渐取代传统机器视觉方法而成为目标检测领域的主流算法,本系列文章将回顾早期的经典工作,并对较新的趋势做一个全景式的介绍,帮助读者对这一领域建立基本的认识。(营长注:因本文篇幅较长,营长将其分为上、下两部分。) 导言:目标检测的任务表述 如何从图像中解析出可供计算机理解的信息,是机器视觉的中心问题。深度学习模型由于其强大的表示能力,加之数据量的积累和计算力的进步,成为机器视觉的热点研究方向。 那么,如何理解一张图片?
刘盼
2018/04/08
1.4K0
干货 | 目标检测入门,看这篇就够了(上)
STN 也来卷 YOLO 了,提升图像检测的质量,并可用于下游应用 !
植物表型分析对于作物改良[1]、产量优化[2]和可持续实践[3]至关重要。人工智能(AI),特别是目标检测算法,已经改变了植物表型分析,提高了效率和性能[4]。You Only Look Once(YOLO)已经在各种农业应用中有效地使用,例如害虫检测[5]、作物疾病检测[6]和作物收获[7]。尽管有大量的使用案例,但由于各种空间变换[8],YOLO仍有一些局限性。空间变换网络[9]是一种提高人工神经网络对空间变换鲁棒性的方法。作者 Proposal 将STN与YOLO模型集成,以引入空间不变性。STN对图像应用可学习的仿射变换,这将有助于目标检测。STN-YOLO模型展示了空间不变性,并在几个农业基准数据集上超越了基本的YOLO模型。
未来先知
2024/08/08
3400
STN 也来卷 YOLO 了,提升图像检测的质量,并可用于下游应用 !
YOLO11-CBAM集成:提升商业苹果园树干与树枝分割的精准度
在本研究中,我们通过将卷积块注意力模块(CBAM)与YOLO11架构相结合,开发了一种定制的实例分割模型。该模型在休眠期和树冠期苹果园图像的混合数据集上进行了训练,旨在提高全年不同季节条件下树干和树枝的分割能力。在两个季节收集的混合数据集上训练YOLO11-CBAM后,在休眠期和树冠期图像上对模型进行了单独验证。此外,还在开花前、开花期、疏果期和收获期对模型进行了测试。YOLO11x-seg-CBAM和YOLO11m-seg-CBAM 的召回率和精确度分别最高。特别是,使用CBAM的YOLO11m-seg在树干类的训练中显示出最高的精确度(0.83),而不使用CBAM的YOLO11m-seg 在树干类的精确度为0.80。同样,对于树枝类,使用CBAM的YOLO11m-seg的精确度最高,达到0.75,而不使用CBAM的YOLO11m-seg的精确度为0.73。在休眠期验证中,YOLO11x-seg的精确度最高,为0.91。树冠季节验证凸显了YOLO11s-seg在所有类别中的卓越精度,树枝精度达到0.516,树干精度达到0.64。该建模方法在休眠期和冠层期两个季节的数据集上进行了训练,证明了YOLO11-CBAM集成在全年所有季节变化中有效检测和分割树干和树枝的潜力。
CoovallyAIHub
2025/03/07
1170
YOLO11-CBAM集成:提升商业苹果园树干与树枝分割的精准度
数据处理(二)| 打磨数据,提升模型:全面解读图像数据质量评估
前面我们了解了数据清洗的整个过程(详情可参考《数据清洗全流程详细解析与实践指南》文章),接下来我们就要讲一讲什么是数据质量评估。
CoovallyAIHub
2025/02/26
1660
数据处理(二)| 打磨数据,提升模型:全面解读图像数据质量评估
YOLO11目标检测:从代码实现到Coovally平台无代码快速部署
YOLO(You Only Look Once)是当前最流行的目标检测算法之一,而YOLO11是YOLO家族中的最新版本,具有更高的准确度和效率。
CoovallyAIHub
2025/01/27
2510
YOLO11目标检测:从代码实现到Coovally平台无代码快速部署
FA-YOLO:高效轻量级检测模型,94.6%参数减少,88倍速度提升!
作为一种突发性和极其破坏性的灾害[1,2,3],火长期以来对人类社会和自然环境构成了严重威胁。随着城市化和工业化的加速,建筑结构的复杂性以及人口的密集度逐渐增加,火灾的频率和危害也在逐年上升[4,5,6,7]。根据国际消防组织(IFPO)的统计数据,每年全球发生数百万起火灾事故,导致了大量的行人伤亡和财产损失,同时对生态环境造成了不可逆转的破坏。在森林区域,火势的蔓延通常会导致大片森林资源的破坏,进而加剧土壤侵蚀和空气污染等生态问题。
未来先知
2024/10/15
3310
FA-YOLO:高效轻量级检测模型,94.6%参数减少,88倍速度提升!
推荐阅读
SCC-YOLO:集成 SCConv 到YOLOv9,脑肿瘤检测mAP提升,代码开源!
950
RF-DETR vs YOLOv12实测:复杂果园青果识别准确率高达94.6%
1490
夜间行车黑科技!中国团队全新YOLO-LLTS低光交通标志检测算法,实时识别精准度提升2.7%
1460
YOLO算法改进 | YOLO11改进揭秘,前沿论文精华预览
1.1K0
YOLO11改进 | DGNN-YOLO:基于YOLO11的动态图神经网络用于小目标检测及跟踪
2950
YOLO新成员 | CRAS-YOLO:基于 YOLOv5s 算法的多类别船舶检测与分类模型
1530
基于YOLO11的课堂点名检测(Python源码+pyside6界面+数据集)
2770
YOLO系列的落地 | YOLOv7+注意力机制在农业上的应用
2.7K0
炸裂 !轻量化YOLO | ShuffleNetv2与Transformer结合,重塑YOLOv7成就超轻超快YOLO
3K0
YOLOv5:道路损伤检测
1.9K0
YOLOv11助力结肠镜检查:精准息肉检测新突破
1110
基于YOLO11的术中超声实时脑肿瘤检测:从模型训练到手术室部署
1710
基于YOLOv8、v9、v11及混合模型的头盔检测深度解析
2580
YOLOv12深度测评:从创新到部署,硬件适配与YOLOv11性能全对比(附无代码流程)
1.6K0
干货 | 目标检测入门,看这篇就够了(上)
1.4K0
STN 也来卷 YOLO 了,提升图像检测的质量,并可用于下游应用 !
3400
YOLO11-CBAM集成:提升商业苹果园树干与树枝分割的精准度
1170
数据处理(二)| 打磨数据,提升模型:全面解读图像数据质量评估
1660
YOLO11目标检测:从代码实现到Coovally平台无代码快速部署
2510
FA-YOLO:高效轻量级检测模型,94.6%参数减少,88倍速度提升!
3310
相关推荐
SCC-YOLO:集成 SCConv 到YOLOv9,脑肿瘤检测mAP提升,代码开源!
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档