【导读】
在工业质检中,发现异常并不难,但“认识”异常却很难。现有检测方法大多只能告诉你“这有问题”,却无法说明“出了什么问题”,更别提识别此前未曾见过的“新型缺陷”。
为了解决这一痛点,华中科技大学等研究团队在CV领域最新论文中提出了AnomalyNCD,一个支持工业场景中异常分类与新类别发现的通用框架,兼容主流检测器,在MVTec AD和MTD两大数据集上全面领先。
过去已经有很多优秀的异常检测方法,能准确圈出“哪里不对劲”,但在实际工业应用中,这远远不够。如果不能进一步判断缺陷类型、归因问题根源、甚至识别此前从未见过的新型异常,就无法真正做到智能化的质检分析。而这正是当前大多数方法的“短板”。
AnomalyNCD的出现,就是为了解决这一从“检测”到“理解”的跨越。它不仅能识别异常,更能学习如何分类这些异常,甚至面对从未见过的缺陷类型,也能“自学成才”完成归类,真正赋予系统“类比与认知”能力。
项目开源地址:
https://github.com/HUST-SLOW/AnomalyNCD
近年来,工业异常检测方法已能有效定位图像中的缺陷区域,但对于下游流程而言,仅仅检测“有问题”还远远不够。
例如,在实际生产中,我们不仅需要知道某个零件是否异常,还需要明确是哪一类问题——是裂纹、烧蚀还是磨损?更进一步,很多缺陷在初期甚至没有明确的定义,因此模型需要具备“发现未知异常类型”的能力,即异常多分类与新类别发现(Novel Class Discovery, NCD)。
但这并不容易。工业异常的“语义性”很弱,往往形态不显著、位于图像角落,现有方法在这种低语义场景中容易混淆背景与前景。
AnomalyNCD 结合异常检测与新类别发现(Novel Class Discovery, NCD)思想,构建了一个完整的异常多分类管线。核心包括三个创新设计:
工业检测容易产生伪异常(误检)和漏检。为了避免这些噪声影响学习,AnomalyNCD 首先设计了主元素二值化算法(MEBin),从检测器输出的异常热图中提取稳定出现的异常区域。
ViT虽强,但在工业场景容易“注意力跑偏”。作者提出掩码引导注意力机制,只引导 [CLS] token 聚焦于异常区域,同时保留其他token的全局感知能力。
由于每幅图中可能有多个异常区域,且部分区域是误检,作者提出面积加权融合策略,避免“平均投票”被噪声干扰:
AnomalyNCD不仅理论设计合理,在实际效果上也具备明显优势。论文在两个权威工业数据集上进行了充分对比实验:
仅使用未标注图像,与当前最强无监督聚类方法(AC)相比,NMI 提升 8.8%,F1 提升 10.8%(见表格1)。
结合一类检测器(如CPR)后,F1 高达 80.5%,比原方法高出近10个百分点(见表格2)。
引入主元素二值化(MEBin)后,F1 提升 7.2%,且在不同AD方法上均优于固定阈值方案。
掩码引导模块(MGA)在不同位置插入后,以“最后9层”为最佳配置(见表格5)。
伪标签修正策略(PLC)显著提升正常类识别的 recall(+14.9%)。
AnomalyNCD不仅兼容各种工业检测算法,还具备以下优势:
这意味着在未来的智能工厂中,算法不再只是“告诉你哪里坏了”,而是能够进一步“告诉你坏在哪、坏了什么”,让生产更加高效、智能、少人工。
AnomalyNCD的提出,标志着工业异常检测进入一个全新阶段:从“发现异常”迈向“理解异常”。这一框架不仅增强了AI在工业质检中的智能程度,也为NCD在低语义场景中的落地应用提供了重要示范。未来,类似的自监督与掩码机制将成为提升工业智能的关键武器。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。