首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >《Towards High-Resolution Industrial Image Anomaly Detection》(迈向高分辨率工业图像异常检测)

《Towards High-Resolution Industrial Image Anomaly Detection》(迈向高分辨率工业图像异常检测)

原创
作者头像
AI小怪兽
发布2025-09-17 10:21:32
发布2025-09-17 10:21:32
2300
举报
文章被收录于专栏:毕业设计毕业设计YOLO大作战

💡💡💡本文摘要:该论文《Towards High-Resolution Industrial Image Anomaly Detection》(迈向高分辨率工业图像异常检测)具有以下重要意义:

1. 直面工业核心痛点

首次系统界定并解决了高分辨率工业检测中的三大核心挑战:

  • 计算效率与精度的平衡:在有限GPU内存下实现4K分辨率图像的精准检测
  • 大尺度异常检测难题:突破预训练网络感受野限制,实现跨数千像素的异常语义捕捉
  • 细粒度纹理误检问题:提出"超细纹理(Ultrafine Texture)"概念并解决由此引发的误报

2. 提出创新性框架HiAD

  • 双分支架构:同时处理高/低分辨率信息,确保从细微缺陷到大尺度异常的全面检测
  • 检测器池机制:通过自适应分配策略实现计算资源的智能调度
  • 多分辨率特征融合:有效抑制纹理变异引起的过检测问题
  • 模块化设计:支持主流检测方法的即插即用,具备高度扩展性

3. 创建权威基准数据集

构建首个高分辨率异常检测基准体系:

  • MVTec-HD & VisA-HD:合成基准包含2K/4K分辨率数据
  • RealIAD-HD:真实工业场景基准,聚焦细微缺陷
  • 特别设计"细微异常"类别,填补低分辨率方法无法检测的空白

4. 提供实用化解决方案

  • 支持多GPU并行训练与推理
  • 实现检测精度与计算成本的最佳平衡
  • 模块化设计允许根据实际需求定制检测方案

5. 推动领域发展

  • 为高分辨率异常检测建立新的性能标杆
  • 开源基准数据集促进后续研究
  • 提出的评估指标和实验框架成为后续工作的参考标准

该研究将工业异常检测从传统的低分辨率(通常≤512px)时代推进到高分辨率(2K-4K)时代,显著提升了在精密制造、电子质检等需要细微缺陷检测场景的实用价值,被誉为"工业检测走向高清化的重要里程碑"。

博主简介

AI小怪兽,YOLO骨灰级玩家,1)YOLOv5、v7、v8、v9、v10、11优化创新,轻松涨点和模型轻量化;2)目标检测、语义分割、OCR、分类等技术孵化,赋能智能制造,工业项目落地经验丰富;

原创自研系列, 2024、25年计算机视觉顶会创新点

《YOLOv13魔术师》

《YOLOv12魔术师》

《YOLO11魔术师》

《YOLOv8原创自研》

《YOLOv5原创自研》

《YOLOv7原创自研》

《YOLOv9魔术师》

​《YOLOv10魔术师》 ​

应用系列篇:

《YOLO小目标检测》

《深度学习工业缺陷检测》

《YOLOv8-Pose关键点检测》

23、24年最火系列,加入24年改进点内涵100+优化改进篇,涨点小能手,助力科研,好评率极高

《YOLOv8魔术师》

《YOLOv7魔术师》

《YOLOv5/YOLOv7魔术师》

《RT-DETR魔术师》

1.原理介绍

论文:Towards High-Resolution Industrial Image Anomaly Detection

摘要——当前异常检测方法主要聚焦于低分辨率场景。针对高分辨率图像,传统的下采样操作会丢失细粒度判别信息,往往导致细微异常区域漏检。尽管已有研究取得一定进展,尝试通过轻量化网络架构或简单图像分块与集成策略提升检测分辨率,但这些方法在检测精度与效率方面仍难以满足工业场景的实际需求。为解决上述问题,我们提出HiAD——一种面向高分辨率异常检测的通用框架。该框架能够在有限计算资源下有效检测高分辨率图像中不同尺寸的异常区域。具体而言,HiAD采用双分支架构整合多尺度异常线索,全面捕捉从细微到大范围的异常模式。此外,该框架引入多分辨率特征融合策略,以应对高分辨率图像中细粒度纹理变化带来的挑战。为兼顾适应性与效率,HiAD通过构建检测器池并结合多样化的分配策略,实现根据图像块特征自适应分配检测器,在保障检测性能的同时有效控制计算成本。我们在专门构建的高分辨率异常检测基准数据集(包括MVTec-HD、VisA-HD以及真实场景数据集RealIAD-HD)上进行了广泛实验,结果证明了HiAD的卓越性能。

我们对高分辨率(1K-4K)工业图像异常检测进行了系统性研究,并将其核心挑战归纳为三个主要方面。首先,高分辨率异常检测方法需同时满足工业场景对精度与效率的要求。然而受限于GPU内存,高分辨率图像无法通过单次前向传播完成处理,这可能导致检测性能与效率的下降。其次,现有针对低分辨率图像预训练的骨干网络难以有效检测高分辨率下的大尺度异常。这是由于预训练网络在高分辨率图像上的感受野和扩展性受限,难以捕捉横跨数百甚至数千像素的异常语义。第三,高分辨率图像中的细粒度纹理信息使样本分布复杂化,增大了正常样本的类内距离,可能导致异常检测模型将纹理变化误判为异常。

为解决上述问题,我们提出HiAD——一种无监督高分辨率异常检测框架,能够将现有低分辨率异常检测方法扩展至任意高分辨率的异常检测任务。如图1所示,HiAD在4K分辨率下可有效检测从数十像素到数千像素跨度异常区域。具体而言,HiAD采用双分支架构,聚合高分辨率分支与低分辨率分支的检测结果,确保全面识别不同尺度的异常。在高分辨率分支中,图像被分割为块状区域进行局部检测。通过构建检测器池并结合多种检测器分配策略,HiAD能够根据图像块特征自适应分配检测器,在保持计算效率的同时实现多样化高分辨率图像的高精度异常检测。为进一步解决高分辨率图像中细粒度纹理变化带来的挑战,HiAD引入多分辨率特征融合策略,缓解因过度检测导致的性能下降。值得注意的是,HiAD支持采用多种主流异常检测方法进行检测器训练,并支持跨多GPU的块级并行训练与推理,兼具灵活性与高效性。凭借模块化设计,HiAD能够为真实异常检测任务定制检测方案,有效应对工业领域的多样化需求。

据我们所知,目前缺乏专为高分辨率异常检测设计的公开基准数据集。为此,我们构建了三个高分辨率异常检测基准数据集用于评估HiAD,包括合成基准MVTec-HD与VisA-HD,以及真实场景基准RealIAD-HD。这些基准基于广泛使用的MVTec-AD [6]、VisA [7]和Real-IAD [8]数据集构建,其高分辨率图像包含不同尺寸的异常区域,极具挑战性。HiAD在所有基准测试中均取得令人满意的性能,相较其他异常检测方法实现显著提升,彰显了其在高分辨率异常检测任务中的有效性与实用性。本研究的主要贡献归纳如下:

• 我们系统阐述了高分辨率工业图像异常检测的核心挑战,并提出HiAD——一个通用可扩展的框架,能够在保持高计算效率的同时精准检测不同尺度的异常区域。

• HiAD可与多种异常检测方法集成,并支持多种检测器分配策略,能够为真实高分辨率应用场景定制检测方案。

• 我们发布了高分辨率异常检测基准数据集(包括MVTec-HD、VisA-HD和RealIAD-HD),这些数据集包含低分辨率下难以识别的细微异常,为评估高分辨率异常检测方法提供了宝贵资源。

• 综合实验一致证明了HiAD的有效性及所构建基准的可靠性,为未来研究奠定了坚实基础。

II.相关工作

A. 无监督图像异常检测

近年来,图像异常检测技术获得广泛关注,并引发了一系列研究[9]–[12]。由于现实场景中异常样本稀缺,大多数异常检测方法遵循无监督范式,仅使用正常数据训练,并在推理阶段识别偏离正常模式的异常样本。这些方法可大致分为三类:基于重建的方法、基于深度特征嵌入的方法以及基于异常合成的方法。基于重建的方法[11], [13]–[15]仅使用正常图像训练重建网络。当输入异常图像时,这些网络无法有效重建异常区域,通过计算重建残差实现异常检测与定位。基于深度特征嵌入的方法[9], [10], [16], [17]学习正常图像的特征分布,通过度量查询图像特征与已学习特征分布之间的距离来识别异常。其中构建记忆库[9], [18]和学习标准化流模型[17], [19]是特征建模的常用方法。基于异常合成的方法[20]–[23]利用合成异常样本训练异常检测模型。这些方法强调合成异常能有效模拟真实异常。尽管这些方法取得显著进展,但它们主要针对低分辨率图像设计,其检测过程依赖于在现代GPU上单次前向传播完成。对于包含细微异常的高分辨率图像,这些方法往往难以实现有效检测。

B. 高分辨率异常检测

高分辨率图像广泛应用于工业生产[8][24][25]、自动驾驶[26][27][28]、遥感监测[29][30][31]和组织病理学[32][33][34]等领域。对深度学习模型而言,使用高分辨率图像作为输入会带来诸多挑战:模型参数量大幅增加导致计算成本和推理延迟显著上升。目前将深度学习模型应用于高分辨率异常检测任务主要存在两种基线方法。第一种方法是将高分辨率图像下采样至目标分辨率进行检测。这种方法被称为均匀下采样,由于整个图像质量被均匀降低,会导致异常检测模型不可避免地遗漏细微异常,因此无法满足高精度要求的任务需求。第二种方法将高分辨率图像分割为具有最大分辨率的较小图像块,独立检测每个图像块后聚合结果。该方法虽能保留图像细节信息并实现高精度检测,但也面临计算成本方面的挑战。

近期研究尝试通过轻量化网络提升异常检测分辨率。例如STCIKD[35]将高分辨率图像转换为视频序列进行异常检测,而VarAD[4]采用轻量化Mamba模型[36]重建图像块,实现了1024×1024分辨率的工业图像检测。尽管取得这些进展,上述方法仍要求高分辨率图像通过单次前向传播进行处理,这本质上限制了方法的可扩展性。更具相关性的工作是Rolih等人[5]提出的分块集成方法:先将高分辨率图像分割为小块,随后为每个位置训练独立的异常检测模型,最终聚合检测结果。但所需模型数量随分辨率呈平方级增长,难以扩展至更高分辨率。此外,由于缺乏专门针对高分辨率异常检测的公开基准数据集,这些方法在检测细粒度异常方面的有效性难以得到全面验证,这可能限制其在实际场景中的应用。

III.方法

我们的目标是在保持计算效率的同时,检测高分辨率图像中不同尺度的异常区域。分块处理是处理高分辨率图像的常见解决方案,即先将图像分割成多个块进行独立检测,再聚合结果。然而,这种简单方法仍存在三个关键局限性,阻碍其在实际场景中的应用:

• 高分辨率图像中大规模异常区域的精准识别要求模型能够捕捉大空间范围内的全局异常语义。然而,现有预训练网络有限的感受野和扩展性,加之分块操作导致的全局信息丢失,阻碍了基于简单分块方案检测大规模异常的有效性。这可能导致检测结果不连续甚至漏检。如图2(a)所示,破损网格异常在低分辨率下能被完整识别,但当尺度提升至高分辨率时,同一异常区域跨越更多像素,导致分块处理产生不连续的检测结果。在某些工业场景中,完整分割异常区域至关重要,例如需要根据异常区域面积评估严重程度的场景。

• 由于现有异常检测方法泛化能力有限,高分辨率图像中的细粒度纹理变化可能被误判为异常。如图2(b)所示,高分辨率网格图像中独特的金属纹理导致分块处理产生过度检测。这种独特金属纹理可能从未出现在训练数据中,但它实际是正常样本的类内差异。我们将超出现有异常检测方法模型能力的细粒度纹理称为"超细纹理"。超细纹理在高分辨率图像中普遍存在,会导致广泛的误检。

• 分块处理将高分辨率图像划分为多个图像块。核心问题在于如何将这些图像块分配给异常检测模型,以平衡检测性能与计算成本。直接的方法是所有图像块使用单一模型检测,但这实际上将任务转换为多类异常检测问题[37][38],块间差异会增加正常特征分布建模的复杂度,通常导致异常检测性能下降。为缓解该问题,Rolih等人[5]为每个空间位置训练独立模型,但这会导致计算和存储成本不可控。

本节提出我们的高分辨率异常检测框架HiAD,旨在解决上述挑战。我们首先阐述HiAD的整体架构,随后详细说明其关键组件,包括多分辨率特征融合策略、检测器池及检测器分配方法。

A. HiAD框架概述

HiAD的整体流程如图3所示,其由高分辨率分支与低分辨率分支构成,可在不同尺度下执行异常检测。针对高分辨率分支,给定输入图像X ∈ R^(H×W×3),我们使用HP × WP的块尺寸和HS × WS的步长将X划分为图像块集合P,其中Pi,j ∈ R^(HP×WP×3)表示位于(i, j)位置的图像块。定义图像块划分的逆操作为X = G(P),其中聚合函数G(·)将图像块集合P拼接为完整图像X。对于多个图像块的重叠区域,聚合函数采用重叠像素的平均值。HiAD从每个图像块提取多分辨率融合特征,表示为fi,j = F(Pi,j),其中F(·)表示多分辨率特征提取函数。对于图像块集合P,其特征集合定义为F = {fi,j | fi,j = F(Pi,j), Pi,j ∈ P}。在高分辨率分支中,我们训练多个检测器组成检测器池D = {D1, D2, ..., DM},每个检测器负责检测特定图像块子集(如检测特定位置的图像块)。这些检测器是使用基于特征的异常检测方法(如PatchCore[9])在不同图像块上训练的模型实例。检测器分配函数Φ(·)将每个图像块特征分配给对应检测器,表示为D = ΦD(fi,j),其中D ∈ D。被分配的检测器基于图像块特征输出异常分数Si,j = D(fi,j) ∈ R^(HP×WP)。高分辨率分支生成的异常图表示为: SH = G({D(fi,j) | D = ΦD(fi,j), fi,j ∈ F}) (1)

图3. 提出的HiAD框架概览,其集成低分辨率(上图)与高分辨率(下图)双分支结构,用于检测不同尺度的异常区域。高分辨率分支采用多分辨率特征融合策略以缓解超细纹理引发的过度检测问题,同时通过检测器池与多种检测器分配策略,在实际计算限制下有效处理高分辨率图像中的结构多样性。

IV. 高分辨率异常检测基准数据集

本节介绍我们构建的高分辨率异常检测基准数据集,包括合成基准MVTec-HD与VisA-HD,以及真实场景基准RealIAD-HD。这些基准旨在反映实际高分辨率异常检测任务的特点:异常区域往往十分细微,在低分辨率设置下容易被遗漏,因而具有显著挑战性。

合成基准构建。我们开发了扩展现有异常检测基准(MVTec-AD [6]和VisA [7])的流程,使其适用于高分辨率检测任务。具体而言,首先采用StableSR [43]对MVTec-AD [6]和VisA [7]数据集的图像进行超分辨率处理,从而提升分辨率与图像细节。随后通过提取原始数据集的真实异常区域,经过下采样处理,并利用泊松图像编辑技术[44]将其无缝粘贴至正常图像上,以此合成细微异常。该方法生成的合成异常在视觉上具有连贯性且与上下文环境保持一致。最终生成的图像构成"细微"异常类别,其特征是异常区域极其细微,在低分辨率下难以检测。为确保这些细微异常能被现代神经网络有效捕捉,其边界框边长至少为16像素。大多数图像包含一个异常区域,少数图像最多包含五个。我们通过人工筛选和校准这些插入区域来保证图像质量。数据集经过重构以消除训练样本与测试样本间的任何重叠。鉴于高分辨率异常检测固有的高计算复杂度,我们移除了原始数据集中某些冗余类别以降低实验成本。例如在MVTec-AD数据集[6]中,Wood(木材)、Tile(瓷砖)、Carpet(地毯)和Leather(皮革)类别具有高度相似特征,因此我们仅保留代表性类别Wood用于研究。最终MVTec-HD基准包含七个代表性类别:Bottle(瓶子)、Capsule(胶囊)、Grid(网格)、Hazelnut(榛子)、Screw(螺丝)、Transistor(晶体管)和Wood(木材)。我们随后构建了分辨率分别为2048×2048和4096×4096的两个数据集,分别称为MVTec-2K和MVTec-4K。对于VisA-HD基准,我们选择五个代表性类别:Capsules(胶囊)、Fryum(脆饼)、Macaroni(通心粉)、PCB(电路板)和Pipe Fryum(管状脆饼)。这些类别经过处理生成2048×2048分辨率的数据集,称为VisA-2K。MVTec-HD与VisA-HD基准均包含源自原始数据集的细微异常区域和大跨度异常区域,必须通过高分辨率检测才能有效识别。

真实场景基准。Real-IAD数据集[8]包含从真实工业场景采集的多视角高分辨率图像,其分辨率范围在2000至5000像素之间。针对RealIAD-HD基准,我们选择了三个以特别细微异常为特征的代表性产品类别:瓶盖(Bottle Cap)、薄荷糖(Mint)和USB适配器(USB Adaptor)。这些类别在Real-IAD数据集[8]中具有最小的平均缺陷区域面积,对低分辨率下的异常检测构成重大挑战。为标准化评估流程,我们仅采用顶视图图像并将其统一缩放至2048×2048像素,形成RealIAD-2K数据集。

表I提供了高分辨率异常检测基准的统计概览。对于合成基准,基于"细微异常与较大异常出现频率相近"的假设,我们将细微异常样本的数量控制为与原始数据集大致相当。图4展示了各数据集的相对缺陷面积[45]统计结果(定义为异常像素占总像素的比例)。统计结果表明:MVTec-HD与VisA-HD基准侧重于检测不同尺度的异常区域,而RealIAD-HD则专注于检测细微异常。

图4. 不同数据集的相对缺陷面积统计结果

V. 实验

为评估我们提出的HiAD框架的有效性及所构建高分辨率基准数据集的可靠性,我们进行了全面实验。本节详细阐述实验设置、评价指标、定量与定性结果,以及系统性消融实验以评估各组件的贡献。

表III:不同方法在2K数据集上跨分辨率异常检测结果对比。最佳结果以粗体标注,次佳结果以下划线标注。

图6. HiAD采用不同异常检测方法在2048×2048检测分辨率下对细微异常的定性检测效果

图8. NA、SCA与RA的定性对比结果。检测器数量设置为4个,分配至相同检测器的图像块标记为相同颜色。

表VII:HiAD与替代性异常检测方法在MVTec-HD基准上的性能对比

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.原理介绍
  • II.相关工作
    • A. 无监督图像异常检测
    • B. 高分辨率异常检测
  • III.方法
    • A. HiAD框架概述
  • IV. 高分辨率异常检测基准数据集
  • V. 实验
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档