网易首页 > 网易号 > 正文 申请入驻

NeurIPS 2025 | 上交大、南农大提出ADPretrain:为工业异常检测量身打造的预训练“超能力”

0
分享至

文章来源:我爱计算机视觉(ID:aicvml)

大家好,今天想和大家聊一篇非常有趣的新工作,来自上海交通大学和南京农业大学的研究者们,他们提出了一个名为 ADPretrain 的新框架。简单来说,这是一个专门为工业异常检测(Industrial Anomaly Detection)任务设计的“预训练”方法,旨在解决现有方法过度依赖ImageNet预训练特征而导致的“水土不服”问题。



  • 论文标题 : ADPretrain: Advancing Industrial Anomaly Detection via Anomaly Representation Pretraining

  • 作者 : Xincheng Yao, Yan Luo, Zefeng Qian, Chongyang Zhang

  • 机构 : 上海交通大学,南京农业大学

  • 论文地址 : https://arxiv.org/abs/2511.05245

  • 项目地址 : https://github.com/xcyao00/ADPretrain

  • 会议 : Accepted by NeurIPS 2025

现有方法的“窘境”

在工业生产线上,利用机器视觉来检测产品瑕疵(即“异常”)是一项关键技术。目前,主流的异常检测(AD)方法大多依赖于在ImageNet上预训练好的深度学习模型来提取特征。

但这里存在两个核心问题:

  1. 目标不匹配 :ImageNet预训练的目标是“分类”,让模型学会识别猫、狗、汽车等自然物体,而不是区分“正常”与“异常”的工业品。

  2. 数据分布差异 :工业图像(比如电路板、药瓶、金属螺丝)和ImageNet中的自然图像在纹理、光照、背景等方面差异巨大。

这两个问题导致ImageNet预训练出的特征对于工业异常检测任务来说,并非最优解,甚至可能限制了模型的性能上限。


从上图可以直观地看到,无论是在MVTecAD还是VisA数据集上,使用了ADPretrain的预训练特征后(虚线),多种异常检测方法的性能都普遍优于使用原始特征(实线),证明了其普适性和有效性。

ADPretrain:为异常检测而生的预训练框架

为了解决上述痛点,作者们提出了一个全新的异常表示预训练框架——ADPretrain。其核心思想是:在一个大规模的工业异常检测数据集(RealIAD)上,专门学习一种能够更好地区分正常与异常样本的特征表示


整个框架如上图所示,它主要包含几个关键设计:

基于残差特征的表示学习

为了让预训练的特征具有更好的泛化能力,能够适应不同的下游数据集,ADPretrain没有直接使用骨干网络输出的特征。而是借鉴了ResAD的思想,采用了一种名为“残差特征”(Residual Features)的表示。

具体来说,对于一个输入特征,模型会从一个“正常样本特征库”中找到与之最相似的正常特征,然后将两者相减,得到残差特征。这种操作可以有效地剥离掉与类别相关的通用模式,让模型更专注于那些“不正常”的微小差异,从而获得更好的跨类别泛化能力。

创新的对比损失函数

为了让模型学到的特征更具判别力,作者设计了两种互补的对比损失函数(Contrastive Losses),分别从“角度”和“范数(模长)”两个维度来拉大正常特征与异常特征之间的距离。

  • 角度导向对比损失 (Angle-Oriented Contrastive Loss)

    这个损失函数的目标是最大化正常特征与异常特征在特征空间中的夹角。不同于传统的对比学习以原点为中心计算余弦相似度,作者认为这会导致特征均匀分布在超球面,不利于区分类内差异。因此,他们提出以所有正常特征的“质心” 为中心来计算角度。对于一个特征 ,先计算中心化后的特征 ,再进行对比学习。其公式如下:

    其中, 和 是来自同一图像的增广对(正样本), 是温度超参。 这个指示函数是关键,它确保了只有标签不同(即一个是正常,一个是异常)的样本 才会被当作负样本。这样,损失函数会明确地将正常特征与异常特征在角度上推开。

  • 范数导向对比损失 (Norm-Oriented Contrastive Loss)

    这个损失函数则希望在范数(模长)上区分正常与异常特征。其灵感源于单分类(One-Class Classification)思想,目标是让所有正常特征的范数都收缩到一个半径为 的预设超球体内,而异常特征的范数则被推到半径为 ( , 是一个安全边界) 的超球体之外。其统一形式的损失函数如下:

    这里, 表示 是正常特征,对其施加收缩损失 ,将其拉入半径为 的球内。 表示 是异常特征,对其施加扩张损失 ,将其推出半径为 的球外。

通过这两个损失函数的共同优化(总损失 ),模型被引导着去学习一种“理想”的特征分布:正常特征在角度和范数上都紧凑地聚集在一起,而异常特征则被推到远处,界限分明。

可学习键/值注意力的特征投影器

在获得残差特征后,作者设计了一个基于Transformer的特征投影器(Feature Projector)来进一步优化和提炼特征。有趣的是,他们没有使用标准的自注意力机制,而是提出了一种名为“可学习键/值注意力”(Learnable Key/Value Attention)的模块。

该模块引入了一组可学习的“参考表示”作为Key和Value,而输入特征作为Query。通过Query与这些可学习的正常模式参考进行交叉注意力计算,再从输入中减去注意力输出,可以自适应地消除特征中可能残留的正常模式,从而进一步凸显异常。

实验效果:显著且普适的性能提升

为了验证ADPretrain的威力,作者进行了一系列详尽的实验。他们将ADPretrain学到的特征直接替换掉五种主流的基于嵌入的异常检测方法(如PaDiM、PatchCore等)中的原始特征,并在五个公开数据集(MVTecAD, VisA, BTAD等)和五种不同的骨干网络(如DINOv2, CLIP等)上进行了测试。


实验结果非常亮眼。如上表所示,几乎在所有组合下,使用ADPretrain的特征(标记为†)都带来了显著的性能提升。例如,在DINOv2-Base骨干网络和MVTecAD数据集上,PatchCore的图像级AUROC从95.5%提升到了99.0%;UniAD更是从71.1%飙升至97.1%,提升了惊人的26个百分点。这充分证明了ADPretrain学习到的特征表示具有极强的泛化性和优越性。

直观的可视化对比

通过t-SNE对特征进行降维可视化,我们可以更直观地感受到ADPretrain带来的改变。


上图展示了VisA数据集中“capsules”类别的特征分布。左边是原始特征,正常(绿色)和异常(红色)样本混杂在一起,难以区分。而右边使用了ADPretrain的特征后,绿色点簇变得异常紧凑,红色点则被清晰地分离出来,界限分明。

同样,在定性结果上,使用ADPretrain特征的模型能够更准确地定位异常区域,同时有效抑制在正常区域的误报。


总结

总的来说,这篇论文点出了当前工业异常检测领域一个长期被忽视但至关重要的问题:预训练任务与下游应用之间的鸿沟。作者提出的ADPretrain框架,通过在大规模行业数据集上进行专门的表示学习,并设计了巧妙的对比损失来强化正常与异常的区分,为该领域提供了一种即插即用、效果显著的“能力升级”方案。这项工作不仅为工业异常检测带来了新的SOTA性能,也为未来研究指明了一个有价值的方向——为特定任务定制预训练。

大家对这个方法怎么看?你觉得为特定领域定制预训练会成为未来的大趋势吗?欢迎在评论区留下你的看法!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
后续!曾医生的父母替女儿道歉了,字字带着泪和痛!没抱怨任何人

后续!曾医生的父母替女儿道歉了,字字带着泪和痛!没抱怨任何人

魔都姐姐杂谈
2025-11-12 10:42:22
离谱!澳洲,突然放开移民政策!

离谱!澳洲,突然放开移民政策!

澳洲财经见闻
2025-11-14 03:36:18
马伊琍都要五十了,这松弛感一般人真比不了,大上海的靓女

马伊琍都要五十了,这松弛感一般人真比不了,大上海的靓女

科学发掘
2025-11-12 13:58:37
多名院士提倡:超过60岁的老人,宁可在家做家务,也别出去做这些

多名院士提倡:超过60岁的老人,宁可在家做家务,也别出去做这些

瓜汁橘长Dr
2025-11-02 13:42:14
制定“两制”台湾方案,努力实现和平统一,驻军是唯一选择

制定“两制”台湾方案,努力实现和平统一,驻军是唯一选择

荐史
2025-11-13 20:57:19
果然不出中方所料,美国解除对叙制裁后,叙总统立即宣布两件大事

果然不出中方所料,美国解除对叙制裁后,叙总统立即宣布两件大事

军机Talk
2025-11-11 12:06:00
韩雨彤上央视节目太心机!只有她化浓妆和长剧演员同框瞬间被秒杀

韩雨彤上央视节目太心机!只有她化浓妆和长剧演员同框瞬间被秒杀

乐悠悠娱乐
2025-11-14 09:33:26
毛主席的机要秘书谢静宜,她被开除党籍后说:我永远是党的女儿

毛主席的机要秘书谢静宜,她被开除党籍后说:我永远是党的女儿

大运河时空
2025-11-14 15:20:03
母亲称女儿被骗柬埔寨 已怀孕6个月 欲卖房凑20万赎金

母亲称女儿被骗柬埔寨 已怀孕6个月 欲卖房凑20万赎金

大象新闻
2025-11-14 11:22:03
历史学家吴晗,十年期间含冤离世,为何却难让众人同情?

历史学家吴晗,十年期间含冤离世,为何却难让众人同情?

花开无田
2025-11-13 23:58:53
妹子“把胸放桌上休息”被拍走红!女菩萨们不服发照片PK:最后这波赢麻了

妹子“把胸放桌上休息”被拍走红!女菩萨们不服发照片PK:最后这波赢麻了

经典段子
2025-10-11 22:34:42
中方召见日本大使,石破茂紧急灭火,绍伊古对高市早苗称呼变了

中方召见日本大使,石破茂紧急灭火,绍伊古对高市早苗称呼变了

时尚的弄潮
2025-11-14 15:30:17
中国可能已被五场战争包围,最先爆发战争的可能不是台湾

中国可能已被五场战争包围,最先爆发战争的可能不是台湾

boss外传
2025-10-17 15:30:03
刘震云:凡是夫妻关系好的,都有一个共性,妻子允许丈夫做自己..

刘震云:凡是夫妻关系好的,都有一个共性,妻子允许丈夫做自己..

诗词中国
2025-10-11 19:09:33
翩翩起舞的小姐姐,黑色瑜伽裤一穿身材好到犯规,时尚感直接拉满

翩翩起舞的小姐姐,黑色瑜伽裤一穿身材好到犯规,时尚感直接拉满

小乔古装汉服
2025-11-01 18:52:37
无论年轻时候多帅的男人,老了都会令人失望

无论年轻时候多帅的男人,老了都会令人失望

乡野小珥
2025-11-11 07:50:46
中企对外宣布:回购中国已购光刻机!外媒:ASML的专利权陷入危机

中企对外宣布:回购中国已购光刻机!外媒:ASML的专利权陷入危机

削桐作琴
2025-11-14 16:13:18
“贝壳衣”引争议,网友:“还以为漏奶了!”

“贝壳衣”引争议,网友:“还以为漏奶了!”

LOGO研究所
2025-11-11 17:57:03
港星李国麟定居福州,买600平超大别墅,站院子里“炫富”好得意

港星李国麟定居福州,买600平超大别墅,站院子里“炫富”好得意

艳姐的搞笑视频
2025-10-24 15:33:14
八路军和新四军那么厉害,为何不去打淞沪会战?

八路军和新四军那么厉害,为何不去打淞沪会战?

《中国国家历史》
2025-11-14 22:31:25
2025-11-15 02:27:00
算法与数学之美 incentive-icons
算法与数学之美
分享知识,交流思想
5233文章数 64596关注度
往期回顾 全部

科技要闻

京东“失去的五年”后,找到新增长了吗?

头条要闻

怀疑19.9元"原切牛肉卷"是合成肉消费者送检 多方回应

头条要闻

怀疑19.9元"原切牛肉卷"是合成肉消费者送检 多方回应

体育要闻

7-0狂胜!15万人口小岛离世界杯只差1分

娱乐要闻

王家卫让古二替秦雯写剧情主线?

财经要闻

财政部:加强逆周期和跨周期调节

汽车要闻

小鹏X9超级增程动态评测全网首发 高速实测车内65分贝

态度原创

艺术
家居
房产
本地
游戏

艺术要闻

伟人写给宋庆龄的信:狂草艺术的巅峰之作

家居要闻

现代简逸 寻找生活的光

房产要闻

共话产业变革下的投资新思维与新机遇|蓝湾财富论坛精华

本地新闻

云游安徽 | 江声浩荡阅千年,文脉相承看芜湖

迟迟没有Switch2版!这三款任天堂第一方游戏太可惜

无障碍浏览 进入关怀版