网易首页 > 网易号 > 正文 申请入驻

NeurIPS 2025 | 上交大、南农大提出ADPretrain:为工业异常检测量身打造的预训练“超能力”

0
分享至

文章来源:我爱计算机视觉(ID:aicvml)

大家好,今天想和大家聊一篇非常有趣的新工作,来自上海交通大学和南京农业大学的研究者们,他们提出了一个名为 ADPretrain 的新框架。简单来说,这是一个专门为工业异常检测(Industrial Anomaly Detection)任务设计的“预训练”方法,旨在解决现有方法过度依赖ImageNet预训练特征而导致的“水土不服”问题。



  • 论文标题 : ADPretrain: Advancing Industrial Anomaly Detection via Anomaly Representation Pretraining

  • 作者 : Xincheng Yao, Yan Luo, Zefeng Qian, Chongyang Zhang

  • 机构 : 上海交通大学,南京农业大学

  • 论文地址 : https://arxiv.org/abs/2511.05245

  • 项目地址 : https://github.com/xcyao00/ADPretrain

  • 会议 : Accepted by NeurIPS 2025

现有方法的“窘境”

在工业生产线上,利用机器视觉来检测产品瑕疵(即“异常”)是一项关键技术。目前,主流的异常检测(AD)方法大多依赖于在ImageNet上预训练好的深度学习模型来提取特征。

但这里存在两个核心问题:

  1. 目标不匹配 :ImageNet预训练的目标是“分类”,让模型学会识别猫、狗、汽车等自然物体,而不是区分“正常”与“异常”的工业品。

  2. 数据分布差异 :工业图像(比如电路板、药瓶、金属螺丝)和ImageNet中的自然图像在纹理、光照、背景等方面差异巨大。

这两个问题导致ImageNet预训练出的特征对于工业异常检测任务来说,并非最优解,甚至可能限制了模型的性能上限。


从上图可以直观地看到,无论是在MVTecAD还是VisA数据集上,使用了ADPretrain的预训练特征后(虚线),多种异常检测方法的性能都普遍优于使用原始特征(实线),证明了其普适性和有效性。

ADPretrain:为异常检测而生的预训练框架

为了解决上述痛点,作者们提出了一个全新的异常表示预训练框架——ADPretrain。其核心思想是:在一个大规模的工业异常检测数据集(RealIAD)上,专门学习一种能够更好地区分正常与异常样本的特征表示


整个框架如上图所示,它主要包含几个关键设计:

基于残差特征的表示学习

为了让预训练的特征具有更好的泛化能力,能够适应不同的下游数据集,ADPretrain没有直接使用骨干网络输出的特征。而是借鉴了ResAD的思想,采用了一种名为“残差特征”(Residual Features)的表示。

具体来说,对于一个输入特征,模型会从一个“正常样本特征库”中找到与之最相似的正常特征,然后将两者相减,得到残差特征。这种操作可以有效地剥离掉与类别相关的通用模式,让模型更专注于那些“不正常”的微小差异,从而获得更好的跨类别泛化能力。

创新的对比损失函数

为了让模型学到的特征更具判别力,作者设计了两种互补的对比损失函数(Contrastive Losses),分别从“角度”和“范数(模长)”两个维度来拉大正常特征与异常特征之间的距离。

  • 角度导向对比损失 (Angle-Oriented Contrastive Loss)

    这个损失函数的目标是最大化正常特征与异常特征在特征空间中的夹角。不同于传统的对比学习以原点为中心计算余弦相似度,作者认为这会导致特征均匀分布在超球面,不利于区分类内差异。因此,他们提出以所有正常特征的“质心” 为中心来计算角度。对于一个特征 ,先计算中心化后的特征 ,再进行对比学习。其公式如下:

    其中, 和 是来自同一图像的增广对(正样本), 是温度超参。 这个指示函数是关键,它确保了只有标签不同(即一个是正常,一个是异常)的样本 才会被当作负样本。这样,损失函数会明确地将正常特征与异常特征在角度上推开。

  • 范数导向对比损失 (Norm-Oriented Contrastive Loss)

    这个损失函数则希望在范数(模长)上区分正常与异常特征。其灵感源于单分类(One-Class Classification)思想,目标是让所有正常特征的范数都收缩到一个半径为 的预设超球体内,而异常特征的范数则被推到半径为 ( , 是一个安全边界) 的超球体之外。其统一形式的损失函数如下:

    这里, 表示 是正常特征,对其施加收缩损失 ,将其拉入半径为 的球内。 表示 是异常特征,对其施加扩张损失 ,将其推出半径为 的球外。

通过这两个损失函数的共同优化(总损失 ),模型被引导着去学习一种“理想”的特征分布:正常特征在角度和范数上都紧凑地聚集在一起,而异常特征则被推到远处,界限分明。

可学习键/值注意力的特征投影器

在获得残差特征后,作者设计了一个基于Transformer的特征投影器(Feature Projector)来进一步优化和提炼特征。有趣的是,他们没有使用标准的自注意力机制,而是提出了一种名为“可学习键/值注意力”(Learnable Key/Value Attention)的模块。

该模块引入了一组可学习的“参考表示”作为Key和Value,而输入特征作为Query。通过Query与这些可学习的正常模式参考进行交叉注意力计算,再从输入中减去注意力输出,可以自适应地消除特征中可能残留的正常模式,从而进一步凸显异常。

实验效果:显著且普适的性能提升

为了验证ADPretrain的威力,作者进行了一系列详尽的实验。他们将ADPretrain学到的特征直接替换掉五种主流的基于嵌入的异常检测方法(如PaDiM、PatchCore等)中的原始特征,并在五个公开数据集(MVTecAD, VisA, BTAD等)和五种不同的骨干网络(如DINOv2, CLIP等)上进行了测试。


实验结果非常亮眼。如上表所示,几乎在所有组合下,使用ADPretrain的特征(标记为†)都带来了显著的性能提升。例如,在DINOv2-Base骨干网络和MVTecAD数据集上,PatchCore的图像级AUROC从95.5%提升到了99.0%;UniAD更是从71.1%飙升至97.1%,提升了惊人的26个百分点。这充分证明了ADPretrain学习到的特征表示具有极强的泛化性和优越性。

直观的可视化对比

通过t-SNE对特征进行降维可视化,我们可以更直观地感受到ADPretrain带来的改变。


上图展示了VisA数据集中“capsules”类别的特征分布。左边是原始特征,正常(绿色)和异常(红色)样本混杂在一起,难以区分。而右边使用了ADPretrain的特征后,绿色点簇变得异常紧凑,红色点则被清晰地分离出来,界限分明。

同样,在定性结果上,使用ADPretrain特征的模型能够更准确地定位异常区域,同时有效抑制在正常区域的误报。


总结

总的来说,这篇论文点出了当前工业异常检测领域一个长期被忽视但至关重要的问题:预训练任务与下游应用之间的鸿沟。作者提出的ADPretrain框架,通过在大规模行业数据集上进行专门的表示学习,并设计了巧妙的对比损失来强化正常与异常的区分,为该领域提供了一种即插即用、效果显著的“能力升级”方案。这项工作不仅为工业异常检测带来了新的SOTA性能,也为未来研究指明了一个有价值的方向——为特定任务定制预训练。

大家对这个方法怎么看?你觉得为特定领域定制预训练会成为未来的大趋势吗?欢迎在评论区留下你的看法!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
他汀立新功!哈佛研究:这2种他汀不仅不伤肝,还能降低肝癌风险

他汀立新功!哈佛研究:这2种他汀不仅不伤肝,还能降低肝癌风险

医学原创故事会
2026-01-23 19:34:20
排面!鲁尼之子首秀,卡里克领衔曼联高层挤满U18看台!

排面!鲁尼之子首秀,卡里克领衔曼联高层挤满U18看台!

画夕
2026-01-24 12:59:18
美媒首次曝光中国轰-20参数,B-21黯然失色!

美媒首次曝光中国轰-20参数,B-21黯然失色!

杨风
2026-01-23 21:56:44
抽象,美媒恶搞勇士下赛季阵容:库里+字母哥兄弟+詹姆斯父子

抽象,美媒恶搞勇士下赛季阵容:库里+字母哥兄弟+詹姆斯父子

懂球帝
2026-01-24 09:15:08
广州程序员去世后续:家属急着分遗产,39万抚恤金,父亲拿走大半

广州程序员去世后续:家属急着分遗产,39万抚恤金,父亲拿走大半

以茶带书
2026-01-24 13:17:34
特朗普突然变卦,还称“美国从没需要过北约”!欧洲抛售美国资产,美股震荡,英特尔暴跌17%,金价银价狂飙!英首相:特朗普应道歉

特朗普突然变卦,还称“美国从没需要过北约”!欧洲抛售美国资产,美股震荡,英特尔暴跌17%,金价银价狂飙!英首相:特朗普应道歉

每日经济新闻
2026-01-24 09:25:07
罪有应得!官方彻查后,闫学晶再迎噩耗,她最担心的事还是发生了

罪有应得!官方彻查后,闫学晶再迎噩耗,她最担心的事还是发生了

东方不败然多多
2026-01-24 10:57:00
谢泼德征服乌度卡!轰18分携手KD拯救申京 3大理由让他值得被重用

谢泼德征服乌度卡!轰18分携手KD拯救申京 3大理由让他值得被重用

锅子篮球
2026-01-24 13:06:13
新冠病毒3大结局已经不可避免,60岁以上的老年人尤其要注意

新冠病毒3大结局已经不可避免,60岁以上的老年人尤其要注意

医护健康科普
2025-08-31 17:07:58
横财一大波,够花一辈子!2026年人旺财旺,注定发达的生肖

横财一大波,够花一辈子!2026年人旺财旺,注定发达的生肖

人閒情事
2026-01-24 11:10:40
做完手术人就废了,这5种手术不需要做,别让无知害了自己

做完手术人就废了,这5种手术不需要做,别让无知害了自己

华庭讲美食
2026-01-19 14:27:13
日本全锦赛女单4强:早田希娜4-0佐藤瞳,张本美和逆转长崎

日本全锦赛女单4强:早田希娜4-0佐藤瞳,张本美和逆转长崎

五姑娘台球
2026-01-24 13:18:56
3-2逆转进四强!国乒20岁新星崛起:林诗栋出局,他冲击两连冠?

3-2逆转进四强!国乒20岁新星崛起:林诗栋出局,他冲击两连冠?

李喜林篮球绝杀
2026-01-23 18:18:07
全麻手术能让多少人身败名裂?都说让你们别玩太花,这下翻车了吧

全麻手术能让多少人身败名裂?都说让你们别玩太花,这下翻车了吧

夜深爱杂谈
2026-01-23 18:13:14
越南U23在点球大战中以7-6击败韩国U23

越南U23在点球大战中以7-6击败韩国U23

星耀国际足坛
2026-01-24 13:19:43
这次庾澄庆的爆料,没给王菲留一丝体面,难怪李亚鹏选择和她离婚

这次庾澄庆的爆料,没给王菲留一丝体面,难怪李亚鹏选择和她离婚

冷紫葉
2025-12-31 15:07:30
女子半夜睡着遭侵犯,她以为是丈夫,10天后男子再睡别人妻子落网

女子半夜睡着遭侵犯,她以为是丈夫,10天后男子再睡别人妻子落网

汉史趣闻
2024-06-09 13:48:02
李银桥在回忆录中提及毛岸英牺牲需由彭德怀承担一定责任,但这一表述缺乏充分依据,难以成立

李银桥在回忆录中提及毛岸英牺牲需由彭德怀承担一定责任,但这一表述缺乏充分依据,难以成立

史海残云
2025-12-23 11:22:17
北京动物园多只猴子冻得瑟瑟发抖,依偎在一起抱团取暖!工作人员:猴山有洞穴和高热量食物保障过冬

北京动物园多只猴子冻得瑟瑟发抖,依偎在一起抱团取暖!工作人员:猴山有洞穴和高热量食物保障过冬

台州交通广播
2026-01-21 21:38:27
明朝覆亡的真正原因是什么?

明朝覆亡的真正原因是什么?

三花是只猫
2026-01-24 12:25:00
2026-01-24 13:59:00
算法与数学之美 incentive-icons
算法与数学之美
分享知识,交流思想
5316文章数 64599关注度
往期回顾 全部

科技要闻

特斯拉Cybercrab即将落地 每公里不到1块钱

头条要闻

女子患癌为筹钱治病卖掉劳力士 收16万元后账户被冻结

头条要闻

女子患癌为筹钱治病卖掉劳力士 收16万元后账户被冻结

体育要闻

当家球星打替补,他们在故意摆烂?

娱乐要闻

李微漪更新:狼王格林去世,3字泪目

财经要闻

“百年老字号”张小泉遭60亿债务压顶

汽车要闻

有增程和纯电版可选 日产NX8或于3-4月间上市

态度原创

家居
游戏
本地
房产
公开课

家居要闻

在家度假 160平南洋混搭宅

Mojang高管:玩《Hytale》还不如直接玩《我的世界》

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

房产要闻

正式官宣!三亚又一所名校要来了!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版