网易首页 > 网易号 > 正文 申请入驻

TPAMI 2025 | AI对抗迁移性评估的「拨乱反正」:那些年效果虚高的攻防算法们

0
分享至

来源:市场资讯

(来源:机器之心)


本文第一作者 / 通讯作者赵正宇来自西安交通大学,共同第一作者张焓韡、李仞珏分别来自德国萨尔大学、中科工业人工智能研究院。其他合作者分别来自法国马赛中央理工、法国 INRIA 国家信息与自动化研究所、德国 CISPA 亥姆霍兹信息安全中心、清华大学、武汉大学、西安交通大学。

对抗样本(adversarial examples)的迁移性(transferability)—— 在某个模型上生成的对抗样本能够同样误导其他未知模型 —— 被认为是威胁现实黑盒深度学习系统安全的核心因素。尽管现有研究已提出复杂多样的迁移攻击方法,却仍缺乏系统且公平的方法对比分析:(1)针对攻击迁移性,未采用公平超参设置的同类攻击对比分析;(2)针对攻击隐蔽性,缺乏多样指标。

为了解决上述问题,本文依据通用机器学习全周期阶段,将迁移攻击方法系统性划分为五大类,并首次针对 23 种代表性攻击与 11 种代表性防御方法(包括针对迁移的防御与现实世界的视觉系统 API),在 ImageNet 数据集上开展对抗迁移性综合评估,并通过大规模用户实验评估对抗隐蔽性。

本文证实上述评估缺陷确实导致了理解盲区甚至误导性结论,而解决这些缺陷后带来一系列新见解,例如:(1)早期攻击方法 DI 性能反而超越所有后续同类攻击;(2) 原本声称白盒防御方法 DiffPure 却极易被(黑盒)迁移方法攻破;(3)几乎所有攻击方法在提升迁移性的同时,实则牺牲了(通过多样化指标量化的)攻击隐蔽性。


  • 论文题目:Revisiting Transferable Adversarial Images: Systemization, Evaluation, and New Insights

  • 接收期刊:TPAMI 2025

  • 预印本链接:https://arxiv.org/abs/2310.11850

  • 代码链接:https://github.com/ZhengyuZhao/TransferAttackEval

研究现状

对抗样本的迁移性是研究深度学习系统鲁棒性的重要课题。在真实世界中,攻击者往往无法访问目标模型的内部参数或训练集(黑盒情形)。攻击在一个 / 一类模型上生成后能否在另一个未知模型上保持效力(即攻击迁移性),直接决定了攻击的实际威胁水平与防御的有效性。

当前相关研究存在两个长期被忽略但是影响深远的问题:

  • 攻击迁移性(transferability)评估缺乏系统的一对一比较与公平的超参数设定:不同方法常在不同或不对等的超参数下对比,导致结论不可比或误导性强。

  • 攻击隐蔽性(stealthiness)几乎没有被系统评估: 许多工作只报告 Lp 约束下的成功率,而忽略了视觉 / 感知质量和攻击可溯源特性的差异;也就是说,攻击「看上去」是否真实不可察觉并未被充分衡量。

这种不严格的比较与不完整的度量导致使得某些方法被高估或低估,进而误导防御设计与研究方向。


创新发现

依托前文所建立的评估框架,我们得以从实验结果中更清晰地分析对抗鲁棒性的内在因素。以下部分将概述主要发现与启发性结论:

1. 在公平的超参数设定下,早期方法 DI 竟优于后续众多所谓改进方法:许多后来被认为更强的迁移攻击,实则得益于更有利的实验设定。一旦把超参数公平化,DI 类的早期方法便会遥遥领先。因此,我们需要公平对比来避免误导性结论。这不仅关系到学术层面的研究,更关系到实际系统对抗威胁的判断与防御优先级的设定。

2. 扩散(diffusion)类防御方法依赖 “虚假安全感”:基于扩散原理进行去噪的防御方法虽然声称在白盒或某些自适应攻击下表现很强,但黑盒(迁移)攻击反而可以很大程度上绕过这些防御。因此,此类防御方法只是由于评估不完善带来的 “虚假安全感”

3. 相同 Lp 约束下,不同攻击在隐蔽性上有巨大差异,且隐蔽性与迁移性之间呈负相关:即便所有攻击都受同一 Lp 限制,在视觉感知度量(PSNR/SSIM/LPIPS 等)上依然差距很大。因此,除了常用 Lp 约束外,需要同时报告迁移性与多维度隐蔽性指标,以便合理权衡攻击迁移性与隐蔽性。

具体评估建议与攻防设计参考如下:


评估框架与结果

本文依据通用机器学习全周期阶段,将迁移攻击方法系统性划分为五大类,如下图所示:


本文涉及了 23 种代表性攻击与 11 种代表性防御方法,如下表所示:



针对攻击迁移性,本文从两个维度入手修正与完善现有评估基准:(1)引入完整的迁移攻击方法分类,并进行公平的类内(intra-category)比较;(2)从 “攻击溯源(attack traceback)” 角度设计隐蔽性评估。更具体地说,本文抛弃了将不同类攻击方法直接对比的传统策略,而是对同类攻击进行一对一、超参数公平化的对比实验:统一攻击强度约束(相同 Lp 限制)、统一优化 / 迭代预算,并在同一组目标模型 / 防御上逐项比较。


针对攻击隐蔽性,本工作不再仅依靠单一 Lp 值来进行衡量,而是引入多样化的感知质量指标(例如常用的 PSNR/SSIM/LPIPS 等)并结合更细粒度的隐蔽性特征。另外,本文创新性地引入 “攻击溯源” 视角,分析攻击是如何产生可见 / 可追溯的扰动(例如是否集中于图像某些高频区域、是否具有结构化模式、扰动是否容易被现有检测器或去噪机制识别)。





未来展望

我们呼吁研究界在对比任何(攻防)方法时务必采用一对一、超参数合理的公平设计;报告迁移性时同时报告多种感知 / 隐蔽性指标(不仅是 Lp),并分析攻击的可追溯性特征;在评估防御有效性时,必须纳入可迁移黑盒攻击的考验,尤其是对扩散 / 去噪类防御要采用更全面的测试;公开代码、超参数与评估脚本,以便社区复现与累积真实进展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
亿万国人破防!90岁院士平静宣布,中国导弹从此没有任何死角

亿万国人破防!90岁院士平静宣布,中国导弹从此没有任何死角

策略述
2026-03-03 18:16:39
发现一个奇怪的现象:兄弟姐妹中最大方的那个,往往日子过得更好,孩子也更优秀

发现一个奇怪的现象:兄弟姐妹中最大方的那个,往往日子过得更好,孩子也更优秀

十点读书
2026-03-04 12:19:08
台积电创办人张忠谋:如果想扼杀中国大陆,中国大陆真的无能为力

台积电创办人张忠谋:如果想扼杀中国大陆,中国大陆真的无能为力

混沌录
2026-02-27 21:29:05
威廉王子高调表达爱意,亲自发布凯特新照,全家祝她生日快乐!

威廉王子高调表达爱意,亲自发布凯特新照,全家祝她生日快乐!

趣味萌宠的日常
2026-03-04 20:25:11
丁俊晖的母亲陈习娟:辛苦抚养儿子成才,最终还没享福就去世了

丁俊晖的母亲陈习娟:辛苦抚养儿子成才,最终还没享福就去世了

老吴教育课堂
2026-03-02 12:53:19
小S复出首秀翻车!捡漏大S代言,台词内涵马筱梅惹众怒,吃相太难看

小S复出首秀翻车!捡漏大S代言,台词内涵马筱梅惹众怒,吃相太难看

八卦王者
2026-03-03 21:50:42
毛利率超70%,直追爱马仕!刚刚,这家昆山公司上市了

毛利率超70%,直追爱马仕!刚刚,这家昆山公司上市了

创客公社-江苏第一创投媒体
2026-03-04 10:39:42
33中5!格林成太阳累赘,排队给火箭道歉,斯通下了一盘大棋

33中5!格林成太阳累赘,排队给火箭道歉,斯通下了一盘大棋

巴叔GO聊体育
2026-03-04 12:35:42
俄罗斯在乌克兰遭遇2023年11月以来最惨单月

俄罗斯在乌克兰遭遇2023年11月以来最惨单月

刀刀观察
2026-03-04 00:12:07
30多岁大叔揭示撩拨年轻姑娘的秘密,网友惊呼:真是老狐狸!

30多岁大叔揭示撩拨年轻姑娘的秘密,网友惊呼:真是老狐狸!

特约前排观众
2026-02-18 00:15:03
【2026.3.4】爆姐的饭后爆料:生命不止,爆料不息!

【2026.3.4】爆姐的饭后爆料:生命不止,爆料不息!

娱乐真爆姐
2026-03-04 23:26:31
《生化危机9:安魂曲》DLC爆料!已进入后期开发

《生化危机9:安魂曲》DLC爆料!已进入后期开发

3DM游戏
2026-03-04 09:18:05
科威特飞行员真牛!4名阵亡美军身份曝光,特朗普不满英国西班牙

科威特飞行员真牛!4名阵亡美军身份曝光,特朗普不满英国西班牙

鹰眼Defence
2026-03-04 18:38:18
机关事业单位退休:40号文件明确待遇,工龄核算别出错

机关事业单位退休:40号文件明确待遇,工龄核算别出错

水泥土的搞笑
2026-03-05 00:51:47
伊朗伊斯兰革命卫队:向美军航母发射了4枚巡航导弹,袭击发生后,这艘航母逃往印度洋东南部

伊朗伊斯兰革命卫队:向美军航母发射了4枚巡航导弹,袭击发生后,这艘航母逃往印度洋东南部

极目新闻
2026-03-04 08:20:18
复制粘贴,青岛一家三口街头散步“齐头并进”,爸爸儿子女儿身高统一1米82;网友:建议每个人分我5厘米

复制粘贴,青岛一家三口街头散步“齐头并进”,爸爸儿子女儿身高统一1米82;网友:建议每个人分我5厘米

台州交通广播
2026-03-04 20:20:50
这跟不穿有啥区别?内裤外露、刘雯半个腚都光着,新时尚真看不懂

这跟不穿有啥区别?内裤外露、刘雯半个腚都光着,新时尚真看不懂

嫹笔牂牂
2026-03-03 07:06:44
李小璐写真生图高清

李小璐写真生图高清

翩翩明星
2025-11-14 09:39:36
贾平凹影响《少妇百洁》?辣眼睛

贾平凹影响《少妇百洁》?辣眼睛

不正确
2026-03-02 14:39:52
无语!平顶山母女遗产案爆出操作猛如虎,舅舅舅妈吃绝户!

无语!平顶山母女遗产案爆出操作猛如虎,舅舅舅妈吃绝户!

社会日日鲜
2026-03-04 06:58:18
2026-03-05 02:20:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2354641文章数 5679关注度
往期回顾 全部

科技要闻

多位核心离职,阿里亲手废掉最强AI天团?

头条要闻

外媒称伊朗封锁霍尔木兹海峡只让中俄船通行 中方回应

头条要闻

外媒称伊朗封锁霍尔木兹海峡只让中俄船通行 中方回应

体育要闻

2026年中超,为什么值得你多看一眼?

娱乐要闻

谢谢谢娜 贡献出26年内娱的第一个笑话

财经要闻

人大代表建议:将农民养老金提到500元

汽车要闻

鸿蒙智行首款猎装车 尚界Z7/Z7T首发

态度原创

教育
旅游
健康
本地
游戏

教育要闻

陕西宝鸡:开学第一课 安全伴成长

旅游要闻

日照莒县:浮来山庙会引来八方游客

转头就晕的耳石症,能开车上班吗?

本地新闻

食味印象|一口入魂!康乐烤肉串起千年丝路香

《LOL》凌晨停机维护!一次性更新两个版本内容

无障碍浏览 进入关怀版