网易首页 > 网易号 > 正文 申请入驻

ICLR 2026 | PIL:基于线性代理的不可学习样本生成方法

0
分享至



不可学习样本(Unlearnable Examples)是一类用于数据保护的技术,其核心思想是在原始数据中注入人类难以察觉的微小扰动,使得未经授权的第三方在使用这些数据训练模型时,模型的泛化性能显著下降,甚至接近随机猜测,从而达到阻止数据被滥用的目的。

例如,对于摄影师公开发布的作品或用户分享的个人照片,在添加扰动后,图像在视觉上几乎不发生变化;但若这些数据被用于训练图像分类模型,其测试准确率可能会从 90% 降至 10% 左右。

随着深度模型对大规模数据依赖程度的不断提升,不可学习样本逐渐成为数据隐私与模型安全领域的重要研究方向。然而,现有方法在实际应用中仍面临显著的效率瓶颈。



  • 论文链接: https://arxiv.org/abs/2601.19967
  • 代码已开源: https://github.com/jinlinll/pil

现有方法的效率瓶颈

当前主流的不可学习样本生成方法大多依赖深度神经网络(DNN)作为代理模型。其典型流程包括:

1. 训练一个复杂的深度模型(如 ResNet、VGG)作为代理;

2. 在代理模型上通过对抗攻击方法(如 PGD)迭代优化扰动;

3. 利用扰动在其他模型上的迁移性实现防护效果。

这种对深度模型的依赖带来了若干问题:

  • 计算开销高:生成一次扰动往往需要大量 GPU 资源。例如,REM 方法在 CIFAR-10 数据集上的扰动生成时间超过 15 GPU 小时;
  • 扩展性受限:当应用于高分辨率图像或大规模数据集(如 ImageNet)时,时间成本迅速上升;
  • 模型复杂度冗余:深模型的强非线性表达能力并非不可学习样本生成的必要条件,反而增加了优化难度。

核心观察:不可学习样本与模型线性化

我们关注到一个关键现象:不可学习样本的作用机制,本质上是诱导深模型退化为近似线性的行为模式。

我们评估了多种现有不可学习样本方法(包括 EM、REM、TAP、SP、AR 等),发现一个一致现象:无论方法设计多么复杂,最终均会诱导深度模型呈现更强的线性特征(通过 FGSM 的成功率度量)



表 1:不同 FGSM 攻击步长下不可学习样本导致的额外准确率下降百分比(扰动比例 50%)

从这一角度出发,如果最终目标是使深模型表现出线性特性,那么使用复杂的深度模型作为代理并非必要。相反,直接利用线性模型生成扰动,可能更直接地作用于这一核心机制。

基于此,我们提出PIL(Perturbation-Induced Linearization): 通过线性模型作为代理,直接生成能够诱导深模型线性化的不可学习扰动。

PIL 方法概述

与基于对抗攻击的方案不同,PIL 通过一个双目标优化过程,引导模型学习线性映射。

1. 语义混淆(Semantic Obfuscation)

通过最小化 KL 散度,使线性代理模型在扰动后的样本上输出接近均匀分布,从而削弱原始图像中可用于分类的语义信息。

2. 捷径诱导(Shortcut Learning)

通过最小化交叉熵损失,使代理模型能够仅依据扰动准确预测标签,从而将判别信息嵌入进扰动中。

两个目标通过平衡参数 λ 进行联合优化,最终生成的扰动同时抑制语义学习并强化线性捷径,从而在深模型训练阶段诱导其产生显著的泛化退化。



图 1:PIL 方法示意图

PIL 的算法流程(简要)

1. 训练一个无偏置的线性分类器作为代理模型;

2. 在不可察觉约束(L∞≤8/255)下,采用类似 PGD 的方法优化扰动;

3. 将扰动注入原始图像,构造不可学习样本;



Algorithm 1:PIL 算法流程

实验结果

我们在 SVHN、CIFAR-10/100 和 ImageNet-100 数据集上,结合 ResNet、VGG、MobileNet 等多种模型进行了系统评估。

1. 有效性

在不同数据集和模型架构下,PIL 生成的不可学习样本均能显著降低模型的测试准确率,在部分设置中准确率接近随机水平。



表 2:在干净数据集(Dc)与 PIL 构建的不可学习数据集(Du)上训练的模型在干净数据上的测试准确率(%)对比

2. 计算效率

在 CIFAR-10 上,PIL 生成扰动仅需 40.53 秒,而 REM 方法需要超过 54k 秒,效率提升超过三个数量级。同时,PIL 在效率与防护效果之间取得了较好的平衡。



表 3:不同方法为 CIFAR-10 训练集构建全部扰动所需的时间对比

3. 鲁棒性

在多种数据增强策略(旋转、裁剪、MixUp)和不同 JPEG 压缩质量下,PIL 依然保持稳定的防护性能。



表 4:不同数据增强策略下,各类不可学习样本在 CIFAR-10 上的干净测试准确率(%)。结果越接近 10% 越好。灰色背景标示 Top-2 的两种方法。



表 5:在不同 JPEG 压缩质量下,各类不可学习样本在 CIFAR-10 上的干净测试准确率(%)。结果越接近 10% 越好。灰色背景标示 Top-2 的两种方法。

4. 线性化验证

我们使用 FGSM 攻击下的准确率下降幅度作为线性化指标。实验表明,随着 PIL 扰动比例增加,模型对 FGSM 的敏感性显著增强,验证了 PIL 确实诱导了模型的线性行为。



表 6:使用不同干净 / PIL 扰动数据混合比例训练的 ResNet-18 模型,在各 FGSM 攻击步长下的测试准确率及下降幅度(%)

进一步分析:

部分扰动设置下的性能退化受限

在实验中我们观察到一个一致现象:当仅有部分训练数据被扰动时,模型的测试准确率往往不会出现显著下降。这一现象并非 PIL 方法特有,而是现有不可学习样本方法普遍存在的特性。

为解释该现象,我们通过实验发现模型对被扰动样本产生的梯度与对干净样本的梯度呈现很强的正交性,于是我们提出在梯度正交假设,并在该假设下进行了理论分析,得到如下结论:

  • 干净样本与扰动样本在训练过程中所产生的梯度方向近似正交,因此扰动样本对应的梯度更新难以显著干扰模型对干净样本的学习;
  • 在混合训练设置下,模型的泛化性能主要由干净数据主导,只要干净样本数量足够,模型仍能学习到稳定且可泛化的特征表示。



图 2:在部分扰动场景下,CIFAR-10 数据集的干净测试准确率(%)

上述分析表明,部分扰动并不足以从根本上削弱模型的泛化能力。这一定性结论对于实际应用具有直接启示意义:若期望获得稳定且显著的防护效果,需要对数据集进行大比例甚至全部的扰动,或至少保证扰动样本在训练数据中占据足够高的比例(通常高于 80%)。

结语

PIL 的核心在于从机制层面重新审视不可学习样本问题,将关注点从复杂的代理模型与攻击策略,转向「模型线性化」这一关键因素。通过使用线性代理模型,PIL 在显著降低计算成本的同时,依然保持了稳定而有效的防护能力。

我们希望这一视角能够为不可学习样本及相关数据保护研究提供新的思路,并推动更加高效、可扩展的方法设计。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
特鲁姆普对香港世界大奖赛非常失望!墨菲:很多人不知道这项赛事

特鲁姆普对香港世界大奖赛非常失望!墨菲:很多人不知道这项赛事

世界体坛观察家
2026-02-24 09:11:40
存款100万后,请立刻放下这三个习惯。

存款100万后,请立刻放下这三个习惯。

流苏晚晴
2026-02-24 18:54:06
突发!武汉知名宝马4s店被申请破产!

突发!武汉知名宝马4s店被申请破产!

三农老历
2026-02-24 22:06:15
暴涨!有相机价格翻10倍,根本抢不到,杭州姑娘傻眼,马上翻出家里老古董

暴涨!有相机价格翻10倍,根本抢不到,杭州姑娘傻眼,马上翻出家里老古董

环球网资讯
2026-02-22 16:48:12
电影《夜王》冲破4500万!黄子华评英国不留情面,即食面赢晒全场

电影《夜王》冲破4500万!黄子华评英国不留情面,即食面赢晒全场

情感大头说说
2026-02-24 01:10:59
美媒评26年自由市场10大控卫!火箭队范乔丹屈居第5 哈登意外落选

美媒评26年自由市场10大控卫!火箭队范乔丹屈居第5 哈登意外落选

锅子篮球
2026-02-24 22:10:05
10万志愿军被包围,彭老总无从下手,毛主席:放弃救援,以攻代守

10万志愿军被包围,彭老总无从下手,毛主席:放弃救援,以攻代守

谈古论今历史有道
2026-02-23 12:00:03
确认访华后,特朗普突然变脸对中国加税!却迎来两大噩耗浇灭野心

确认访华后,特朗普突然变脸对中国加税!却迎来两大噩耗浇灭野心

阿讯说天下
2026-02-24 16:15:29
姚笛再次复出!她变美了不少,脸上的哀愁消失了,整个人变化很大

姚笛再次复出!她变美了不少,脸上的哀愁消失了,整个人变化很大

背包旅行
2026-02-23 15:02:37
76%日本人支持?高市早苗点名中国,话音刚落,中方连出2重击!

76%日本人支持?高市早苗点名中国,话音刚落,中方连出2重击!

纾瑶
2026-02-24 17:05:07
被称为“中国最大忽悠”的贾跃亭,似乎要翻身了。

被称为“中国最大忽悠”的贾跃亭,似乎要翻身了。

流苏晚晴
2026-02-19 16:19:47
iPhone 18 Pro灵动岛缩小35%,将首发搭载基于台积电2nm工艺制造的A20 Pro芯片

iPhone 18 Pro灵动岛缩小35%,将首发搭载基于台积电2nm工艺制造的A20 Pro芯片

中国能源网
2026-02-24 12:01:06
当因杀死毒贩,而让半个国家燃起战火后,终于理解了墨西哥的绝望

当因杀死毒贩,而让半个国家燃起战火后,终于理解了墨西哥的绝望

阅微札记
2026-02-24 17:06:05
县城消费「限时繁荣」了十天

县城消费「限时繁荣」了十天

镜相工作室
2026-02-24 09:06:36
哪一瞬间你觉得众生皆苦?网友:怎么在外国很少听到这种事情

哪一瞬间你觉得众生皆苦?网友:怎么在外国很少听到这种事情

带你感受人间冷暖
2026-02-22 08:03:33
女孩当小姐,一晚要提供4到5次上门服务,2015年被亲人点到不赴约

女孩当小姐,一晚要提供4到5次上门服务,2015年被亲人点到不赴约

汉史趣闻
2025-11-08 09:27:32
谷爱凌14岁就说自己是中国人:我不是老外 会不会说中文有打区别

谷爱凌14岁就说自己是中国人:我不是老外 会不会说中文有打区别

念洲
2026-02-24 16:34:24
美伊26日谈判在即 是否对伊朗动武:白宫先内讧了

美伊26日谈判在即 是否对伊朗动武:白宫先内讧了

环球网资讯
2026-02-24 07:25:18
他们干掉了最大的毒枭,没想到整个国家却烧起来了...

他们干掉了最大的毒枭,没想到整个国家却烧起来了...

英国那些事儿
2026-02-23 23:28:04
《卫报》:普京曾认为90%的乌克兰人会支持入侵

《卫报》:普京曾认为90%的乌克兰人会支持入侵

时尚的弄潮
2026-02-24 11:47:43
2026-02-24 23:44:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12344文章数 142569关注度
往期回顾 全部

科技要闻

宇树科技发布四足机器人Unitree As2

头条要闻

男子搂住继女强吻动作亲密 当地妇联介入

头条要闻

男子搂住继女强吻动作亲密 当地妇联介入

体育要闻

苏翊鸣总结米兰征程:我仍是那个热爱单板滑雪的少年

娱乐要闻

汪小菲官宣三胎出生:承诺会照顾好3个孩子

财经要闻

县城消费「限时繁荣」了十天

汽车要闻

入门即满配 威兰达AIR版上市 13.78万元起

态度原创

游戏
健康
家居
数码
军事航空

LOL传奇选手公布恋情!发博晒照被夸夫妻相,女方身份曝光

转头就晕的耳石症,能开车上班吗?

家居要闻

本真栖居 爱暖伴流年

数码要闻

299元双模电竞鼠标,专为中小手设计?

军事要闻

美军参联会主席警告:对伊朗动武可能带来重大风险

无障碍浏览 进入关怀版