网易首页 > 网易号 > 正文 申请入驻

NeurIPS 2025 | 从流形假设视角解析生成式模型反演

0
分享至

模型反演攻击(Model Inversion Attack, MIA)是一类通过访问训练好的模型,重建具有代表性类别样本的隐私攻击方法。近期的生成式 MIA 借助生成对抗网络(GAN)学习图像先验,从而在反演过程中生成高保真且语义一致的图像。然而,这类方法的成功机制仍缺乏理论解释。本文从流形假设(manifold hypothesis)出发,首次从几何视角系统分析生成式 MIA 的本质。研究发现,生成式反演过程在反向传播中隐式地对梯度进行了“几何去噪”:通过将损失梯度投影到生成器流形的切空间,去除了偏离流形的噪声分量,并保留了与流形一致的语义方向。进一步实验证明,当模型的损失梯度与生成器流形更加对齐时,模型对 MIA 的脆弱性会相应增强。基于这一发现,本文提出AlignMI,一种通过增强梯度-流形对齐来提升反演性能的高效方法。


论文题目: Generative Model Inversion Through the Lens of the Manifold Hypothesis 论文链接: https://arxiv.org/abs/2509.20177 代码链接: https://github.com/tmlr-group/AlignMI
一、背景与动机

早期的 MIA 方法由 Fredrikson 等人提出,其核心思想是直接在输入空间中进行优化,通过梯度下降寻找最大化目标类别预测分数的输入。然而,当目标模型为深度神经网络(DNN),且训练数据为高维自然图像时,这种直接优化往往难以产生语义合理的样本。根本原因在于:自然图像并非均匀分布于高维输入空间,而是集中分布在一个低维流形上(即“流形假设”)。因此,简单的梯度优化常导致生成的样本偏离图像流形,出现噪声和伪特征,无法反映真实的类别语义。为了解决这一问题,Zhang等人提出了一种基于生成对抗网络(GAN)的生成式模型反演方法,通过学习分布先验来约束攻击优化空间,使其集中在有意义的流形上,该思路显著改善了重建样本的视觉质量与语义一致性,为高维数据条件下的模型反演夯实了重要基础。


图1: 生成式MIA框架和损失梯度可视化

尽管生成式 MIA 在实践中表现出色,其背后为何能够有效提取模型中潜藏的私有信息,却仍缺乏系统的解释。如图 1(a) 所示,生成式反演通过反演阶段的分类损失梯度从目标模型中提取隐私信息;图 1(b) 展示了在高分辨率设置下对 PPA 方法的损失梯度可视化,比较了交叉熵损失与庞加莱损失。在这两种情况下,梯度均呈现出显著的噪声特征。

二、问题分析与方法提出

生成式MIA通过利用反演时损失梯度对目标模型中编码的隐私信息进行挖掘,以达到重建训练数据的目的。基于梯度所呈现出的显著噪声特征,我们尝试从几何的角度进行分析,发现生成式MIA能够奏效的原因在于其隐式地对损失梯度进行了去噪处理。具体而言,如图2所示,在模型反演过程中,生成式 MIA 将损失梯度投影到生成器流形的切空间上。这一过程保留了与流形对齐的方向,同时过滤掉了偏离流形的噪声成分。


图2: 损失梯度投影到生成流形的几何解释

我们又通过测量损失梯度与生成器流形之间的对齐程度,发现模型的损失梯度中包含的有效信息有限。如图 3 所示,在高分辨和低分辨两种实验场景下,损失梯度往往都与生成器流形的切空间存在较大偏差,这表明损失梯度中与流形对齐的、富有语义的成分较少,而噪声成分占比较大。这种有限的有效信息限制了生成式 MIA 在反演过程中从目标模型中提取私有信息的能力,从而影响了其反演性能。


左:低分辨率(DCGAN)中:高分辨率(StyleGAN)右:反演过程动态 图3: 反演过程中的梯度流形对齐

根据以上的几何分析和实验观察,我们提出了一个假设:当模型的损失梯度与生成流形的切空间更加一致时,模型往往更容易受到生成式 MIA 的影响。为了验证这个假设,我们设计了一个新颖的训练目标,通过在标准分类损失的基础上添加一个几何对齐项,显示地促进损失梯度与生成器流形之间的对齐程度。具体而言,我们利用预训练的变分自编码器(VAE)来估计数据流形的切空间,并在训练过程中鼓励模型的输入梯度与估计的流形切空间对齐。


图4:梯度-流形对齐的实证评估图5:MIA 在具有不同对齐分数的vanilla模型和对齐感知模型上取得的反演性能


表1:原始模型和三种对齐感知模型的对齐分数、测试准确率和反演性能

假设验证的实验结果如图4、图5和表1所示。图 4(a)表明随着训练时对齐分数的增加,模型的测试准确率呈现下降趋势,说明模型的梯度-流形对齐程度和泛化性能之间存在权衡。图 4(b)表明训练时梯度-流形对齐程度的增加会导致反演时梯度-流形对齐程度的增加。图 4(c)则表明使用标准损失函数训练得到的模型,在测试准确率有差异的情况下,梯度-流形对齐程度也几乎一致。这些结果验证了我们提出的流形对齐训练目标函数的有效性。图 5 则比较了具有不同对齐分数的模型在 GMI (LOM) 攻击方法下的脆弱性,结合表 1 的数据,揭示了模型脆弱性与梯度-流形对齐之间的”倒置 V 形”关系,即模型的 MIA 脆弱性随着对齐分数的增加先增加后减少,说明梯度-流形对齐创造了一个新的攻击面,从而验证了我们提出的假设。

那么进一步的,我们提出了一个自然的问题:能否在反演阶段,通过增强梯度与流形的对齐程度,来提升生成式 MIA 的性能?为此,我们提出了一种全新的免训练(training-free)方法AlignMI,在不修改模型参数的前提下,通过在反演过程中主动增强梯度与生成器流形的对齐程度提升生成式 MIA 的性能,核心思想是在合成输入的局部邻域内采样多个变体,并平均相应的损失梯度,从而削弱噪声的、偏离流形的分量,同时增强与生成器流形对齐的一致方向,产生更具语义信息量的梯度信号。其中,扰动平均对齐(PAA)通过在合成输入的局部邻域内添加随机扰动来生成多个样本变体,变换平均对齐(TAA)则采用语义不变的图像变换(如随机裁剪、翻转等)来生成样本变体。具体步骤如下:

  1. 局部邻域采样 :

    在合成输入的局部邻域内添加随机扰动或应用语义不变的图像变换生成多个样本变体。

  2. 损失梯度计算 :

    对每个采样的样本变体,计算其损失梯度。

  3. 梯度平均处理 :

    将采样得到的多个样本变体的损失梯度进行平均,得到一个平滑且更具语义信息的梯度估计。

  4. 优化更新 :

    利用平均后的梯度估计来更新生成器的输入隐变量,从而优化合成输入,指导合成输入向更符合目标类别特征的方向变化。

三、主要实验结果表2: 高分辨率设置下与PPA反演性能的比较

如表 2 所示,将 PPA 方法与 PAA 和 TAA 策略结合后,所有关键指标均呈现改进趋势。在 ResNet-18 、DenseNet-121 和 ResNeSt-50三个模型上,PAA 策略和TAA 策略都使 Acc@1 得到提升,并让KNN Dist 有所下降。这些结果表明, AlignMI 方法能有效增强模型反演攻击的性能,验证了其在提升梯度-流形对齐方面的有效性。

四、总结与展望

本文从几何角度深入分析了生成式模型反演攻击的有效性,揭示了其隐含的梯度去噪机制。基于此,研究提出了增强模型反演性能的新方法 AlignMI,并通过实验验证了其有效性。这一成果不仅增进了对生成式 MIA 的理解,还为开发更强大的防御策略提供了新视角。未来研究将进一步探索如何在高分辨率设置下降低计算成本,以及如何缓解梯度-流形对齐与模型泛化性能之间的权衡问题。

来源:公众号【HKBU计算机系】

llustration From IconScout By IconScout Store

-The End-

扫码观看!

本周上新!

“AI技术流”原创投稿计划

TechBeat是由将门创投建立的AI学习社区(www.techbeat.net)。社区上线700+期talk视频,3000+篇技术干货文章,方向覆盖CV/NLP/ML/Robotis等;每月定期举办顶会及其他线上交流活动,不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台,希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。

投稿内容

// 最新技术解读/系统性知识分享 //

// 前沿资讯解说/心得经历讲述 //

投稿须知

稿件需要为原创文章,并标明作者信息。

我们会选择部分在深度技术解析及科研心得方向,对用户启发更大的文章,做原创性内容奖励

投稿方式

发送邮件到

michellechang@thejiangmen.com

或添加工作人员微信(michelle333_)投稿,沟通投稿详情

关于我“门”

将门是一家以专注于数智核心科技领域新型创投机构,也是北京市标杆型孵化器。 公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

bp@thejiangmen.com


点击右上角,把文章分享到朋友圈

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
A股突发!002598,被立案!

A股突发!002598,被立案!

中国基金报
2026-01-01 16:51:09
人社部明确!2000元低收入退休人员,2026年能涨 400元?答案来了

人社部明确!2000元低收入退休人员,2026年能涨 400元?答案来了

云鹏叙事
2026-01-01 09:47:07
大蒜在超市里不发芽,为什么拿回家后就会发芽?超市员工道出实情

大蒜在超市里不发芽,为什么拿回家后就会发芽?超市员工道出实情

妙招酷
2025-12-30 23:11:35
解放军最绝一招,替郑丽文彻查“内鬼”:蓝白阵营五位高层须提防

解放军最绝一招,替郑丽文彻查“内鬼”:蓝白阵营五位高层须提防

梦回千年aa
2025-12-31 22:30:57
美日印澳在北京会谈,共谋反华?不到24小时,莫迪政府找中国对表

美日印澳在北京会谈,共谋反华?不到24小时,莫迪政府找中国对表

南宫一二
2026-01-01 12:38:41
预算成本3.5亿港元,《寻秦记》票房扑街,古天乐亏到怀疑人生

预算成本3.5亿港元,《寻秦记》票房扑街,古天乐亏到怀疑人生

电影票房预告片
2026-01-01 23:46:49
上海这里大概有一亿人!凌晨3点,200人同时打车,货拉拉都显示"高峰"

上海这里大概有一亿人!凌晨3点,200人同时打车,货拉拉都显示"高峰"

潇湘晨报
2026-01-01 16:34:29
特斯拉车顶维权当事人就被限高再发声:将按程序给付赔偿款

特斯拉车顶维权当事人就被限高再发声:将按程序给付赔偿款

南方都市报
2025-12-31 16:12:09
2026年1月1日微信新规生效!私聊、钱包、账号都变天,不懂要吃亏

2026年1月1日微信新规生效!私聊、钱包、账号都变天,不懂要吃亏

复转这些年
2025-12-30 23:39:15
2025年谍战剧最大黑马来了,45集剧情一口气追完根本停不下来

2025年谍战剧最大黑马来了,45集剧情一口气追完根本停不下来

阿废冷眼观察所
2026-01-02 03:33:24
中国军队回撤时越军为何不追击?越南少将阮德辉回忆:并非不敢打

中国军队回撤时越军为何不追击?越南少将阮德辉回忆:并非不敢打

古书记史
2025-12-22 19:50:50
TOP14位身高170以上的女神,有颜有灯有演技

TOP14位身高170以上的女神,有颜有灯有演技

素然追光
2026-01-02 02:45:02
隐忍24年,陈婷终于撕下完美伪装,她给所有“已婚女人”上了一课

隐忍24年,陈婷终于撕下完美伪装,她给所有“已婚女人”上了一课

瓜汁橘长Dr
2025-12-30 17:03:39
资产移交美国,民进党捅了马蜂窝,台富商将访陆,郑丽文开始收网

资产移交美国,民进党捅了马蜂窝,台富商将访陆,郑丽文开始收网

花寒弦絮
2026-01-02 03:25:30
美国洛克希德·马丁公司突然宣布了

美国洛克希德·马丁公司突然宣布了

安安说
2026-01-01 14:29:53
孩子大了才发现,这些年来生的气、操的心、发的愁,大都没有必要

孩子大了才发现,这些年来生的气、操的心、发的愁,大都没有必要

新东方家庭教育
2025-12-31 11:33:19
雷霆124-95大胜开拓者!亚历山大创58年纪录,杨瀚森迎NBA里程碑

雷霆124-95大胜开拓者!亚历山大创58年纪录,杨瀚森迎NBA里程碑

球场没跑道
2026-01-01 11:24:49
卫冕冠军广厦34分大胜天津豪取7连胜 詹姆斯22+7赵岩昊19分

卫冕冠军广厦34分大胜天津豪取7连胜 詹姆斯22+7赵岩昊19分

醉卧浮生
2026-01-01 21:14:58
中方下“逐客令”,直言:一粒大米也不要,直接叫停900万吨订单

中方下“逐客令”,直言:一粒大米也不要,直接叫停900万吨订单

爱吃醋的猫咪
2025-12-27 16:24:13
美方提醒:如果双方谈不拢,中国的武器装备可能会去美国大门口

美方提醒:如果双方谈不拢,中国的武器装备可能会去美国大门口

趴在桌子上属羊
2025-12-31 21:35:00
2026-01-02 04:24:49
将门创投 incentive-icons
将门创投
加速及投资技术驱动型初创企业
2295文章数 596关注度
往期回顾 全部

科技要闻

特斯拉Model 3车主首度全程自驾横穿美国

头条要闻

瑞士酒吧新年爆炸致百余死伤 有人严重烧伤难以辨认

头条要闻

瑞士酒吧新年爆炸致百余死伤 有人严重烧伤难以辨认

体育要闻

2026,这些英超纪录可能会被打破

娱乐要闻

跑调风波越演越烈!沈佳润被网友喊话

财经要闻

巴菲特「身退,权还在」

汽车要闻

一汽-大众2025年整车销量超158万辆 燃油车市占率创新高

态度原创

教育
亲子
数码
手机
公开课

教育要闻

2026,一路向前!南京一中学子在吃喝玩乐中迎新年!

亲子要闻

产检全免费,通过减负促进生育健康

数码要闻

REDMI Note 15系列新春版图赏:999元起 新增车厘子红配色

手机要闻

高通第六代骁龙8至尊版Pro曝光,定价将上涨

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版