网易首页 > 网易号 > 正文 申请入驻

从Bayesian Deep Learning到Adversarial Robustness新范式

0
分享至

论文标题: Adversarial Attacks are Reversible with Natural Supervision 论文链接: http://wanghao.in/paper/ICCV21_ReverseAttack.pdf 代码链接: https://github.com/cvlab-columbia/SelfSupDefense 视频链接: https://www.youtube.com/watch?v=0Yv3eQ9JR4Y

Adversarial Robustness 新思路: 可以说,这个 work 提出了一个 adversarial defense 的新范式,叫做 Reverse Attack。举个简单的例子,如下图,给定一个原始图片(下面左边的图),attacker 会通过比如 PGD 的方法,找到一个 attack vector(下面中间的图),叠加在原始图片上,而我们 reverse attack 的思路是,在 inference time(或者叫 test time)临时找到一个 reverse attack vector(下面右边的图),再次叠加在已经被 attack 过的图片上,从而来抵消掉部分 attack vector。

把 Reverse Attack 作为 Bayesian Inference 来解:那么问题来了,defense 方拿到的图片已经是被 attack 过的(已经叠加了 attack vector),那我们如何能机智地找到一个有效的 reverse attack vector 呢?这就要回到文章的开头,Bayesian Deep Learning 和 Deep Bayesian Network 了。简单地讲,我们把寻找 reverse attack vector 作为一个 Bayesian inference 的问题来解。假设被 attack 过的图片(原始图片+ attack vector)叫 , 而我们想寻找的 reverse attack 后的图片(原始图片+ attack vector+reverse attack vector)叫 ,那么寻找 reverse attack vector 的过程其实可以 formulate 成:

求一个 ,使得后验概率 最大。

这里的 表示的是图片的结构一致性信息(具体的讲,就是同一图片的不同部分的颜色、纹理、内容应该一致),而这个信息是已知的,因为不管图片有没有被attack过,我们都知道,我们需要还原的图片,它肯定是满足结构的一致性的。关于 的问题我们下文会再仔细讨论。

最大后验估计和 Deep Bayesian Network:那么现在的主要问题是,如何有效,而且 robust 地得到 的最大后验呢?答案就是可以基于我们之前在 AAAI 2019 提的一个Deep Bayesian Network(深度贝叶斯网络)[2],叫做Bidirectional Inference Network(BIN)

论文标题: Bidirectional Inference Networks: A Class of Deep Bayesian Networks for Health Profiling 论文链接: http://wanghao.in/paper/AAAI19_BIN.pdf 代码链接: https://github.com/js05212/bidirectional-inference-network

下面我们先简单介绍一下 BIN,然后再回过头来介绍如何把 BIN 的思想用到 Reverse Attack 上。

BIN属于Deep Bayesian Network,那么什么是Bayesian Network(贝叶斯网络)呢?

贝叶斯网络:比如下图就是一个贝叶斯网络。

图里面3个节点分别表示三个随机变量 , , 。而图里的边则表示的是conditional dependency。 到 的边表示 ,而 和 同时指向 的边表示 。灰色的节点表示已知的值(observed variable),而白色的节点表示我们需要推断的值(latent variable)。正如神经网络,贝叶斯网络也分成学习(learning)推断(inference)两个阶段。

贝叶斯网络的学习:一般贝叶斯网络的学习指的就是通过数据,学习到各个条件概率分布。比如上面的图,如果我们有很多 和 对应的数据,我们就可以学到 这个条件概率分布。同理如果我们有很多 、 和 的数据,我们也可以学到 。

贝叶斯网络的推断:在模型学习后,我们会根据已经学到的各个条件概率分布,来做概率推断,比如,虽然我们在学习阶段只学到了 和 两个条件概率分布,但是根据Bayes Rule我们可以做更多的推断任务,比如给定 和 ,我们可以推断出 最可能的值是多少;正式地讲,我们可以找到一个 的值,从而使得 最大。而找这个值的过程就是最大后验推断。(贝叶斯网络的推断是一个非常广泛的问题,有兴趣的同学可以参考相关的教科书,我们这里只是简要介绍一些这个文章需要用到的部分。)

从贝叶斯网络到深度贝叶斯网络:那么现在的问题是,如果 和 这两个条件概率分布非常复杂,每个都需要用多层的神经网络来表示,那该怎么办?我们该如何学习(learning),如何推断(inference)呢?

深度贝叶斯网络的学习:学习的部分其实很简单,假设我们有很多 , , 的数据,我们只需要分别训练2个概率神经网络(Probabilistic Neural Network),一个负责 ,一个负责 。这里的概率神经网络和一般的神经网络不同的是:概率神经网络会输出整个分布的参数,而一般的神经网络只会输出一个预测的定值。最简单的概率神经网络的做法是,我们假设网络输出的是高斯分布,那么我们就可以用高斯分布log likelihood作为目标函数,来训练(学习) 和 这两个概率神经网络。整体地看,我们可以用下面这个目标函数来训练:

这个目标函数的前2项对应的是 这个概率神经网络,这个网络的输入是 ,而这里的 和 则分别是这个概率神经网络输出的mean和variance。所以,前2项其实是在用一个被控制的高斯分布,来拟合。注意这里 表示第一个神经网络的参数。

同理,目标函数的后2项对应的是 ) 这个概率神经网络。有了这个目标函数以及很多 , , 的数据,我们就可以训练出来 和 这两个概率神经网络。(眼尖的同学可能会发现,前2项和后2项是没有关系的,所以这2个网络还可以分开、并行地训练,从而提高速度。)

深度贝叶斯网络的推断:深度贝叶斯网络的推断部分是BIN的精髓,也是Reverse Attack的灵感来源之一。我们依然沿用前面 , , 的例子,在我们学习了 和 这两个概率神经网络之后,一个重要的推断问题是,如果给定一组 和 ,我们能否推断出最可能发生的 。换句话说,我们能否找到一个 ,使得 的后验概率 最大呢?

熟悉概率论的人可能已经发现上面的目标函数,其实等于

而后验概率 的log:

由于我们 和 是给定的,所以上面的第二项 log p(v_2 | X)$ 其实是一个常数,那么我们就可以推出来:

然后我们会惊喜地发现(这其实是最大后验的常规操作),其实给定 和 推断 的时候,我们可以用同一个目标函数:)

区别在于,在学习(learning)阶段,我们是已知, , ,然后通过BP去更新网络的参数。而在推断(inference)阶段,我们是已知,, 和网络的参数,然后通过BP去更新

眼尖的同学可能会发现另一个区别,那就是在学习阶段,前2项和后2项是独立、没有关系的,但是在推断阶段,我们的推断目标同时出现在前2项和后2项里。也就是说,虽然2个概率神经网络可以分开训练,但是推断的时候是需要一起协作的。

深度贝叶斯网络推断的intuition:其实如果只看后面2项,可以发现,我们做的其实就是BP到神经网络的输入 ,从而不断更新 ,而前面2项的作用,其实相当于给这个更新提供了一个L2的regularization。而这个L2 regularization的系数,则由 动态决定的。

算法实现:从算法上讲,这个推断过程可以分成2步(如下图):

1. 计算上面目标函数的前2项里的 和 ,这个部分只需要通过feedforward计算一次

2. 把初始化为 ,然后通过BP多次计算目标函数关于 的gradient,并且更新 。

因为我们这个方法既可以前向推断(feedforward)也可以后向推断(BP),我们把它叫做Bidirectional Inference Network(BIN

从BIN到Reverse Attack:那么回到文章最初提的Reverse Attack,假设被attack过的图片(原始图片+attack vector)叫 , 而我们想寻找的reverse attack后的图片(原始图片+attack vector+reverse attack vector)叫 。这里的关键是结构一致性信息 。我们知道,原始的图片,是满足结构一致性的,而被attack后的图片,结构一致性会被破坏或者甚至 ,然后我们希望reverse attack后的图片,可以(部分)恢复这种结构一致性(使得尽可能靠近1)。

那么我们应该怎么做呢?这时我们就可以把它formulate成一个最大后验估计的问题:寻找一个 使得后验概率 最大。套用前面BIN的例子,这里的 对应之前的 , 对应之前 ,而 对应之前的 。于是我们就有了下面这个熟悉的图。需要注意的是,在reverse attack里问题甚至比之前的例子更简单,因为 和 之间没有链接。

Reverse Attack与BIN的推断:给定一个reverse attack后的图片 ,以及已知我们reverse attack后的结构一致性 ,根据BIN的推断(inference)算法,我们只需要通过BP,来求 关于 的gradient,然后不断更新 到收敛,就可以找到最优的 了。

如何学习概率神经网络: 细心的读者会问,BIN的inference是假设已经学好了概率神经网络 和 ,那么如何学习这两个概率神经网络呢?

其实很简单, 甚至不需要学习,我们直接假设 服从一个以 为均值的高斯分布 就行。

至于 ,我们可以直接训练一个contrastive learning(CL)的神经网络。给定任意2个图片的crop作为输入,CL的网络可以判断他们是否来自于同一张图。这其实就是在判断结构一致性。被attack过的图片,结构一致性受损,所以即使给定这同一个图片的2个crop,CL的网络也可以判断出来他们不是来自于同一张图。基于这个intuition,我们只需要直接用clean image,训练一个CL的网络,就可以当成 来用了。

理论:更有趣的是,在我们reverse attack for defense的paper中,我们还证明了,通过以上贝叶斯推断得到的模型准确率的上界可以提升。也就是说,从某种程度上讲,用了这种基于贝叶斯的reversal method,对于训练恰当的模型会保证更好。

实验结果:因为我们的方法只是在原有输入的基础上额外考虑了 这一项,因此我们的算法与目前所有做adversarial robustness的方法兼容,可以直接加到他们上面。我们在4个主流的数据集上,对7种主流的adversarial robust的算法进行了测试。

实验结果之CIFAR-10:我们测试了6种主流adversarial robust算法,并且在他们上面加入我们reversal defense的方法。在包括AutoAttack在内的5种adversarial attack下,我们的算法都直接提升了原有算法的robust accracy。

有意思的是,对于越强的adversarial attack算法,我们的算法提升的越多(对于比较弱的PGD50,我们提升2%左右,但是对于更强的autoattack,我们能够提升7个点之多)。这是因为更强的attack算法其实破坏了更多的结构一致性信息,我们的算法从而能够恢复更多原有信息来提升准确率。

实验结果之 CIFAR-100,SVHN 和 ImageNet:我们的算法同样可以扩展到更大规模的数据集。在另外 3 个数据集上,我们的算法同样有高达 11% 的提升。下面是每个数据集的结果:

另一个使用贝叶斯最大后验来增强鲁棒性的优点,就是我们的方法对于没见过的,特别强的 adversarial attack 更加有效。在以下图中,所有的模型都在最小的扰动上进行训练(使用 8/255 的扰动范围,ImageNet 除外,是 4/255)。随着在推断时扰动的增加,我们的模型在这些从未训练过的扰动上准确率提升越来越明显。

写在最后之用 BIN 处理任意贝叶斯网络结构:有一点需要注意的是,虽然我们上面给的是一个非常简单的深度贝叶斯网络结构,只涉及 3 个变量。实际上 BIN 可以处理任意节点数的贝叶斯网络,比如下图这些结构。因为可以处理任意结构, BIN 最初是用来做 health profiling 的。有兴趣同学可以移步看看 health profiling 通俗易懂的应用介绍:https://news.mit.edu/2019/machine-learning-incomplete-patient-data-0125

写在最后之用 natural-parameter network(NPN)来作为 BIN 的概率神经网络 backbone:另一点需要注意的是,上文提到的概率神经网络(probabilistic neural network)的具体实现(比如 的具体实现),除了简单的用一个 MLP 最后输出 2 个 branch(mean 和 variance)之外,也可以用比如 natural-parameter network(NPN)[3] 的贝叶斯神经网络,从而达到更好的效果。

参考文献

[1] Adversarial attacks are reversible with natural supervision. Chengzhi Mao, Mia Chiquier, Hao Wang, Junfeng Yang, Carl Vondrick. ICCV, 2021.

[2] Bidirectional inference networks: A class of deep Bayesian networks for health profiling. Hao Wang, Chengzhi Mao, Hao He, Mingmin Zhao, Tommi S. Jaakkola, Dina Katabi. AAAI , 2019.

[3] Natural parameter networks: a class of probabilistic neural networks. Hao Wang, Xingjian Shi, Dit-Yan Yeung. NIPS, 2016.

[4] A survey on Bayesian deep learning. Hao Wang, Dit-Yan Yeung. ACM Computing Surveys, 2020.

[5] Towards Bayesian deep learning: a framework and some existing methods. Hao Wang, Dit-Yan Yeung. TKDE, 2016.


本文来自:公众号【PaperWeekly】 作者:王灏 、毛成志

Illustrastion by Natasha Remarchuk from icons8

-The End-

扫码观看!

本周上新!

关于我“门”

将门是一家以专注于发掘、加速及投资技术驱动型创业公司的新型创投机构,旗下涵盖将门创新服务将门技术社群以及将门创投基金

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

bp@thejiangmen.com

点击右上角,把文章分享到朋友圈

⤵一键送你进入TechBeat快乐星球

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
苦难值得歌颂吗?10年前工资3千,10年后工资还3千,物价呢?

苦难值得歌颂吗?10年前工资3千,10年后工资还3千,物价呢?

唯唯安
2024-04-22 22:30:48
井喷!双色球24068期:爆发25注一等奖,分落12省,二等奖190注

井喷!双色球24068期:爆发25注一等奖,分落12省,二等奖190注

王晓爱体彩
2024-06-17 00:12:54
感动!曝胡明轩降薪留在广东宏远,只为拿到总冠军

感动!曝胡明轩降薪留在广东宏远,只为拿到总冠军

祝晓塬
2024-06-16 23:23:04
让更多的姜萍走向展示天赋的舞台

让更多的姜萍走向展示天赋的舞台

南方都市报
2024-06-15 22:22:17
A股:刚刚,证监会发声!2亿股民:融券和转融通就不应该存在!

A股:刚刚,证监会发声!2亿股民:融券和转融通就不应该存在!

兵哥闲聊
2024-06-16 22:32:43
奔驰男甩棍敲女孩后续:上头给压力了,视频下架,男子身份被扒了

奔驰男甩棍敲女孩后续:上头给压力了,视频下架,男子身份被扒了

小鹿姐姐情感说
2024-06-17 01:18:36
动物交配六亲不认,若雄性遇上自己母亲呢?马不欺母是真的吗?

动物交配六亲不认,若雄性遇上自己母亲呢?马不欺母是真的吗?

答案在这儿
2024-06-16 00:02:21
尘埃落定!孙杨归来,禁赛4年后剑指奥运,三项目挑战布拉登预言

尘埃落定!孙杨归来,禁赛4年后剑指奥运,三项目挑战布拉登预言

九霄云者
2024-06-14 12:55:17
致命绝杀!以色列的噩梦来了!

致命绝杀!以色列的噩梦来了!

大嘴说天下
2024-06-16 20:53:01
外媒:以色列面对真主党左右为难

外媒:以色列面对真主党左右为难

参考消息
2024-06-16 09:57:07
美国选手夸张幅度破女子100蝶世界纪录 超现实水准全世界独她拥有

美国选手夸张幅度破女子100蝶世界纪录 超现实水准全世界独她拥有

威猛孟巍
2024-06-16 08:39:11
曼联悍将凌空斩+创新历史,丹麦1-1斯洛文尼亚,24年纪录诞生

曼联悍将凌空斩+创新历史,丹麦1-1斯洛文尼亚,24年纪录诞生

侧身凌空斩
2024-06-17 01:51:20
申花老本吃完,斯帅只会大脚找马莱莱 不换外援将掉队 小戴又被弃

申花老本吃完,斯帅只会大脚找马莱莱 不换外援将掉队 小戴又被弃

替补席看球
2024-06-16 22:06:11
G7背书,再用瑞士峰会推高,之后F-16进入,反攻就开始了

G7背书,再用瑞士峰会推高,之后F-16进入,反攻就开始了

邵旭峰域
2024-06-15 11:59:20
59岁港星县城酒吧捞金,下车七个保镖护送,表情冷漠被批耍大牌

59岁港星县城酒吧捞金,下车七个保镖护送,表情冷漠被批耍大牌

大双
2024-05-18 21:41:45
湖南:小伙捧鲜花表白女技师,做足疗一见钟情,网友:长得很哇塞

湖南:小伙捧鲜花表白女技师,做足疗一见钟情,网友:长得很哇塞

百晓史
2024-06-02 09:09:36
剧情反转,以色列在中东被群殴,伊拉克民兵袭击以色列海法港口

剧情反转,以色列在中东被群殴,伊拉克民兵袭击以色列海法港口

青年的背包
2024-06-16 12:02:54
浙江红色预警!入梅后最强爆发!杭州天气将大变,今天下午起影响……

浙江红色预警!入梅后最强爆发!杭州天气将大变,今天下午起影响……

杭州之声
2024-06-16 16:42:52
2018年,那个检举男友一家贪腐的女子,两年后,自己也被判刑3年

2018年,那个检举男友一家贪腐的女子,两年后,自己也被判刑3年

可乐86
2024-05-16 09:12:38
涉195名员工! 理想汽车派“大礼包”

涉195名员工! 理想汽车派“大礼包”

每日经济新闻
2024-06-16 19:37:10
2024-06-17 03:20:49
将门创投
将门创投
加速及投资技术驱动型初创企业
1823文章数 585关注度
往期回顾 全部

科技要闻

iPhone 16会杀死大模型APP吗?

头条要闻

冷藏货车违规乘人致8人窒息后遇难 河南叶县通报

头条要闻

冷藏货车违规乘人致8人窒息后遇难 河南叶县通报

体育要闻

没人永远年轻 但青春如此无敌还是离谱了些

娱乐要闻

上影节红毯:倪妮好松弛,娜扎吸睛

财经要闻

打断妻子多根肋骨 上市公司创始人被公诉

汽车要闻

售17.68万-21.68万元 极狐阿尔法S5正式上市

态度原创

艺术
房产
数码
公开课
军事航空

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

房产要闻

万华对面!海口今年首宗超百亩宅地,重磅挂出!

数码要闻

PCIe 5.0 SSD终于要便宜了!群联E31T主控无缓存能跑12GB/s

公开课

近视只是视力差?小心并发症

军事要闻

以军宣布在加沙南部实行"战术暂停"

无障碍浏览 进入关怀版