网易首页 > 网易号 > 正文 申请入驻

CVPR 2023 | 数据驱动的解释对分布外数据具有鲁棒性吗?

0
分享至

本文提出了一个端到端的、与模型无关的学习框架——分布鲁棒解释(DRE),它充分利用了分布间的信息,为解释学习提供了监督信号,而无需人工注释。在包括图像和科学数据上的分类和回归等广泛任务中的实证结果显示,我们的模型在面对分布外(OOD)数据时,其解释和预测的鲁棒性都优于其他模型。

论文链接: https://arxiv.org/abs/2303.16390 代码链接: https://github.com/tangli-udel/DRE

一、研究背景:数据驱动的解释对分布外数据具有鲁棒性吗?

近年来,将黑盒机器学习(ML)模型用于高风险应用的趋势日益明显。模型可解释性的缺乏可能会在医疗健康、刑事司法以及其他领域造成严重后果。与此同时,机器学习模型不可避免地会遭遇到超出其训练分布范围的未知数据分布。一个平均水平上表现出色的模型可能因为自然因素、子集群偏移、伪相关性和对抗攻击而在分布外(OOD)数据上发生灾难性的失败。例如,一个肿瘤检测模型可能会错误地预测来自使用不同数据获取协议或设备制造商的医院的样本。因此,跨数据分布的可靠解释对于机器学习模型的安全部署至关重要。然而,现有的研究主要集中在可解释方法在分布内的可靠性,而忽视了解释对于分布变化的鲁棒性。

我们针对不同的可解释方法对此问题进行了实证研究。图1中定性地展示了Grad-CAM[1]方法的解释结果。我们观察到,由于机器学习模型的黑盒属性,分布的偏移会进一步掩盖其决策过程。如图所示,现有方法训练出的模型即使预测正确,其在进行解释时不仅会突出目标对象,也会突出不相关元素(如树枝)。这些伪相关性会导致不同数据分布上的解释不一致,并最终产生在分布外数据上不可靠的解释。这种现象与人们的先验知识相悖,即最具区分性的特征应该是不变的(invariant)。

图1Terra Incognita[2]数据集分布内和分布外数据的Grad-CAM解释。与现有方法不同,我们的模型(DRE)的解释在不同的分布下始终突出最具区分性的特征。需要指出的是,GroupDRO[3]和IRM[4]是为能够跨分布准确预测而特别设计的方法。

二、方法介绍:如何开发对分布外数据鲁棒的解释?

获得对分布外数据鲁棒的解释并不容易。

一方面,现有关于分布外泛化的研究主要局限于数据增强、分布对齐、元学习以及不变学习。然而,在没有对解释施加约束的情况下,模型仍会不加选择地吸收训练数据中发现的所有关联,包括伪相关[4]。

另一方面,为了约束模型的解释,现有方法依赖于人工标注或数据增强之间的一对一映射[5]。然而,它们通常不存在于自然发生的分布偏移中。此外,由于标注者的主观性,获得真实解释标注的成本极高,甚至是不可能的。

2.1 问题表述

传统的有监督学习的目标是学习一个预测器 ,使得对于任何 ,都有都有 ,其中 是一个未知的联合概率分布,而 是一个对预测任务模型无关的函数类。但在分布外泛化的场景中,由于分布的变化,我们无法直接从 中抽样。相反,我们假设只能在不同的环境条件 下测量 ,因此数据是从一组 中抽取的,满足 。例如,在肿瘤细胞检测的例子中,环境条件代表了影响不同医院的潜在因子(如数据采集协议或设备供应商)。

这种假设意味着应该有一个转换函数 ,通过 关联随机变量 和 。假设 是一个有限子集表示训练组(分布),在给定损失函数 和可解释方法 的情况下,我们提出通过解决以下约束优化问题来开发分布鲁棒解释(Distributionally Robust Explanations, DRE):

直观上,我们鼓励模型对不同环境条件(分布)下的样本有不变的解释。解决这一问题具有挑战性,因为我们既无法获得所有分布的集合 ,又无法获得转换函数 。替代方案可能需要解释的人工标注,即提供 ;或者通过数据增广获取人工合成分布之间的一对一映射,即提供 。然而,如上文所论述的,在现实场景中这两种方法都不可行。因此,实现DRE的核心挑战在于监督信号的缺失

2.2 分布解释一致性

为了解决上述挑战,我们设计了分布解释一致性(Distributional Explanation Consistency, DEC)。核心思路是,受到自监督学习的启发,我们使用混合解释为解释的学习提供监督信号。混合(Mixup)[6]是一种数据增广的技术,其已被在实践中证明能够大幅提高预测鲁棒性。如图2所示,与原始的随机混合样本和标签的混合方式不同,我们将来自不同分布但有相同真值标签的样本进行混合,即 。同时,我们用相同的参数混合各样本的解释,即 。我们用混合解释与混合样本的解释之间的一致性来实现


直观上,混合解释作为伪标签来指导混合样本的解释学习,无需人工标注。并且,分布之间的混合实现了简单但有效的跨分布转换。需要注意的是, 不是固定的,它涵盖了基于梯度的解释方法,例如Grad-CAM和Input Gradient。

图2 分布鲁棒解释(DRE)方法的总览


三、实验结果:分布鲁棒解释能否提升模型的泛化能力?

我们在广泛的任务中对DRE进行了评估,包括图像和科学数据的分类与回归任务。我们将DRE与最先进的基准模型进行了分布外解释鲁棒性与泛化性能的比较,并对DRE的关键组成部分进行了消融研究。

3.1 图像分类

图3对VLCS数据集中的Bird类(左)和Chair类(右)图片的Grad-CAM解释。使用现有方法训练的模型,不仅关注于对象,还关注伪相关性,特别是在分布外数据上这种情况更为严重。相反,我们的模型减少了对伪相关性(例如,背景像素)的依赖,并在分布外数据上做出了一致的解释。

Terra Incognita[2]数据集(约11K图像,10个类别)包含四个子数据集:Location 100、38、43和46。每个子数据集表示野外的一个相机陷阱位置,并可以被视为一个不同的分布。这些数据集中的每个图像都包含一个单一的动物类别(例如,土狼),但具有不同的照明、背景、视角等。

VLCS[7]数据集(约25K图像,5个类别)由四个子数据集组成:Caltech101、LabelMe、SUN09和VOC2007。每个子数据集可以被视为一个不同的分布。这些数据集中的每个图像都包含一个单一的图像类别(例如,汽车),并具有不同的风格和背景。

对于每一个数据集,我们逐个地把每一个分布设置为测试集,其他分布作为训练集。从每个训练集中,我们按照80%与20%的划分来分割数据,其中80%的数据用于训练,而20%的数据用于验证及模型的选择。

表1 在Terra Incognita和VLCS数据集上对出分布外数据解释和预测性能进行比较。我们突出显示了最好的结果和次优的结果,体现了我们方法的优越性。

图3中定性地展示了我们的解释的优越性。我们在表1中定量地展示了两个数据集所有分布上的结果。结果表明,我们的DRE方法能在分布外数据上取得最佳的解释一致性与保真度。同时,分布鲁棒的解释也提升了模型的分布外泛化性能。

3.2 科学数据回归

城市土地数据集(Global National Total Amounts of Urban Land v1,以下简称Urban Land)[8]将全球的土地分为997,022个方格区域。每个方格中都有九种地形、人口和历史城市化率的属性数据。该任务是使用过去40年的数据来预测2010年的城市化率。全球被分为九个大陆区域,每个区域可以看作是一个独特的分布。同样的,我们逐个地把每一个分布设置为测试集。

表2 在Urban Land数据集上对短期城市化预测(2000-2010)的分布外解释和预测性能进行比较。0.01的残差表示估计和观测到的建成土地比例之间的一百分点差异。

我们在表2中展示了在Urban Land数据集所有分布上的结果。结果表明,我们的DRE方法能在分布外数据上取得最佳的科学一致性(Scientific Consistency),即与领域专家的判断真值一致。同样的,分布鲁棒的解释也提升了模型的分布外泛化性能。

四、结语

我们的贡献包括:


  1. 我们对在自然出现的分布偏移下,数据驱动的解释的鲁棒性进行了全方位的研究。



  2. 我们提出了一个端到端的、与模型无关的学习框架——分布鲁棒解释(DRE)。它充分利用了分布间的信息,为解释学习提供了监督信号,而无需人工注释。



  3. 在包括图像和科学数据上的分类和回归等广泛任务中的实证结果显示,我们的模型在面对分布外(OOD)数据时,其解释和预测的鲁棒性都优于其他模型。


参考文献

[1] Selvaraju et al. Grad-cam: Visual explanations from deep networks via gradient-based localization. ICCV 2017.

[2] Beery et al. Recognition in terra incognita. ECCV, 2018.

[3] Sagawa et al. Distributionally robust neural networks. ICLR, 2019.

[4] Arjovsky et al. Invariant risk minimization. ArXiv, 2019.

[5] Rieger et al. Interpretations are useful: penalizing explanations to align neural networks with prior knowledge. ICML, 2020.

[6] Zhang et al. mixup: Beyond empirical risk minimization. ICLR, 2018.

[7] Fang et al. Unbiased metric learning: On the utilization of multiple datasets and web images for softening bias. ICCV, 2013.

[8] Gao et al. Mapping global urban land for the 21st century with data-driven simulations and shared socioeconomic pathways. Nature communications, 2020.

美国特拉华大学计算机和信息科学系招收AI/ML/CV方向博士生 招生信息 学校:University of Delaware 院系:Computer & Information Sciences 研究方向:Machine Learning, Scientific Machine Learning, and Computer Vision. 开始时间:2024年春季或秋季 可选研究课题 Out-of-distribution generalization; Explainable machine learning; Domain adaptation/generalization; Foundation models. 申请要求 计算机,电子,或数学相关专业本科或以上学历; 良好GPA记录,专业排名靠前比如前20%; 本科同学不要求有论文,但最好有机器学习相关研究经历; 托福85分以上,免GRE成绩。 申请方式 有兴趣同学请发送下列材料到 xipeng@udel.edu ,邮件主题/简历命名格式:博士申请+姓名 CV; 本科与研究生成绩单,以及专业排名情况; 托福或雅思成绩,GRE成绩; 其他材料比如已(将)发表论文,报告,GitHub主页等。 导师介绍: Dr. Xi Peng joined the University of Delaware (UD) in 2019. He received the PhD degree in Computer Science from Rutgers University in 2018. Dr. Peng is holding three positions at UD: Assistant Professor, Department of Computer & Information Sciences (CIS) Resident Faculty, Data Science Institute (DSI) Affiliate Faculty, Delaware Environmental Institute (DENIN) 实验室主页: Deep-REAL (Deep Robust & Explainable AI Lab) https://deep-real.github.io/
作者:李唐

Illustration by IconScout Store from IconScout

-The End-

扫码观看!

本周上新!

“AI技术流”原创投稿计划

TechBeat是由将门创投建立的AI学习社区(www.techbeat.net)。社区上线480+期talk视频,2400+篇技术干货文章,方向覆盖CV/NLP/ML/Robotis等;每月定期举办顶会及其他线上交流活动,不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台,希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。

投稿内容

// 最新技术解读/系统性知识分享 //

// 前沿资讯解说/心得经历讲述 //

投稿须知

稿件需要为原创文章,并标明作者信息。

我们会选择部分在深度技术解析及科研心得方向,对用户启发更大的文章,做原创性内容奖励

投稿方式

发送邮件到

chenhongyuan@thejiangmen.com

或添加工作人员微信(chemn493)投稿,沟通投稿详情;还可以关注“将门创投”公众号,后台回复“投稿”二字,获得投稿说明。

关于我“门”

将门是一家以专注于数智核心科技领域新型创投机构,也是北京市标杆型孵化器。 公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

bp@thejiangmen.com

点击右上角,把文章分享到朋友圈

⤵一键送你进入TechBeat快乐星球

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
41岁夫妻因“房事频繁”双双入院,医生提醒:每周不应超过一个数

41岁夫妻因“房事频繁”双双入院,医生提醒:每周不应超过一个数

路医生健康科普
2026-06-03 16:36:08
BYD在英国有多火?英超足球巨星在网上分享自己购买比亚迪海豹

BYD在英国有多火?英超足球巨星在网上分享自己购买比亚迪海豹

手工制作阿歼
2026-06-08 04:42:37
律师丈夫家暴妻子片疯传 飞脚掌掴铁棍狂殴 妻挺身反抗结局超暖

律师丈夫家暴妻子片疯传 飞脚掌掴铁棍狂殴 妻挺身反抗结局超暖

环球趣闻分享
2026-06-07 17:11:06
大陆海警一出手,台湾渔民渔获量暴涨超60%!唐湘龙:民进党丢脸

大陆海警一出手,台湾渔民渔获量暴涨超60%!唐湘龙:民进党丢脸

故事终将光明磊落
2026-06-07 12:58:41
​欧美观众嫌动漫黑人角色少,日本网友回怼:本就不是为你们画的

​欧美观众嫌动漫黑人角色少,日本网友回怼:本就不是为你们画的

国创漫话
2026-06-06 16:15:10
颠覆!神药二甲双胍,经典降糖机制竟出错了?Nature子刊:降糖核心不在肝脏,而在肠道,且还能抑制食欲

颠覆!神药二甲双胍,经典降糖机制竟出错了?Nature子刊:降糖核心不在肝脏,而在肠道,且还能抑制食欲

梅斯医学
2026-06-05 07:53:59
“五脏六腑都在沸腾”:热浪之下,印度每天超额死亡3000余人

“五脏六腑都在沸腾”:热浪之下,印度每天超额死亡3000余人

新京报
2026-06-05 08:47:38
一年关闭2万多家,曾经最暴利的行业迎来“闭店潮”?

一年关闭2万多家,曾经最暴利的行业迎来“闭店潮”?

毒sir财经
2026-06-07 23:10:10
想抓人了?美海军陆战队在南海拘押训练,士兵直接上船抓人!

想抓人了?美海军陆战队在南海拘押训练,士兵直接上船抓人!

阿龙聊军事
2026-06-05 19:55:21
苏州一对情侣,谈了7年,女子提了18次分手,分手后在街头痛哭!

苏州一对情侣,谈了7年,女子提了18次分手,分手后在街头痛哭!

川渝视觉
2026-04-17 22:13:14
正大量上市,钾是苹果8倍!6月使劲吃,腿脚有劲精神足

正大量上市,钾是苹果8倍!6月使劲吃,腿脚有劲精神足

观星赏月
2026-06-07 14:12:42
46岁董洁花期太短了,这是董洁为某时尚杂志拍的大片,董洁贴上假胡子,脸上戴着厚重的网纱,脖子上挂着繁复的花朵,这妆造真的太前卫了

46岁董洁花期太短了,这是董洁为某时尚杂志拍的大片,董洁贴上假胡子,脸上戴着厚重的网纱,脖子上挂着繁复的花朵,这妆造真的太前卫了

牛油果生活观
2026-06-02 19:09:43
演都不演了!央视《主角》刚收官,恶心事发生,难怪官媒发文批评

演都不演了!央视《主角》刚收官,恶心事发生,难怪官媒发文批评

往史过眼云烟
2026-06-05 16:47:56
李晨妹妹低调嫁人,韩景枫10万礼金+500万保时捷当婚车

李晨妹妹低调嫁人,韩景枫10万礼金+500万保时捷当婚车

落雪听梅a
2026-06-07 15:02:15
中央定调,6月或启动养老金调整?2026年上涨比例能否止跌反弹?

中央定调,6月或启动养老金调整?2026年上涨比例能否止跌反弹?

云鹏叙事
2026-06-07 17:42:42
江苏人有福了!南京将要迎来大变化,住在这儿的人幸福了!

江苏人有福了!南京将要迎来大变化,住在这儿的人幸福了!

朗威谈星座
2026-06-07 19:07:42
万万没想到,反华喊最响的高市早苗,居然扭头把孙子送中国留学!

万万没想到,反华喊最响的高市早苗,居然扭头把孙子送中国留学!

爱看剧的阿峰
2026-06-08 00:29:40
碎三观!准新郎发现未婚妻把亲生子伪装成弟弟,网友爆料引发热议

碎三观!准新郎发现未婚妻把亲生子伪装成弟弟,网友爆料引发热议

火山詩话
2026-06-07 08:17:59
好样的!女排3-1逆转,颜面找回来了,积分也赚回来了,央媒盛赞

好样的!女排3-1逆转,颜面找回来了,积分也赚回来了,央媒盛赞

萌兰聊个球
2026-06-07 22:07:02
俱乐部随便划水,国家队很努力但状态也不行,怪不得上海队不要他

俱乐部随便划水,国家队很努力但状态也不行,怪不得上海队不要他

稻谷与小麦
2026-06-07 21:30:34
2026-06-08 06:12:49
将门创投 incentive-icons
将门创投
加速及投资技术驱动型初创企业
2403文章数 596关注度
往期回顾 全部

科技要闻

黄仁勋访韩:首尔网吧会晤游戏巨头负责人

头条要闻

伊朗发射多轮导弹袭击以色列 特朗普回应

头条要闻

伊朗发射多轮导弹袭击以色列 特朗普回应

体育要闻

劳塔罗传射 梅西伤缺 阿根廷2-0洪都拉斯

娱乐要闻

戚薇坦言:陪睡只是低级潜规则

财经要闻

SpaceX上市前夕,忙着干三件大事

汽车要闻

奥迪全新超跑Nuvolari登场 千匹混动性能拉满

态度原创

时尚
房产
数码
公开课
军事航空

聊点实用的:38°高温天出门,全靠它们保持体面美丽

房产要闻

7.8万考生创新高,但海南高考还是全国最稳

数码要闻

AMD AIB合作伙伴预测:下代独立显卡至少要等一年

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美以伊战争100天 美或用冻结的伊朗资产赔偿海湾盟友

无障碍浏览 进入关怀版