网易首页 > 网易号 > 正文 申请入驻

一篇综述带你全面了解领域泛化(Domain Generalization)

0
分享至

「领域泛化 (Domain Generalization, DG)」 是近几年非常热门的一个研究方向。它研究的问题是从若干个具有不同数据分布的数据集(领域)中学习一个泛化能力强的模型,以便在 「未知 (Unseen)」 的测试集上取得较好的效果。

本文介绍DG领域的第一篇综述文章《Generalizing to Unseen Domains: A Survey on Domain Generalization》。该论文一共调研了 「159」 篇文献,其中直接与领域泛化相关的有 「90」 篇。

文章从问题定义、理论分析、方法总结、数据集和应用介绍、未来研究方向等几大方面对领域泛化问题进行了详细的概括和总结。

  • 文章链接:https://arxiv.org/abs/2103.03097

  • PDF:https://arxiv.org/pdf/2103.03097

  • 作者单位:微软亚洲研究院、中央财经大学

1

问题定义

领域泛化问题与领域自适应 (Domain Adaptation,DA)最大的不同:DA在训练中,源域和目标域数据均能访问(无监督DA中则只有无标记的目标域数据);而在DG问题中,我们只能访问若干个用于训练的源域数据,测试数据是不能访问的。毫无疑问,DG是比DA更具有挑战性和实用性的场景:毕竟我们都喜欢“一次训练、到处应用”的足够泛化的机器学习模型。

例如,在下图中,DA问题假定训练集和测试集都可以在训练过程中被访问,而DG问题中则只有训练集。

DG问题的示意图如下所示,其形式化定义如下:

DG不仅与DA问题有相似之处,其与多任务学习、迁移学习、元学习、终身学习等,都有一些类似和差异之处。我们在下表中对它们的差异进行了总结。

2

理论和方法

理论

我们从Domain adaptation理论出发,分析影响不同领域学习结果的因素,如H -divergence、 等,继而过渡到领域Domain generalization问题中,分析影响模型泛化到新领域的因素。 从理论上总结了领域泛化问题的重要结果,为今后进行相关研究指明了理论方向。

详细结果请参考原文第3部分。

方法

领域泛化方法是我们的核心。我们将已有的领域泛化方法按照数据操作、表征学习、学习策略分为三大方面,如下图所示。

其中:

  1. 「数据操作」 ,指的是通过对数据的增强和变化使训练数据得到增强。这一类包括数据增强和数据生成两大部分。

  2. 「表征学习」 ,指的是学习领域不变特征(Domain-invariant representation learning)以使得模型对不同领域都能进行很好地适配。领域不变特征学习方面主要包括四大部分:核方法、显式特征对齐、领域对抗训练、以及不变风险最小化(Invariant Risk Minimiation, IRM)。特征解耦与领域不变特征学习的目标一致、但学习方法不一致,我们将其单独作为一大类进行介绍。

  3. 「学习策略」 ,指的是将机器学习中成熟的学习模式引入多领域训练中使得模型泛化性更强。这一部分主要包括基于集成学习和元学习的方法。同时,我们还会介绍其他方法,例如自监督方法在领域泛化中的应用。

在文章中,我们对每大类方法都进行了详细地介绍与总结。

3

应用与数据集

领域泛化问题在众多领域都得到了广泛应用。大多数已有工作偏重于设计更好的DG方法,因此,其往往都在图像分类数据上进行评估。除此之外,DG方法还被应用于行人再识别(Re-ID)、语义分割、街景识别、视频理解等计算机视觉的主流任务中。

特别地,DG方法被广泛应用于健康医疗领域,例如帕金森病识别、组织分割、X光胸片识别、以及震颤检测等。

在自然语言处理领域,DG被用于情感分析、语义分割、网页分类等应用。

DG也在强化学习、自动控制、故障检测、语音检测、物理学、脑机接口等领域中得到了广泛应用。

下图展示了领域泛化问题中流行的标准数据集。

4

未来挑战

我们对DG进行以下展望:

  • 「连续领域泛化」: 一个系统应具有连续进行泛化和适配的能力,目前只是离线状态的一次应用。

  • 「新类别的领域泛化」: 目前我们假定所有的领域具有相同的类别,未来需要扩展到不同类别中、乃至新类别中。

  • 「可解释的领域泛化」: 尽管基于解耦的方法在可解释性上取得了进步,但是,其他大类的方法的可解释性仍然不强。未来需要对它们的可解释性进行进一步研究。

  • 「大规模预训练与领域泛化」: 众所周知,大规模预训练(如BERT)已成为主流,那么在不同问题的在规模预训练中,我们如何利用DG方法来进一步提高这些预训练模型的泛化能力?

  • 「领域泛化的评价」: 尽管有工作在经验上说明已有的领域泛化方法的效果并没有大大领先于经验风险最小化,但其只是基于最简单的分类任务。我们认为DG需要在特定的评测,例如行人再识别中才能最大限度地发挥其作用。未来,我们需要找到更适合DG问题的应用场景。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
智商税真贵啊!14万买的钻石项链只值200块,女子吐槽欲哭无泪…

智商税真贵啊!14万买的钻石项链只值200块,女子吐槽欲哭无泪…

火山诗话
2026-01-18 06:29:32
曝腾讯向GitHub发函,要求下架“用户可获取自己聊天记录”的仓库

曝腾讯向GitHub发函,要求下架“用户可获取自己聊天记录”的仓库

爆角追踪
2026-01-18 14:25:38
官媒锐评贾国龙闭店风波,言辞犀利没有维护,有一点罗永浩没说错

官媒锐评贾国龙闭店风波,言辞犀利没有维护,有一点罗永浩没说错

断翼的鸟儿
2026-01-18 09:02:35
文班亚马39分9篮板马刺拒绝逆转险胜森林狼,爱德华兹复出55分

文班亚马39分9篮板马刺拒绝逆转险胜森林狼,爱德华兹复出55分

湖人崛起
2026-01-18 11:35:56
2026年最大风口?万亿资金大迁徙,一波造富神话刚开始

2026年最大风口?万亿资金大迁徙,一波造富神话刚开始

柏年说政经
2026-01-16 18:00:03
75岁大妈的愤怒:请38岁男人做住家保姆,开始很满意,后面很恼火

75岁大妈的愤怒:请38岁男人做住家保姆,开始很满意,后面很恼火

施工员小天哥
2026-01-17 13:04:41
曼联2-0曼城进前4!卡里克能阿莫林所不能,坚决战术打爆保守瓜帅

曼联2-0曼城进前4!卡里克能阿莫林所不能,坚决战术打爆保守瓜帅

罗米的曼联博客
2026-01-18 00:03:57
大爆发!李月汝留洋3分钟轰13分创新高 4战3胜终命中首记三分

大爆发!李月汝留洋3分钟轰13分创新高 4战3胜终命中首记三分

醉卧浮生
2026-01-18 12:41:14
两人消费1400被上海服务员嘲讽!网友:在上海1400只能吃个路边摊

两人消费1400被上海服务员嘲讽!网友:在上海1400只能吃个路边摊

火山诗话
2026-01-18 11:19:13
访华第三天,卡尼情绪爆发,当着中方的面,说了一句掏心窝子的话

访华第三天,卡尼情绪爆发,当着中方的面,说了一句掏心窝子的话

知鉴明史
2026-01-17 22:39:23
对话挖出古剑上交博物馆男子:工作忙挖出10天后才交 博物馆多次提醒注意安全

对话挖出古剑上交博物馆男子:工作忙挖出10天后才交 博物馆多次提醒注意安全

红星新闻
2026-01-17 15:57:21
果然!加拿大与中国合作,让西方开始不爽了

果然!加拿大与中国合作,让西方开始不爽了

青青子衿
2026-01-18 00:51:02
许家印侄子许火健豪宅被法拍,起拍价4400万元,配有5个洗手间

许家印侄子许火健豪宅被法拍,起拍价4400万元,配有5个洗手间

红星资本局
2026-01-17 13:53:03
范志毅:U23国足半死不活的踢法世界最先进最科学 对手不会踢了

范志毅:U23国足半死不活的踢法世界最先进最科学 对手不会踢了

念洲
2026-01-18 09:41:26
全职主妇屡遭丈夫责骂吞30多粒安眠药!丈夫:她觉得她是美女嫁我可惜,女同事都夸我很优秀

全职主妇屡遭丈夫责骂吞30多粒安眠药!丈夫:她觉得她是美女嫁我可惜,女同事都夸我很优秀

扬子晚报
2026-01-18 11:11:45
不服就干!加拿大打响反击第一枪,通告全球,断的就是特朗普退路

不服就干!加拿大打响反击第一枪,通告全球,断的就是特朗普退路

知鉴明史
2026-01-18 03:50:02
被吓输?李昊玩心理战!看纸条后:对手2个点球,1个踢飞另1被扑

被吓输?李昊玩心理战!看纸条后:对手2个点球,1个踢飞另1被扑

足球大腕
2026-01-17 23:30:33
闲鱼不愧是全国最大的黑市,网民:只有你想不到,没有你买不到

闲鱼不愧是全国最大的黑市,网民:只有你想不到,没有你买不到

小熊侃史
2026-01-16 07:40:07
孔祥明:我为什么要和聂卫平离婚

孔祥明:我为什么要和聂卫平离婚

犀利辣椒
2026-01-18 06:40:48
美媒爆:五角大楼下令1500名美军做好部署明尼苏达准备,FBI征调全美特工前往当地执行临时任务

美媒爆:五角大楼下令1500名美军做好部署明尼苏达准备,FBI征调全美特工前往当地执行临时任务

环球网资讯
2026-01-18 14:51:33
2026-01-18 15:08:49
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7046文章数 20725关注度
往期回顾 全部

科技要闻

AI大事!马斯克:索赔9300亿元

头条要闻

一天两枚火箭发射失利 中国航天科技集团发文回应

头条要闻

一天两枚火箭发射失利 中国航天科技集团发文回应

体育要闻

越南媒体:李昊将成为越南U23面临的巨大挑战

娱乐要闻

43岁贾玲退出春晚、解散公司

财经要闻

BBA,势败如山倒

汽车要闻

林肯贾鸣镝:稳中求进,将精细化运营进行到底

态度原创

教育
健康
时尚
家居
数码

教育要闻

孩子不够聪明,大多是家长踩了这些坑

血常规3项异常,是身体警报!

伊姐周六热推:电视剧《寻雪迷踪》;电视剧《秋雪漫过的冬天》......

家居要闻

岁月柔情 现代品质轻奢

数码要闻

华为MateBook Pro电脑通过OpenHarmony 6.0 Release认证

无障碍浏览 进入关怀版