网易首页 > 网易号 > 正文 申请入驻

任务向量做模型编辑为何有效?ICLR 2025 Oral论文给出了理论分析

0
分享至

本文作者李宏康,博士毕业于美国伦斯勒理工大学,本科毕业于中国科学技术大学,并即将前往宾夕法尼亚大学担任博士后研究员。研究方向包括深度学习理论、大语言模型理论等等。本文的通讯作者为伦斯勒理工大学的汪孟教授。

任务向量(task vector)方法近来在许多视觉和语言任务中表现出了在效率与可迁移性方面的优势。但是由于人们尚未深入理解任务向量的理论机制,其在更广泛与更大规模的应用中面临挑战。

近期,一个来自美国伦斯勒理工大学、密歇根州立大学 OPTML 实验室、和 IBM 研究院的研究团队从神经网络的优化和泛化理论的角度分析了任务向量在模型编辑中的有效性。该工作已经被 ICLR 2025 录取,并被选为前 1.8% 的 Oral 论文。

  • 论文标题:When is Task Vector Provably Effective for Model Editing? A Generalization Analysis of Nonlinear Transformers
  • 论文地址:https://openreview.net/pdf?id=vRvVVb0NAz

背景介绍

任务向量(task vector)是指微调得到的模型与预训练模型之间的权重差值。人们发现,将不同的任务向量进行线性算术运算后叠加在一个预训练模型上可以直接赋予此模型多种全新的能力,例如多任务学习(multi-task learning)、机器遗忘(machine unlearning)、以及分布外泛化(out-of-domain generalization),其优势是无需使用下游任务的训练数据对模型进行微调。

这种基于任务向量的直接运算对模型进行编辑从而做下游任务预测的方法被称为任务运算(task arithmetic)

由于缺乏对该方法的理论研究,本文重点探索任务向量方法能够被有效且高效使用的深层原因。我们的贡献如下:

  • 我们为任务加法和减法运算的有效性提供了一个特征学习的理论分析框架。
  • 我们给出了任务运算在分布外泛化的理论保证。
  • 解释了任务向量的低秩近似和模型剪枝的理论机制。

初步观察

我们从一个简单的问题出发:组合多个任务向量的系数会受到哪些因素的影响?

直觉告诉我们,任务间的关系可能是一个关键因素。比如说,在多任务学习中,让一个模型具备两个相似任务的能力,理应是更容易的。

为了论证这一点,我们用 Colored-MNIST 数据集构建了一组二分类实验。其中,分类的标准是数字的奇偶性。我们通过调整数字的颜色来控制任务之间的关系。

于是,我们设计了「相似任务」(aligned tasks)、「无关任务」(irrelevant tasks)、「相反任务」(contradictory tasks) 的任务关系。

根据上图所示的实验结果,我们有以下观察:

  1. 在多任务学习和机器遗忘的实验中,最佳的任务运算系数会随着给定的任务向量间的关系的不同而改变。
  2. 在分布外泛化的实验中,目标任务与给定任务的正反相关性可以被最佳的任务运算系数的正负性反映出来。

以上的两点发现引向了一个重要的研究方向:任务关系会如何影响任务运算。

理论分析

我们在二分类问题的设定下研究该问题。我们以一层单头的带有 softmax attention 的 Transformer 为理论分析的基本模型,用 Ψ 来表示所有权重参数的集合,其中包括 attention 层的参数 W 以及 MLP 层的参数 V。仿照许多特征学习(feature learning)的理论工作,我们做如下的数据建模:定义 μ_T 为当前任务的 discriminative pattern。数据 X 中的每一个 token 都是从 μ_T、-μ_T 以及无关的 pattern 中选择的。如果对应于 μ_T 的 token 个数多于 -μ_T 的个数,那么 X 的标签 y=1。如果对应于 -μ_T 的 token 个数多于 μ_T 的个数,那么 X 的标签 y=-1。

接下来我们给出使用两个任务向量进行多任务学习和机器遗忘的理论结果。

定理 1的结果表明:当两个任务是相似的关系的时候,将任务向量叠加可以得到理想的多任务学习性能,即泛化误差在两个任务上都达到 ϵ。

定理 2的结果表明:当两个任务是相反关系时,用 T_1 的任务向量减去 T_2 的任务向量可以得到理想的机器遗忘性能,即 T_1 的泛化误差达到ϵ,而 T_2 的泛化误差较大。

定理 3的结果表明:总是存在一组 λ_i,使得融合多个任务向量得到的模型可以在目标任务 T' 上取得理想的泛化性能。

我们还在理论上论证了对任务向量进行高效应用的方法。在我们的一层 Transformer 以及二分类问题的框架下,我们得出了推论 1:任务向量可以被低秩近似,同时只会造成很小的预测误差。这意味着人们可以将各种低秩训练和推断方法用在任务向量中,从而大大节省任务向量的计算和存储开销。

我们还可以得到推论 2:训练得到的任务向量在 MLP 层中的部分神经元权重较大,而剩余的神经元权重很小。对这些小的神经元进行剪枝只会引起很小的误差,从而使得前面所有定理依然成立。这个推论为对于任务向量进行权重剪枝与稀疏化提供了理论保障。

实验验证

我们下图的结果表明:实验中得到的能够带来出色的分布外泛化性能的 λ_1,λ_2 区域(图 A 的红色部分)与定理 3 中证明得到的(图 B 的红色部分)一致。

我们接下来用 Phi-3-small (7B) 模型对任务向量在机器遗忘中的表现进行验证,所使用的数据集为《哈利波特 I》(HP1),《哈利波特 II》(HP2),《傲慢与偏见》(PP)。其中,由于出自相同的作者 J.K. 罗琳,《哈利波特 I》与《II》的语义相似度较高,而《傲慢与偏见》与另外两个数据集不太相似。

总结

本文定量证明了如何根据任务间关系确定任务运算系数,从而实现理想的多任务学习、机器遗忘、以及分布外泛化的方法,解释了使用低秩和稀疏任务向量的可靠性。本文的理论通过实验得到了验证。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
亏麻了!暴跌50%,跟不上时代的张坤,还能嘴硬多久?

亏麻了!暴跌50%,跟不上时代的张坤,还能嘴硬多久?

坠入二次元的海洋
2026-05-26 12:44:23
扑克牌中的12个历史人物,你知道几个?

扑克牌中的12个历史人物,你知道几个?

史不语
2026-05-20 11:40:03
章子怡现身女儿钢琴演奏会,低调抱儿子观看,汪峰发文大赞女儿

章子怡现身女儿钢琴演奏会,低调抱儿子观看,汪峰发文大赞女儿

韩小娱
2026-05-26 05:38:06
男子将24岁女孩撞成高位截瘫,得知要赔200万,灵机一动将名下2套房过户给女儿,女孩去要钱,男子:要钱没有,要命一条!

男子将24岁女孩撞成高位截瘫,得知要赔200万,灵机一动将名下2套房过户给女儿,女孩去要钱,男子:要钱没有,要命一条!

大爱三湘
2026-04-28 19:39:24
美光科技股价涨超20% 股价突破900美元大关

美光科技股价涨超20% 股价突破900美元大关

财联社
2026-05-27 02:25:08
晚饭七分饱被推翻了?医生发现:过了60岁,吃饭尽量要做到这4点

晚饭七分饱被推翻了?医生发现:过了60岁,吃饭尽量要做到这4点

健康之光
2026-05-26 21:15:03
再见艾顿!湖人首笔引援曝光,佩林卡终于行动了,东契奇迎帮手!

再见艾顿!湖人首笔引援曝光,佩林卡终于行动了,东契奇迎帮手!

体育大朋说
2026-05-26 12:47:53
马雅舒晒一家四口合照,女儿米雅又高又美,外籍老公显年轻仍很帅

马雅舒晒一家四口合照,女儿米雅又高又美,外籍老公显年轻仍很帅

尺素a
2026-05-24 22:16:14
从5人到0人:皇马在西班牙队的消亡史,不止是一份名单那么简单

从5人到0人:皇马在西班牙队的消亡史,不止是一份名单那么简单

落夜足球
2026-05-26 16:46:48
被抓后家中查出20吨黄金,秘密移民国外?赵本山私生活谣言太离谱

被抓后家中查出20吨黄金,秘密移民国外?赵本山私生活谣言太离谱

做一个合格的吃瓜群众
2026-04-06 17:10:33
属相猪留心:5月27号周三,有件重要事要“落”到你身上

属相猪留心:5月27号周三,有件重要事要“落”到你身上

小陆搞笑日常
2026-05-27 01:25:48
糖尿病人饭后半小时很关键,几个动作决定血糖走向!

糖尿病人饭后半小时很关键,几个动作决定血糖走向!

荷兰豆爱健康
2026-05-27 00:38:47
各位驾驶员注意!驾驶新规,6月1日起执行

各位驾驶员注意!驾驶新规,6月1日起执行

锦绣太原
2026-05-26 14:46:29
原来俄军打了两枚“榛树”导弹:一枚坠毁,一枚打偏!

原来俄军打了两枚“榛树”导弹:一枚坠毁,一枚打偏!

鹰眼Defence
2026-05-26 17:58:41
广东肇庆山里藏一片烂尾别墅,盖完没人要,开发商踩了什么坑?

广东肇庆山里藏一片烂尾别墅,盖完没人要,开发商踩了什么坑?

林子说事
2026-05-23 11:13:53
小鹏GX爆单!何小鹏:我的两台先不提了 给其他下定的朋友们

小鹏GX爆单!何小鹏:我的两台先不提了 给其他下定的朋友们

周哥一影视
2026-05-26 08:49:42
朋友圈疯传“I-485被斩断”?别慌!叫停是假,但这几类人必须立即调整策略

朋友圈疯传“I-485被斩断”?别慌!叫停是假,但这几类人必须立即调整策略

留学生日报
2026-05-26 20:54:05
女星谢依霖辟谣老公患渐冻症,否认对方隐瞒遗传病史:生第二胎时才发现患肌无力,无论何时遭遇病痛都会陪伴他

女星谢依霖辟谣老公患渐冻症,否认对方隐瞒遗传病史:生第二胎时才发现患肌无力,无论何时遭遇病痛都会陪伴他

鲁中晨报
2026-05-25 18:34:05
上海市市委常委、浦东区区委书记李政调研这几家港航企业,传递什么信号?!

上海市市委常委、浦东区区委书记李政调研这几家港航企业,传递什么信号?!

航运星球tech
2026-05-26 10:06:09
我年过六十岁才恍然大悟:为什么大多数女人都对六十岁以上的男人敬而远之,甚至会主动回避,两个原因

我年过六十岁才恍然大悟:为什么大多数女人都对六十岁以上的男人敬而远之,甚至会主动回避,两个原因

心理观察局
2026-05-04 08:51:10
2026-05-27 03:56:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13088文章数 142653关注度
往期回顾 全部

科技要闻

中国AI要向外卷,而不只是做第二个OpenAI

头条要闻

武契奇获授"友谊勋章":父母特意打电话 我们都哭了

头条要闻

武契奇获授"友谊勋章":父母特意打电话 我们都哭了

体育要闻

上赛季差点降入英甲,下赛季要踢英超了

娱乐要闻

台媒贴脸!S妈被问大S嗑药当场沉默

财经要闻

中国铝行业爆单 下一个“煤炭”大周期?

汽车要闻

涉水加强 福特烈马亚马逊限量版上市 售价39.98万

态度原创

健康
教育
本地
时尚
公开课

外泌体抗衰,什么时候能用上?

教育要闻

不是知错了,是怕了!家长投诉老师,被老师起诉,哭着求老师谅解

本地新闻

用云锦的方式,打开江苏南京

蓝色系穿搭太适合夏天了!快来看看这些穿搭示范,美得不重样

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版