网易首页 > 网易号 > 正文 申请入驻

参数高效微调新范式!上海交大联合上海AI Lab推参数冗余微调算法

0
分享至


本文作者来自复旦大学、上海交通大学和上海人工智能实验室。一作江书洋为复旦大学和实验室联培的博二学生,目前是实验室见习研究员,师从上海交通大学人工智能学院王钰教授。本文通讯作者为王钰教授与张娅教授。

低秩适配器(LoRA)能够在有监督微调中以约 5% 的可训练参数实现全参数微调 90% 性能。然而,在 LoRA 训练中,可学习参数不仅注入了知识,也学习到了数据集中的幻觉噪声。因为这种特性的存在,大多数的 LoRA 参数都将可学习秩设置为一个较小的值(8 或者 16),通过减小知识学习程度来避免幻觉,而这也限制了 LoRA 的性能上限

图 1 普通的 LoRA 微调随着秩的增大性能无法同步增加,而参数冗余微调能够以冗余参数提升性能。

为了解决这个问题,上海交通大学人工智能学院、复旦大学和上海人工智能实验室的团队提出了参数冗余微调范式以及一种创新性的微调算法:NoRM(Noisy Reduction with Reserved Majority)。参数冗余微调范式下,可以以普通的 LoRA 训练方式进行训练,并使用特定的方法在将 LoRA 参数合并回基模型参数前将冗余部分去除。NoRM 通过 SVD 将 LoRA 参数分解为主成分和冗余成分,并提出了 Sim-Search 方法,以子空间相似度动态决定主成分的数量。评估结果显示,NoRM 在指令微调、数学推理和代码生成的任务上一致性强于 LoRA 和其他参数冗余微调方法,实现无痛涨点。

  • 论文链接:https://openreview.net/pdf?id=ZV7CLf0RHK
  • 开源代码:https://github.com/pixas/NoRM
  • 论文标题:FINE-TUNING WITH RESERVED MAJORITY FOR NOISE REDUCTION

研究动机

研究者首先在 Llama3-8B-Instruct 上进行预备实验,使用 MetaMathQA-395K 数据集对模型进行微调,并在 SVAMP 上进行测试。研究者通过三个方面探究微调过程中的冗余现象:(1)随机删除 10%~90% 的 LoRA 参数通道;(2)使用(1)中的方法,对 Transformer 中的不同层的 LoRA 参数进行随机删除;(3)使用(1)的方法,对 Transformer 中的不同模块的 LoRA 参数进行随机删除。实验结果发现,不仅随机删除 LoRA 参数能够提升下游模型的性能,不同层之间和模块之间删除 LoRA 参数对性能的影响呈现一定的规律。

图 2 随机删除比例(a)的性能变化曲线和模型层索引(b)以及模块(c)上的性能分布。对达成最好性能的保留比例用深蓝色重点展示。

方法概述

在 LoRA 微调中,并不是直接更新参数,而是更新一个低秩表达:。这个表达假设了参数的更新过程中,只在秩以内进行变化。在参数冗余微调中,为了高效减小参数冗余度,并能够根据不同模块和层之间的冗余不同去设计算法,研究者们首先考虑直接使用奇异值分解(SVD)对参数更新部分进行分解:

其中为左右奇异矩阵,是包含了奇异值的对角矩阵。一种朴素的思想是保留最大的个奇异值和响应的奇异向量:

然而,通过这种方法只能得到整体的更新参数,无法得到两个 LoRA 参数分别去除冗余后的分量。为了能够获得一个在预处理和参数存储上都更加高效的算法,研究者转向使用随机 SVD 来分别近似 和。特别地,随机 SVD 以高斯分布初始化一个随机矩阵:

图 3 NoRM 的算法总览。其使用随机奇异值分解来提取 delta 参数的主成分,并使用(b)Sim-Search 基于裁剪后的 delta 权重和预训练权重间的子空间相似度决定拥有最小幻觉成分的 c 个通道。

接着,计算的主要列子空间:来近似特征空间。在此之后,通过对的QR分解得到的正交基的近似。基于此正交基,可以在的低维空间上得到delta权重的投影:

那么在这个小矩阵上执行标准SVD就可以得到:

其中,然后将转化回去来近似奇异向量:。基于上述计算量,可以重构近似处理后的低秩参数:

确定好整个计算流程后,研究者们通过一种Sim-Search的方法来确定要保留的分量。这种方法通过预先设置好的两个搜索超参数,搜索步数和搜索步长,得到一组不同下的低秩分量,以及所对应的delta权重。研究者对每一个delta权重使用SVD计算主要的个奇异矩阵:

并使用同样的公式对基模型的权重进行同样的分解得到。通过提取个和的左奇异向量来计算子空间相似度:

其中

。基于计算好的Grassmann距离,可以选择这一组中拥有最大Grassmann距离的值及对应的delta权重和:

实验结论

NoRM 通过在三种不同的基模型以及三个不同的微调任务上进行实验,展现出强大的性能。

实验 1:指令微调实验

该任务主要测试,对 Instruct 模型进行微调后,如何保证多任务间的泛化性。通过和不同的 PEFT 基线进行比较,NoRM 在所有基模型上相比于最好的 PEFT 方法有着约 5 个点的提升。和之前最强的冗余微调方法 TAIA 相比,也有着 1~3 个点的提升,展现了 NoRM 强大的冗余去除能力。

实验 2:专域微调实验

该任务主要测试通过 NoRM 去除了冗余成分后,是否会对下游知识的学习造成影响。该实验选择 Llama3-8B 作为基模型,在数学推理和代码生成上进行测试。实验结果表明,由于 NoRM 可以使用更大的秩进行微调,在下游知识的吸收上,也优于之前的 PEFT 方法约 4 个点,领先 TAIA 约 3 个点。

实验 3:可学习参数对 NoRM 的影响

NoRM 通过对可微调参数中的冗余部分进行自适应去除降低微调幻觉。本实验中,通过改变秩的大小,NoRM 的性能随着可微调参数的增加而增加,而 LoRA 的性能并没有这样的趋势,这也映证了微调参数中存在大量冗余,这也是 LoRA 无法使用大秩提升性能的原因之一。

图 4 NoRM 可以从大秩中受益,但基础的 LoRA 在秩增大后反而降低性能。

实验 4:NoRM 的学忘比

通过对 LoRA 和 NoRM 在记住预训练知识的能力上进行比较,可以证实 NoRM 的设计哲学在于尽可能保留下游语料中和预训练参数中重叠最大的部分。通过测试在 WikiText-103 测试集上的损失函数值,可以看到 NoRM 的损失降低,而 LoRA 相比于基模型都有着一定程度上的升高。

结论和展望

这篇工作发现了有趣的高效参数冗余现象,并提出了 NoRM 算法来智能识别并保留最有价值的参数,同时去除有着负面作用的冗余参数,给微调参数做了一次 “减重手术”。在目前强化学习微调盛行的当下,可以将 NoRM 的设计哲学迁移到强化学习中,通过去除数据中会带来噪声的成分,提升模型下游任务的适配性和多任务之间的泛化性。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
康熙用30名宫女做“试验”,结果导致四人死亡,试验成果至今受用

康熙用30名宫女做“试验”,结果导致四人死亡,试验成果至今受用

观史搜寻着
2026-04-12 10:45:23
毕业于哈工大的中国籍连环迷奸犯 在德国被判囚14年

毕业于哈工大的中国籍连环迷奸犯 在德国被判囚14年

吃瓜体
2026-02-11 14:25:36
4换1!森林狼报价伦纳德!重磅交易方案曝光

4换1!森林狼报价伦纳德!重磅交易方案曝光

篮球实战宝典
2026-05-27 19:39:43
90%退休职工全搞错!个人档案根本不在社保局,难怪养老金吃亏

90%退休职工全搞错!个人档案根本不在社保局,难怪养老金吃亏

小影的娱乐
2026-05-28 11:31:53
华为韬定律到底含金量如何?现在的舆论环境,就是不让人说实话

华为韬定律到底含金量如何?现在的舆论环境,就是不让人说实话

担扑
2026-05-27 16:17:14
卢伟展望总决赛G2:洛夫顿出战看个人,直指困难,表扬国内球员!

卢伟展望总决赛G2:洛夫顿出战看个人,直指困难,表扬国内球员!

篮球资讯达人
2026-05-28 12:54:19
曝光了!哈登第一心仪下家!已经离开整整5年时间

曝光了!哈登第一心仪下家!已经离开整整5年时间

篮球实战宝典
2026-05-27 20:39:24
装修5天就入住,曾沛慈、阚清子、孙怡、谢楠、范玮琪相继出现咽痛、流鼻血、麦粒肿等症状,《乘风2026》宿舍被指甲醛超标

装修5天就入住,曾沛慈、阚清子、孙怡、谢楠、范玮琪相继出现咽痛、流鼻血、麦粒肿等症状,《乘风2026》宿舍被指甲醛超标

大风新闻
2026-05-28 11:11:09
南部战区对荷兰侵入舰机警示电子干扰,专家:已相当克制

南部战区对荷兰侵入舰机警示电子干扰,专家:已相当克制

环球网资讯
2026-05-27 22:59:11
晚到却是全球第一!纯电轿跑续航635km,拥有50万的档次仅售15万多

晚到却是全球第一!纯电轿跑续航635km,拥有50万的档次仅售15万多

隔壁说车老王
2026-05-28 07:56:36
白玉兰奖入围名单出炉:3人实至名归,2人镀金成功,1人被骂惨

白玉兰奖入围名单出炉:3人实至名归,2人镀金成功,1人被骂惨

君笙的拂兮
2026-05-27 13:15:11
蔚来ES9上市:李斌称是公司集大成之作 姚明是首席体验官

蔚来ES9上市:李斌称是公司集大成之作 姚明是首席体验官

雷递
2026-05-28 13:00:15
并非危言耸听:印度,正被遗弃在酷热中自生自灭

并非危言耸听:印度,正被遗弃在酷热中自生自灭

小莜读史
2026-05-27 04:25:03
诬告朱军性骚扰的“弦子”,终于被封禁了

诬告朱军性骚扰的“弦子”,终于被封禁了

韬闻
2026-05-27 12:46:12
57岁大妈做饭爱加蚝油,2年后去医院体检,医生疑惑平时咋吃的?

57岁大妈做饭爱加蚝油,2年后去医院体检,医生疑惑平时咋吃的?

芹姐说生活
2026-05-27 22:40:29
中国男篮VS塞尔维亚球队!全新阵容亮相,赵维仑首秀,央视直播

中国男篮VS塞尔维亚球队!全新阵容亮相,赵维仑首秀,央视直播

体坛瞎白话
2026-05-28 09:59:00
湖北大娘讹收割机后续:警方介入,当地人曝恶行

湖北大娘讹收割机后续:警方介入,当地人曝恶行

草莓信箱
2026-05-28 03:42:14
女子坐网约车对司机心动,高情商追爱!客服:我只是个工具人罢了

女子坐网约车对司机心动,高情商追爱!客服:我只是个工具人罢了

用车指南
2026-05-27 10:02:03
“不认识他,上来就扇我媳妇的脸,给她打个脑震荡”,河南一小区多位业主称物业经理喝酒后,对业主们又打又骂无差别攻击,警方已立案调查

“不认识他,上来就扇我媳妇的脸,给她打个脑震荡”,河南一小区多位业主称物业经理喝酒后,对业主们又打又骂无差别攻击,警方已立案调查

潇湘晨报
2026-05-27 21:20:16
尼泊尔为何愿意放弃7万平方公里,却对372平方公里寸土必争?

尼泊尔为何愿意放弃7万平方公里,却对372平方公里寸土必争?

究竟谁主沉浮
2026-05-27 08:56:11
2026-05-28 15:04:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13102文章数 142653关注度
往期回顾 全部

科技要闻

台积电3纳米下半年涨价15% 明年或再涨10%

头条要闻

男子疑遭妻子家暴跳楼身亡:女儿没考好 妻子要罚他5万

头条要闻

男子疑遭妻子家暴跳楼身亡:女儿没考好 妻子要罚他5万

体育要闻

如果雷霆拼图是这水平 马刺确实打不过

娱乐要闻

广电总局发布2026年“微短剧+”行动计划推荐剧目

财经要闻

长鑫科技IPO过会,市值会到几万亿?

汽车要闻

限时补贴价9.28-10.98万 MG 4X正式上市

态度原创

游戏
亲子
教育
家居
军事航空

《巫师3》新图藏玄机!为《巫师4》剧情埋伏笔?

亲子要闻

女儿以为爸爸给买的礼物,高兴的不知所措,知道是别人的反应太逗

教育要闻

高考536分捡漏进北大,曾被北大三次退档,省教育厅两次驳回,后以专业第一考上北大研究生

家居要闻

蜂鸟餐椅 线面交错

军事要闻

美锁定伊朗打击新目标 考虑重启军事行动

无障碍浏览 进入关怀版