网易首页 > 网易号 > 正文 申请入驻

比LoRA更高效!上交大&哈佛推出新微调框架,瞄准特定任务方向

0
分享至

DV lab 投稿
量子位 | 公众号 QbitAI

LoRA更高效的模型微调方法来了——

以常识推理为例,在参数量减少8~16倍的情况下,两种方法能达到相同效果。

新方法名叫LoRA-Dash,由来自上海交通大学和哈佛大学的研究人员提出,主要针对特定任务微调模型往往需要大量计算资源这一痛点。

研究完成的主要工作是:

  • 对高效微调过程中的TSD(Task-specific Directions,特定任务方向)进行了严格定义,并详细分析了其性质。
  • 为了进一步释放TSD在下游任务中的潜力,提出新的高效微调方法LoRA-Dash。

来看具体内容。

从头搭建特定任务方向的框架

随着大型语言模型的发展,针对特定任务微调模型往往需要大量计算资源。

为了解决这一问题,参数高效微调(PEFT)策略应运而生,像LoRA等方法被广泛应用。

在LoRA中,作者们通过一系列实验发现,LoRA本质上是捕捉一些预训练中已学习到的但并不重要的方向,这些方向对应的特征在之后的下游任务中被LoRA放大。

LoRA把这些方向定义为“特定任务方向”(Task-specific Directions, TSD)。

然而,在LoRA原论文关于TSD的叙述中却出现了一些矛盾和冲突

比如作者认为TSD是∆的最大的几个奇异值对应的奇异向量

然而这些从∆中得到的奇异向量基本不可能和的奇异向量一致。

这些冲突导致研究者们对TSD的概念很模糊,更别说利用这些方向。

为了解决这些问题,论文作者对高效微调过程中的TSD进行了严格的定义,并详细分析了其性质。

TSD的定义

首先,定义矩阵的基、矩阵的方向如下。

定义1:对于一个矩阵 ,其左奇异向量和右奇异向量分别由矩阵和表示,矩阵的基定义如下。

核心基:矩阵的核心基定义为

,其中每个

是由奇异向量和构成的秩为1的矩阵。

全局基:矩阵的全局基定义为

,对于所有, ,涵盖了左奇异向量和右奇异向量的所有组合。

定义2:矩阵 ∈ ℝx(其中 < )的方向基于其全局基定义,采用其奇异值∑的扩展集合,并用零填充。

具体表示为(1,0,…,0,2,0,…,0,n,…,0)∈ ℝx,即通过行展平的∑。

研究人员提醒道,任何全局基都可以视为一个单位方向,因为它的方向是一个one-hot的向量。

至于特定任务方向,作者们基于以下前提进行研究:

  • 对于任何特定任务,矩阵空间ℝx中存在一个最优矩阵

对于预训练权重矩阵,其针对该任务的最佳调整为∆=-。

在PEFT中,研究人员只能获得及其方向的信息。

由于∆和*的方向基于各自的基,他们首先将二者投影到的全局基上。

定义3:定义 ·(·)为将一个坐标系中的方向投影到另一个坐标系中的投影算子。

特别地,()=(11,…,)∈ ℝ是将矩阵 ∈ ℝx 的方向投影到矩阵 ∈ ℝx的全局基上。

基于矩阵的全局基,(*)表示需要演变的方向。

由于最多只能利用个核心基,它只能改变其方向的个值。

因此,重点关注核心方向的变化

变换过程中,不同核心方向的坐标值变化程度不同,受下游任务的多样性影响,某些核心方向可能变化显著,而其他方向变化较小。

定义的变化率衡量了第个核心方向的变化程度:

因此,研究人员定义TSD为:

对于某个特定任务和预训练权重矩阵,假设该任务的最优权重为,则该任务在上的TSD是指那些在从到的变化过程中,其坐标值表现出显著高变化率的核心方向。

TSD的性质及使用难点

作者通过一系列实验,得出了TSD的两个性质

  • TSD主要对应于较小但非最小的奇异值相关的核心方向。
  • TSD仅涵盖少数方向,这些方向在从到*的转变过程中具有显著的变化率,而其他大多数核心方向的变化率则较小或可以忽略不计。

尽管TSD的定义和性质已被充分探讨,但由于在微调之前∆和都是未知的,因此在实际操作中事先利用TSD信息几乎不可能

为解决这一挑战,作者假设LoRA的∆预测出的高变化率核心方向与TSD密切相关。

通过广泛实验,结果显示预测方向与实际TSD之间存在高度重叠,由此得出一个重要结论:

  • 无论LoRA的秩设置、训练步骤或模型层次如何,LoRA的∆一致地捕捉到了任务特定方向的信息。

这表明,即便在未知TSD的情况下,仍能通过LoRA训练中获得的∆捕捉到这些关键信息。

释放TSD潜力:LoRA-Dash

为了进一步释放TSD在下游任务中的潜力,研究人员提出了一个新的高效微调方法LoRA-Dash

LoRA-Dash包含两个主要阶段:

第一是“预启动阶段”。在此阶段,任务特定方向被识别。这是模型优化的关键部分,确保识别出最需要调整的方向。

具体而言,这一阶段中LoRA-Dash利用在t次更新之后得到的∆进行TSD的预测,确定下一阶段需要被调整的方向。

第二是“冲刺阶段”。在这一阶段,模型利用之前识别的TSD的潜力,进行微调优化,使预训练模型更好地适应特定任务。

具体而言,作者直接模拟TSD的坐标变化,加速模型的适应性调整,从而提升其在新任务中的表现。

LoRA-Dash的伪代码如图。

实验

作者们分别在常识推理(commonsense reasoning)、自然语言理解(natural language understanding)和主体驱动生成(subject-driven generation)任务上做了实验。

实验结果表明,LoRA-Dash在各个任务上都取得了远超LoRA的性能提升。

常识推理(使用LLAMA-7B,LLAMA2-7B以及LLAMA3-8B进行微调):

自然语言理解(使用DeBERTaV3-base和DeBERTaV3-large进行微调):

主体驱动生成(使用SDXL进行微调)。与LoRA相比,LoRA-Dash和原图的一致性更高,比如图中的狗和花瓶

实验结果证明了TSD对于下游任务的有效性,LoRA-Dash能够充分释放TSD的潜能,进一步激发高效微调的性能水平。

目前相关论文已公开,代码也已开源。

论文:
https://arxiv.org/pdf/2409.01035
代码:
https://github.com/Chongjie-Si/Subspace-Tuning
项目主页:
https://chongjiesi.site/project/2024-lora-dash.html

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
心理学上说,极度坦诚的人其实很可怕:开始,你可能觉得他傻、性子直,但慢慢会发现,他的境界极高,他的一切都可以摊开讲,打的全是明牌

心理学上说,极度坦诚的人其实很可怕:开始,你可能觉得他傻、性子直,但慢慢会发现,他的境界极高,他的一切都可以摊开讲,打的全是明牌

心理观察局
2026-05-22 07:29:28
周琦斗志遭质疑:最后两场仅7分与6分 下半场0分提前下场认输

周琦斗志遭质疑:最后两场仅7分与6分 下半场0分提前下场认输

醉卧浮生
2026-05-22 21:40:17
湖南一新郎婚礼当天去世后续,新娘不受婆家重视想撤销结婚证

湖南一新郎婚礼当天去世后续,新娘不受婆家重视想撤销结婚证

九方鱼论
2026-05-23 09:26:57
马英九露面澄清失智传言,手写签名自证 “不接受家人的医疗安排”

马英九露面澄清失智传言,手写签名自证 “不接受家人的医疗安排”

凤凰卫视
2026-05-22 18:13:52
最后20票,台岛投票结果出炉,郑丽文愤怒拍桌,人民日报敲响警钟

最后20票,台岛投票结果出炉,郑丽文愤怒拍桌,人民日报敲响警钟

娱乐圈的笔娱君
2026-05-23 06:25:27
从万众瞩目到黯然退场!伊万卡的十年梦醒与豪门权力真相

从万众瞩目到黯然退场!伊万卡的十年梦醒与豪门权力真相

别让往昔的悲伤和对未来的恐惧
2026-05-23 00:48:54
宋庆龄向毛主席求情,希望宽大处理陈璧君,陈:我情愿监狱度余生

宋庆龄向毛主席求情,希望宽大处理陈璧君,陈:我情愿监狱度余生

史之铭
2026-05-10 19:24:25
曾以5000万吞下22亿酒厂,12万吨陈酿套现32亿!河南前首富成老赖

曾以5000万吞下22亿酒厂,12万吨陈酿套现32亿!河南前首富成老赖

历史伟人录
2026-04-01 17:50:25
小鹏GX一夜爆单,李想余承东都没想到!

小鹏GX一夜爆单,李想余承东都没想到!

趣味萌宠的日常
2026-05-23 04:09:03
申京突袭欧冠半决赛现场 直言“火箭首轮被淘汰了我很遗憾”

申京突袭欧冠半决赛现场 直言“火箭首轮被淘汰了我很遗憾”

仰卧撑FTUer
2026-05-23 09:43:19
辛芷蕾哭了!陕西知名演员孙浩发文告别

辛芷蕾哭了!陕西知名演员孙浩发文告别

情感大头说说
2026-05-22 18:53:22
哈登谈骑士队G2惨败给尼克斯队:投不进,不知道是不是因为腿累了

哈登谈骑士队G2惨败给尼克斯队:投不进,不知道是不是因为腿累了

好火子
2026-05-22 23:29:15
“摸奶子”再惹争议,OPPO的流量反噬开始了

“摸奶子”再惹争议,OPPO的流量反噬开始了

品牌头版
2026-05-13 10:18:15
张雪接手奥迪项目,斥资研发五缸摩托2028年上路

张雪接手奥迪项目,斥资研发五缸摩托2028年上路

随遇而安之心
2026-05-10 00:47:03
谁炸了以色列核基地?48 小时惊天反转,特朗普不打伊朗了

谁炸了以色列核基地?48 小时惊天反转,特朗普不打伊朗了

面包夹知识
2026-05-20 18:34:32
歌手2026首播翻车!张碧晨跑调、胡彦斌破音,都被王菲女儿抢风头

歌手2026首播翻车!张碧晨跑调、胡彦斌破音,都被王菲女儿抢风头

一盅情怀
2026-05-23 10:06:21
一句话点评:中天科技(600522)到底值不值得投资?

一句话点评:中天科技(600522)到底值不值得投资?

小白鸽财经
2026-05-23 07:05:03
知名招聘网站申请破产!网友:这消息来得挺突然的

知名招聘网站申请破产!网友:这消息来得挺突然的

上观新闻
2026-05-22 06:55:05
小乔丹和娇妻近照,38岁没退役,二婚娶超模,曾因孩子太白测DNA

小乔丹和娇妻近照,38岁没退役,二婚娶超模,曾因孩子太白测DNA

大西体育
2026-05-22 16:13:19
你抛美债,我抛中债!外资纷纷减持中国债,大量资金流向美国?

你抛美债,我抛中债!外资纷纷减持中国债,大量资金流向美国?

混沌录
2026-04-22 20:55:37
2026-05-23 10:40:49
量子位 incentive-icons
量子位
追踪人工智能动态
12675文章数 176467关注度
往期回顾 全部

科技要闻

爆炸声中又迈一步!拆解马斯克“十二飞”

头条要闻

媒体:美国宣布暂停对台军售 中国大陆未表达"赞许"

头条要闻

媒体:美国宣布暂停对台军售 中国大陆未表达"赞许"

体育要闻

嘲讽许利民的发言,可许指导说错了吗?

娱乐要闻

周也恋情曝光!对象身份不简单

财经要闻

股价暴跌!富途老虎是什么来头?

汽车要闻

11万级直接上四驱 银河星耀7限时权益价9.88万起

态度原创

旅游
亲子
时尚
游戏
军事航空

旅游要闻

沿着高速读济宁!2026"交旅融合"推广月启幕 高速票据秒变文旅消费凭证

亲子要闻

伊能静谈48岁生子危险,两次手术闯鬼门关

520天猫把“短剧男友团”请来送礼了!将浪漫营销玩出新花样!

亚瑟"本人"谈《大镖客3》的可能性:不出才奇怪呢

军事要闻

俄罗斯试射具备核打击能力的高超音速导弹

无障碍浏览 进入关怀版