网易首页 > 网易号 > 正文 申请入驻

科学家提出模型编辑算法,实现Llama 3在知识编辑任务表现提升35%

0
分享至

近期,中国科学技术大学团队提出了一种精准编辑大语言模型内知识的算法 AlphaEdit,为大模型的知识更新和管理提供了一种高效解决方案。

该算法的核心思想是在对模型进行知识更新时,将参数变化投影到原始知识的零空间上。这种方法理论上保证了在定向更新大模型内错误、过时和不安全知识时,模型的通用能力不会受到干扰。

值得关注的是,研究人员在主流编辑方法只加入一行代码,就实现了 Llama 3 在知识编辑任务表现性能提升 35%。

该方法具有普适性,可以应用于大多数常用的模型编辑算法,并且在论文中的测试结果中得到了验证。

审稿人之一对该论文评价称:“该研究有效解决了当前模型编辑中知识更新和保留间始终难以平衡的问题。”

日前,相关论文以《AlphaEdit:基于零空间约束的语言模型知识编辑》(AlphaEdit: Null-Space Constrained Knowledge Editing for Language Models)为题发表在国际学习表征会议(ICLR 2025,International Conference on Learning Representations)上,并被遴选为 Oral Presentation(仅占投稿总数的 1.8%)。

中国科学技术大学博士生方俊峰和硕士生姜厚丞是共同第一作者,王翔教授和何向南教授担任共同通讯作者。

该课题组发现,以往研究通常将“加入新知识”和“保留旧知识”这两个目标放在一起。目前,大多数研究范式通过调整优化目标中二者的参数来维持平衡。

但是,现有的平衡方式并不理想,往往会为了保证新知识的成功加入而牺牲一部分旧知识,进而影响模型的语言流畅性和逻辑性。这种权衡在频繁更新知识的情况下,容易导致模型崩溃。

为解决上述问题,他们大胆提出:是否可以打破这种限制,而是每一步只需要处理一件事呢?

研究人员在查阅大量数学文献和理论后,找到了经典数学概念——零空间。零空间理论能够在不破坏旧知识的情况下,完美地保留新知识,从而实现对模型的无损更新。

“虽然只加入一行代码听起来很简单,但它将原本算法目标的两部分简化为一部分,通过零空间投影矩阵将结果投影到原始知识的零空间中。这种简化使得它具有很强的泛化性,并且其适用于目前大部分基于定位的模型编辑算法。”方俊峰说。

实验结果显示,AlphaEdit 在几乎所有指标和基础模型上都取得了优越的性能,特别是在效率和泛化能力上,与最佳基线方法相比,平均提升了 12.54% 和 16.78%。

此外,AlphaEdit 在文本生成的流畅性和连贯性方面也表现出显著的改进。在对编辑后的大模型进行的一般能力测试中,AlphaEdit 保持了模型的原始性能,在编辑了 3000 个样本后,平均保留了 98.48% 的模型一般能力。

值得关注的是,该方法对模型的语言输出流畅度几乎没有造成损害。方俊峰指出,“我们的方法是目前唯一能够在理论上彻底避免这种情况的解决方案。”

此外,研究人员还验证了该方法具有普适性,其在遗忘学习、持续学习、概念擦除、模型去偏和多模态安全等领域,都可实现简单且好用的效果。

模型编辑是大模型发展过程中非常重要的一环。随着模型架构的不断增大,其效果也在持续增强。未来随着算力的提升,可能会出现更大规模的模型架构。

然而,模型规模的增大也带来了新的挑战。尽管小模型可通过微调快速更新知识,但对大模型进行微调的难度将随着规模的增大而显著增加。因此,高效、精确的模型编辑在这种背景下显得尤为重要。

此外,在垂类大模型能力持续增强的发展趋势下,基础模型本身的迭代更新或被推迟,而模型编辑可以在官方更新缓慢的情况下,快速响应市场和用户的需求,保持模型的时效性和实用性。

尽管目前的模型编辑方法在理论方面不会对旧知识造成破坏,但实际操作中仍会存在一些近似误差,导致微小的破坏。

“此前,模型编辑由于破坏较为严重难以被工业界接受,可能几千次更新就会导致模型崩溃。但如今,我们已经将这种破坏降低了 1 个数量级,这使模型编辑的意义变得更加重大。”方俊峰说。

在接下来的研究阶段,该课题组首先计划将这项技术推广到更多国内外知名的大模型中,以验证其通用性和泛化性。

其次,他们计划探索将零空间应用于不同的垂直领域,例如安全防护或多模态生成,以在增强大模型安全性、提升特定能力的同时,确保原始存储知识的逻辑表达能力不受影响。

此外,研究人员还考虑利用零空间来增强大模型的某个特定能力,比如针对艺术、生化、数学等领域的模型,或定制化模型(如定制家教)。该团队认为,将这项技术应用于持续学习等深度学习领域,也是具有研究价值的方向之一。

参考资料:

1.https://openreview.net/forum?id=HvSytvg3Jh

2.https://github.com/jianghoucheng/AlphaEdit

运营/排版:何晨龙、刘雅坤

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国股市会不会取代楼市,成为居民主要的资产性收入来源?

中国股市会不会取代楼市,成为居民主要的资产性收入来源?

流苏晚晴
2026-02-25 18:13:43
山东高铁全面爆发!2026年预计双线通车,鲁西鲁北告别绕行时代

山东高铁全面爆发!2026年预计双线通车,鲁西鲁北告别绕行时代

瓜哥的动物日记
2026-02-27 16:21:14
阿斯报道莱斯特城:十年间从天堂坠入地狱,球队濒临降级英甲

阿斯报道莱斯特城:十年间从天堂坠入地狱,球队濒临降级英甲

懂球帝
2026-02-27 13:41:53
真相大白!张本智和输球原因曝光,终于不吼了,王楚钦林诗栋冲冠

真相大白!张本智和输球原因曝光,终于不吼了,王楚钦林诗栋冲冠

曹说体育
2026-02-27 23:48:30
这就是公开辱华的后果!取消冠军头衔只是开始,职业生涯也全毁了

这就是公开辱华的后果!取消冠军头衔只是开始,职业生涯也全毁了

阿凫爱吐槽
2025-12-17 17:24:39
湖南女子与丈夫丁克40年,备受宠爱,退休后才知丈夫已三世同堂

湖南女子与丈夫丁克40年,备受宠爱,退休后才知丈夫已三世同堂

晓艾故事汇
2024-12-12 20:17:15
别再自我感动了!借钱不还的人,根本不是忘了,是算准了你好欺负

别再自我感动了!借钱不还的人,根本不是忘了,是算准了你好欺负

智慧生活笔记
2026-02-28 05:31:19
“阴伟达”来了?首个儿童小阴茎专用药获批

“阴伟达”来了?首个儿童小阴茎专用药获批

中国新闻周刊
2026-02-26 19:01:05
两极反转!网友被父母的老式旅游折服了!评论区全部是真香现场

两极反转!网友被父母的老式旅游折服了!评论区全部是真香现场

另子维爱读史
2026-02-26 21:36:17
江苏一店推出闭关项目,价格2980到19800元不等,不让带手机等个人物品被质疑“花钱关禁闭”,工作人员回应:每个人看事物不一样

江苏一店推出闭关项目,价格2980到19800元不等,不让带手机等个人物品被质疑“花钱关禁闭”,工作人员回应:每个人看事物不一样

大象新闻
2026-02-27 10:45:04
范冰冰坐镇国外杂志封面,带来鬼魅写真~

范冰冰坐镇国外杂志封面,带来鬼魅写真~

美剧组|人人影视
2026-02-27 23:24:52
副省长升任省委常委后,新职务明确!两个省委领导班子调整

副省长升任省委常委后,新职务明确!两个省委领导班子调整

上观新闻
2026-02-27 18:59:22
男子因系统错误“欠款1000万亿元”,远超中国年度GDP总量,征信黑了3年,125万贷款逾期

男子因系统错误“欠款1000万亿元”,远超中国年度GDP总量,征信黑了3年,125万贷款逾期

观威海
2026-02-27 18:23:07
福建舰有多烧钱?电磁弹射超百亿,伙食费能供养一个小型国家!

福建舰有多烧钱?电磁弹射超百亿,伙食费能供养一个小型国家!

孤单是寂寞的毒
2026-02-27 12:40:06
美方要求中方参加中美俄三边核裁军谈判,外交部:不公平、不合理也不可行!“中国的核力量同美俄完全不在一个量级”

美方要求中方参加中美俄三边核裁军谈判,外交部:不公平、不合理也不可行!“中国的核力量同美俄完全不在一个量级”

每日经济新闻
2026-02-27 17:25:20
王天辰:住北京部队大院,身高185帅气迷人,出道10年终于火了

王天辰:住北京部队大院,身高185帅气迷人,出道10年终于火了

陈意小可爱
2026-02-27 11:10:14
春天,少吃苹果多吃它,一次买20斤,晒干囤起来,从春天吃到夏天

春天,少吃苹果多吃它,一次买20斤,晒干囤起来,从春天吃到夏天

阿龙美食记
2026-02-26 19:13:38
78岁连路都走不稳还开演唱会,全网骂声一片,她却扬言回馈粉丝

78岁连路都走不稳还开演唱会,全网骂声一片,她却扬言回馈粉丝

洲洲影视娱评
2026-01-28 12:23:18
上海警方通报:全市首例!3名"00后"被刑拘!1人为数学系博士

上海警方通报:全市首例!3名"00后"被刑拘!1人为数学系博士

新浪财经
2026-02-27 17:06:34
内蒙古自治区人民政府办公厅印发通知!事关重大电网项目选址用地

内蒙古自治区人民政府办公厅印发通知!事关重大电网项目选址用地

青城之窗
2026-02-28 06:04:43
2026-02-28 06:51:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16333文章数 514667关注度
往期回顾 全部

科技要闻

狂揽1100亿美元!OpenAI再创融资神话

头条要闻

特朗普警告伊朗:“有时候不得不打”

头条要闻

特朗普警告伊朗:“有时候不得不打”

体育要闻

一场必须要赢的比赛,男篮何止击败了裁判

娱乐要闻

郭晶晶霍启刚现身香港艺术节尽显恩爱

财经要闻

沈明高提共富建议 百姓持科技股国家兜底

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

亲子
时尚
数码
健康
军事航空

亲子要闻

今年过年和父母闹别扭了吗?希望小女孩能找到和父母相处最舒服的方式

舒淇最爱穿的裙子搭配,真的很适合春天!

数码要闻

Omdia:时隔5年,小米去年再度回归可穿戴设备出货榜首

转头就晕的耳石症,能开车上班吗?

军事要闻

美国11架F-22隐形战机抵达以色列

无障碍浏览 进入关怀版