网易首页 > 网易号 > 正文 申请入驻

科学家提出模型编辑算法,实现Llama 3在知识编辑任务表现提升35%

0
分享至

近期,中国科学技术大学团队提出了一种精准编辑大语言模型内知识的算法 AlphaEdit,为大模型的知识更新和管理提供了一种高效解决方案。

该算法的核心思想是在对模型进行知识更新时,将参数变化投影到原始知识的零空间上。这种方法理论上保证了在定向更新大模型内错误、过时和不安全知识时,模型的通用能力不会受到干扰。

值得关注的是,研究人员在主流编辑方法只加入一行代码,就实现了 Llama 3 在知识编辑任务表现性能提升 35%。

该方法具有普适性,可以应用于大多数常用的模型编辑算法,并且在论文中的测试结果中得到了验证。

审稿人之一对该论文评价称:“该研究有效解决了当前模型编辑中知识更新和保留间始终难以平衡的问题。”

日前,相关论文以《AlphaEdit:基于零空间约束的语言模型知识编辑》(AlphaEdit: Null-Space Constrained Knowledge Editing for Language Models)为题发表在国际学习表征会议(ICLR 2025,International Conference on Learning Representations)上,并被遴选为 Oral Presentation(仅占投稿总数的 1.8%)。

中国科学技术大学博士生方俊峰和硕士生姜厚丞是共同第一作者,王翔教授和何向南教授担任共同通讯作者。

该课题组发现,以往研究通常将“加入新知识”和“保留旧知识”这两个目标放在一起。目前,大多数研究范式通过调整优化目标中二者的参数来维持平衡。

但是,现有的平衡方式并不理想,往往会为了保证新知识的成功加入而牺牲一部分旧知识,进而影响模型的语言流畅性和逻辑性。这种权衡在频繁更新知识的情况下,容易导致模型崩溃。

为解决上述问题,他们大胆提出:是否可以打破这种限制,而是每一步只需要处理一件事呢?

研究人员在查阅大量数学文献和理论后,找到了经典数学概念——零空间。零空间理论能够在不破坏旧知识的情况下,完美地保留新知识,从而实现对模型的无损更新。

“虽然只加入一行代码听起来很简单,但它将原本算法目标的两部分简化为一部分,通过零空间投影矩阵将结果投影到原始知识的零空间中。这种简化使得它具有很强的泛化性,并且其适用于目前大部分基于定位的模型编辑算法。”方俊峰说。

实验结果显示,AlphaEdit 在几乎所有指标和基础模型上都取得了优越的性能,特别是在效率和泛化能力上,与最佳基线方法相比,平均提升了 12.54% 和 16.78%。

此外,AlphaEdit 在文本生成的流畅性和连贯性方面也表现出显著的改进。在对编辑后的大模型进行的一般能力测试中,AlphaEdit 保持了模型的原始性能,在编辑了 3000 个样本后,平均保留了 98.48% 的模型一般能力。

值得关注的是,该方法对模型的语言输出流畅度几乎没有造成损害。方俊峰指出,“我们的方法是目前唯一能够在理论上彻底避免这种情况的解决方案。”

此外,研究人员还验证了该方法具有普适性,其在遗忘学习、持续学习、概念擦除、模型去偏和多模态安全等领域,都可实现简单且好用的效果。

模型编辑是大模型发展过程中非常重要的一环。随着模型架构的不断增大,其效果也在持续增强。未来随着算力的提升,可能会出现更大规模的模型架构。

然而,模型规模的增大也带来了新的挑战。尽管小模型可通过微调快速更新知识,但对大模型进行微调的难度将随着规模的增大而显著增加。因此,高效、精确的模型编辑在这种背景下显得尤为重要。

此外,在垂类大模型能力持续增强的发展趋势下,基础模型本身的迭代更新或被推迟,而模型编辑可以在官方更新缓慢的情况下,快速响应市场和用户的需求,保持模型的时效性和实用性。

尽管目前的模型编辑方法在理论方面不会对旧知识造成破坏,但实际操作中仍会存在一些近似误差,导致微小的破坏。

“此前,模型编辑由于破坏较为严重难以被工业界接受,可能几千次更新就会导致模型崩溃。但如今,我们已经将这种破坏降低了 1 个数量级,这使模型编辑的意义变得更加重大。”方俊峰说。

在接下来的研究阶段,该课题组首先计划将这项技术推广到更多国内外知名的大模型中,以验证其通用性和泛化性。

其次,他们计划探索将零空间应用于不同的垂直领域,例如安全防护或多模态生成,以在增强大模型安全性、提升特定能力的同时,确保原始存储知识的逻辑表达能力不受影响。

此外,研究人员还考虑利用零空间来增强大模型的某个特定能力,比如针对艺术、生化、数学等领域的模型,或定制化模型(如定制家教)。该团队认为,将这项技术应用于持续学习等深度学习领域,也是具有研究价值的方向之一。

参考资料:

1.https://openreview.net/forum?id=HvSytvg3Jh

2.https://github.com/jianghoucheng/AlphaEdit

运营/排版:何晨龙、刘雅坤

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
叶珂生女后不再隐忍!挑明与黄晓明分手真相,原来baby才是天花板

叶珂生女后不再隐忍!挑明与黄晓明分手真相,原来baby才是天花板

橙星文娱
2026-05-14 10:26:46
央视把世界杯版权玩成印钞机:4亿成本,12天回本,净赚28亿

央视把世界杯版权玩成印钞机:4亿成本,12天回本,净赚28亿

体坛狗哥
2026-05-29 10:08:28
凌晨4点排队抢中职名额:非京籍孩子的出路,家长最后的倔强

凌晨4点排队抢中职名额:非京籍孩子的出路,家长最后的倔强

右右细毛和爸妈
2026-05-29 13:23:12
辽宁铁人连胜!会做人:徐正源挨个安抚对手,对海港主帅躬身帖耳

辽宁铁人连胜!会做人:徐正源挨个安抚对手,对海港主帅躬身帖耳

足球大腕
2026-05-29 23:07:35
美国人发现,美国近三十年来最大外交失误,可能就是阻止中国统一

美国人发现,美国近三十年来最大外交失误,可能就是阻止中国统一

呼呼历史论
2026-05-30 01:49:40
72岁TVB绿叶在成都提新车,自曝已在当地买房,每年旅居住三个月

72岁TVB绿叶在成都提新车,自曝已在当地买房,每年旅居住三个月

树娃
2026-05-28 13:20:21
如果雷霆这次无法跨过马刺,亚历山大可能这辈子都别想拿MVP了?

如果雷霆这次无法跨过马刺,亚历山大可能这辈子都别想拿MVP了?

稻谷与小麦
2026-05-29 22:12:37
江姐临刑遭特务刁难,被逼脱去衣履,背后缘由格外残酷

江姐临刑遭特务刁难,被逼脱去衣履,背后缘由格外残酷

唠叨说历史
2026-05-27 14:45:34
我刚进省政府办,主任就把32岁女厅长介绍给我,我连忙说不敢高攀,她往椅背一靠:我让你点头你就点头

我刚进省政府办,主任就把32岁女厅长介绍给我,我连忙说不敢高攀,她往椅背一靠:我让你点头你就点头

麦子情感故事
2026-05-29 19:18:15
皇马与穆帅、本菲卡保持现状;皇马有意的利物浦中卫今夏成自由身

皇马与穆帅、本菲卡保持现状;皇马有意的利物浦中卫今夏成自由身

福酱的小时光
2026-05-30 06:38:42
连休3天!上海多校通知:下周一放假1天!期末考时间最早6.16开考

连休3天!上海多校通知:下周一放假1天!期末考时间最早6.16开考

金哥说新能源车
2026-05-29 18:31:50
亨利:瓜帅让我重新认识足球;作为枪迷解说欧冠决赛会很痛苦

亨利:瓜帅让我重新认识足球;作为枪迷解说欧冠决赛会很痛苦

懂球帝
2026-05-30 06:38:03
多人跟投大V私募几乎亏光,有人140万只赎回2732元,“不闹赔三成、闹赔四五成 威胁赔七成”

多人跟投大V私募几乎亏光,有人140万只赎回2732元,“不闹赔三成、闹赔四五成 威胁赔七成”

每日经济新闻
2026-05-30 00:29:58
人口大迁徙已是定局?明后年,越来越多人会流入这4座城市?

人口大迁徙已是定局?明后年,越来越多人会流入这4座城市?

空谷幽幽蓝
2026-05-28 20:33:01
为28元外卖恶意投诉骑手!985女白领遭全网社死,已被公司开除

为28元外卖恶意投诉骑手!985女白领遭全网社死,已被公司开除

网络易不易
2026-05-30 06:00:32
辽宁队战胜海港,徐正源指导鼓舞士气

辽宁队战胜海港,徐正源指导鼓舞士气

十三哥侃大山
2026-05-30 05:51:13
可爱可甜可乐的俏皮女孩

可爱可甜可乐的俏皮女孩

疾跑的小蜗牛
2026-05-29 19:49:57
尿检清白、裁判换人、特训变度假:CBA一夜之间,三个反转

尿检清白、裁判换人、特训变度假:CBA一夜之间,三个反转

酷侃体坛
2026-05-29 10:02:14
竟然全胜,国羽6席闯入新加坡公开赛4强,大概能拿1冠

竟然全胜,国羽6席闯入新加坡公开赛4强,大概能拿1冠

真理是我亲戚
2026-05-29 22:50:35
老人最适合吃的高蛋白,虾肉只排第四,第一名很多人都不知道!

老人最适合吃的高蛋白,虾肉只排第四,第一名很多人都不知道!

健康科普365
2026-05-28 19:04:58
2026-05-30 07:00:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16767文章数 514986关注度
往期回顾 全部

科技要闻

Claude Opus 4.8凌晨突发上线

头条要闻

释永信被判24年 中国佛教协会:完全是咎由自取

头条要闻

释永信被判24年 中国佛教协会:完全是咎由自取

体育要闻

即使是文班亚马,也做不到这件事

娱乐要闻

奚梦瑶何猷君将于6月在法国举行婚礼

财经要闻

近3个月跌超20% 黄金"猴市"下的众生相

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

家居
数码
健康
教育
公开课

家居要闻

云栖 舒展如流云

数码要闻

499元!vivo首款头戴降噪耳机发布:58dB降噪!75小时续航

尝试干细胞疗法如何避免踩坑?

教育要闻

动点定值问题,一个视频学会!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版