网易首页 > 网易号 > 正文 申请入驻

ACL 2024 | 牵一发而动全身—知识图谱增强的大模型知识编辑新策略

0
分享至

大语言模型虽然具有强大的生成能力,但知识过时、事实错误的问题限制了其在实际应用中的可靠性,特别是在如医疗和法律的关键领域中。传统微调方法存在参数破坏和遗忘问题。基于以上问题,本文提出了基于知识图谱增强的模型编辑方法(GLAME,Graphs for LArge language Model Editing)。GLAME通过引入外部知识图谱,捕捉并建模知识间的关联变化,从而实现对目标知识及其关联知识的协同编辑,克服了现有方法只能编辑孤立知识的局限性,提高了模型的泛化能力。

论文题目: Knowledge Graph Enhanced Large Language Model Editing, ACL Findings, 2024 论文链接: https://arxiv.org/abs/2402.13593

一、背景与动机

大语言模型凭借其强大的生成能力和蕴含的丰富知识在各种任务中表现卓越。然而,大模型中可能存在知识过时、事实错误等问题,这限制了大模型在实际应用中的可靠性。在一些关键领域的实际场景,如医疗诊断或法律咨询中,过时和错误的知识可能导致严重的后果。如何对大模型中的知识进行准确、有效的编辑更新,成为了亟待解决的重要问题。传统的微调方法虽然可以对模型进行更新,但却面临着参数破坏和灾难性遗忘等问题。为解决这些问题,知识编辑任务应运而生,旨在对大模型内特定知识进行精确更新,而不对其他无关知识和模型整体性能造成负面影响。

尽管已有的研究工作在知识编辑方面取得了一定效果,但在捕捉与目标知识关联的知识变化方面仍存在挑战。具体来说,现有的研究工作侧重于单个知识的编辑,比如将知识从(s,r,o)修改成(s,r,o*),但单个知识的修改往往会引发其他相关知识的连带改变。如图1所示,将“勒布朗 · 詹姆斯效力于迈阿密热火”修改为“勒布朗 · 詹姆斯效力于洛杉矶湖人队”需要相应地将“勒布朗 · 詹姆斯在迈阿密工作”更新至“勒布朗 · 詹姆斯在洛杉矶工作”。现有的编辑方法未能考虑由于修改目标知识而导致的关联知识变化的影响,这限制了编辑后模型的泛化能力。大模型的黑盒特性使得发掘大模型内部知识之间的关联关系变得极为复杂,这进一步增加了在编辑过程中检测这些相关知识变化的难度。

图1 大模型知识编辑的一条示例 单次编辑可能引发关联知识改变

为了解决这一问题,我们提出了知识图谱增强的模型编辑方法(GLAME, Graphs for LArge language Model Editing)。GLAME通过引入外部知识图谱,利用图结构数据捕捉目标知识更新带来的关联知识变化,从而缓解了大模型黑盒特性导致无法显式地建模知识依赖的问题。此外,我们还设计了用于图结构数据的编辑模块,将变化的关联知识编辑到大模型相关参数,实现了目标知识及其关联知识的协同编辑,突破了现有方法只能编辑孤立知识而难以泛化的局限性

二、模型方法

模型GLAME的整体架构如下图所示,包含两个主要模块:

(1)知识图谱增强模块(KGA):利用外部知识图谱构建子图,以捕捉知识编辑引起的关联知识的变化;

(2)图数据编辑模块(GKE):利用关系型图神经网络(RGNN)编码构建的子图,将编辑知识及其变化的关联知识注入到大模型特定参数中。

图2 GLAME模型的架构示意图

每个模块具体操作如下:

知识图谱增强模块(KGA)

KGA模块利用外部知识图谱对每个编辑样本构建一个子图,该子图包含了新的编辑知识以及变化的关联知识:

a. 目标知识匹配与采样:知识编辑任务中,每个编辑样本都包含一个主语s、关系r、原宾语o以及编辑后新宾语o。为了捕捉受到编辑影响的知识,我们使用o在外部知识图谱(如Wikidata)中匹配最相关的实体。然后以该实体为中心,采样其邻近的实体及其关系,得到一个包含新关联关系的子图。

b. 知识表征提取:我们大模型的浅层中提取子图中实体和关系对应的隐向量,作为子图里节点和边的初始表征,这可以对知识表征间的依赖关系显式建模。

图数据编辑模块(GKE)

GKE模块主要将包含关联关系变化的图结构知识(子图)注入到大模型的参数中,完成知识编辑。基于ROME框架,我们需要在定位层计算大模型对编辑主语的原有表征图片和目标知识表征图片,来完成编辑:

a. 编码子图增强主语表征:使用关系型图神经网络(RGNN)对构建的子图进行编码,利用图神经网络在主语s的输出来增强其表征 。增强后的表征不仅包含目标编辑知识,也包含了新的关联知识的信息。

b. 原始表征提取:大模型处理主语实体时,提取实体对应的隐向量,作为大模型对主语的知识表征图片。

c. 参数更新:得到原表征和新表征后,基于ROME框架可在大模型中间层实现两个表征的映射关系,得到建立新映射后的模型参数,从而实现对大模型特定参数的更新:

三、实验结果

各模型在CounterFact、CounterFactPlus和MQuAKE数据集上的实验效果如表1和表2所示:

表1 各模型在CounterFact及CounterFactPlus数据集上的性能指标

表2 各模型在MQuAKE数据集上的性能指标

实验结果显示,GLAME在CounterFact与CounterFactPlus数据集上的综合评估指标Edit Score上取得了最高表现,相比现有的最佳基线模型,GLAME在反映捕获关联知识能力的Portability Score上分别提升了11.76%和10.98%。在MQuAKE数据集中,GLAME在不同难度任务下的平均指标提升了5.9%,在最复杂的4-hops推理任务上更是有着12.45%和16.75%的提升幅度。

为证明单纯引入更多额外信息并不一定能提升效果,我们设计了ROME-KG和MEMIT-KG两个基线方法,分别用ROME和MEMIT这两种现有的效果较好的方法,将图谱中包含的多跳信息直接编辑进大模型中。与原始方法相比,ROME-KG和MEMIT-KG的性能出现了显著下降。ROME-KG需要对模型的参数进行多次调整以编辑高阶关系,可能会损害原有的模型参数;MEMIT-KG则会将大量的信息不受约束地同时引入到LLM中,这可能会影响对目标知识的约束强度。适用于图结构的GLAME只需一次编辑便能将编辑引起的多个关联知识一并融合到模型中,大大减小了对模型的损害,增强了对外部知识图谱的利用程度。

四、本文贡献

  • 探究了在知识编辑过程中捕捉单次编辑引发的关联关系变化的重要性。通过对目标知识及其关联知识的协同编辑,提升编辑后大模型的泛化能力。

  • 将外部知识图谱引入大语言模型的知识编辑任务中,利用知识图谱结构化的特性显式关联目标知识及其关联知识的变化。并提出了新的知识编辑方法GLAME,通过两个关键模块实现目标知识及其关联知识的协同编辑。

  • 通过在多个标准数据集上的实验展示了GLAME在编辑效果和泛化能力上的提升。


来源:公众号【社媒派SMP】

llustration From IconScout By Inspiring Vector

-The End-

扫码观看!

本周上新!

“AI技术流”原创投稿计划

TechBeat是由将门创投建立的AI学习社区(

www.techbeat.net
) 。 社区上线500+期talk视频,3000+篇技术干货文章,方向覆盖CV/NLP/ML/Robotis等;每月定期举办顶会及其他线上交流活动,不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台,希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。

投稿内容

// 最新技术解读/系统性知识分享 //

// 前沿资讯解说/心得经历讲述 //

投稿须知

稿件需要为原创文章,并标明作者信息。

我们会选择部分在深度技术解析及科研心得方向,对用户启发更大的文章,做原创性内容奖励

投稿方式

发送邮件到

chenhongyuan@thejiangmen.com

或添加工作人员微信(chemn493)投稿,沟通投稿详情;还可以关注“将门创投”公众号,后台回复“投稿”二字,获得投稿说明。

关于我“门”

将门是一家以专注于数智核心科技领域新型创投机构,也是北京市标杆型孵化器。 公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

bp@thejiangmen.com

点击右上角,把文章分享到朋友圈

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
3200 万人请愿赶他走!姆巴佩破耻辱吉尼斯纪录,进 41 球没用!

3200 万人请愿赶他走!姆巴佩破耻辱吉尼斯纪录,进 41 球没用!

奶盖熊本熊
2026-05-08 00:29:53
大S女儿直播出圈!笑起来酒窝超像妈妈,单眼皮完美复刻汪小菲

大S女儿直播出圈!笑起来酒窝超像妈妈,单眼皮完美复刻汪小菲

观鱼听雨
2026-05-07 23:24:19
欠了快400亿,骂了整十年,华西村硬是靠一笔意外投资活过来了

欠了快400亿,骂了整十年,华西村硬是靠一笔意外投资活过来了

小莜读史
2026-05-07 19:10:59
三星员工:240万人民币就想打发我 隔壁SK海力士明年可是要发650万!

三星员工:240万人民币就想打发我 隔壁SK海力士明年可是要发650万!

快科技
2026-05-07 19:53:05
湖南一28岁干部受邀钓鱼溺亡,家属称其手机里有大量领导违纪证据,死后才知他欠银行37万元,多名领导长期赌博,并带领其参与

湖南一28岁干部受邀钓鱼溺亡,家属称其手机里有大量领导违纪证据,死后才知他欠银行37万元,多名领导长期赌博,并带领其参与

极目新闻
2026-05-07 21:48:08
又一个“爱国大V”人设翻车!靠爱国捞金千万,私下悄悄办移民!

又一个“爱国大V”人设翻车!靠爱国捞金千万,私下悄悄办移民!

麦杰逊
2026-05-07 13:13:17
不能失忆!人民日报平安校园:海参崴的街头,中国孩子在为谁欢呼

不能失忆!人民日报平安校园:海参崴的街头,中国孩子在为谁欢呼

瑜说还休
2026-05-07 17:45:15
48岁欧阳夏丹现状:离开央视,被教授邀请现身挪威,至今未婚未育

48岁欧阳夏丹现状:离开央视,被教授邀请现身挪威,至今未婚未育

白面书誏
2026-05-07 17:50:08
江苏生态环境厅工作组赴徐州调查,多部门连夜转运黑臭水体

江苏生态环境厅工作组赴徐州调查,多部门连夜转运黑臭水体

上观新闻
2026-05-08 06:34:12
总部人均奖金610万 中国厂却一毛不拔!三星、SK海力士国内员工集体要求涨薪

总部人均奖金610万 中国厂却一毛不拔!三星、SK海力士国内员工集体要求涨薪

快科技
2026-05-07 20:13:05
广州地标不再是小蛮腰?双子塔悄然挺立成新晋地标,珠海区要爆发

广州地标不再是小蛮腰?双子塔悄然挺立成新晋地标,珠海区要爆发

跟着萱仔去旅游
2026-05-08 09:15:12
小朋友在政府牌匾上涂鸦,镇政府最新回应:此前已专设白板供孩子们画画

小朋友在政府牌匾上涂鸦,镇政府最新回应:此前已专设白板供孩子们画画

极目新闻
2026-05-07 20:24:16
央视工作人员:以前世界杯转播权提前半年搞定 现在一切都不确定

央视工作人员:以前世界杯转播权提前半年搞定 现在一切都不确定

念洲
2026-05-08 07:31:02
全力冲击冠军!凌晨2点王楚钦发文反对饭圈:不要给我生日办应援

全力冲击冠军!凌晨2点王楚钦发文反对饭圈:不要给我生日办应援

风过乡
2026-05-08 07:01:44
告别NBA生涯!41岁塔克正式宣布退役:曾随雄鹿夺得总冠军

告别NBA生涯!41岁塔克正式宣布退役:曾随雄鹿夺得总冠军

罗说NBA
2026-05-08 09:12:04
14岁神童手搓发动机被曝造假!漏洞百出吹上天,普通人拿什么比?

14岁神童手搓发动机被曝造假!漏洞百出吹上天,普通人拿什么比?

社会日日鲜
2026-05-08 04:18:01
三亚4只皮皮虾1035元反转!市监局:价格合规,游客别想白吃

三亚4只皮皮虾1035元反转!市监局:价格合规,游客别想白吃

垛垛糖
2026-05-07 20:14:29
国际足联也急了!原来除了中国,还有这么多国家不给世界杯买单了

国际足联也急了!原来除了中国,还有这么多国家不给世界杯买单了

可乐爱微笑
2026-05-08 05:22:07
伦敦世乒赛:4强已出其2!中日德选手锁定奖牌,瑞典男团爆冷出局

伦敦世乒赛:4强已出其2!中日德选手锁定奖牌,瑞典男团爆冷出局

全言作品
2026-05-08 05:53:25
iOS "小狐狸" 最新上架App Store,4K,多源,速收,随时下架!

iOS "小狐狸" 最新上架App Store,4K,多源,速收,随时下架!

新浪财经
2026-05-07 23:08:50
2026-05-08 11:35:00
将门创投 incentive-icons
将门创投
加速及投资技术驱动型初创企业
2369文章数 596关注度
往期回顾 全部

教育要闻

文华学院虚境智学团队走进浠水小学助力实践教学提质

头条要闻

媒体:特朗普党内同盟访华 当着王毅的面感谢中国

头条要闻

媒体:特朗普党内同盟访华 当着王毅的面感谢中国

体育要闻

巴黎再进欧冠决赛,最尴尬的情况还是发生了

娱乐要闻

黄子佼获缓刑4年,无需入狱服刑

财经要闻

一觉醒来,美伊又打起来了

科技要闻

追赶星舰:中国商业火箭离SpaceX有多远?

汽车要闻

雷克萨斯全新纯电三排SUV 全新TZ全球首发

态度原创

健康
艺术
旅游
公开课
军事航空

干细胞治烧烫伤面临这些“瓶颈”

艺术要闻

21 岁徐悲鸿画的 “天价仙女”,被网友骂 “生无可恋”

旅游要闻

记者手记|新加坡景区迎来中国智能机器狗

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗:最高领袖穆杰塔巴全面掌控局势

无障碍浏览 进入关怀版