网易首页 > 网易号 > 正文 申请入驻

ACL 2024 | CogMG:大语言模型与知识图谱的协同增强

0
分享至

本文针对LLMs与KG整合时常被忽视的两个问题——知识覆盖不足与知识更新不一致——提出了解决方案。为应对这些挑战,作者提出了CogMG,一个旨在协同增强LLMs与KG的框架。CogMG通过明确定义并补全相关知识,弥补KG未涵盖的信息缺口。此外,它还能主动收集并验证知识需求,以确保KG的动态更新。作者还基于智能体框架微调LLMs以实现CogMG,并开发了直观的交互系统,便于可视化其能力。用例分析与实验结果均验证了CogMG的有效性。

论文标题: CogMG: Collaborative Augmentation Between Large Language Model and Knowledge Graph 论文链接: https://aclanthology.org/2024.acl-demos.35.pdf

一、动机

大语言模型(LLMs)在问答任务中已经被广泛应用,然而LLMs容易出现幻觉和事实性错误。虽然可以通过查询知识图谱(KG)来减少这种幻觉,但是存在两个挑战:

(1)KG中的知识可能覆盖不完全:KG有能力涵盖大量信息,但在存储知识时也面临着实现全面覆盖的挑战。KG中明确编码的三元组不足以完全涵盖实际问答场景所需的知识。现有的用KG增强问答系统的方法主要集中在改进解析形式语言或检索知识三元组中的语义相关性,为预定义问题在KG中寻找相应的知识预存储。对于未命中KG的查询的后续处理关注相对较少;

(2)通过信息抽取和KG补全来更新KG的时候,面临着知识不一致的问题:当前更新KG的方法主要依赖于两种策略:从非结构化文本中提取知识三元组(信息提取)和通过分析节点之间的现有连接来推断未见链接(KG补全)。这些用于更新KG的范式具有无目的且看似无限的特点,因此不能完全解决新获取的知识与现实世界用户需求之间的不一致问题。这凸显了在更新KG以更好地与用户需求保持一致方面缺乏积极的考虑。

在本文中,作者引入了一个协同增强框架CogMG,利用KG来解决LLMs在问答场景中的局限性,明确针对知识覆盖不完整和知识更新不一致的问题。当查询超出当前KG的知识范围时,LLMs被鼓励明确分解所需的知识三元组。随后,基于LLMs参数中编码的广泛知识进行补全,作为最终答案的参考。明确识别必要的知识三元组是模型内省以减轻幻觉的一种手段,并主动突出KG在满足现实世界需求方面的不足。

此外,识别这些三元组允许通过使用外部文档的检索增强生成(RAG)对其进行自动验证。检索到的相关文档也可以在将三元组纳入KG之前作为手动审查的参考。这种持续且主动的知识更新过程使KG能够逐渐满足实际知识需求。

二、贡献

本文的主要贡献有:

(1)提出了LLMs和KG之间的协同增强框架CogMG,解决LLMs中的知识缺陷,并倡导根据用户需求主动更新KG中的知识

(2)微调一个开源LLMs以在智能体框架中适应协同增强范式CogMG,并通过实现一个网站系统来展示它,智能体框架是模块化和可插拔的,并且系统是交互式且用户友好的

(3)根据一个用例展示和在各种情况下的实验结果,展示了CogMG在主动更新知识和提高各种现实世界问答场景中的回复质量方面的有效性。

三、方法

总体框架如图1所示,左侧部分是示意图,说明协作增强框架CogMG的总体设计,涉及LLMs和KG。右侧部分是使用基于代理的框架实现CogMG,每个模块都设计为即插即用,以确保通用性。

图1 总体框架图

CogMG 框架的单次迭代包括三个步骤:

(1)查询KG:LLMs利用推理和规划能力分解查询并生成用于查询KG的形式化查询语句。对于一个知识密集型问题,我们通过将相应的形式化查询分解为自然语言子步骤来启动我们的方法。这种分解有助于阐明查询KG所需的必要和通用逻辑,确保我们的方法在各种KG模式中的通用性。然后LLMs调用一个形式语言解析工具来执行查询。该工具接收自然语言中的逻辑分解步骤作为输入,将其翻译成适合目标KG的形式化查询语言,并返回查询结果。

(2)处理结果:如果成功返回结果,则整合人类偏好的详细答案。如果不成功,则在整合到答案之前明确识别并分解所需的三元组。在从KG接收到查询结果后,LLMs利用其理解和推理能力组织最终答案。如果查询执行遇到错误,LLMs根据分解步骤描绘出具有未知组件的必要知识三元组。假设这些三元组的补充可以提供回答问题所需的知识。随后,利用模型参数中编码的知识来补全这些三元组。然后,模型根据这些事实生成最终答案。在这里,补全步骤适用于任何能力水平的LLMs。明确必要的知识不仅减轻了当前输出中由于滚雪球效应导致的幻觉影响,还识别了KG中的知识差距,从而有助于提高图谱的知识覆盖率。不完整的知识三元组及其补全被记录下来,以便可能纳入图谱或进一步验证。

图2 处理KG中未找到的查询以及相关知识处理的完整示例

(3)图谱演化:利用外部知识验证和修改将未命中的三元组纳入KG。LLMs参数中编码的高度通用性和广泛覆盖的知识可以补充KG中更专业的知识。由LLMs补全的这些三元组可以直接添加到KG中。然而,LLMs在处理罕见、长尾和特定领域知识方面存在困难,并且其知识表述缺乏稳健性。

因此作者提供手动干预选项,管理员可以选择(1)直接将补全的三元组纳入KG,(2)在添加之前手动调整它们,或(3)根据外部知识源自动验证它们。为了自动验证和纠正这些三元组,CogMG在非结构化语料库中搜索相关文档,并在文档和三元组之间进行事实比较。这些文档可以来自特定领域文本、通用百科全书或快速更新的搜索引擎,不仅提高了知识的事实准确性,还为手动审查提供了可解释的参考。基于这些外部来源的见解,模型调整提议的知识三元组,使其适合手动纳入KG。

四、实现用例

模型与组件:采用 ReAct 的智能体框架来使LLMs适应CogMG理念中的模块化和泛化。作者使用维基数据的一个子集作为KG,KoPL作为查询引擎,KQA-Pro数据集作为微调数据集的骨干。KQA-Pro包含自然语言问题以及相应的KoPL查询、SPARQL查询和标准答案。为确保智能体在各种场景中表现出预期行为,作者构建定制的SFT数据集来微调或利用上下文学习来提示模型。Qwen-14B-Chat负责所有SFT数据生成和智能体骨干。作者提出,该框架适用于各种KG和LLMs并逐个场景介绍解决方案。

(1)问题分解:利用分解步骤作为问题和形式语言之间的中介,阐明了解决问题的逻辑,并增强了对问题不同表达方式的鲁棒性。作者手动编写几个查询步骤的自然语言解释,以根据相应的KoPL函数调用获得问题和自然语言解释之间的并行数据案例。利用这些并行示例,我们提示LLMs在整个数据集中生成子步骤,并获得5万对数据。这些数据被保留用于构建智能体行为SFT数据集。

(2)形式查询生成:一个将查询步骤的自然语言解释解析为KoPL形式程序的模型可以使用并行数据快速训练。由于解析过程对模型能力的要求相对较低,作者微调一个7B模型来在查询KG的工具中创建一个专用模型。

(3)查询KG:作者包装KoPL引擎的执行,以便在出错时统一返回 “失败”,便于模型决策和识别。查询工具通过解析模型处理分解步骤输入,预测KoPL查询程序并返回KG查询结果。

(4)知识补全:作者直接指示模型承担知识补全任务,参考图2手动编写的示例。为了适应整个ReAct智能体框架并确保模块化,作者将知识补全部分封装为一个工具,输入问题和相应的不完整知识三元组,输出参数知识与这些三元组的映射。

(5)答案整合:KQA Pro提供的标准答案在单词级别简洁精确,与人类偏好的更详细解释存在差距。因此,作者向推理模型提供来自KG执行的问题和标准答案,指示它为数据集中的每个问题生成更详尽、解释性更强的回复。答案整合场景是智能体行为的一部分。

(6)知识分解:作者明确分解形式查询的目标三元组,以阐明回答问题所需的事实。这一步对于手动注释一些查询语句为不完整三元组至关重要,将未知事实部分表示为问号,然后使用这些样本作为模型推断所有数据的三元组分解的示例。鉴于KoPL程序中的精确标签名称作为实体链接,作者在三元组推断期间添加标签名称约束,如果产生非标准标签名称则重新生成三元组。所有知识分解数据都用于模拟处理KG未涵盖的问题。

(7)RAG验证:由于经过通用指令调整和偏好对齐的LLMs熟悉RAG,作者利用提示工程要求模型根据检索到的相关文档、带问号的不完整三元组以及相应的参数知识补全三元组生成知识三元组的修正。作者采用维基百科作为检索语料库,每256个词元分割为一个块。作者通过BM25构建文档索引,通过连接知识三元组和原始问题进行搜索,并选择前十个块作为外部知识参考。对于整个ReAct智能体框架,作者为智能体的规划和调用工具构建了两条路线,区分必要知识是否包含在KG中。利用构建的并行训练数据,作者构建了考虑上述每个场景的两条Thought-Action-Observation 执行路线的SFT数据。智能体使用总共 10 万条行为 SFT 数据进行微调。

五、实验

为了展示CogMG框架的有效性,作者从KQA Pro数据集中抽样问题并测试了以下场景:(1)直接回答:仅使用骨干LLMs回答,不利用KG;(2)CogMG无知识:从图谱中删除相关知识并使用知识的参数补全回答;(3)CogMG更新:更新所有相关知识,利用图谱查询结果回答。由于精确匹配难以反映真实答案的正确性,作者手动评估了50个问题的正确性。表1展示了这三种场景下的准确性。

表1 三种不同场景下问答准确率对比结果

实验结果表明,由于缺乏精确的事实知识,直接使用LLMs回答问题的准确性较低。此外,利用模型的知识澄清和补全可以减轻一些幻觉并提高准确性。最后,在利用协同增强框架更新KG后,后续查询的准确性得到提高。

图3 系统界面
六、总结

本文解决了在整合LLMs和KG时两个相对被忽视的问题:知识覆盖不完整和知识更新不一致。针对这些挑战,作者引入了CogMG,一个用于LLMs和KG协同增强的框架。CogMG通过明确定义和补全相关知识来解决使用KG未涵盖的知识回答问题的问题。此外,它积极收集和验证知识需求以更新KG。此外,作者基于智能体框架微调一个LLMs来实现CogMG,并开发一个用户友好的交互系统来可视化其能力。用例和实验结果展示了CogMG的有效性。


作者:杜超超 来源:公众号【开放知识图谱 】

llustration From IconScout By IconScout Store

-The End-

扫码观看!

本周上新!

“AI技术流”原创投稿计划

TechBeat是由将门创投建立的AI学习社区(

www.techbeat.net
) 。 社区上线600+期talk视频,3000+篇技术干货文章,方向覆盖CV/NLP/ML/Robotis等;每月定期举办顶会及其他线上交流活动,不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台,希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。

投稿内容

// 最新技术解读/系统性知识分享 //

// 前沿资讯解说/心得经历讲述 //

投稿须知

稿件需要为原创文章,并标明作者信息。

我们会选择部分在深度技术解析及科研心得方向,对用户启发更大的文章,做原创性内容奖励

投稿方式

发送邮件到

melodybai@thejiangmen.com

或添加工作人员微信(yellowsubbj)投稿,沟通投稿详情;还可以关注“将门创投”公众号,后台回复“投稿”二字,获得投稿说明。

关于我“门”

将门是一家以专注于数智核心科技领域新型创投机构,也是北京市标杆型孵化器。 公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

bp@thejiangmen.com

点击右上角,把文章分享到朋友圈

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
从3.9万跌至8736台!小米YU7过山车行情,雷军压力大!

从3.9万跌至8736台!小米YU7过山车行情,雷军压力大!

科技专家
2026-06-21 12:17:03
罗马诺连曝2大转会:梅西迎皇马传奇队友,穆里尼奥清洗23岁铁卫

罗马诺连曝2大转会:梅西迎皇马传奇队友,穆里尼奥清洗23岁铁卫

万花筒体育球球
2026-06-21 20:08:49
莫言:如果你混到没人找你吃饭,没人喊你聚会,连电话也没几个,那庆祝了,你不是人缘变差,而是真正觉醒了

莫言:如果你混到没人找你吃饭,没人喊你聚会,连电话也没几个,那庆祝了,你不是人缘变差,而是真正觉醒了

品读时刻
2026-05-27 09:00:58
翁虹女儿被UCLA录取,翁虹发长文:万万没想到真切发生在我家

翁虹女儿被UCLA录取,翁虹发长文:万万没想到真切发生在我家

韩小娱
2026-06-21 16:22:33
大陆担心的事还是发生了,关键时刻,赖清德直接叛变,外交部回应

大陆担心的事还是发生了,关键时刻,赖清德直接叛变,外交部回应

不甜的李子
2026-06-22 04:53:35
儿子在北京买了房,我很骄傲去住了2天后,第3天我自己买了回程票

儿子在北京买了房,我很骄傲去住了2天后,第3天我自己买了回程票

阿凯销售场
2026-06-22 01:03:25
硅谷高管三分之一为印裔,排挤外人成潜规则

硅谷高管三分之一为印裔,排挤外人成潜规则

阅尽天下大事
2026-06-22 04:58:55
幸亏中国没中标!泰国高铁曾选日本人建设,建成后让泰国欲哭无泪

幸亏中国没中标!泰国高铁曾选日本人建设,建成后让泰国欲哭无泪

史智文道
2026-06-21 16:38:50
97年我娶了离过婚的女教师,洞房夜她把灯关了:我有件事要告诉你

97年我娶了离过婚的女教师,洞房夜她把灯关了:我有件事要告诉你

千秋文化
2026-06-18 20:19:03
美伊谈判突发反转,美软肋被拿捏,特朗普被迫二度访华震撼全球

美伊谈判突发反转,美软肋被拿捏,特朗普被迫二度访华震撼全球

噶噶香的晚餐
2026-06-21 23:03:11
“一看就是争家产的面相”,大家庭过生日,让所有人看清了家教

“一看就是争家产的面相”,大家庭过生日,让所有人看清了家教

熙熙说教
2026-06-16 19:42:39
2026年养老金政策落地,实现22连涨,这3类人群养老金涨幅有变化

2026年养老金政策落地,实现22连涨,这3类人群养老金涨幅有变化

细说职场
2026-06-21 14:23:44
用三只分红电力股,覆盖水电和买菜支出?

用三只分红电力股,覆盖水电和买菜支出?

我是一个养虾人
2026-06-21 03:41:26
越南前领导人黎笋的长子在采访中称,当年越南对华采取军事行动

越南前领导人黎笋的长子在采访中称,当年越南对华采取军事行动

磊子讲史
2026-06-16 15:09:05
"磨膝大户"被公布,是跑步的20倍,医生:不想软骨磨光,早扔掉

"磨膝大户"被公布,是跑步的20倍,医生:不想软骨磨光,早扔掉

王医生健康讲坛
2026-06-22 06:30:35
惜败!中国女排2-3土耳其,龚翔宇爆发,庄宇珊、董禹含拼尽全力

惜败!中国女排2-3土耳其,龚翔宇爆发,庄宇珊、董禹含拼尽全力

生活新鲜市
2026-06-22 05:55:04
震撼!内马尔花魁女友挺孕肚助威,三胎在即

震撼!内马尔花魁女友挺孕肚助威,三胎在即

舞指飞扬
2026-06-21 08:12:46
电商卖出20台品牌充电器,遭买家退货后全变成了沙子,店家耗时一个月从西安到珠海上门维权,对方一听会行政拘留就慌了......

电商卖出20台品牌充电器,遭买家退货后全变成了沙子,店家耗时一个月从西安到珠海上门维权,对方一听会行政拘留就慌了......

大风新闻
2026-06-21 15:24:40
外资银行,集中发声!

外资银行,集中发声!

证券时报
2026-06-21 16:22:03
历史首次!联合国把以色列拉入黑名单!美国对犹太人的态度变了

历史首次!联合国把以色列拉入黑名单!美国对犹太人的态度变了

李云飞Afey
2026-06-21 19:38:22
2026-06-22 07:11:00
将门创投 incentive-icons
将门创投
加速及投资技术驱动型初创企业
2410文章数 596关注度
往期回顾 全部

教育要闻

不愧是上海市,小升初压轴求面积

头条要闻

世界第10难求一胜!10人比利时0-0伊朗

头条要闻

世界第10难求一胜!10人比利时0-0伊朗

体育要闻

德国的超级替补,10年前还在工厂上班

娱乐要闻

原来她就是张颂文老婆

财经要闻

“床垫界的特斯拉”破产了

科技要闻

马斯克拿下7800亿元天价薪酬 2028年可兑现

汽车要闻

惊出冷汗!重庆实测奥迪A5L,华为智驾这波操作绝了…

态度原创

数码
艺术
教育
本地
军事航空

数码要闻

曝英特尔"Raptor Lake Next"处理器移动端仅提供"HX"版本

艺术要闻

310米!欧盟第一高楼,坐落于波兰

教育要闻

热议云南中考历史题

本地新闻

龙腾资江 韵动邵阳

军事要闻

时隔44年试射洲际导弹 现场照片传递三个重磅信息

无障碍浏览 进入关怀版