网易首页 > 网易号 > 正文 申请入驻

让DeepSeek更可靠!清华提出Hyper-RAG,用超图提升知识建模精准度

0
分享至

新智元报道

编辑:LRST

【新智元导读】Hyper-RAG利用超图同时捕捉原始数据中的低阶和高阶关联信息,最大限度地减少知识结构化带来的信息丢失,从而减少大型语言模型(LLM)的幻觉。

大语言模型(Large Language Models, LLMs)在面对专业领域知识问题的时候,经常会生成偏离既定事实的回复,或模糊不清的回答,从而带来了潜在应用风险。

检索增强生成(Retrieval-Augmented Generation, RAG)通过构建特定领域知识库,采用基于向量的检索技术来提取与给定查询相关的信息,从而使LLM能够生成更准确、更可靠的内容。

然而,现有的基于图的RAG方法受限于仅能表示实体之间的成对关联,无法表示那些更复杂的多实体间的群组高阶关联,导致数据结构化过程中这些高阶信息的丢失。

为了解决这一难点,清华大学、西安交通大学等提出Hyper-RAG:一种超图驱动的检索增强生成方法。

Hyper-RAG将超图表征融入RAG中,通过超图捕获原始数据中的成对低阶关联和群组高阶关联,从而最大限度减少领域知识结构化带来的信息损失,提高生成响应的准确性和可靠性,可以作为医疗诊断金融分析等高可靠需求应用的有利支撑。

在神经科学任务上对六种LLMs进行的实验表明,Hyper-RAG相比于直接使用LLM,其准确率平均提升了12.3%,比GraphRAG和LightRAG分别高出6.3%和6.0%。

此外,Hyper-RAG在查询问题复杂性增加的情况下仍能保持稳定性能,而现有方法的性能则有所下降;其轻量级变体Hyper-RAG-Lite在检索速度上达到了Light RAG的两倍,并且性能提升了3.3%。

论文地址:https://arxiv.org/abs/2504.08758

Github仓库:https://github.com/iMoonLab/Hyper-RAG

Hyper-RAG集成系统



超图驱动的本地检索增强大模型

超图本地知识库可视化系统

RAG困境

现有基于知识结构化的RAG方法,如Graph RAG和Light RAG,利用图结构来表示特定领域文本中的关系信息。

然而,基于图的方法仅限于成对关系,限制了其捕捉复杂互连的能力,如下图所示,在叙事故事中,虽然图可以有效地模拟人物之间错综复杂的相关关系,但却不足以表示涉及多个人物同时互动的事件。

在叙事故事中,虽然图可以有效地模拟人物之间错综复杂的关联,但却不足以表示涉及多个人物同时互动的事件。在构建知识图谱的过程中,通常会丢失这些超出成对相关的关联,从而导致信息的损失。

相比之下,超图能够对多个数据点之间的高阶关联(及以上)进行建模,提供了更全面的领域知识表示。

研究人员探讨了基于超图的RAG技术,以实现关键知识的全面覆盖。通过整合基于超图的结构,大型语言模型能够更好地减轻与关键信息相关的幻觉现象,从而增强其在专业领域输出的可靠性和准确性。

超图建模索引

下图举例说明了如何从原始语料中提取实体、低阶关联和高阶关联。可以看出,加入高阶关联可确保更全面地检索相关信息。与此相反,如果使用传统图,则仅提取成对相关性,会导致潜在的信息丢失,从而导致大模型产生幻觉。

方法概述

为了减少LLM的幻觉,Hyper-RAG将超图建模纳入RAG框架,利用超图来捕捉错综复杂的多方面相关性。

具体来说,首先,从原始数据集中提取实体,作为超图中的节点。随后,这些实体之间的低阶和高阶关联会被识别和整合,从而构建一个基于超图的知识库。

在查询阶段,首先从输入查询中提取关键实体,然后利用超图结构从知识库中检索相关的先验语料信息。

知识索引

随后,使用文档结构函数Φ从语料库中提取结构信息,从而得到超图G。

检索增强

(基本组件)和关联关键词(复杂的相互依赖关系),如下所示:

值得注意的是,实体关键字检索的目标是顶点,而关联关键字检索的目标是超边。出现这种区别是因为实体关键字主要描述单个实体,使顶点成为合适的检索对象。

相反,相关性关键词描述的是抽象信息,通常涉及多个实体之间的关系,因此需要超边作为检索目标。

对于实体信息检索,通过扩散实体对应的超边作为补充信息,对于关联信息检索,通过扩散超边对应的实体作为补充信息:

通过超图知识库进行一步扩散,获得与这些实体相关的超边/超边相关的节点作为补充信息。

随后将顶点相关和超边相关的信息合并送给大模型以获得可靠知识补充,生成LLM对查询的回答。

实验结果

研究人员在9个不同领域数据集上(神经科学、病理学、数学、物理学、法律、艺术等),采用了6个不同大模型,2种不同评估策略,多维评价指标进行了实验验证。

基于打分的评估

在NeurologyCrop数据集上的实验结果表明,Hyper-RAG的性能优于直接应用LLM,平均提高了12.3%;此外,与GraphRAG和LightRAG相比,Hyper-RAG的性能分别提高了6.3%和6.0%。

当通过引入嵌套,即一个问题后接另一个问题以增加复杂性,如下表所示。随着问题难度的增加,现有的LLM和基于RAG的方法的性能显著下降。相比之下,Hyper-RAG 保持了稳定的性能水平。

具体来说,随着问题难度的增加,Hyper-RAG与直接使用LLM相比,性能提高了12.7%到15%。这些结果证实了基于超图的全面信息表示的优越性。

对于简单的查询,直接来自大型语言模型的回答或简单的成对(即低阶)关联可能已足够。

然而,随着查询变得更加复杂,复杂的高阶关联的可用性对于约束和丰富模型的输出变得至关重要,这一实验趋势强调了开发基于超图的结构表示和检索方法,以应对日益复杂的问题所带来的挑战的重要性。

基于选择的评估

为了进一步验证Hyper-RAG,本文将实验扩展到跨越多个领域的九个不同语料库数据集。

在这些数据集中,Hyper-RAG的性能始终优于传统的基于图的方法Light RAG,在使用基于选择的评估方法对性能进行评估时,Hyper-RAG的平均性能提高了35.5%。

效率分析

这里进一步评估了从数据库本地检索获取相关知识和构建先验知识提示所需的时间。

作者开发了Hyper-RAG的轻量级变体,Hyper-RAG-lite,它保留了实体检索的基本增强功能。

可以看出,Hyper-RAG和Hyper-RAG-lite都位于图的左上角附近,这表明这些方法在速度和性能方面都优于其他方法。

总结

Hyper-RAG通过利用超图对原始数据进行更加全面且结构化的知识表示,最大程度地减少信息丢失并降低大型语言模型的幻觉现象。

与现有的基于图的RAG方法相比,Hyper-RAG在多个不同领域的数据集上表现出更优异的性能,能够有效捕捉复杂的多实体群组高阶关系,从而提升生成内容的准确性和可靠性。

研究表明,Hyper-RAG在增强LLM的可靠性和减少不准确输出方面具有显著优势,能够更好地应对输出内容不可靠带来的挑战。

参考资料:

[1] Feng Y, You H, Zhang Z, et al. Hypergraph neural networks[C]//Proceedings of the AAAI conference on artificial intelligence. 2019, 33(01): 3558-3565.

[2] Gao Y, Feng Y, Ji S, et al. HGNN+: General hypergraph neural networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2022, 45(3): 3181-3199.

[3] Feng Y, Han J, Ying S and Gao Y. Hypergraph Isomorphism Computation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2024, 46(5): 3880-3896.

[4] Feng Y, Yang C, Hou X, et al. Beyond Graphs: Can Large Language Models Comprehend Hypergraphs?[C]//Proceedings of the Thirteenth International Conference on Learning Representations. 2025.

[5] Feng Y, Liu S, Han X, et al. Hypergraph Foundation Model[J]. arXiv preprint arXiv:2503.01203, 2025.

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
珠宝店的女店员也开始擦边了…

珠宝店的女店员也开始擦边了…

微微热评
2026-06-28 16:55:36
非常意外!苹果突然上架大量特价新品

非常意外!苹果突然上架大量特价新品

XCiOS俱乐部
2026-06-28 13:16:32
湖人4大消息!艾顿将执行810万选项+首轮追特纳 詹姆斯热火或重聚

湖人4大消息!艾顿将执行810万选项+首轮追特纳 詹姆斯热火或重聚

锅子篮球
2026-06-28 11:55:36
彝族姑娘查分后转头先喂猪,她心仪的武汉大学回应了!

彝族姑娘查分后转头先喂猪,她心仪的武汉大学回应了!

环球网资讯
2026-06-28 08:09:11
月薪35k挖过来一个同事,入职不到一个月,被领导斥责能力不行,让马上转岗!结果同事回怼:不是我能力不行,是你真不会用人!

月薪35k挖过来一个同事,入职不到一个月,被领导斥责能力不行,让马上转岗!结果同事回怼:不是我能力不行,是你真不会用人!

励职派
2026-06-28 19:15:43
沉默5天后!菲防长再发声,中国的制裁:成他心里过不去的坎儿

沉默5天后!菲防长再发声,中国的制裁:成他心里过不去的坎儿

瓦伦西亚月亮
2026-06-28 16:46:58
女子瞒着情夫去宾馆开房,竟忘关掉手机通话,情夫听到声音崩溃

女子瞒着情夫去宾馆开房,竟忘关掉手机通话,情夫听到声音崩溃

丫头舫
2026-06-28 12:20:50
五年少了近一半幼儿!北京幼儿园从一位难求到空教室遍地……

五年少了近一半幼儿!北京幼儿园从一位难求到空教室遍地……

一口娱乐
2026-06-29 00:07:32
7闺蜜众筹70万开咖啡馆  4个月后从“七仙女”变成“战国七雄”

7闺蜜众筹70万开咖啡馆 4个月后从“七仙女”变成“战国七雄”

尘埃里的看客
2026-06-28 10:42:41
法国一跳伞体验飞机坠毁,11人全员不幸遇难,多名护士“人生首跳”成永别

法国一跳伞体验飞机坠毁,11人全员不幸遇难,多名护士“人生首跳”成永别

意大利华人网0039
2026-06-29 00:11:03
看看朝鲜的下场,就明白为什么我们不对俄罗斯提供军事援助了。

看看朝鲜的下场,就明白为什么我们不对俄罗斯提供军事援助了。

小马姨
2026-06-28 09:19:39
经济热点快评丨麦肯锡:中国是“全球最硬核的健身房”

经济热点快评丨麦肯锡:中国是“全球最硬核的健身房”

人民网
2026-06-28 17:59:10
韩红20年0收入!基金会工资单曝光,网友:韩红就是无私纯粹的人

韩红20年0收入!基金会工资单曝光,网友:韩红就是无私纯粹的人

火山詩话
2026-06-28 06:35:13
朴智星再度向洪明甫开炮!韩媒:这是写入韩国足球史册的耻辱之日

朴智星再度向洪明甫开炮!韩媒:这是写入韩国足球史册的耻辱之日

新杀猪的秀才
2026-06-28 10:18:25
俄罗斯女议员曾预言,一旦对华免签,将有大量中国男性赴俄搞对象

俄罗斯女议员曾预言,一旦对华免签,将有大量中国男性赴俄搞对象

说历史的老牢
2026-06-28 03:11:53
重磅利好!国内首条四代半导体材料落地!8大硬核材料龙头曝光

重磅利好!国内首条四代半导体材料落地!8大硬核材料龙头曝光

媛来这样
2026-06-28 11:44:10
刘烨儿子久违现身,16岁诺一身高超180,过了容貌尴尬期变更帅了

刘烨儿子久违现身,16岁诺一身高超180,过了容貌尴尬期变更帅了

潋滟晴方DAY
2026-06-28 13:01:32
前国足主帅伊万科维奇:仅两支亚足联球队晋级世界杯32强并不意外

前国足主帅伊万科维奇:仅两支亚足联球队晋级世界杯32强并不意外

北青网-北京青年报
2026-06-28 14:26:04
今年90%的家长和“张雪峰们”都是用的AI志愿填报工具,最后反而丢掉了最大的捡漏机会

今年90%的家长和“张雪峰们”都是用的AI志愿填报工具,最后反而丢掉了最大的捡漏机会

帅领留学真话
2026-06-27 09:53:57
黄长烨进入韩国使馆避难,中方集结武警筑起防线阻拦朝方人员

黄长烨进入韩国使馆避难,中方集结武警筑起防线阻拦朝方人员

磊子讲史
2026-06-22 15:59:52
2026-06-29 03:35:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15555文章数 66940关注度
往期回顾 全部

科技要闻

DeepSeek最新论文:如何让大模型跑得更快

头条要闻

四川宜宾市高县发生5.5级地震 震中距宜宾28公里

头条要闻

四川宜宾市高县发生5.5级地震 震中距宜宾28公里

体育要闻

两周飞5万公里!因凡蒂诺遭环保人士猛批

娱乐要闻

曾沛慈拿下《乘风2026》年度总冠军

财经要闻

省钱,我只服梁文锋

汽车要闻

搭载华为乾崑六件套 东风奕派M8预售19.98万起

态度原创

艺术
时尚
亲子
健康
公开课

艺术要闻

她不用笔,她用刀

夏天裙子不用买多,建议入手一条蓝裙子,清爽高级又耐看

亲子要闻

肠道真菌菌群紊乱增加儿童过敏风险

“无糖汤圆”是否隐藏着健康陷阱?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版