网易首页 > 网易号 > 正文 申请入驻

GraphRAG太慢LightRAG延迟高?华东师大新方法一招破解双重难题

0
分享至

Planing Lab团队 投稿
量子位 | 公众号 QbitAI

GraphRAG的索引速度慢,LightRAG的查询延迟高?

这些影响效率的难题,现在终于迎来改进——

由华东师范大学李翔老师带领的的Planing Lab团队推出高效解决方法E²GraphRAG

该方法在大部分测试中接近了最优的GraphRAG方法。

并且值得关注的是,该方法在构建索引时间上是GraphRAG的1/10,在查询时间上是LightRAG的1/100

动机与背景

现有的RAG方法中,大部分都是依赖于文本知识库,通过向量检索的方式,从中检索到与问题相关的一些文档片段作为补充知识。

这种方法难以实现对整个文档知识库的全局理解,比如通过普通RAG的方法,模型仍然无法回答“这篇小说的主旨是什么”这类问题。

为了解决对知识库的全局理解问题,RAPTOR提出了先对文档块进行聚类,然后递归构建文档总结树,然后在这个文档总结树上进行向量查询的方法,来引入不同粒度的信息;

GraphRAG则利用了大模型强大的信息抽取能力,由大模型从逐个文档块中抽取出三元组,然后构成一张图,之后再通过图分割算法分割成多个社区,再由大模型对社区进行总结,从而得到了不同粒度的信息。

然而,GraphRAG在图构建以及查询的过程中需要调用太多次大模型,导致其开销过重,难以实用。

为了解决这一问题,LightRAG让大模型一次性抽取出所有粒度的三元组,从而减少了总结不同社区带来的大模型调用开销;

FastGraphRAG则是在查询的过程中利用了PageRank算法来聚合全局信息,从而避免了查询时的大模型开销。

但是这些方法仍然面临一些问题:

每一个文档块需要调用一次大模型,带来的开销仍然相对较高;

严重依赖于大模型自身的能力,当模型参数量较小或者不支持Json格式输出的时候,这些方法难以实现;

需要手动设置查询模式,限制了其面对不同类型问题时的灵活性。

因此,本文中提出通过使用SpaCy来进行文档中的实体识别,利用实体之间的句中共现关系构成一张图,然后利用大模型对文档块按顺序递归总结,将其构建成不同粒度的文档总结树,之后结合利用图和树来进行查询,实现高效率、高性能。

方法
构建阶段

首先和普通RAG一样,先将长文档进行分块,本文中选取1200tokens一块,相邻块间有100tokens的重叠,follow了LightRAG的实验设置。然后构建阶段主要有两个任务:

利用LLM递归总结文档树:将文档块按照顺序排列,每g个文档块一组,交给大模型来进行内容总结,由于文档块是连续的,这里的相邻文档块之间的重叠可以合并,节约token消耗;

然后对于大模型生成的总结,继续每g个一组,进一步总结,构成一个文档树。

通过这种方式,团队得到了不同层次、不同粒度的信息,越接近根节点,信息越全局;

越接近叶子节点,信息越具体。

利用SpaCy抽取实体图:对于每一个文档块,团队利用SpaCy抽取其中的实体以及名词(他们可能是潜在的实体的代称),然后在同一句子内出现的实体以及名词之间构建连边,体现二者之间存在一定关系。

然后将所有的文档块对应的子图合并到一起,构成一个针对整个文档中的实体关系的实体图。

同时,团队构建两个index,来描绘文档和实体之间的关系,即文档块中抽取出哪些实体,一个实体能从哪些文档块中抽取出来。

通过这两个任务,团队得到了上图中的四种数据结构以及两个索引,即总结节点、文档节点、实体、边;以及实体到文档块的一对多索引,文档块到实体的一对多索引。

检索阶段

团队的检索方式可以根据问题的内容来自动选择local or global的检索方式,为了区分这两种检索方式,在下文中用斜体来表示global检索,以示区分。

同时团队提供了伪代码,其中标⭐️的是全局检索的部分。

假设要检索最多k个文档块,具体步骤如下:

  1. 利用SpaCy从问题中抽取出来实体,然后将这些实体两两组合(无序),假设有n个实体,团队会得到*个候选实体对(即图中Entity Extraction步骤)。
  2. 如果步骤1中不存在实体,那么认为这是一个全局的问题,同时无法利用实体信息来辅助检索,直接通过向量检索的方式,从文档树上检索到相关的文档块。
  3. 候选实体对中肯定存在噪声,因此拿它到团队构建好的图中去过滤,即两个实体如果在图中的距离超过h跳,那么就认为他们是无关的,将其排除(即图中Graph Filtering步骤)。
  4. 根据上一步剩余的实体对数量,团队如果有剩余的实体,进行5的local检索,如果没有,则执行步骤6的全局检索:
  5. 如果有剩余的实体对,团队利用实体到文档块的索引将每个实体对中的两个实体映射到各自对应的文档块上,然后对这两个文档块集合取交集,即得到了和这两个实体均相关的文档块(即图中的Index Mapping步骤)。
  6. 如果没有剩余的实体对,那么也就意味实体并非紧密相关,那么这也更可能是一个全局查询,因此团队首先通过向量检索检索到树上的top- 2k个相关的文档块作为候选;
    然后由于问题中也有实体,因此实体可以辅助进行查询,即计算每一个候选文档块中实体的出现次数作为权重,如果这个候选文档块是总结块,那么其对应的权重即为其子节点的权重之和,向下一直递归。
    这样的设计自然会给总结块更高的权重,自然符合了这是一个全局查询的假设(即图中的Occurrence Ranking步骤)。
  7. 如果步骤5返回了超过k个文档, 那说明团队的约束太松,因此团队令h =h-1,然后重新执行步骤5,循环至只剩下不超过k个文档。
  8. 如果步骤7返回了0个文档,那么取缩紧约束之前的一个查询结果,从其中进行筛选,具体筛选指标为:
  • 看这个文档包含了多少个不同的问题相关的实体;
  • 看这个文档中问题相关的实体出现了多少次。

团队首先比较指标1,当指标1打平时,比较指标2,取最高的k个文档作为结果。

最后团队将其整理为实体1,实体2:文档内容的形式,输入给模型。

实验结果

团队在7-8B的相对易部署的模型上进行实验,确保了该方法在资源受限的情况下仍然能够有良好表现。

团队发现,该方法达到了最短的索引构建时间,同时没有带来查询的延迟。

在性能上,在大部分实验设置下超过或者接近了最优的GraphRAG方法,实现了效率与性能的均衡。

值得关注的是,该方法在构建索引时间上是GraphRAG的1/10,在查询时间上是LightRAG的1/100。

同时,团队绘制了文档token数量和构建索引时间的散点图,并且拟合成直线。

团队发现该方法构建索引时间随着文档token数量以最低的斜率线性增长,体现该方法可以扩展到更大的文档上。

团队进一步进行了消融实验,三栏分别是:

  • 针对团队整体方法必要性的消融:只用向量检索,确保团队的local-global检索系统是有效的;
  • 针对local检索的消融:分别以及同时消去Graph Filter以及Entity-aware Ranking,确保团队的local检索的部件是有效的;
  • 针对global检索的消融:分别以及同时消去Dense Retrieval以及Occurrence Ranking,发现在NovelQA上出现了一个异常的升高,可能是由于模型的幻觉导致的。

通过结合树与图,该团队达成了GraphRAG效率与效果的平衡,在该方法中,图主要用于信息点的关系发现以及过滤噪声,而树则主要用于提供具体不同粒度的信息内容,二者各有所长,相互依赖。

论文地址:https://arxiv.org/abs/2505.24226
代码仓库:https://github.com/YiboZhao624/E-2GraphRAG

— 完 —

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
58岁那英改走颜值路线?过度医美变化大到认不出,这是要闹哪出?

58岁那英改走颜值路线?过度医美变化大到认不出,这是要闹哪出?

锋哥与八卦哥
2026-01-25 13:26:51
广东一村庄清扫冲洗路面迎游子回乡过年,村干部:约40人花了八九天,清扫了近20公里道路

广东一村庄清扫冲洗路面迎游子回乡过年,村干部:约40人花了八九天,清扫了近20公里道路

极目新闻
2026-02-01 11:26:28
央媒对冯远征的称呼变了,2字之差释放强烈信号,也是对其的肯定

央媒对冯远征的称呼变了,2字之差释放强烈信号,也是对其的肯定

草莓解说体育
2026-02-01 17:17:40
本科已严重饱和的五个专业,1、临床医学,2、法学,3、计算机

本科已严重饱和的五个专业,1、临床医学,2、法学,3、计算机

明智家庭教育
2026-01-31 10:29:14
东方卫视首播!31集谍战巨制,敌特潜入我方,王千源抓刘诗诗

东方卫视首播!31集谍战巨制,敌特潜入我方,王千源抓刘诗诗

乐枫电影
2026-02-01 14:36:35
央媒怒批、坑害老百姓!臭名昭著的几个相声演员,各个难以原谅

央媒怒批、坑害老百姓!臭名昭著的几个相声演员,各个难以原谅

无力的滋味
2026-02-01 11:32:33
京东001号快递员已退休,勤恳工作16年,刘强东承诺的房给了吗?

京东001号快递员已退休,勤恳工作16年,刘强东承诺的房给了吗?

阿纂看事
2025-12-10 15:38:14
过度思考,是行动最大的敌人

过度思考,是行动最大的敌人

洞见
2026-01-23 21:34:44
出大事了?中国突然收到“求救”信号,外交部火速回应,信号强烈

出大事了?中国突然收到“求救”信号,外交部火速回应,信号强烈

通鉴史智
2026-01-31 19:18:29
就是他,把全球吓崩了

就是他,把全球吓崩了

中国新闻周刊
2026-01-31 17:02:07
还有冷空气!最低-7℃!江苏发布最新天气预测

还有冷空气!最低-7℃!江苏发布最新天气预测

城市日历
2026-02-01 12:46:21
68岁大妈喜欢睡前泡脚,不久脑梗去世,医生怒斥:太无知了

68岁大妈喜欢睡前泡脚,不久脑梗去世,医生怒斥:太无知了

医学科普汇
2025-12-13 16:40:05
2027款奔驰S级全球首发!全新前脸,车内配三块大屏,车长超5米3

2027款奔驰S级全球首发!全新前脸,车内配三块大屏,车长超5米3

小史谈车
2026-02-01 15:42:24
除了黄金,白银,接下来2026年起飞的将会是什么?

除了黄金,白银,接下来2026年起飞的将会是什么?

小白鸽财经
2026-02-01 07:05:03
黄一鸣新房直播落泪,空调都追不上他的自信!

黄一鸣新房直播落泪,空调都追不上他的自信!

舞指飞扬
2026-02-01 07:49:00
格林要告别库里了?勇士9换1报价字母哥更新:巴特勒大概率留队

格林要告别库里了?勇士9换1报价字母哥更新:巴特勒大概率留队

罗说NBA
2026-02-01 05:12:06
林彪为何多次探望远离政治的贺子珍?孔东梅:恐怕只有一个原因

林彪为何多次探望远离政治的贺子珍?孔东梅:恐怕只有一个原因

小豫讲故事
2026-01-30 06:00:06
到了初中,你会发现数学考试低于110分,则完全跟智商没关系

到了初中,你会发现数学考试低于110分,则完全跟智商没关系

好爸育儿
2026-01-27 17:24:54
土媒:本泽马向贝西克塔斯要2000万欧年薪+一半球衣销售收入被拒

土媒:本泽马向贝西克塔斯要2000万欧年薪+一半球衣销售收入被拒

懂球帝
2026-02-01 14:34:13
出卖信任的刀,最终刺向了谁?汇丰银行为孟晚舟事件付出惊人代价

出卖信任的刀,最终刺向了谁?汇丰银行为孟晚舟事件付出惊人代价

顾史
2026-01-28 20:39:56
2026-02-01 17:48:49
量子位 incentive-icons
量子位
追踪人工智能动态
12092文章数 176369关注度
往期回顾 全部

科技要闻

腾讯元宝宣布:10亿现金红包,今日开抢

头条要闻

开年首月连打张又侠等十"虎" 反腐没有"禁区特区盲区"

头条要闻

开年首月连打张又侠等十"虎" 反腐没有"禁区特区盲区"

体育要闻

锁喉吃红牌+扇耳光 英超15人打群架

娱乐要闻

马年春晚第三次联排,多位明星现身

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

手机
数码
本地
亲子
公开课

手机要闻

别急着换机,只因下半年各大厂商都有大升级,这次等等党要赢了

数码要闻

REDMI Turbo 5 Max媒体评价汇总,大家认为客观吗?

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

亲子要闻

班主任察觉:全职妈妈与职场妈妈的育儿效果,二者天差地别

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版