网易首页 > 网易号 > 正文 申请入驻

GraphRAG 与 RAG 的比较分析

0
分享至


检索增强生成(RAG)技术概述

检索增强生成(Retrieval-Augmented Generation,简称 RAG)是一种旨在提升大型语言模型(Large Language Models,LLMs)性能的技术方法。其核心思想是通过整合外部可靠知识库的信息来增强模型的输出质量。

RAG 的工作原理可以概括如下:当 LLM 接收到查询时,它不仅依赖于自身的预训练知识,还会主动从指定的知识源检索相关信息。这种方法确保了生成的输出能够参考大量上下文丰富的数据,并得到最新、最相关可用信息的支持。

RAG 系统的核心组件

标准 RAG 系统主要由三个关键组件构成:

  1. 检索器组件(Retriever Component):
  • 功能:在知识库或大规模文档集中搜索与查询主题高度相关的信息。
  • 工作方式:识别在语义上与查询相关的文档,并通过相似度度量(通常采用向量间的余弦相似度)计算相关性。
  1. 生成器(Generator):
  • 定义:通常是一个大型语言模型。
  • 输入:检索到的相关信息和原始查询。
  • 输出:基于输入生成响应。
  1. 知识库(Knowledge Base):
  • 用途:作为检索器查找文档或信息的数据源。

RAG 的工作流程

  1. 从外部源收集相关信息。
  2. 将收集到的信息附加到用户的原始提示中。
  3. 将增强后的提示作为输入发送给语言模型。
  4. 在生成阶段,LLM 结合增强提示和自身的训练数据表示,生成针对用户查询定制的响应。

这一过程产生的响应融合了个性化和可验证的信息,特别适用于聊天机器人等应用场景。

图2:检索增强生成流程示意

构建 RAG 系统的关键步骤

  1. 知识库准备:
  • 对文档进行索引
  • 创建文本嵌入
  1. 检索器模型:
  • 训练或微调,以有效搜索知识库
  1. 生成器模型:
  • 通常采用预训练的语言模型
  1. 系统集成:
  • 确保各组件无缝协作

Graph RAG 技术简介

Graph RAG 是 RAG 方法的一个高级变体,其特点是引入了图结构数据。与将知识库视为平面文档集合不同,Graph RAG 将信息表示为实体和关系的互联网络。

Graph RAG 的核心概念

Graph RAG 基于知识图谱(Knowledge Graphs,KGs)构建。知识图谱是现实世界实体及其关系的结构化表示,主要由两个基本元素组成:

  • 节点(Nodes):表示单个实体,如人物、地点、物体或概念。
  • 边(Edges):表示节点之间的关系,定义了实体间的连接方式。

相比于标准 RAG 使用向量相似度和向量数据库进行检索,Graph RAG 利用知识库进行更全面、系统的信息检索,从而提高了检索的完整性和准确性。

Graph RAG 的技术优势

Graph RAG 相较于标准 RAG 具有以下显著优势:

  1. 关系上下文捕捉:
  • 能够捕捉和利用信息片段之间的复杂关系,提供更丰富、更具语境的信息检索结果。
  1. 多跳推理能力:
  • 图结构支持系统沿关系链进行推理,实现更复杂、更深入的逻辑分析。
  1. 结构化知识表示:
  • 相比平面文档结构,图结构能更自然地表示层级和非层级关系,更贴近现实世界的知识组织方式。
  1. 查询效率提升:
  • 对于涉及关系遍历的查询类型,图结构可显著提高处理效率。

图3:知识图谱示例

Graph RAG 的工作原理

Graph RAG 的工作流程可以概括为以下几个关键步骤:

  1. 查询处理:
  • 对输入查询进行分析和转换,使其适合图结构的查询格式。
  1. 图遍历:
  • 系统在图结构中进行探索,沿相关关系路径寻找连接的信息节点。
  1. 子图检索:
  • 不同于检索独立的信息片段,系统提取包含相互关联上下文的相关子图。
  1. 信息整合:
  • 将检索到的子图进行组合和处理,形成一个连贯、全面的上下文信息集。
  1. 响应生成:
  • 语言模型基于原始查询和整合后的图信息生成最终响应。

Graph RAG 处理流程图

图4:Graph RAG 处理流程示意图

标准 RAG 与 Graph RAG 的关键区别

  1. 知识表示方式:
  • 标准 RAG:采用平面文档结构
  • Graph RAG:使用图结构表示知识
  1. 检索机制:
  • 标准 RAG:主要依赖向量相似度搜索
  • Graph RAG:采用图遍历算法进行信息检索
  1. 上下文理解能力:
  • Graph RAG 能够捕捉更复杂的多步骤关系,这些关系在标准 RAG 中可能被忽略
  1. 推理能力:
  • Graph RAG 的图结构支持对相互关联信息进行更深入、更复杂的推理

图5:RAG 与 Graph RAG 对比示意

总结

Graph RAG 技术通过引入图结构化的知识表示和处理方法,显著增强了传统 RAG 系统的能力。它不仅提高了信息检索的准确性和完整性,还为复杂查询和多步推理提供了更强大的支持。这种方法在处理需要深度上下文理解和复杂关系分析的任务中,展现出了明显的优势。

随着知识图谱技术和图数据库的不断发展,Graph RAG 有望在各种高级人工智能应用中发挥越来越重要的作用,特别是在需要精确、全面信息检索和复杂推理的领域。

https://avoid.overfit.cn/post/1c6163da1c1d43d099fad164d01710c1

作者:Praveen Raj

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
平凡岗位上,他们让劳模精神非凡绽放

平凡岗位上,他们让劳模精神非凡绽放

新华社
2026-05-01 16:04:30
姜育恒、关喆在湖北街头喝早酒!吃着火锅唱着歌,整条街都疯了

姜育恒、关喆在湖北街头喝早酒!吃着火锅唱着歌,整条街都疯了

川川八卦说
2026-05-02 10:20:03
进过一次家长群,就懂了真正的狂野

进过一次家长群,就懂了真正的狂野

不相及研究所
2026-04-23 22:37:10
这家把Kindle逼到墙角的厂商,突然给自家产品上了锁

这家把Kindle逼到墙角的厂商,突然给自家产品上了锁

码上闲叙
2026-05-01 22:42:02
连续三天嫖娼一次嫖俩,花800元毁掉一手女神好牌,他图什么?

连续三天嫖娼一次嫖俩,花800元毁掉一手女神好牌,他图什么?

街上的行人很刺眼
2026-04-25 10:55:49
王平河系列:一将难求(5/10)

王平河系列:一将难求(5/10)

金昔说故事
2026-05-02 23:12:23
华宇晨抚仙湖演唱会被取消真实原因!

华宇晨抚仙湖演唱会被取消真实原因!

谣谈乡村振兴
2026-05-01 10:06:01
欧洲巨头懵了:在华订单暴跌,竟因中国改写了电动车制造工艺

欧洲巨头懵了:在华订单暴跌,竟因中国改写了电动车制造工艺

次元君情感
2026-05-02 19:12:17
大局已定!湖火生死战不改赛程,雷霆半决赛G1时间敲定

大局已定!湖火生死战不改赛程,雷霆半决赛G1时间敲定

体育见习官
2026-05-02 11:02:54
想和你去散步:不是去哪里,是和你一起

想和你去散步:不是去哪里,是和你一起

疾跑的小蜗牛
2026-05-02 21:17:35
“把你打死我都赔得起”博主称在大理街头唱歌遭纹身男子威胁,报警后对方向其道歉,警方回应

“把你打死我都赔得起”博主称在大理街头唱歌遭纹身男子威胁,报警后对方向其道歉,警方回应

极目新闻
2026-05-02 20:27:22
香蕉放两天就会变黑,水果店老板教我一招,这样放半个月都不会坏

香蕉放两天就会变黑,水果店老板教我一招,这样放半个月都不会坏

暖心萌阿菇凉
2026-05-01 23:28:55
演员朱珠疑似塌房?照片流出,惊呆网友!

演员朱珠疑似塌房?照片流出,惊呆网友!

大眼妹妹
2025-12-15 10:39:19
触目惊心!美日合谋进行渗透,中国抓获的间谍个个都是厉害人物

触目惊心!美日合谋进行渗透,中国抓获的间谍个个都是厉害人物

霁寒飘雪
2026-04-27 09:59:55
特朗普称美国“几乎能立即接管”古巴

特朗普称美国“几乎能立即接管”古巴

界面新闻
2026-05-02 08:52:12
动容!东莞街头一男子突然倒地失去呼吸脉搏,3岁幼童在一旁茫然……他们出现了!

动容!东莞街头一男子突然倒地失去呼吸脉搏,3岁幼童在一旁茫然……他们出现了!

广东活动
2026-05-01 12:09:07
我退休金12000每月给女儿9千 午饭时女婿忽然说:妈以后给3800就好

我退休金12000每月给女儿9千 午饭时女婿忽然说:妈以后给3800就好

小影的娱乐
2026-05-02 01:20:59
骑士还给4年2.7亿续约吗?场均23+5,球星气质顶级,但天赋太差了

骑士还给4年2.7亿续约吗?场均23+5,球星气质顶级,但天赋太差了

你的篮球频道
2026-05-02 11:09:48
比披丝巾更可怕的是“瑜伽裤外穿”,廉价又卡裆,三角区更尴尬

比披丝巾更可怕的是“瑜伽裤外穿”,廉价又卡裆,三角区更尴尬

生命之泉的奥秘
2026-03-20 03:56:49
近照严重韩化,47岁高龄拼二胎的汤唯,这次要为自己的选择买单了

近照严重韩化,47岁高龄拼二胎的汤唯,这次要为自己的选择买单了

白面书誏
2026-05-01 18:02:02
2026-05-03 00:32:49
deephub incentive-icons
deephub
CV NLP和数据挖掘知识
1986文章数 1461关注度
往期回顾 全部

科技要闻

AI热潮耗尽库存,Mac Mini起售调高200美元

头条要闻

媒体:美国突然"翻脸" 对欧洲连打"三拳"一气呵成

头条要闻

媒体:美国突然"翻脸" 对欧洲连打"三拳"一气呵成

体育要闻

休赛期总冠军,轮到休斯顿火箭

娱乐要闻

高圆圆赵又廷游三亚 牵手逛街好甜蜜

财经要闻

雷军很努力 小米还是跌破了30港元大关

汽车要闻

同比大涨190% 方程豹4月销量29138台

态度原创

教育
游戏
时尚
健康
公开课

教育要闻

十一学校名师揭秘:顶尖高手,都不是补课补出来的

艾欧尼亚杯第二日:XR全胜晋级!决赛队伍出炉

连衣裙还得是“法式”,性感妩媚却不轻浮

干细胞治烧烫伤面临这些“瓶颈”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版