网易首页 > 网易号 > 正文 申请入驻

GraphRAG 与 RAG 的比较分析

0
分享至


检索增强生成(RAG)技术概述

检索增强生成(Retrieval-Augmented Generation,简称 RAG)是一种旨在提升大型语言模型(Large Language Models,LLMs)性能的技术方法。其核心思想是通过整合外部可靠知识库的信息来增强模型的输出质量。

RAG 的工作原理可以概括如下:当 LLM 接收到查询时,它不仅依赖于自身的预训练知识,还会主动从指定的知识源检索相关信息。这种方法确保了生成的输出能够参考大量上下文丰富的数据,并得到最新、最相关可用信息的支持。

RAG 系统的核心组件

标准 RAG 系统主要由三个关键组件构成:

  1. 检索器组件(Retriever Component):
  • 功能:在知识库或大规模文档集中搜索与查询主题高度相关的信息。
  • 工作方式:识别在语义上与查询相关的文档,并通过相似度度量(通常采用向量间的余弦相似度)计算相关性。
  1. 生成器(Generator):
  • 定义:通常是一个大型语言模型。
  • 输入:检索到的相关信息和原始查询。
  • 输出:基于输入生成响应。
  1. 知识库(Knowledge Base):
  • 用途:作为检索器查找文档或信息的数据源。

RAG 的工作流程

  1. 从外部源收集相关信息。
  2. 将收集到的信息附加到用户的原始提示中。
  3. 将增强后的提示作为输入发送给语言模型。
  4. 在生成阶段,LLM 结合增强提示和自身的训练数据表示,生成针对用户查询定制的响应。

这一过程产生的响应融合了个性化和可验证的信息,特别适用于聊天机器人等应用场景。

图2:检索增强生成流程示意

构建 RAG 系统的关键步骤

  1. 知识库准备:
  • 对文档进行索引
  • 创建文本嵌入
  1. 检索器模型:
  • 训练或微调,以有效搜索知识库
  1. 生成器模型:
  • 通常采用预训练的语言模型
  1. 系统集成:
  • 确保各组件无缝协作

Graph RAG 技术简介

Graph RAG 是 RAG 方法的一个高级变体,其特点是引入了图结构数据。与将知识库视为平面文档集合不同,Graph RAG 将信息表示为实体和关系的互联网络。

Graph RAG 的核心概念

Graph RAG 基于知识图谱(Knowledge Graphs,KGs)构建。知识图谱是现实世界实体及其关系的结构化表示,主要由两个基本元素组成:

  • 节点(Nodes):表示单个实体,如人物、地点、物体或概念。
  • 边(Edges):表示节点之间的关系,定义了实体间的连接方式。

相比于标准 RAG 使用向量相似度和向量数据库进行检索,Graph RAG 利用知识库进行更全面、系统的信息检索,从而提高了检索的完整性和准确性。

Graph RAG 的技术优势

Graph RAG 相较于标准 RAG 具有以下显著优势:

  1. 关系上下文捕捉:
  • 能够捕捉和利用信息片段之间的复杂关系,提供更丰富、更具语境的信息检索结果。
  1. 多跳推理能力:
  • 图结构支持系统沿关系链进行推理,实现更复杂、更深入的逻辑分析。
  1. 结构化知识表示:
  • 相比平面文档结构,图结构能更自然地表示层级和非层级关系,更贴近现实世界的知识组织方式。
  1. 查询效率提升:
  • 对于涉及关系遍历的查询类型,图结构可显著提高处理效率。

图3:知识图谱示例

Graph RAG 的工作原理

Graph RAG 的工作流程可以概括为以下几个关键步骤:

  1. 查询处理:
  • 对输入查询进行分析和转换,使其适合图结构的查询格式。
  1. 图遍历:
  • 系统在图结构中进行探索,沿相关关系路径寻找连接的信息节点。
  1. 子图检索:
  • 不同于检索独立的信息片段,系统提取包含相互关联上下文的相关子图。
  1. 信息整合:
  • 将检索到的子图进行组合和处理,形成一个连贯、全面的上下文信息集。
  1. 响应生成:
  • 语言模型基于原始查询和整合后的图信息生成最终响应。

Graph RAG 处理流程图

图4:Graph RAG 处理流程示意图

标准 RAG 与 Graph RAG 的关键区别

  1. 知识表示方式:
  • 标准 RAG:采用平面文档结构
  • Graph RAG:使用图结构表示知识
  1. 检索机制:
  • 标准 RAG:主要依赖向量相似度搜索
  • Graph RAG:采用图遍历算法进行信息检索
  1. 上下文理解能力:
  • Graph RAG 能够捕捉更复杂的多步骤关系,这些关系在标准 RAG 中可能被忽略
  1. 推理能力:
  • Graph RAG 的图结构支持对相互关联信息进行更深入、更复杂的推理

图5:RAG 与 Graph RAG 对比示意

总结

Graph RAG 技术通过引入图结构化的知识表示和处理方法,显著增强了传统 RAG 系统的能力。它不仅提高了信息检索的准确性和完整性,还为复杂查询和多步推理提供了更强大的支持。这种方法在处理需要深度上下文理解和复杂关系分析的任务中,展现出了明显的优势。

随着知识图谱技术和图数据库的不断发展,Graph RAG 有望在各种高级人工智能应用中发挥越来越重要的作用,特别是在需要精确、全面信息检索和复杂推理的领域。

https://avoid.overfit.cn/post/1c6163da1c1d43d099fad164d01710c1

作者:Praveen Raj

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
干不掉中国,那就扶持一个“中国”?美国看上了中国的这两个邻国

干不掉中国,那就扶持一个“中国”?美国看上了中国的这两个邻国

老谢谈史
2026-01-13 18:05:16
给老板当两年司机,男子帮公司贷款3750万,现在被债务折磨得很惨

给老板当两年司机,男子帮公司贷款3750万,现在被债务折磨得很惨

十九妹
2026-01-14 01:22:34
万科泊寓多地租户被清退:或赔付一个月租金,有房东称房租被拖欠 泊寓称已制定多种安置方案

万科泊寓多地租户被清退:或赔付一个月租金,有房东称房租被拖欠 泊寓称已制定多种安置方案

红星资本局
2026-01-13 21:07:08
退休10年后被查的“老虎”:8万元入股张家界大峡谷,退居“二线”后获利数千万元

退休10年后被查的“老虎”:8万元入股张家界大峡谷,退居“二线”后获利数千万元

上观新闻
2026-01-13 13:04:18
7连胜!山东主帅:关键在于我们的凝聚力和大家高度的思想统一

7连胜!山东主帅:关键在于我们的凝聚力和大家高度的思想统一

狼叔评论
2026-01-13 22:46:09
厄瓜多尔观鲸胜地海滩惊变血腥刑场  5人头被串起悬挂示众

厄瓜多尔观鲸胜地海滩惊变血腥刑场  5人头被串起悬挂示众

环球趣闻分享
2026-01-13 13:35:05
土耳其警告外国不要干预伊朗

土耳其警告外国不要干预伊朗

一种观点
2026-01-13 08:37:50
新的发现必将震惊世界,黄土高原的地底,埋藏着无数的古人类遗迹

新的发现必将震惊世界,黄土高原的地底,埋藏着无数的古人类遗迹

铭记历史呀
2025-12-19 20:28:59
利沃夫储气库炸了,欧洲家家户户慌了,战争冷到人心里去了

利沃夫储气库炸了,欧洲家家户户慌了,战争冷到人心里去了

勇志歌
2026-01-12 20:26:11
四川成都一佳人好漂亮,身高168cm,体重47kg 美的让人移不开眼

四川成都一佳人好漂亮,身高168cm,体重47kg 美的让人移不开眼

东方不败然多多
2026-01-07 10:20:04
“让我睡一次,不然死给你看!”17岁少年持刀,威胁舅妈发生关系

“让我睡一次,不然死给你看!”17岁少年持刀,威胁舅妈发生关系

有书
2026-01-09 21:30:59
于文红出手太阔绰!送小30岁男友1200w劳斯莱斯,男友提车乐开花

于文红出手太阔绰!送小30岁男友1200w劳斯莱斯,男友提车乐开花

乐悠悠娱乐
2026-01-09 10:18:55
阿尔特塔:哈弗茨还不能首发;萨利巴和特罗萨德出战存疑

阿尔特塔:哈弗茨还不能首发;萨利巴和特罗萨德出战存疑

懂球帝
2026-01-13 23:04:12
反转!中欧电车关税战终落幕 35.3%重税取消,最低价格承诺换和平

反转!中欧电车关税战终落幕 35.3%重税取消,最低价格承诺换和平

达文西看世界
2026-01-13 10:40:06
伊朗从骨子里瞧不上中国!弃GPS改用北斗,被美打痛不得已选中

伊朗从骨子里瞧不上中国!弃GPS改用北斗,被美打痛不得已选中

百态人间
2025-12-12 16:03:57
水电气、医疗、教育……上海最新价格标准公布!

水电气、医疗、教育……上海最新价格标准公布!

上观新闻
2026-01-13 23:14:19
一位在巴西开超市十年的老乡说:当地人恨我们,不是因为东西便宜

一位在巴西开超市十年的老乡说:当地人恨我们,不是因为东西便宜

南权先生
2025-12-13 16:51:47
顺风车订单挂了几小时没人接,乘客低下了高贵的头颅:求你了,能不能过来接我

顺风车订单挂了几小时没人接,乘客低下了高贵的头颅:求你了,能不能过来接我

网约车观察室
2025-11-30 10:38:12
案件:北京一女教授在家养病长达10年,民警进门后,当场愣在原地

案件:北京一女教授在家养病长达10年,民警进门后,当场愣在原地

五元讲堂
2024-12-24 16:57:49
商业航天第一股,火箭回收唯一低估大龙头,证金持股,北向加仓

商业航天第一股,火箭回收唯一低估大龙头,证金持股,北向加仓

财报翻译官
2026-01-13 13:39:09
2026-01-14 03:23:00
deephub incentive-icons
deephub
CV NLP和数据挖掘知识
1889文章数 1442关注度
往期回顾 全部

科技要闻

每年10亿美元!谷歌大模型注入Siri

头条要闻

特朗普:已取消所有与伊朗官员的会谈

头条要闻

特朗普:已取消所有与伊朗官员的会谈

体育要闻

他带出国乒世界冠军,退休后为爱徒返场

娱乐要闻

蔡卓妍承认新恋情,与男友林俊贤感情稳定

财经要闻

"天量存款"将到期 资金会否搬入股市?

汽车要闻

限时9.99万元起 2026款启辰大V DD-i虎鲸上市

态度原创

房产
艺术
健康
亲子
游戏

房产要闻

又一新校开建!海口这一片区,迎来教育重磅升级!

艺术要闻

461米!14亿美元!越南第一高楼,形如“竹捆”

血常规3项异常,是身体警报!

亲子要闻

孕激素的威力算是见识到了!网友:喝不下水,胆汁吐没了就吐泡泡

《生化危机 安魂曲》新发布会官宣 / Steam 推理游戏节开幕

无障碍浏览 进入关怀版