网易首页 > 网易号 > 正文 申请入驻

OpenAI把RAG藏了3年,开发者发现后集体破防

0
分享至

92%的AI项目死在同一个环节:不是模型不够聪明,是喂进去的东西不对。

我见过太多团队砸钱换GPT-4、 Claude 3,结果输出还是像醉汉胡诌。问题根本不在模型——在检索。这就像雇了个哈佛博士当客服,却给他一本1998年的黄页查电话。

从"猜答案"到"查答案":RAG到底改了什么

传统大语言模型(LLM,Large Language Model)的工作方式是闭卷考试。训练时读过的书不能带进场,全凭记忆答题。RAG(检索增强生成,Retrieval-Augmented Generation)改成开卷考:先翻资料,再动笔。

核心流程就三步:用户提问→系统检索相关文档→模型基于检索结果生成回答。

2020年Meta发表论文提出RAG框架时,业内反响平平。直到2023年ChatGPT爆火,开发者才发现一个尴尬事实:模型知道"2024年美国总统是谁",是因为训练数据截止时间;但你的内部文档、上周的客户邮件、今早的行业报告,它一概不知。

这个盲区直接催生了RAG的爆发。微软2023年Build大会宣布Azure OpenAI服务原生支持RAG架构,AWS同年推出Knowledge Bases for Amazon Bedrock。不是大厂突然良心发现——是企业客户真金白银的投诉堆出来的。

搭一套RAG,到底要闯几关

第一步是切分文档。PDF、Word、网页全扔进去?不行。模型有上下文长度限制,得把长文档切成几百字的"块"(chunk)。切大了检索不精准,切小了丢上下文。我见过一个金融团队把招股书切成50字片段,结果"净利润增长"和"源于主营业务"被拆到两个块里,模型读完以为公司在亏钱。

第二步是向量化。每个文本块要转成一组数字(向量,vector),语义相近的内容在数学空间里距离就近。"苹果股价"和"AAPL走势"会被扔到相邻角落,"苹果派食谱"则隔得很远。OpenAI的text-embedding-3模型把1536维向量做到成本降了5倍,精度还涨了,这是2024年RAG普及的关键推手。

第三步是检索策略。最简单的做法是向量相似度搜索:用户问题也转成向量,找最近的邻居。但纯语义匹配会翻车——用户问"怎么退款",文档里写的是"退货政策",向量距离可能很远。所以生产环境要加关键词过滤、重排序(rerank)、甚至让模型自己判断哪些文档真的有用。

一个冷知识:ChatGPT的"浏览"功能就是RAG的工程化包装。2023年3月OpenAI给它加了Bing搜索,9月又撤回,12月重新上线。这来回折腾不是因为技术难,是检索结果的质量控制太难做——搜到垃圾网页,GPT-4也会一本正经地胡说。

那些血淋淋的踩坑现场

2023年某法律科技公司上线RAG系统,把10万份判决书喂给模型。测试时效果很好,上线第一周就出事:用户问"强奸罪量刑标准",系统检索到一份"强奸罪无罪辩护成功"的判决书,模型输出"强奸罪可能判无罪"。客户差点被告。

问题出在检索逻辑。系统按语义相似度召回Top 5文档,没做内容安全过滤。判决书里的"无罪"是程序事实,不是法律结论,但模型分不清。

另一个坑是多轮对话。用户先问"你们支持哪些支付方式",再问"那手续费多少"。第二轮的"那"指代什么?系统得把历史对话一起向量化,否则检索会跑偏到"手续费"的字面意思,漏掉"支付宝1.2%、微信0.6%"这种具体数字。

更隐蔽的是数据更新。某电商用RAG做客服,商品库存存在向量数据库里。大促时库存每秒变,向量检索结果却是5分钟前的缓存。用户拍下显示"有货"的商品,付款时已经售罄。技术负责人后来把实时库存走API查,只把商品详情页扔给RAG,才解决一致性问题。

2024年的新玩法:从"能跑"到"好用"

向量数据库赛道去年卷疯了。Pinecone融资1.38亿美元,Milvus开源社区月活翻倍,连PostgreSQL都加了pgvector插件。但真正的分水岭是检索质量的评估工具——以前调RAG像蒙眼射箭,现在有了RAGAS、ARES这些框架,可以自动算"检索到的文档对回答有没有用"。

微软研究院2024年2月发的论文提出"GraphRAG",把文档先建成知识图谱再检索。传统RAG问"公司A和公司B有什么关系",得运气爆棚才能同时检索到两条相关记录;GraphRAG直接走图谱边,把"共同投资方""竞品关系"这种结构化关联挖出来。测试显示复杂问答的准确率从46%提到71%,代价是建索引的成本涨3倍。

更务实的改进是混合检索。向量搜语义,BM25(一种关键词匹配算法)搜精确词,结果合并重排。Elasticsearch 8.11版本原生支持这种玩法,延迟从200ms压到50ms以内——这对客服场景是生死线,用户等3秒就开始骂。

还有一个趋势叫"Agentic RAG"。系统不再一次性检索完事,而是让模型自己决定"这个问题需要查资料吗""查完一轮够了吗"。LangChain的Self-RAG实现里,模型每生成一句话就自检"需不需要核实",需要就触发二次检索。延迟高了,但幻觉率从23%降到4%。

说白了,RAG已经从"技术 demo"变成"工程基建"。2023年跑通流程就能拿融资,2024年要比谁检索准、延迟低、成本低。某头部云厂商的解决方案架构师告诉我,他们现在接RAG项目,客户第一句问的不是"用哪个模型",是"检索准确率能做到多少"。

如果你正在搭RAG系统,最后一个建议:先别急着优化向量模型,去翻你的检索日志。用户实际问了什么、系统召回了什么、模型用没用到——这三者的差距,往往比算法选型更致命。

你的RAG系统,最近一次检索失败是什么时候?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
妈妈去世,爸爸去日本打工后失联,长春姐弟俩被遗留在托管班两年,最新消息:相关部门介入调查,将为两人建立学籍,在托管班附近小学就读

妈妈去世,爸爸去日本打工后失联,长春姐弟俩被遗留在托管班两年,最新消息:相关部门介入调查,将为两人建立学籍,在托管班附近小学就读

鲁中晨报
2026-04-13 21:24:11
受权发布|中华人民共和国国务院令  第835号

受权发布|中华人民共和国国务院令  第835号

新华社
2026-04-13 17:03:04
遭绳子锁喉的13岁男孩已转诊北京,母亲哭得看不清手机上的字:孩子气道食管破裂,后续花费非常大

遭绳子锁喉的13岁男孩已转诊北京,母亲哭得看不清手机上的字:孩子气道食管破裂,后续花费非常大

极目新闻
2026-04-13 11:23:58
必须严惩,中国篮协宣布重要决定,18岁小将面临被重罚要背锅

必须严惩,中国篮协宣布重要决定,18岁小将面临被重罚要背锅

宗介说体育
2026-04-13 10:39:28
曾志伟大办素宴!席开60桌,超多港星现身,邱淑贞素颜判若两人

曾志伟大办素宴!席开60桌,超多港星现身,邱淑贞素颜判若两人

裕丰娱间说
2026-04-13 09:12:26
特朗普:前一天有34艘船只通过霍尔木兹海峡

特朗普:前一天有34艘船只通过霍尔木兹海峡

财联社
2026-04-14 00:52:33
中美俄同时力挺也没用,匈牙利强人欧尔班为何大败?

中美俄同时力挺也没用,匈牙利强人欧尔班为何大败?

码头青年
2026-04-13 12:32:33
曝《寂静岭》等大作将被国内禁售!全平台下架封禁

曝《寂静岭》等大作将被国内禁售!全平台下架封禁

游民星空
2026-04-13 11:12:18
说封就封!美国4月13日锁死伊朗港口,伊朗傻眼

说封就封!美国4月13日锁死伊朗港口,伊朗傻眼

老马拉车莫少装
2026-04-13 10:02:14
欧尔班:泽连斯基笑到了最后

欧尔班:泽连斯基笑到了最后

史政先锋
2026-04-13 16:03:44
上海地铁9号线上,男子携带拉杆箱咋有“血”渗出来? 地铁回应:装有冷冻食品鸭血,时间长融化了

上海地铁9号线上,男子携带拉杆箱咋有“血”渗出来? 地铁回应:装有冷冻食品鸭血,时间长融化了

大风新闻
2026-04-13 19:00:06
美国中央司令部修复了特朗普的“封锁令bug”

美国中央司令部修复了特朗普的“封锁令bug”

凤眼论
2026-04-13 09:50:25
新iPhone 最新曝光,首次采用新设计

新iPhone 最新曝光,首次采用新设计

科技堡垒
2026-04-13 11:39:06
王石和秦枫,必有一个要进去

王石和秦枫,必有一个要进去

葱哥说
2026-04-13 10:28:28
手握百亿,拥有顶级医疗资源,赌王女儿仍去世,60岁的她得什么病

手握百亿,拥有顶级医疗资源,赌王女儿仍去世,60岁的她得什么病

阿纂看事
2026-04-13 11:48:21
国家烟草专卖局:坚决拥护党中央决定

国家烟草专卖局:坚决拥护党中央决定

新京报
2026-04-13 15:25:08
绿牌医美变白牌!多地新能源车主跟风改色 交管:一次记9分

绿牌医美变白牌!多地新能源车主跟风改色 交管:一次记9分

快科技
2026-04-13 19:18:41
热搜第一!员工中1500万元彩票后离职?科大讯飞最新发文,知情人士:确有员工中奖,但金额不对

热搜第一!员工中1500万元彩票后离职?科大讯飞最新发文,知情人士:确有员工中奖,但金额不对

每日经济新闻
2026-04-13 20:59:45
欧尔班时代结束,匈牙利选出新总理,对华态度曝光,最大赢家浮现

欧尔班时代结束,匈牙利选出新总理,对华态度曝光,最大赢家浮现

军机Talk
2026-04-13 13:51:25
1700万知青的悲哀:青春被剥夺,余生皆颠簸

1700万知青的悲哀:青春被剥夺,余生皆颠簸

爱历史
2026-04-13 14:37:57
2026-04-14 01:31:00
薛定谔的BUG
薛定谔的BUG
有态度网友ytd
1346文章数 35关注度
往期回顾 全部

科技要闻

"抄作业"近四年,马斯克版微信周五上线

头条要闻

上海女子2个月内结2次婚 生下的孩子却是第3个男人的

头条要闻

上海女子2个月内结2次婚 生下的孩子却是第3个男人的

体育要闻

一支球队不够烂,也是一种悲哀

娱乐要闻

初代“跑男团”合体,邓超、鹿晗缺席

财经要闻

谈判未完全关闭?3国力促美伊重启谈判

汽车要闻

不止命名更纯粹 领克10/10+要做纯电操控新王

态度原创

教育
时尚
家居
亲子
游戏

教育要闻

老师们活的通透的几大标准,看看你做到了吗?

今年春夏一定要拥有的4条裙子,这样穿减龄又好看!

家居要闻

复古风格 自然简约

亲子要闻

老了才明白:不管多 心疼儿女,帮忙带 娃时,都要留意这3点

《GTA6》或不及前作轰动?前作配音:现实太抽象

无障碍浏览 进入关怀版