网易首页 > 网易号 > 正文 申请入驻

200行代码 vs 全家桶框架:手撕RAG系统后,我把LangChain扔进了回收站

0
分享至

检索增强生成(RAG)已经成为给大模型应用添加知识库的标准做法。用户提问时,系统从你的数据里找出相关片段,连同问题一起丢给模型,模型基于你提供的上下文作答。

但大多数教程一上来就搬出LangChain。这篇指南跳过框架,从零开始搭建完整流水线:pgvector负责向量存储,OpenAI Python SDK处理嵌入和生成,psycopg对接数据库。最终代码不到200行。


数据库设计:三张表搞定核心架构

pgvector是PostgreSQL的向量扩展,把向量检索直接塞进关系数据库。不需要额外维护一套专用向量库,备份、权限、事务都能复用现有基础设施。

表结构很直白。documents表存文档元数据:标题和来源。chunks表存切片后的文本块,每个块带1536维向量,用HNSW索引加速相似度搜索。索引参数设成m=16、ef_construction=64,在构建速度和召回率之间取平衡。

这里有个细节:token_count字段预留了,但实际代码里用的是len(chunk.split())做简单估算。生产环境建议换用tiktoken精确计算,避免超出模型上下文窗口。

文本切片:滑动窗口策略

chunk_text函数实现了带重叠的滑动窗口。默认每块400词、重叠50词。重叠设计是为了防止关键信息正好落在边界被切断。比如"2024年第三季度营收增长"如果切成"2024年第三季度"和"营收增长",语义就碎了。

嵌入环节做了批处理优化。OpenAI的嵌入接口单次最多接受256条输入,代码里用range(0, len(chunks), 256)分批处理,避免超长列表被截断或触发速率限制。

模型选的是text-embedding-3-small,1536维输出,成本和性能的平衡点。如果预算充裕且对精度敏感,可以换成text-embedding-3-large,3072维,但价格翻几倍。

检索逻辑:余弦相似度的SQL实现

retrieve_chunks函数是核心。先把问题转成向量,然后执行这条SQL:

SELECT c.content, d.title, 1 - (c.embedding <=> %s::vector) AS similarity...

<=>是pgvector的余弦距离运算符,返回0到2之间的值(0表示完全相同)。用1减去距离得到相似度分数,方便人类阅读。JOIN操作把文本块和原始文档关联,输出时带上来源标题,方便追溯。

limit=5默认返回前5个最相关块。这个值需要根据实际场景调:知识库密集、答案分散时加大,文档结构清晰、答案集中时减小,省token。

生成环节:强制约束模型

answer_question函数把检索结果格式化成上下文块,用---分隔,前面标注来源。system prompt很直接:"Answer using only this context",禁止模型调用预训练知识瞎编。

temperature=0.2压低随机性,适合事实性问答。如果要做创意写作或头脑风暴,可以调高到0.7-0.9。

模型选gpt-4o-mini,便宜、快、够用。上下文窗口128K,但这里检索结果通常几千token,远未触顶。

为什么选pgvector,而不是专用向量数据库?

这是架构上最关键的取舍。Pinecone、Weaviate、Milvus这些专用方案在超大规模场景确实有优势,但大多数应用根本到不了那个量级。

pgvector的好处是减少技术栈复杂度。你的用户数据、业务数据、向量数据全在一个库里,JOIN查询不用跨服务,事务能保证一致性,备份策略统一。团队如果已经有PostgreSQL经验,学习成本几乎为零。

性能方面,HNSW索引在百万级向量上查询延迟通常在10-50毫秒,对交互式应用足够快。真到千万级再考虑分片或迁移也不迟——向量导出导入比想象中还简单。

这套代码缺什么?

生产部署至少还要补几块:重排序(reranking),用更精确的模型对初筛结果二次打分;查询重写,把口语化问题扩展成更利于检索的表述;缓存层,常见问题的嵌入结果和答案直接命中;监控,追踪检索命中率、答案相关性、延迟分布。

但这些增量改进,在200行骨架上扩展,比从LangChain的抽象层里扒拉出来要直观得多。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美国万万没想到,别国军备是为了打仗,中国军工却为以防万一?

美国万万没想到,别国军备是为了打仗,中国军工却为以防万一?

栗子熟了呀
2026-05-14 08:37:30
小米SU7 Ultra挖孔机盖案 一审宣判

小米SU7 Ultra挖孔机盖案 一审宣判

每日经济新闻
2026-05-13 23:52:11
45万“买”烟草局编制?诈骗人员伙同物业员工,带人进成都市烟草局会议室“面试”,两年多时间里诈骗36人获利874万,主犯获刑13年6个月

45万“买”烟草局编制?诈骗人员伙同物业员工,带人进成都市烟草局会议室“面试”,两年多时间里诈骗36人获利874万,主犯获刑13年6个月

扬子晚报
2026-05-14 07:28:52
俄宣发布虚假消息,称苏-57战机在乌克兰上空击落萨博-340预警机

俄宣发布虚假消息,称苏-57战机在乌克兰上空击落萨博-340预警机

走进乌克兰2022
2026-05-14 19:48:01
庄则栋临终前放心不下日本妻子,眼噙泪水:你没有医保,没有工资

庄则栋临终前放心不下日本妻子,眼噙泪水:你没有医保,没有工资

抽象派大师
2026-05-12 20:36:26
悉尼妹的R级片,竟然引进了

悉尼妹的R级片,竟然引进了

来看美剧
2026-05-13 23:07:16
热刺已追平上赛季积分,还剩两轮比赛

热刺已追平上赛季积分,还剩两轮比赛

懂球帝
2026-05-14 15:58:14
174亿元!国内最大Token大单,首次开标

174亿元!国内最大Token大单,首次开标

智东西
2026-05-14 11:01:16
第1现场|俄乌对峙下的红场阅兵:36年来首次未见坦克

第1现场|俄乌对峙下的红场阅兵:36年来首次未见坦克

澎湃新闻
2026-05-09 21:40:28
麻省理工发现:唤醒孩子自律最快的方法,竟是飞轮效应!

麻省理工发现:唤醒孩子自律最快的方法,竟是飞轮效应!

户外阿毽
2026-05-10 19:24:43
岳云鹏探望蔡磊,称渐冻症攻克后会去演出!有意收蔡磊儿子为徒

岳云鹏探望蔡磊,称渐冻症攻克后会去演出!有意收蔡磊儿子为徒

娱乐团长
2026-05-14 14:13:13
记者:申花外援仅拉唐一人随队出征玉溪,刘诚宇出战待定

记者:申花外援仅拉唐一人随队出征玉溪,刘诚宇出战待定

懂球帝
2026-05-14 15:37:17
日本乒协没想到,世乒赛刚被国乒打懵,张本智和就率先传出坏消息

日本乒协没想到,世乒赛刚被国乒打懵,张本智和就率先传出坏消息

刘剮说体坛
2026-05-14 10:15:11
国际足联代表团到访北京工人体育场

国际足联代表团到访北京工人体育场

新京报
2026-05-14 17:55:19
迄今为止,天安门城楼上只挂过12个人画像,其中一人仅挂了1天

迄今为止,天安门城楼上只挂过12个人画像,其中一人仅挂了1天

文史达观
2025-05-08 12:39:14
从每年2.1万飙升至超1200万,能不贬值才怪!

从每年2.1万飙升至超1200万,能不贬值才怪!

灯锦年
2026-05-14 20:42:46
忍了大半年,闻泰科技终于亮剑:荷兰政府抢走的,连本带利赔80亿

忍了大半年,闻泰科技终于亮剑:荷兰政府抢走的,连本带利赔80亿

知法而形
2026-05-14 12:02:59
父母的无效人脉能让人多恼火?网友:亲戚水电,两代人都踩雷了!

父母的无效人脉能让人多恼火?网友:亲戚水电,两代人都踩雷了!

另子维爱读史
2026-05-14 20:24:27
特朗普访华首日,大陆宣布统一后安排!岛内学者:台军应对付台独

特朗普访华首日,大陆宣布统一后安排!岛内学者:台军应对付台独

陈意小可爱
2026-05-14 20:41:24
岳父是高管,岳母开公司,娶了乒乓冠军的许昕,在上海儿女双全

岳父是高管,岳母开公司,娶了乒乓冠军的许昕,在上海儿女双全

素衣读史
2026-05-13 20:17:12
2026-05-14 21:47:01
字节漫游指南
字节漫游指南
有态度网友ytd
3879文章数 41关注度
往期回顾 全部

科技要闻

马斯克说会谈很顺利 黄仁勋点赞 库克比耶

头条要闻

重庆"萌感"佛头意外走红 雕刻者:不是文物且尚未完工

头条要闻

重庆"萌感"佛头意外走红 雕刻者:不是文物且尚未完工

体育要闻

争议抽象天王山,和季后赛最稳定中锋

娱乐要闻

何九华官宣当爸!全程不提孩子妈

财经要闻

李强会见美国工商界代表

汽车要闻

双零重力座椅/AI智能体/调光天幕 启境GT7内饰发布

态度原创

艺术
房产
本地
手机
公开课

艺术要闻

美国务卿鲁比奥点赞中式美学,实景令人惊叹!

房产要闻

海南楼市新政要出!拟调公积金贷款额度,最高可贷168万!

本地新闻

用苏绣的方式,打开江西婺源

手机要闻

vivo S60预热开启,超大面积一体冷雕玻璃

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版