「你的原型能跑通,但上线就崩。」这是每个做检索增强生成(Retrieval-Augmented Generation,检索增强生成)的工程师都听过的嘲讽。
决策一:检索什么?
![]()
不是扔整篇文档进向量库。原文把内容切成100-400字的语义块,重叠20%保上下文。切太大丢细节,切太小碎成渣。
![]()
决策二:怎么表示?
嵌入模型(Embedding,文本向量化模型)选开源还是闭源?原文没给标准答案,但点出关键:领域术语多的场景,通用模型会翻车。
决策三:怎么召回?
向量相似度+关键词混合搜索是底线配置。纯向量在专有名词、缩写、ID上死得很难看。
决策四:怎么排序?
![]()
重排序模型(Reranker,结果精排模型)把候选从几百压到个位数。这步省算力,更省幻觉。
决策五:怎么生成?
提示词工程(Prompt Engineering,提示设计)不是玄学。原文强调:给模型明确的检索上下文边界,比让它自由发挥靠谱十倍。
五个决策,没有一个是算法突破,全是工程取舍。RAG的护城河不是技术深度,是你愿意为边界情况写多少分支代码。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.