网易首页 > 网易号 > 正文 申请入驻

乐产功场丨薛利华:RAG 答得不稳,可能一开始就切错了资料

0
分享至

【摘要】RAG 答得不稳,问题有时从资料入库前就埋下了。切片太粗,系统会召回一大块含混资料;切片太碎,条件、例外和适用范围又容易断开。产品经理不用盯技术参数,但要能追问资料按什么逻辑被切开,是否还能支撑完整回答。

一个企业做内部制度问答,系统已经接入了报销制度、差旅制度和培训管理办法。业务方测试时问:“去外地参加培训,住宿按什么标准报销?”

系统很快回答:按差旅住宿标准执行,并引用了差旅制度中的住宿标准表。看起来有资料、有引用、有解释,技术同学也觉得检索链路跑通了。

财务同事却指出,答案不完整。因为培训住宿还有一条额外规则:如果是公司统一组织的培训,住宿安排和报销口径要看培训管理办法里的例外说明。系统引用的那一段没错,但漏掉了真正决定答案的适用范围。

继续往前查,才发现问题并没有发生在最终生成阶段。制度入库时,差旅标准表被切成了一块,培训适用范围被切到了另一块,例外说明又被拆到后面。用户问的是一个完整业务场景,系统拿到的却只是几个断开的资料片段。

这就是很多 RAG 答得不稳时容易被忽略的一层:资料已经接进来了,也能被检索到,可资料在进入知识库时被切得太粗、太碎或关系断开,后面的召回、组织和生成都会跟着不稳。



01|答不稳,先看资料怎么切

很多团队看到 RAG 答错,第一反应会去看模型、提示词、召回率、重排效果。这个方向没有错,但如果资料切片阶段已经把规则切断,后面调很多参数,也可能只是在碎片上继续加工。

用户问的是一个完整问题,系统检索到的是一个个资料块。资料块怎么切,决定了系统能不能找到合适证据,也决定了模型拿到证据后能不能组织出完整答案。人读制度时,可以前后翻几页,把定义、条件、例外、适用范围连起来看;RAG 系统通常先拿到若干片段,再尝试把这些片段组织成回答。

问题就在这里。切片如果没有贴着业务语义走,系统可能只拿到“看起来相关”的片段。比如只拿到标准,没有拿到例外;只拿到定义,没有拿到适用范围;只拿到结论,没有拿到前置条件。答案表面上有依据,业务上仍然会偏。

产品经理在这里要做一个取舍:看到答得不稳时,先别急着把问题都归到模型能力或检索参数上,要回头看一眼资料进入知识库时的切法。资料是按页切、按标题切、按段落切,还是按业务规则切?一条完整规则有没有被拆开?一个资料块里是不是混了太多主题?这些问题会直接影响后面的回答质量。



02|切得太粗,召回会变钝

切片太粗时,最常见的问题是系统“找到了资料”,但找得不够准。一个资料块里可能同时塞进定义、流程、标准、例外、注意事项,甚至混着多个业务主题。检索命中了这一大块资料,系统看起来没有漏召回,可真正相关的内容被埋在一堆弱相关信息里。

比如一份差旅制度里,同一页同时写着交通标准、住宿标准、餐补标准和审批流程。用户只问住宿标准,系统召回了整页内容。模型拿到这一块后,可能会把交通审批、住宿金额、餐补规则混在一起解释。回答看起来很完整,实际重点已经散了。

切得太粗还会让相似问题互相干扰。用户问“外地培训住宿怎么算”,系统召回了一大块差旅制度;用户问“客户拜访住宿怎么算”,系统也召回同一块。两个场景都出现“住宿标准”,但适用条件不同。如果资料块过大,系统很难从这一大块里分清用户到底问的是哪一种业务场景。

产品经理不需要判断具体切片长度该是多少,但要能判断资料块是否承载了过多主题。一个简单标准是:如果一个资料块被召回后,里面只有一小段和用户问题有关,其余内容都在制造干扰,这个切片大概率太粗。召回有结果,只说明系统找到了文字;召回是否有用,还要看这块资料能不能精准支撑当前问题。

03|切得太碎,答案会断线

切片太碎时,问题会换一种形式出现:系统找到的每个片段单独看都对,但放在一起支撑不了完整答案。制度、FAQ、产品手册里的很多规则,本来就需要前后几段一起理解。切得太碎之后,条件、例外、适用范围、操作步骤被拆开,系统只拿到其中一小块,就容易答得片面。

比如一条报销规则分成三段:第一段写适用对象,第二段写报销标准,第三段写例外情况。用户问“实习生外出培训能不能报销住宿”,系统只召回了第二段标准,就可能直接回答“可以按标准报销”。可真正决定答案的是第一段的适用对象和第三段的例外条件。

这类错误特别隐蔽,因为被引用的片段本身可能没有错。问题出在片段太孤立,无法支撑完整判断。业务方看到答案时,会觉得“这句话好像来自制度,但怎么少了关键条件”;技术同学看到检索结果时,会觉得“相关内容已经召回了”。双方都没完全错,真正的问题是资料块之间的语义关系断了。

产品经理可以这样追问:这条规则是否需要前后文才能成立?用户问的场景是否需要同时看到定义、条件、例外和适用范围?如果一个片段单独拿出来会改变原意,就不能只看它有没有被召回,还要看系统能不能同时拿到支撑完整回答的相邻资料。



04|资料块不稳,组织也会乱

RAG 回答并不只取决于“有没有找到资料”。找到资料之后,系统还要把多个资料块组织成一段答案。切片不合理时,组织阶段也会变得很难:资料块之间关系不清、顺序不明、主次不稳,模型就容易把几个片段拼成一个看似顺畅但逻辑不完整的回答。

比如用户问“试用期员工出差报销怎么走流程”。系统可能召回三块资料:一块是出差报销流程,一块是试用期员工管理规定,一块是费用审批权限表。三块资料都相关,但它们之间谁决定适用范围、谁决定流程、谁决定审批权限,需要有清楚关系。切片如果没有保留标题层级、上下位关系和适用范围,模型就只能凭片段内容去拼。

这时答案容易出现两种问题。第一种是拼漏了:系统只回答流程,漏掉试用期员工的特殊限制。第二种是拼混了:系统把不同制度里的条件揉成一段折中表达,让答案看起来很稳,实际业务口径并不成立。

后面还会继续讲召回、重排、生成这些环节该怎么看,本篇先把上游问题收住:如果资料块本身切得不稳,后面的排序和生成都会被迫在不完整证据上工作。产品经理要能把问题往前推一层,不只看最终答案顺不顺,也要看答案背后的资料块是否能组成一条完整证据链。



05|产品经理要追问切法

产品经理不需要替技术同学设计切片算法,但要能提出能推进排查的问题。看到 RAG 答得不稳,可以先拿几条典型错误样例,反查系统当时召回了哪些资料块,再看这些资料块是否真的足够支撑答案。

第一,要问资料是按什么逻辑切开的。按页切、按固定长度切、按标题切、按段落切,得到的效果会不同。对于制度、FAQ、产品手册这类资料,只按长度切开,往往会把业务规则拆断;只按页面切开,又可能把太多主题塞在一块。

第二,要看一条完整规则有没有被拆散。凡是涉及“适用对象、适用条件、例外情况、处理流程、责任部门”的内容,都要警惕切片把前后关系拆开。单个片段看起来相关,不能直接说明它足够支撑回答。

第三,要用真实问题回放切片效果。产品经理可以拿高频问题、边界问题和容易误答的问题,让团队回看召回结果:该召回的资料块有没有出现?不该出现的资料块为什么也被找到了?被召回的资料块合在一起,是否能支持一个完整答案?

这几个问题问完,本篇的判断就可以收住:RAG 答得不稳,不一定要从模型开始改,也不一定一上来就调重排。很多时候,资料在进入知识库时已经埋下了不稳的种子。先看资料怎么切,才能判断后面是该补资料、改切片、调召回,还是进入更完整的链路排查;下一篇,我们继续看:用户随口一问,RAG 为什么就找不到资料?

#RAG #RAG设计 #AI产品经理 #知识库 #资料切片 #检索召回 #资料治理 #产品经理 #AI产品经理培训 #企业知识库

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
州长亲自招募詹姆斯:我们生活质量第一

州长亲自招募詹姆斯:我们生活质量第一

林间小温柔
2026-07-02 01:20:39
白玉兰视后输给90后杨紫,转头吴越就上央视领国家级大奖。

白玉兰视后输给90后杨紫,转头吴越就上央视领国家级大奖。

动物奇奇怪怪
2026-07-02 20:25:57
连续8跌停!002217,控股股东拟最多增持1亿元!

连续8跌停!002217,控股股东拟最多增持1亿元!

证券时报e公司
2026-07-02 23:41:49
太罕见!今夜,102家A股公司提示风险

太罕见!今夜,102家A股公司提示风险

新浪财经
2026-07-02 22:58:34
SpaceX 亮出超薄 AI 手机原型,比 iPhone 更轻薄

SpaceX 亮出超薄 AI 手机原型,比 iPhone 更轻薄

环球网资讯
2026-07-02 10:55:41
世界银行做出决定,五年内对中国停止贷款,美国第一时间出面祝贺

世界银行做出决定,五年内对中国停止贷款,美国第一时间出面祝贺

看尽人间百态
2026-07-02 10:27:39
央视罕见公开西太对峙细节!日舰模拟攻击辽宁舰,结果沉默?

央视罕见公开西太对峙细节!日舰模拟攻击辽宁舰,结果沉默?

青青衫书生
2026-06-30 13:24:21
80后,正成为社会的高危人群

80后,正成为社会的高危人群

职场资深秘书
2026-07-02 20:10:34
2交易日后!自由市场还剩13大牌:哈登、威少领衔1号位!

2交易日后!自由市场还剩13大牌:哈登、威少领衔1号位!

运筹帷幄的篮球
2026-07-02 17:39:07
2026高考出现反常一幕:国防科大暴跌,另一所军校却涨了102分

2026高考出现反常一幕:国防科大暴跌,另一所军校却涨了102分

妍妍教育日记
2026-06-29 19:27:46
陪玩陪睡只是皮毛!继手伸进裤子后,又一女星自曝,50多都不放过

陪玩陪睡只是皮毛!继手伸进裤子后,又一女星自曝,50多都不放过

不似少年游
2026-06-22 19:32:51
拜仁官宣!签下25岁摩洛哥攻击手赛巴里

拜仁官宣!签下25岁摩洛哥攻击手赛巴里

竞技风云录
2026-07-02 00:41:03
大量上市,5毛一斤吃得起,买15斤晒干存着,炖肉比肉还香

大量上市,5毛一斤吃得起,买15斤晒干存着,炖肉比肉还香

华庭讲美食
2026-06-07 14:46:53
大降0.97元/升后,明晚12时汽柴油“再大降”,预跌825元/吨

大降0.97元/升后,明晚12时汽柴油“再大降”,预跌825元/吨

猪友巴巴
2026-07-02 09:10:57
入夏后,少买黄瓜茄子,多吃8种“碱性菜”,鲜嫩营养,应季而食

入夏后,少买黄瓜茄子,多吃8种“碱性菜”,鲜嫩营养,应季而食

美食店主
2026-06-30 08:19:55
中国空调欧洲订单大增 集运企业:每天四五十台寄到转运仓库,多从成都和惠州发货

中国空调欧洲订单大增 集运企业:每天四五十台寄到转运仓库,多从成都和惠州发货

封面新闻
2026-07-02 20:05:04
美联储主席,重要表态

美联储主席,重要表态

环球网资讯
2026-07-02 21:09:20
艺人疑似高铁车厢脱鞋被拍 业内人士:脱鞋不违规,但违背文明乘车倡议

艺人疑似高铁车厢脱鞋被拍 业内人士:脱鞋不违规,但违背文明乘车倡议

封面新闻
2026-07-01 21:52:25
7月4日左右开始!四川将迎来首轮“烧烤型”高温天气

7月4日左右开始!四川将迎来首轮“烧烤型”高温天气

掌上金牛
2026-07-02 18:13:04
赚着中国人钱,毒害中国人身体,日企在华收割万亿,至今仍在售卖

赚着中国人钱,毒害中国人身体,日企在华收割万亿,至今仍在售卖

云舟史策
2026-07-02 07:09:53
2026-07-03 00:11:00
来学吧
来学吧
培养产品经理的黄埔军校
115文章数 12关注度
往期回顾 全部

科技要闻

马斯克不承认,但SpaceX就该造AI手机

头条要闻

多国元首和高官将参加哈梅内伊葬礼 莫迪受邀无法出席

头条要闻

多国元首和高官将参加哈梅内伊葬礼 莫迪受邀无法出席

体育要闻

韩国人,为什么恨透了洪明甫?

娱乐要闻

众星祝福祖国,曾沛慈原形毕露?

财经要闻

千亿茶市场无赢家:澜沧巨亏 八马停"蹄"

汽车要闻

有纯电有增程 还有二代VLA支持 小鹏MONA L03预售价14.38万起

态度原创

房产
数码
本地
旅游
公开课

房产要闻

稀缺预警!海岸线200米+限墅令下,海南「绝版硬通货」来了!

数码要闻

大疆推出迷你无线麦克风DJI Mic Mini 2S,399-1199元

本地新闻

这场穿越酉阳的光影之旅,张张都是壁纸!

旅游要闻

曲靖藏着一座千年古城,史料写得清清楚楚,实地却找不到完整城郭

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版