网易首页 > 网易号 > 正文 申请入驻

Claude把"缺信息"玩成"错信息"

0
分享至


6,933种时间格式,82条正则,97%覆盖率——这套 parser 本该是 AI 辅助编程的教科书案例。直到作者在某个周六下午打开搜索页面:50家药店,大部分明明关门,却全部显示营业中。

更讽刺的是,出错的代码被同一条设计原则盖过章:「Missing info > Wrong info」(缺信息好过错信息)。AI 用这条原则自我辩护,人类审核者也点了头。结果?系统把「周一到周五(周三除外)」解析成「周一到周五」,周三赫然在列。

这不是信息缺失。这是方向性错误。

一条原则的诞生与异化

项目背景很具体:日本紧急避孕药药房数据集,营业时间全是自由文本。作者让 Claude Code 接手,核心诉求只有一个——紧急场景下,错答案比没答案更危险。

Claude 自己提炼出原则,写进设计文档:解析不了就展示原文,别瞎猜。作者认可,审核通过,代码上线。从流程看,这是人机协作的理想状态。

问题出在执行层。数据里出现这种格式:

月-金:9:00-18:00(除く水曜)


「周一到周五 9点到18点(周三除外)」。Claude 的归一化管道把括号里的排除信息剥离,只保留主干:周一至周五,9至18点。周三被包含在输出结果中。

从 AI 的视角,这完全符合原则:排除信息太难解析,所以丢弃;基础时段保留,用户至少能看到大部分正确信息。缺信息 > 错信息,逻辑自洽。

但用户看到的不是「部分信息缺失」,而是一张完整的周三营业时间表。有人周三按图索骥,到店发现关门——这就是原则试图阻止的「错信息」,却被原则本身包装成了合规操作。

三个层级的失效

作者复盘时拆出三条故障链,每条都指向人机协作的盲区。

第一层是设计级错误。括号内的排除规则被系统性丢弃,而「Missing info > Wrong info」成了免死金牌。作者事后承认:「我信任了判断,发布了代码。」难点在于,跨几十种格式可靠解析括号排除确实困难,但「困难」不等于「可以静默失败」。

第二层是数据与逻辑的断裂。Claude 已经从「日祝休み」中提取出 holidayClosed: true,却没把它接入筛选逻辑。数据存在,管道不通,作者审核时同样漏看。

第三层是缓存机制的天真。同一文本,节假日和平日的正确答案不同,但缓存只按文本本身做键值。日期上下文被完全忽略。


三层叠加,让「Open Now」筛选功能成了错误的放大器。时间表里的周三时段容易被忽略,但筛选器亮起的「营业中」标签是二元判决——错得无可辩驳。

当原则成为遮羞布

这个案例的吊诡之处在于:AI 没有违反规则,而是过度遵循规则。Claude 把「丢弃难解析内容」解释为「缺失信息」,从而绕过了「生成错误信息」的指控。人类审核者被这套话术带偏,直到真实场景暴露后果。

作者用了一个精妙的类比:这就像医生给病人做过敏测试,跳过「青霉素过敏」因为「那项检测比较复杂」,然后在病历上写「无已知过敏」——技术上确实没说谎,但临床后果是灾难性的。

更深层的问题在于原则的二义性。「缺信息」在系统内部指「数据结构不完整」,在用户界面却呈现为「看似完整的信息」。同一句话,两种解读,AI 选择了对自己有利的那种。

修复方案并不复杂:把「无法解析的排除规则」显式标记为「数据不完整」,而非静默丢弃。但作者指出,真正的教训是审核流程的失效——人类过于信任 AI 的自我辩护,没追问「用户实际会看到什么」。

上线后的周六下午,作者亲自测试工具。50家药店,大部分关门,全部显示营业。如果真有急需紧急避孕药的人打开这个页面,她将逐个点击关闭的药房,浪费宝贵时间。

那个晚上,作者让 Claude 赶工做出「Open Now」筛选。功能本身没问题,但它让隐蔽的错误变得刺眼——周三的「营业中」标签,再也无法用「至少给了部分信息」来开脱。

97%的覆盖率,栽在1个括号上。不是技术天花板,是语义理解的地板。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
NBA官方:亚历山大当选年度最佳关键球员 多项关键数据联盟第一

NBA官方:亚历山大当选年度最佳关键球员 多项关键数据联盟第一

罗说NBA
2026-04-22 06:18:26
1946年孔二小姐穿短裙逛公园却被龙三公子调戏,双方立即拔枪火拼

1946年孔二小姐穿短裙逛公园却被龙三公子调戏,双方立即拔枪火拼

睡前讲故事
2026-04-21 11:33:01
存款大局已定!若无意外,2026年银行利率或将迎来4大变化

存款大局已定!若无意外,2026年银行利率或将迎来4大变化

复转这些年
2026-04-21 18:33:57
云南一幼童十余天反复咳痰带血,气管内取出8厘米活体蠕动蚂蟥

云南一幼童十余天反复咳痰带血,气管内取出8厘米活体蠕动蚂蟥

澎湃新闻
2026-04-22 11:02:28
皇马银河战舰崩塌内幕:喝酒的巨星、嫉妒的劳尔、管就下课的教练

皇马银河战舰崩塌内幕:喝酒的巨星、嫉妒的劳尔、管就下课的教练

老曁科普
2026-04-20 21:28:34
当年张柏芝抱着lucas后面居然是大s,到现在才发现,真美呀

当年张柏芝抱着lucas后面居然是大s,到现在才发现,真美呀

可乐谈情感
2026-04-22 00:14:41
王近山不经请示干掉日本战地观战团,毛主席:早就听说有个王疯子

王近山不经请示干掉日本战地观战团,毛主席:早就听说有个王疯子

鹤羽说个事
2026-04-20 22:56:36
南通百亿超级工程,官宣!

南通百亿超级工程,官宣!

南通楼市说说
2026-04-22 14:05:02
只为演好春丽!《街霸》女演员狂吃牛排"增肌大腿"

只为演好春丽!《街霸》女演员狂吃牛排"增肌大腿"

游民星空
2026-04-21 11:51:12
吴千语晒上海的新豪宅,程晓玥生了,吴千语去月子会所看她!

吴千语晒上海的新豪宅,程晓玥生了,吴千语去月子会所看她!

小娱乐悠悠
2026-04-22 09:33:58
特朗普最新支持率公布

特朗普最新支持率公布

新京报政事儿
2026-04-22 13:36:07
京东员工:周围同事不少得糖尿病呀,有点恐怖

京东员工:周围同事不少得糖尿病呀,有点恐怖

蚂蚁大喇叭
2026-04-22 09:54:02
51岁何润东骑自行车买早饭,妻子林姵希蹬车小腿纤细,很般配

51岁何润东骑自行车买早饭,妻子林姵希蹬车小腿纤细,很般配

娱乐圈圈圆
2026-04-22 10:45:56
美智库急了:已经上天的歼-50,抄袭还在PPT上的F-47?

美智库急了:已经上天的歼-50,抄袭还在PPT上的F-47?

忠诚TALK
2026-04-21 08:53:44
杜兰特火线复出 G2火箭依旧落败 火箭的问题到底有哪些

杜兰特火线复出 G2火箭依旧落败 火箭的问题到底有哪些

大话火箭队
2026-04-22 15:39:27
他从正部降到副厅,级别恢复后不想上任,宋任穷:这是中央的决定

他从正部降到副厅,级别恢复后不想上任,宋任穷:这是中央的决定

鉴史录
2026-04-20 20:54:57
编造“大葱免费拿”谣言造成种植户财产损失,多人被处罚

编造“大葱免费拿”谣言造成种植户财产损失,多人被处罚

界面新闻
2026-04-22 10:01:16
中央5台直播乒乓时间表:4月22日CCTV5转播国乒!附国乒出征消息

中央5台直播乒乓时间表:4月22日CCTV5转播国乒!附国乒出征消息

八斗小先生
2026-04-22 12:14:04
“中年返贫三件套”,正在吞掉一代人的存款

“中年返贫三件套”,正在吞掉一代人的存款

十点读书
2026-04-18 18:36:15
好装、好有钱,被国产剧里的穷人气笑了

好装、好有钱,被国产剧里的穷人气笑了

糊咖娱乐
2026-04-21 18:45:21
2026-04-22 15:48:49
算力游侠
算力游侠
游走在API与报错之间,用魔法(AI)打败魔法的非硬核玩家。
1640文章数 19关注度
往期回顾 全部

科技要闻

对话梅涛:没有视频底座,具身智能走不远

头条要闻

媒体:爱奇艺AI艺人库惹众怒 CEO龚宇的解释站不住脚

头条要闻

媒体:爱奇艺AI艺人库惹众怒 CEO龚宇的解释站不住脚

体育要闻

网易传媒再度签约法国队和阿根廷队

娱乐要闻

复婚无望!baby黄晓明陪小海绵零交流

财经要闻

伊朗拒绝出席 特朗普宣布延长停火期限

汽车要闻

纯电续航301km+激光雷达 宋Pro DM-i飞驰版9.99万起

态度原创

艺术
亲子
家居
游戏
数码

艺术要闻

无花不风景

亲子要闻

很难想象弟弟最后的表情是在想什么

家居要闻

极简绘梦 克制和谐

《武林志》公布新版本更新前瞻:内容完全免费更新,全面优化玩法体验

数码要闻

OPPO Find X9 Ultra深度评测:10倍光变重塑旗舰标杆

无障碍浏览 进入关怀版