网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

AI该学心脏外科医生：不懂就直说

2026-05-11 11:31:59　来源: 码上闲叙

北京举报

0

分享至

心脏外科主任盯着片子看了十分钟："两种情况症状重叠，我需要这三项检查加增强CT，没看到结果前我不下诊断。"

旁边实习医生三十秒给出答案，声音清脆，毫无犹豫。引用上周课本里的类似病例，自信满满。

你选谁给你妈主刀？

问题是，现在所有AI都是那个实习医生。快，准（看起来），从不承认"我不知道"。所以你只能让它改改README，真刀真枪的事不敢交。

今天聊怎么改——不是改算法，是改架构。

被 accuracy 毁掉的行业共识

业内有个心照不宣的灾难：用准确率衡量模型。GPT-4 MMLU 86%，Claude 88%，Gemini 90%，数字节节高。

这数字藏着陷阱。那10%-14%不是"没答"，是"自信地答错"。模型没有"我不太确定"的警示灯，所有输出看起来一样笃定。

写笔记无所谓。但用于生产代码、医疗决策、法律意见、金融交易？10%的自信幻觉就是10%的当面撒谎。

生产级AI的正确指标该是：

在可接受的拒绝率下，自信错误的行动为零。

不是"正确率多少"，是"错误行动多少"——零。外加拒绝率：系统诚实说"我不知道，需要数据/验证/澄清"的频率。零错误加30%拒绝，比90%准确率加10%自信幻觉靠谱十倍。

注意：我说的是"零错误行动"，不是"零错误答案"。答案只是文字，可以再看一遍扔掉。行动是提交、交易、诊断、API调用、生产变更——已经发生。

"答案"和"行动"的分离，正是现代AI代理架构缺失的东西。

把"拒绝"变成一等公民

本系列第二部分提过真实记忆的七条原则，第二条是严格模式：事实进提示词之前过一道门——来源、置信度、时效性、无未解决矛盾。没事实能过门，系统返回 abstain = true，并给明确原因。

有个细节值得单独拎出来：拒绝不是故障，是设计好的输出状态。就像心脏外科主任说"我需要更多检查"——这是专业判断，不是系统崩溃。

但现在的AI代理架构把拒绝当异常处理。模型必须生成点什么，API必须返回200，前端必须展示结果。拒绝被层层过滤，最后用户看到的永远是"答案"，哪怕它是幻觉。

要改的是这个管道。拒绝应该有自己的HTTP状态码，自己的UI组件，自己的工作流分支。用户问"这份合同有没有法律风险"，系统可以回答"我找到了三个相关判例，但都不完全匹配你的条款结构，建议找执业律师确认X、Y两点"。

这叫诚实的能力。

从"尽量答"到"敢不答"

技术实现上，这需要三层改造：

第一层，记忆层的严格模式。前面说过，不重复。

第二层，推理层的置信度分离。不是让模型自己说"我不太确定"——它永远会说"根据我的分析"。而是用独立模块评估：检索到的事实覆盖度多少？与问题匹配度多少？历史类似查询的后续反馈如何？这些量化指标触发拒绝阈值。

第三层，行动层的执行闸门。即使模型生成了内容，提交按钮也可以灰掉，附带说明"以下结论缺少Z类验证，确认继续？"

三层都有拒绝权，任何一层触发就进入"需要更多信息"分支。不是单点故障，是冗余保险。

为什么现在没人这么做

成本。拒绝率30%意味着同样用户请求，实际调用下游服务的次数减少，但系统复杂度飙升。要多维护一套置信度评估模块，要多设计一套"待补充信息"的交互流程，要多训练客服处理"AI为什么不理我"的投诉。

更隐蔽的是商业压力。Demo场景里，"秒回"比"谨慎"好看。投资人问"你们AI能做什么"，你说"它知道什么时候不该做"，场面一度尴尬。

但生产环境会报复。一个自信错误的交易指令，损失够付十年工程师工资。

心脏外科主任的沉默权

回到开头那个场景。主任说"我不知道"的时候，没人觉得他无能。相反，这是专业信誉的累积——上次他这么说，查完果然是他预判的那两种可能之一。

AI代理需要同样的信誉账户。每次正确拒绝，存一笔；每次被迫回答导致后续纠错，扣一笔。账户余额决定系统可调用的行动权限范围。

这不是科幻。金融领域的风险限额系统、医疗领域的分级诊疗，都是同一逻辑：能力边界由历史表现动态划定。

问题是，现在的AI架构里没有这个账户。模型权重是静态的，API权限是固定的，用户信任是一次性买断的。

改架构，就是把这些补上。

最后一点

这篇文章是"AI代理的记忆"系列第三篇。第一部分讲记忆为什么不只是RAG，第二部分讲严格模式的七条原则。这篇讲拒绝作为一等公民。

三篇合起来，核心就一句话：让AI像专业从业者一样工作，而不是像考试拿高分的学生。

学生被训练成不能留空白。从业者被训练成空白比错填更安全。

我们的行业还在用学生的评分标准，生产从业者的工具。这个错位，比任何算法缺陷都致命。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

刚刚，Claude Mythos打爆AI评测天花板！超指数狂飙，2027奇点加速

新智元 2026-05-11 13:10:26
0 跟贴 0
别卷推理了！当前大模型 STEM 短板在视觉感知，代码才是破局关键

机器之心Pro 2026-05-11 11:53:59
0 跟贴 0

全网确诊前额叶损伤 AI正在批量生产“空心人”

经济观察报 2026-05-11 13:36:09
0 跟贴 0

00后小哥复刻Claude最强神话模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟贴 0
六维经营核心要务 ——数智时代下，以“人才×智能”构筑企业发展新根基

经济观察报 2026-05-11 10:00:04
0 跟贴 0

AOC一句话点破：算法权力正在绑架政治

固件更新中 2026-05-11 10:40:32
0 跟贴 0

盾构电气系统“外科医生”（奋斗者之歌）

海外网 2026-05-07 06:56:03
0 跟贴 0
2025程序员面试剧变：AI协作成必考题，不会"氛围编程"直接挂

赛博兰博 2026-05-11 11:54:37
0 跟贴 0

退休的外科医生，在家里做饭，看手法有点可怕！

快乐娱夫 2026-05-11 11:25:57
1 跟贴 1
女子指挥男子用斜坡把行李箱滑下去，没想到男子把自己也一起滑下去了

南阳日报 2026-05-10 18:54:56
233 跟贴 233
数独背后的数学密码：图论如何解谜

字节漫游指南 2026-05-11 10:57:08
0 跟贴 0
算法“破笼”：打工人终于能从“永动机”上下来了

迷世书童H9527 2026-05-11 09:27:50
0 跟贴 0
2500亿美元的xAI死了，但SpaceXAI的算力游戏才刚开始

钛媒体APP 2026-05-11 11:15:26
0 跟贴 0
韩国人对华好感度最新数据公布

扬子晚报 2026-05-10 15:52:55
1438 跟贴 1438
法国新法落地：归还 “260万被抢文物”有多艰难？｜重建现场

新京报动新闻 2026-05-11 01:46:32
313 跟贴 313
台"军购条例"大幅缩水美坐不住了美官员:向大陆屈服

澎湃新闻 2026-05-10 17:54:57
406 跟贴 406
Agent评测的下半场：为什么需要一个「活的」Benchmark？

新智元 2026-05-11 13:08:40
0 跟贴 0
山姆成“欠款大户”？雨花客厅北区法拍公告披露：山姆欠租887万元

扬子晚报 2026-05-10 20:25:23
574 跟贴 574
国家体育总局呼吁不组织不参与运动员庆生

央视新闻客户端 2026-05-10 15:38:30
794 跟贴 794
张雪峰直播片段心脏不适，其实早有预兆，早点治疗或许还能挽救！

唐尼二爱生活 2026-05-10 09:02:02
12 跟贴 12
小伙刮刮乐中了一百万，中奖当天花了三四百元

今日女报 2026-05-11 05:37:35
132 跟贴 132
卧底为保身份不暴露，毅然朝着心脏开一枪，惊险场面令人动容

料定历史 2026-05-08 10:30:56
1 跟贴 1
浙江一加油站92号汽油6.6元/升被质疑“便宜没好货”，回应：优惠力度大

潇湘晨报 2026-05-10 17:11:17
559 跟贴 559
汉坦病毒邮轮零号病人身份曝光

现代快报 2026-05-10 20:18:33
764 跟贴 764
死神行事风格超诡异，一言不合就要掏心脏，如此行径令人胆寒

丰收影说 2026-05-09 23:25:28
1 跟贴 1
【AI大模型安全与评测】从DeepSeek-V4拆解真实评估逻辑，90%的人都搞错了！企业级大模型评

卢菁老师 2026-05-09 09:07:47
0 跟贴 0
超市里经常用到的字体，美女技术真是牛，打印的都没有这么精准！

趣笑小行星 2026-05-09 16:44:39
1 跟贴 1
心脏决定寿命，记得多吃这五种食物

雪莲073 2026-05-11 09:40:00
1 跟贴 1
天舟十号货运飞船发射任务取得圆满成功

新华社 2026-05-11 08:34:33
656 跟贴 656
茶颜悦色，装不下去了

中国新闻周刊 2026-05-07 22:15:57
299 跟贴 299
嘴炮王者谭sir竟被逻辑女帝反杀成渣：愿大姐被岁月温柔以待

解压小剧场 2026-05-09 08:17:50
17 跟贴 17
战斗机如何用航炮击沉潜艇？演示二战飞机反潜航炮战术模型

老周说趣 2026-05-10 09:44:15
0 跟贴 0
我穿旧衣回娘家过年，院长岳父让我搬酒箱，急诊主任来电他手抖了

小哥很OK 2026-05-10 21:08:57
0 跟贴 0
余额宝年化收益率0.888% 刷新历史最低纪录

红星新闻 2026-05-10 21:54:53
525 跟贴 525
年薪超25万美元：这个14年前创造的工程师岗位为何突然爆火

灰度测试中 2026-05-11 11:49:06
0 跟贴 0
宣传的时候遥遥领先，出事后甩锅未达阈值？人民网三问享界！

今朝牛马 2026-05-10 19:24:21
0 跟贴 0
舒城：县医院成功救治江西籍重度肝破裂患者！

舒城视听在线 2026-05-09 17:36:41
0 跟贴 0
猝死去世的人越来越多？医生再次强调：宁可吃猪肉，也别做这3事

蜉蝣说 2026-05-11 11:50:29
2 跟贴 2
停火后到底发生了什么？梳理伊朗破局美军封锁的战术逻辑

北山战史 2026-05-09 20:21:15
1 跟贴 1
王励勤总结世乒赛：男队阵容不是最强但最拼，女队经受对手超水平发挥考验，点赞孙颖莎王楚钦力挽狂澜

红网 2026-05-11 11:59:00
16 跟贴 16

广东入夏湿气重！要多喝这款老广靓汤，清甜润口，喝完清爽不黏腻

广东入夏湿气重！要多喝这款老广靓汤，清甜润口，喝完清爽不黏腻

房产衫哥

2026-05-10 12:11:03

为什么女教师成了单身女的最重灾区？网友剖析一针见血，我明白了

为什么女教师成了单身女的最重灾区？网友剖析一针见血，我明白了

夜深爱杂谈

2026-04-27 22:11:39

伦敦世乒赛收官：3位选手满分，1人表现欠佳，1人仅达标

伦敦世乒赛收官：3位选手满分，1人表现欠佳，1人仅达标

晓岇就是我

2026-05-11 11:48:15

美媒：中国不可怕，可怕的是中国只用10万头猪，就解决了治沙难题

美媒：中国不可怕，可怕的是中国只用10万头猪，就解决了治沙难题

北纬的咖啡豆

2026-04-12 19:15:01

王晓晨刘浩存同框，展现张艺谋选角眼光有多毒辣

王晓晨刘浩存同框，展现张艺谋选角眼光有多毒辣

落雪听梅a

2026-05-09 09:37:16

泰王的妻妾同框：王后优雅，贵妃颜值回春，3位小主年轻貌美

泰王的妻妾同框：王后优雅，贵妃颜值回春，3位小主年轻貌美

小书生吃瓜

2026-05-08 19:25:35

知情人士透露伊朗对美回应内容要点

知情人士透露伊朗对美回应内容要点

界面新闻

2026-05-11 09:25:19

赖昌星的情人蔡玲玲：悔不该委身于他，58岁的她现状如何？

赖昌星的情人蔡玲玲：悔不该委身于他，58岁的她现状如何？

细品名人

2026-04-29 07:06:35

老人不死，子孙遭罪？如果家有八九十岁双亲还在，要牢记这两条准则

老人不死，子孙遭罪？如果家有八九十岁双亲还在，要牢记这两条准则

心理观察局

2026-05-05 09:24:14

最新民调出炉，“共和党要慌”

观察者网

2026-05-11 13:22:08

国企干4年，公积金账户躺了10万块！算了一笔账，我彻底坐不住了

国企干4年，公积金账户躺了10万块！算了一笔账，我彻底坐不住了

阿离家居

2026-05-11 12:48:51

中方一锤定音，特朗普访华3天！抢在最后时刻，美突然做出新安排

中方一锤定音，特朗普访华3天！抢在最后时刻，美突然做出新安排

晓楖科普

2026-05-11 12:14:02

《新闻联播》大换血，李梓萌康辉退居幕后，四代接班人悄然就位

《新闻联播》大换血，李梓萌康辉退居幕后，四代接班人悄然就位

阿纂看事

2026-04-25 13:48:54

10-4！奥沙利文大胜登顶：打败2冠名将夺冠，创3纪录，获28万奖金

10-4！奥沙利文大胜登顶：打败2冠名将夺冠，创3纪录，获28万奖金

刘姚尧的文字城堡

2026-05-11 07:20:38

被捕9个月后，释永信再迎噩耗，4大罪名坐实，最后的体面都没了

被捕9个月后，释永信再迎噩耗，4大罪名坐实，最后的体面都没了

好贤观史记

2026-03-21 17:07:15

这才是让人疯狂的好身材！肉肉的超可爱，看了就忍不住想抱抱！

这才是让人疯狂的好身材！肉肉的超可爱，看了就忍不住想抱抱！

情感大头说说

2026-05-11 11:06:25

盐城男子车祸去世，保单金额凭空对半砍，家属质疑：签名是假的，贷款是懵的，利息还一直滚？

盐城男子车祸去世，保单金额凭空对半砍，家属质疑：签名是假的，贷款是懵的，利息还一直滚？

盐城市民网

2026-05-11 11:41:17

人类意志能扛住酷刑吗？真相远比想象残酷

人类意志能扛住酷刑吗？真相远比想象残酷

三农老历

2026-05-11 09:19:46

赖清德没料到，曾扬言与华断交，转向台北的洪都拉斯总统，改口了

赖清德没料到，曾扬言与华断交，转向台北的洪都拉斯总统，改口了

透视到底

2026-05-11 13:26:36

5月1日起！全院一张床全国落地，住院再也不用托关系

5月1日起！全院一张床全国落地，住院再也不用托关系

牛锅巴小钒

2026-05-09 15:51:16

有态度网友ytd

3680文章数 43关注度

往期回顾全部

科技要闻

黄仁勋：你们赶上了一代人一次的大机会

头条要闻

媒体：特朗普确定本周访华中美在东亚有个共同的敌人

头条要闻

媒体：特朗普确定本周访华中美在东亚有个共同的敌人

体育要闻

那个曾让詹姆斯抱头的兄弟，40岁从大学毕业了

娱乐要闻

谢霆锋没想到，王菲靠张艺谋重返巅峰

财经要闻

"手搓汽车"曝光:伪造证件、电池以旧代新

汽车要闻

全球化成国内车企未来胜负手，谁是出海最强"水手"?

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

旅游

教育

时尚

房产

干细胞能让人“返老还童”吗

旅游要闻

核心路线！四川剑门关空气清新氧气充足，一夫当关千年一叹！

教育要闻

高中持续扩招，录取位次面临“大洗牌”，家长不用慌了？

轻松拿捏又甜又酷的造型，试试这些轻熟穿搭，温柔有女人味儿

房产要闻

低价甩卖！海口这个地标商业，无人接盘！

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版