网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

Anthropic悄悄给AI装了「沉默故障」探测器

2026-04-07 21:36:30　来源: 硬核玩家2哈

北京举报

0

分享至

AI系统最麻烦的不是崩溃，而是「假装正常」。Anthropic本周放出一项内部研究：他们的模型会在不报错的情况下输出错误答案，而常规监控工具完全察觉不到。换句话说，你的AI可能在「一本正经地胡说八道」，你还以为它在好好干活。

这项研究由云与AI工程高管Varun Raj牵头。团队发现，传统监控只看系统是否宕机、响应是否超时，但对「答案错了却格式正确」的情况束手无策。他们测试了多个生产环境，近70%的隐性故障就这样溜了过去。

Raj的原话很直白：「AI可以出错而不崩溃——标准监控抓不到。」团队最终搞出一套新方案，让模型在输出前多走一步自检，把「沉默故障」暴露出来。这相当于给AI配了个质检员，专门抓那些看起来没问题的错答案。

目前这套机制已在Anthropic内部部分上线。一个有趣的细节是：早期测试中，模型自检后反而更频繁地「喊停」——不是变得更谨慎，而是终于学会了承认「这道题我不会」。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

坏了，我成AI的乙方了！Anthropic论文爆火，谁还敢无脑Copy？

新智元 2026-04-07 20:12:55
0 跟贴 0
飙至300亿美元！Anthropic年化收入首超OpenAI，官宣AI芯片大单

智东西 2026-04-07 15:57:14
0 跟贴 0

我们还能信任AI吗？科学家编造了一种不存在的疾病，AI模型纷纷上当

生物世界 2026-04-08 12:12:28
0 跟贴 0

CVPR 2026｜1分钟单图变4D视频！AI看图直接脑补物理规律

机器之心Pro 2026-04-08 12:04:29
0 跟贴 0
张雪机车燃爆封神！国产2B语音模型重磅开源，全网听完都起鸡皮疙瘩

新智元 2026-04-08 12:07:08
0 跟贴 0

再不怕乱引文献！绕过付费墙，BibAgent把学术核验转为证据链

新智元 2026-04-08 12:04:39
0 跟贴 0

谷歌Deep Think八语奥赛屠榜！自主攻克4大未解难题，科研壁垒崩塌

新智元 2026-04-08 12:05:15
0 跟贴 0
Claude灾难级大宕机，全球开发者集体炸锅！Anthropic三连翻车被怒喷

新智元 2026-04-07 13:48:58
41 跟贴 41

拉索的建设“天阵”

一头漂浮在北京的大妞 2026-04-06 17:30:10
0 跟贴 0
帕克太阳探测器——人类造的最快的探测器！

老友地理 2026-04-04 11:43:18
1 跟贴 1
美国宇航员代表人类首次肉眼看见月球背面：六小时里他们在找什么

楠楠自语 2026-04-06 02:37:49
899 跟贴 899
太强了不敢公开！Anthropic推出顶级AI模型，暂时仅限科技巨头试用

华尔街见闻官方 2026-04-08 08:17:43
0 跟贴 0
河南小伙，被中东大佬下300辆战车模型，全村都上了！

乘风笑浪 2026-04-06 14:56:09
7 跟贴 7
米尔斯海默：我不会中文，但在思想上，我和中国人是同类！

仔仔大王king 2026-04-05 04:42:11
50 跟贴 50
这是什么模特？每天晚上坐在街头的橱窗内，就这样看着路人

历史图鉴 2026-04-06 11:38:52
149 跟贴 149
张雪说要革掉一些不上进的人

点时新闻 2026-04-07 14:50:35
268 跟贴 268
白宫官员：美国停火将于霍尔木兹开放时生效

央视新闻 2026-04-08 07:29:47
5249 跟贴 5249
猫：我不会一直这么倒霉的…倒霉猫咪

三只豆芽菜 2026-04-04 09:48:55
1 跟贴 1
毛新宇携家人到杨开慧烈士陵园祭扫

政知新媒体 2026-04-05 08:48:13
2610 跟贴 2610
功夫博主的出差日记：就这样记录你慢慢长大

含亮老师 2026-04-07 00:41:41
0 跟贴 0
农民养老金专题座谈会在京召开专家建议提高高龄农民基础养老金

中国青年报 2026-04-07 19:52:06
878 跟贴 878
“一盒只加一滴”？北冰洋NFC葡萄汁添加量仅0.005%，公司回应：产品没问题

红星资本局 2026-04-07 20:40:07
2809 跟贴 2809
大妈吃面顺走大半罐花椒带走店家：说好多次都没用管不了

荔枝新闻 2026-04-08 09:43:05
9 跟贴 9
“祖先给的特权”，河南网友称祖坟在景区祭祖免票，景区回应：没过检票口，一般是附近住户的祖坟

大风新闻 2026-04-06 15:06:12
2008 跟贴 2008
我宣布，我不会首先使用蘑菇

阿彪动画 2026-04-04 11:50:00
0 跟贴 0
二狗脱口秀：看惯错误答案，见正确答案竟恍惚

何轐说 2026-04-07 03:06:47
3 跟贴 3
广州外卖骑手去年平均薪酬15万，快递员、货车司机收入下降

南方都市报 2026-04-07 18:12:09
1041 跟贴 1041
美媒：“无法无天的世界代价高昂”

参考消息 2026-04-07 16:50:06
300 跟贴 300
不止055！神秘水泥模型曝光，中国2万吨巨舰要来了？

因果 2026-04-06 20:39:40
0 跟贴 0
这个工程干完，可以吹一辈子！

超人侃剧 2026-04-06 15:51:25
1 跟贴 1
Claude新模型强得离谱，但

AI进化论花生 2026-04-08 08:20:11
1 跟贴 1
三个人各怀鬼胎，就这样把人整没了

小六一影视 2026-04-06 11:51:20
1 跟贴 1
吕迪格：在拜仁两个进球中，我们送了两次大礼

懂球帝 2026-04-08 05:57:06
9 跟贴 9
坎塞洛：我知道我下赛季想要什么，但我不会说出来

懂球帝 2026-04-08 09:50:16
0 跟贴 0
日本交警在路上，看到骑自行车的，当场就这样做

笑出脑血栓俱乐部 2026-04-07 14:44:17
1 跟贴 1
上海一公园内，游客爬上樱花树拍照，结果整棵树倒下！网友：不堪重妇！

上观新闻 2026-04-07 16:33:38
271 跟贴 271
客人用语音呼叫智能助手，结果万万没想到，低情商：我不会，高情商：还是你去吧我累了

星沙时报 2026-04-06 17:18:52
0 跟贴 0
广州新一轮强对流天气时间，确定了

鲁中晨报 2026-04-08 08:57:06
17 跟贴 17
还会执教多久？里弗斯：或许是时候多陪陪孙辈们了

北青网-北京青年报 2026-04-08 09:54:25
0 跟贴 0
里弗斯谈退休：我想多陪陪我的孙子孙女，剩下的你们自己体会

懂球帝 2026-04-08 09:18:41
2 跟贴 2

停火、谈判、通航，“最后期限”之际的伊朗战事最新进展

停火、谈判、通航，“最后期限”之际的伊朗战事最新进展

极目新闻

2026-04-08 08:36:22

午评：创业板指半日涨4.81% 全市场超5000只个股上涨

午评：创业板指半日涨4.81% 全市场超5000只个股上涨

财联社

2026-04-08 11:33:07

以媒称以色列“仍在持续打击伊朗”

以媒称以色列“仍在持续打击伊朗”

财联社

2026-04-08 09:14:21

44岁苍井空老师复出后变这样了？现场红色吊带裙实拍，网友热评：她老公精神力太强大

44岁苍井空老师复出后变这样了？现场红色吊带裙实拍，网友热评：她老公精神力太强大

乔话

2026-04-07 21:11:37

现场无红毯，无仪仗队！大陆一句话讲清郑丽文访问的性质！

现场无红毯，无仪仗队！大陆一句话讲清郑丽文访问的性质！

阿龙聊军事

2026-04-08 08:54:27

熔断！暴涨2400点！

中国基金报

2026-04-08 09:13:01

杀人诛心！拜仁2-1客胜皇马，主帅孔帕尼赛后发言暗藏捧杀玄机！

杀人诛心！拜仁2-1客胜皇马，主帅孔帕尼赛后发言暗藏捧杀玄机！

田先生篮球

2026-04-08 09:06:27

陈丽华辞世：巨额遗产分配合理，“唐僧”迟重瑞可按理想方式养老

陈丽华辞世：巨额遗产分配合理，“唐僧”迟重瑞可按理想方式养老

天天热点见闻

2026-04-08 08:16:03

美军新型PrSM导弹首次实战？2月28日击中伊朗体育馆致21名青少年遇难

美军新型PrSM导弹首次实战？2月28日击中伊朗体育馆致21名青少年遇难

网易新闻出品

2026-04-07 16:36:53

纽约时报嘲讽特朗普：发动战争正把伊朗变成世界强国，成全球第四极

纽约时报嘲讽特朗普：发动战争正把伊朗变成世界强国，成全球第四极

西游日记

2026-04-08 09:42:07

特朗普怒斥CNN发布虚假伊朗声明，已启动刑事调查

特朗普怒斥CNN发布虚假伊朗声明，已启动刑事调查

不掉线电波

2026-04-08 09:30:40

安徽六岁女童嫌疑犯的社交账号，让人越看心里越发毛，家有两娃

安徽六岁女童嫌疑犯的社交账号，让人越看心里越发毛，家有两娃

魔都姐姐杂谈

2026-04-08 05:08:34

开车致女友截瘫，男方首次发声，正面照被扒，社交账号曝光！

开车致女友截瘫，男方首次发声，正面照被扒，社交账号曝光！

眼光很亮

2026-04-07 13:20:41

原来陈丽华长子是他，北大毕业，31岁接手家业，他才是富华掌舵人

原来陈丽华长子是他，北大毕业，31岁接手家业，他才是富华掌舵人

冷紫葉

2026-04-07 15:26:07

“中国紫檀女王”陈丽华逝世，曾是中国女首富，47岁时倒追“唐僧”迟重瑞，晚年每天生活费10元

“中国紫檀女王”陈丽华逝世，曾是中国女首富，47岁时倒追“唐僧”迟重瑞，晚年每天生活费10元

极目新闻

2026-04-07 12:39:33

张雪公布自己设计的跨界踏板车设计图，最新回应：正在制作踏板摩托，这款踏板偏运动越野风格，售价可能比传统的贵一点

张雪公布自己设计的跨界踏板车设计图，最新回应：正在制作踏板摩托，这款踏板偏运动越野风格，售价可能比传统的贵一点

鲁中晨报

2026-04-07 17:13:05

和儿子微信聊天的“妈妈”其实是杀人嫌犯！装修工强奸未遂杀害女子，用她手机欺骗家属

和儿子微信聊天的“妈妈”其实是杀人嫌犯！装修工强奸未遂杀害女子，用她手机欺骗家属

潇湘晨报

2026-04-08 12:05:19

特朗普同意停火两周

财联社

2026-04-08 06:38:07

为了郑丽文专机能顺利落地，解放军果断亮出底牌，痛击台独要害

为了郑丽文专机能顺利落地，解放军果断亮出底牌，痛击台独要害

共工之锚

2026-04-08 00:37:29

仅一户报名摇号的楼盘次日被告知售罄，到底有无暗箱操作

仅一户报名摇号的楼盘次日被告知售罄，到底有无暗箱操作

极目新闻

2026-04-08 11:26:26

硬核玩家2哈

沉淀中，勿扰

926文章数 5关注度

往期回顾全部

科技要闻

造出地表最强AI，却死活不给你用！

头条要闻

午评：创业板指半日涨4.81% 全市场超5000只个股上涨

头条要闻

午评：创业板指半日涨4.81% 全市场超5000只个股上涨

体育要闻

皇马1.5亿巨星浪费超级单刀丢球摊手抱怨

娱乐要闻

杨颖邓超低调现身观众席支持陈赫话剧

财经要闻

特朗普同意停火两周伊朗:接受停火提议

汽车要闻

5门5座/新复古造型缤果Pro将于4月14日开启预售

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

手机

时尚

教育

艺术

数码

手机要闻

看片不再被吓一跳！Binge恐怖片预警神器上线：支持灵动岛提醒

阔腿裤失宠了？今年这几条裤子最时髦！

教育要闻

孩子主动表达的重要性与警示信号

艺术要闻

齐白石『凌波仙子』

数码要闻

闪迪推出2TB Extreme Pro UHS-II SD存储卡

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版