网易首页 > 网易号 > 正文 申请入驻

交白卷也排第一?Fable 5二百题全部拒答,却登顶最严AI编程基准

0
分享至

编辑|Panda


太离谱了!

是的,本文的主角还是前些天刚发布了 Claude Fable 5 的 Anthropic。

Fable 5 发布时的排面是真的足。SWE-Bench Pro 得分 80.3%,把第二名甩出 11 个百分点;Andrej Karpathy 直接喊出「deserves a major version bump」;Stripe 拿它在 5000 万行 Ruby 代码库里跑了一整天的迁移,顶上了原本需要整个团队两个月才能完成的工作量。势头之猛,让人一度以为 AI 编程进入了新纪元。



然而,Fable 5 刚开香槟,就被自己的「安全护栏」绊了个大跟头。

其系统卡中明确表示,Fable 5 被设计成:一旦检测到用户正在从事前沿 AI 研发工作(比如训练流水线、分布式训练基础设施、ML 加速器设计),模型会悄悄降低自己的回答质量——而且不通知用户。也就是说,你花着 Fable 5 的钱,收到的可能是 Opus 4.8 级别的活,还没有任何提示。

Anthropic 为此用了提示词修改、转向向量等技术手段,让模型在特定查询下悄悄变笨,整个过程对用户完全不透明。

这一操作在研究社区炸了锅。许多学者和开发者纷纷发声批评,称此举严重损害了用户信任,本质上是背刺付费用户。舆论压力之下,Anthropic 被迫在发布后数小时内宣布政策调整:还是会降智,只是不再偷偷来了——触发安全拦截时,模型将明确通知用户,并切换到 Opus 4.8 进行回答。至少他们是这么说的。参阅《刚刚,Anthropic 道歉了》。

然后,更尴尬的来了。

也正因为 Fable 5 现在的降智操作变得「透明」了,一些有趣的情况随之浮出水面。

其中最让人无语的,就是 Fable 5 在ProgramBench基准测试上的「表现」。

ProgramBench 来自大名鼎鼎的 SWE-Bench 作者团队,专注于「从编译后的二进制文件重建源代码」这一高难度任务,一上线就把当时的前沿 AI 模型全部清零:Claude、GPT、Gemini,无一幸免,完成率清一色 0%。此前我们曾报道过《0%完成率!Claude、GPT、Gemini 全灭,SWE-Bench 作者新作把 AI 圈干沉默了》。

那么,Fable 5 成绩如何呢?

不是 0 分。是拒绝作答:200 道题,全部拒绝!



ProgramBench 之所以没有 Fable 5 的成绩,是因为「重建编译后的二进制文件」这一操作触发了 Fable 5 的网络安全分类器。说白了,Fable 5 看到这道题,判定其涉及「二进制逆向」,打了个安全警报,直接拒绝作答。而且 200 道,一道不落。



有趣的是,Fable 5 在其他编程基准上可是一点不含糊的,都能好好答题。



Fable 5 在不同基准上的成绩和排名

然而,就在这份弃考成绩单提交之后,ProgramBench 排行榜做了一个让人目瞪口呆的决定:综合其他基准表现,仍然将 Fable 5 列在了榜首。



一个字都没答的考生,坐了第一名的座位。这大概是 AI 评测史上头一遭:弃考也能登顶榜单。

当然,这操作很快引来了四面八方的异议。有人直接发问:正经考试怎么交了白卷还能得第一名?应该直接给零分才对。







这也让很多网友吐槽其护栏太高,以至于难以实际应用:



顺带一提,有网友还发现,Fable 5 在英文输出中依然会偶发性地夹杂汉字,这个老毛病到了这一代还没彻底根治。





事实上,Fable 5 的「过度拒绝」问题并非首次出现在 Claude 家族。

早在 Claude 3 Opus 时代,研究人员就发现该模型在面对安全测试题目时,会在解题进行到一半时突然罢工,以「伦理顾虑」为由拒绝继续作答。Claude 3.5 Sonnet 也曾被记录到在结构化 bash 任务中以「制作 payload 涉及执行命令」为由直接拒绝。

Fable 5 的问题究竟出在哪里?

回到 Fable 5 本身。根据目前披露的信息,它的「护栏系统」采用了两级架构:一个探针实时监控模型的内部激活状态,对所有流量进行扫描;一旦触发警报,请求会被上报给一个独立训练的 LLM 分类器做最终裁决。



https://www-cdn.anthropic.com/d00db56fa754a1b115b6dd7cb2e3c342ee809620.pdf

这套系统拦截的领域,涵盖网络安全、生物化学,以及前面提到的前沿 AI 研发。以 Terminal-Bench 2.1 为例,约 20.9% 的测试用例触发了安全拒绝并回退到 Opus 4.8。

ProgramBench 的「二进制重建」任务,在分类器眼里,大概和「逆向工程恶意软件」没有太大区别,于是 200 道题统统被挡在了门外。

Vals AI 在实测中也发现,Fable 5 在生物和网络安全相关问题上的拒绝率明显偏高,以至于他们不得不将 Opus 4.8 配置为默认兜底模型。也就是说,Fable 5 拒绝的任务,就让Opus 4.8 来接。

技术上这套系统当然有其合理性。Fable 5 的前身 Mythos 级模型,在漏洞利用、进攻性网络操作等任务上展现出了让各国政府都坐不住的能力,这也是 Anthropic 一直将其列为受限模型的核心原因。给这样的模型套上严格的安全枷锁,似乎也有一点道理。

但问题在于,当安全护栏的判断标准过于粗糙,「二进制逆向」这个本属于正常编程教学和安全研究的基础操作,就会被一视同仁地拦截。开发者为此付出的代价是真实的:要么换模型,要么改提示词,要么接受一个「什么都懂、很多都不说」的超能助手。

顺便,还有另一份成绩单也值得一看

Fable 5 发布后不久,UC Berkeley RDI 实验室(负责人 Dawn Song 教授)的团队完成了对它的评测,用的是他们自己做的新基准:Agents' Last Exam(ALE)。



  • 论文地址:https://arxiv.org/abs/2606.05405

这个基准的出发点有点意思:它不考「AI 能不能在 HumanEval 里写出两行代码」,而是直接对齐真实劳动力市场,覆盖 55 个职业方向、1500+ 道真实工作场景题目,由来自 100 余家机构的 300 余位行业专家贡献,全部按可验证的结果计分。说白了,就是让 AI agent 去考一场「职场模拟高考」。论文发布当天就登上了 Hugging Face Daily Papers 第一名。

评测结果如何?Fable 5 的得分是 22.0%,排在 GPT-5.5(Codex)的 24.0% 之后,位列第二。听起来差距不大,但成本项就有点扎眼了:Fable 5 平均每道题花费约 15.70 美元,GPT-5.5 只需 3.80 美元,另一个模型 Composer 2.5 更是只要 1.33 美元。换句话说,Fable 5 每解一道题的成本,大约是 GPT-5.5 的四倍。



最有意思的,还是最高难度那一档,即「Last-Exam」,也就是 ALE 里专门为「前沿 agent 挑战极限」设计的题目。结果是:除了 GPT-5.5,包括 Fable 5 在内的所有参评的前沿 agent通过率均为 0%。更多详情请参阅《Claude Fable 5最难档零分!智能体的最后考试来了》。



排行榜备注说明:claude-fable-5——除了彻底的访问限制(我们只是不断重试运行直到任务顺利完成),Anthropic 还可能默认悄无声息地提供该模型的一个降级版、低能力变体。重试无法纠正这一点,因此这里的数据可能低估了其真实能力——解读时需谨慎

ProgramBench 拒绝作答是 0%,ALE 最难档努力作答也是 0%。不同的姿态,一样的结局。

结语

弃考但排名第一,这个荒诞结果背后,其实暗藏着一个正在撕裂 AI 行业的根本矛盾:能力越强,护栏越紧;护栏越紧,可用性越差。

Anthropic 的处境尤其典型。它拥有(按自家说法)当下最强的编程模型,却同时在替用户决定哪些编程任务「可以做、哪些不能做」。而那条边界,目前还画得相当模糊。

https://www.digitalapplied.com/blog/claude-fable-5-mythos-5-agentic-coding-deep-dive-2026

https://www.vals.ai/benchmarks/programbench

https://agentpedia.codes/blog/claude-fable-5-benchmark-prompting-guide

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
很多父母变聪明了,不论红白喜事,都是自己走亲戚,不让子女去

很多父母变聪明了,不论红白喜事,都是自己走亲戚,不让子女去

舒山有鹿
2026-05-11 12:59:14
42岁李宇春嫁法国老头真相曝光,近况不意外

42岁李宇春嫁法国老头真相曝光,近况不意外

微风轻拂面
2026-06-21 17:45:18
印度美女晒广州公寓直言接哥哥父母过来住   网友:完犊子了

印度美女晒广州公寓直言接哥哥父母过来住 网友:完犊子了

尘埃里的看客
2026-06-23 10:00:45
未来球王!2026世界杯10位怪物级新星!

未来球王!2026世界杯10位怪物级新星!

ChicMyGeek
2026-06-21 11:07:19
皇马喉舌:所有梅吹马屁精都给我跪下!他在欧冠是失败者30岁后0冠

皇马喉舌:所有梅吹马屁精都给我跪下!他在欧冠是失败者30岁后0冠

晚雾空青
2026-06-23 10:34:25
AI交易骤然降温:美光暴跌逾8%、英伟达跌2%,科技板块全线下挫

AI交易骤然降温:美光暴跌逾8%、英伟达跌2%,科技板块全线下挫

码上闲叙
2026-06-24 01:51:29
心理学上说:如果一个人对家人不耐烦、易发火,对外人却客客气气、够温和,不是本性凉薄,根源无外乎有两点

心理学上说:如果一个人对家人不耐烦、易发火,对外人却客客气气、够温和,不是本性凉薄,根源无外乎有两点

心理观察局
2026-05-12 09:06:23
出大事了!马科斯突遭晴天霹雳,菲律宾后院失火,解放军要出手了

出大事了!马科斯突遭晴天霹雳,菲律宾后院失火,解放军要出手了

寄予的清风
2026-06-23 01:16:43
哈兰德偷喝对方门将的水,喝完不忘递水给对方:你喝不喝?网友:还怪贴心的

哈兰德偷喝对方门将的水,喝完不忘递水给对方:你喝不喝?网友:还怪贴心的

洪观新闻
2026-06-23 16:29:20
澳门一警员执行任务遭围堵抢劫,7人被捕,其中包括3名澳门本地男子,分别姓赖、45岁、地产发展商,姓郑、63岁、商人,姓梁、64岁、商人

澳门一警员执行任务遭围堵抢劫,7人被捕,其中包括3名澳门本地男子,分别姓赖、45岁、地产发展商,姓郑、63岁、商人,姓梁、64岁、商人

大风新闻
2026-06-22 16:32:50
苏州和绍兴,为什么都没机场!

苏州和绍兴,为什么都没机场!

城市生态圈
2026-06-22 22:30:08
退休要变天?不出意外的话,2026年延迟退休将迎来四大转变。

退休要变天?不出意外的话,2026年延迟退休将迎来四大转变。

小怪吃美食
2026-06-18 16:26:22
越扒越有!娜然坐霍家主桌仅48小时,再迎2大噩耗,大房早已表态

越扒越有!娜然坐霍家主桌仅48小时,再迎2大噩耗,大房早已表态

趣文说娱
2026-06-23 18:39:52
吃相太难看,他出轨、背刺亲家的时候,完全忘掉自己是“凤凰男”

吃相太难看,他出轨、背刺亲家的时候,完全忘掉自己是“凤凰男”

嘴角上翘的弧度
2026-06-22 18:23:30
31国军舰扎堆秀肌肉,环太军演来势汹汹,央视亮出东风17实弹画面

31国军舰扎堆秀肌肉,环太军演来势汹汹,央视亮出东风17实弹画面

音乐时光的娱乐
2026-06-24 00:14:08
全球拒接奥运,奥委会关注中国,中方回应2036台北见

全球拒接奥运,奥委会关注中国,中方回应2036台北见

烟雨洛神生
2026-06-23 22:54:59
95年杭州夫妻花50万囤茅台酒,15年后茅台价格令他们不敢置信

95年杭州夫妻花50万囤茅台酒,15年后茅台价格令他们不敢置信

星宇共鸣
2025-05-20 17:59:18
藏獒归来!张继科重返赛场,6月26日百分大战硬刚奥恰洛夫!樊振东“空降”成谜!

藏獒归来!张继科重返赛场,6月26日百分大战硬刚奥恰洛夫!樊振东“空降”成谜!

好乒乓
2026-06-23 21:43:19
太治愈了!14.1万点赞1.3万条回复:夫妻失业 38万房贷 孩子降生

太治愈了!14.1万点赞1.3万条回复:夫妻失业 38万房贷 孩子降生

火山詩话
2026-06-23 06:05:51
当年买了泰坦尼克号票的8位顶级富豪,为何开船前,却都没上船?

当年买了泰坦尼克号票的8位顶级富豪,为何开船前,却都没上船?

云霄纪史观
2026-06-21 23:44:07
2026-06-24 03:07:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13339文章数 142678关注度
往期回顾 全部

科技要闻

48名中国开发者联名举报苹果

头条要闻

"纸尿裤风波"第一爆料人:如果我错了 坐牢都接受

头条要闻

"纸尿裤风波"第一爆料人:如果我错了 坐牢都接受

体育要闻

扬尼斯去了迈阿密:凯尔特人怎么办?

娱乐要闻

内娱95后顶流格局发生潜移默化的变化

财经要闻

AI“算力稀缺”信仰开始动摇?

汽车要闻

施鹏泽:为什么奥迪E7X强调座舱气味安全?

态度原创

艺术
手机
教育
房产
军事航空

艺术要闻

高约400米!深圳湾金融中心大厦,冲出正负零

手机要闻

外媒上手苹果iOS 27 AI扩图功能:生成画面自然

教育要闻

2026四川高考成绩25日18:30公布!附查询入口→

房产要闻

洞察新局|预算不变 居住升级 2026广州置业成本观察

军事要闻

以色列总理、国防部长和国防军总参谋长发表联合声明

无障碍浏览 进入关怀版