网易首页 > 网易号 > 正文 申请入驻

Claude Fable 5,名存实亡

0
分享至


新智元报道


【新智元导读】Fable 5刑满归来,但跑分却断崖暴跌。翻进官方文档才发现:你付着Fable的钱,跑的可能一直是Opus。

别高兴得太早!

你眼前的Fable 5,大概率只是一具空壳。

当它带着万众期待宣告回归,现实却极其惨烈。


就在模型恢复上线的第一时间,BridgeMind火速重跑了BridgeBench基准测试。

结果不仅是翻车,而是彻头彻尾的崩盘——

  • 调试能力从86.2直线坠落至25.9,狂跌百分之七十。

  • 重构能力从73.6暴跌至38.4,直接腰斩。

  • 连最基础的幻觉指标,也从75.9狼狈滑落到61.7。

一夜之间,开发者社区彻底炸锅。

「Fable 5被物理阉割」的怒骂声,震耳欲聋。



花着Fable的钱,跑的却是Opus

开发者kaize满怀期待,把个人项目交给Fable 5去做安全审计。

结果,迎面撞上的却是一堵冰冷的墙:违反规则,拒绝执行。


有人只是做个普通的教育工具,就莫名其妙触发了安全标记,直接被系统一脚踢出Fable。

还有人发现,只要你的项目敢沾一点AuthN或AuthZ认证模块,几乎百分之百会触发护栏。

绝望的网友甚至建议,Fable 5干脆改名叫Feeble 5(虚弱5)算了。


把数据拆开后,BridgeMind发现,测试的12道题里,只有可怜的3道真正跑在了Fable 5上。

剩下9道全被安全分类器半路拦截,悄无声息地上演了一出狸猫换太子,强行切成了上一代的Opus 4.8。

按照BridgeBench的计分规则,凡是被护栏强制降级的题目,直接记零分。

那9道题,就这么硬生生吃了鸭蛋。


对此,BridgeMind的分析是:「只要任务能跑通,Fable 5和6月12日被禁前那个版本一模一样强。问题出在护栏上。」

换句话说,模型没有变蠢,只是在绝大部分时间里,你根本就没在用它。

Anthropic:就是故意的

如果只是护栏太严,调松一点就完了。

但令人绝望的是,这不是bug,是Anthropic深思熟虑、甚至引以为傲的顶层设计。


官方博文上白纸黑字写得清清楚楚:「我们刻意将安全分类器设置为,会对一组我们知道大概率无害的请求触发拦截。」

意思就是,他们明知道你的请求大概率没问题,却还是选择把大门死死焊上。



更让人后怕的是审查范围。

触发降级的检查,不会只盯着你刚发的那句话,而是模型能够读取的全部内容——

  • 你的历史对话记忆

  • 你接入的各种连接器

  • 网络搜索的返回结果

  • 甚至是你上传的每一份文件

你可能啥字都还没敲都没碰,但因为几天前上传了某份文件,Fable 5就被强制切成了Opus 4.8。


这个自动降级在Claude、Claude Code、Claude Cowork和Microsoft 365里全部默认开启。

你不主动关,它就替你做主。


事已至此,开发者的怒火已经被彻底点燃。

网友alexenpr在X上大吐苦水:

以前丢给Fable 5同样的任务,它会静静思考二十多分钟,给出一套极其深思熟虑的方案。

现在呢?它吐答案比Opus还快,但质量却惨不忍睹。


一个Bug修了一个多小时,依然满屏报错。切回老旧的Opus,反而瞬间修好了。简直是个天大的笑话。

开发者MaxLumnar则发现,模型token的消耗量非常夸张。

5小时的Max x5额度短短15分钟就被系统彻底烧光.更绝望的是,似乎连Opus也跟着一起变蠢了。


媒体thehypedotnews做了一组实测。

他们让Fable 5通过API生成五个HTML动画。结果,2个渲染错误,3个质量拉胯。

白白花了7分25秒和6.48美元,最后没有一个能用的。


篡改prompt、全球拉闸、误杀成灾

6月9日,共享同一个大脑的Fable 5和Mythos 5同时亮相。

仅仅两天后,社区骇然发现,Fable 5的体内竟暗藏着一个反蒸馏护栏。

没有通知,没有提示,直接在底层暗中篡改你的prompt,逼迫模型悄无声息地吐出有缺陷的劣质代码。

SemiAnalysis一针见血:「如果你是竞争对手,Claude Fable 5被允许蓄意破坏你的应用。」Anthropic当天道歉,承诺改成可见的回退机制。

6月12日,Amazon安全团队递交越狱报告,声称Fable 5能识别软件漏洞并产出利用代码。

商务部长Howard Lutnick震怒,直接发函下达全球禁令。连Anthropic自家非美籍员工都不能碰。


但最荒诞的黑色幽默来了。

Anthropic在回归博文里表示,他们把市面上的模型全测了一遍,Opus 4.8能做到,GPT-5.5能做到,连自家最廉价的Haiku 4.5都能复现这个漏洞。

按他们的话说,Fable 5压根没有变得更危险。它只是在美国政府眼皮子底下暴露了护栏失灵。

但对Anthropic来讲,丢了面子、惹怒了监管,比模型到底有多危险要致命得多。

熬过漫长的19天。

终于刑满释放的Fable 5,在7月1日带着「全新的护栏」重返舞台。

商务部下属的AI标准与创新中心做完验收,给出四个字的评价:异常强大。

确实强大,强大到75%的正常调试任务,都被扼杀在摇篮里。


最贵的模型,大部分时间不让你用

所以真相是大概率是,Fable 5并没有被「阉割」。

它的智商没掉,代码能力也未曾缩水。只要上场,就能和被禁之前一样强。

但问题就在这里,在绝大部分时间里,它压根就上不了场。

那道被官方「有意设宽」的护栏,像幽灵一样,盯着着你的全部上下文。

而你无法预判,它会在哪个瞬间把你一脚踢回Opus 4.8。

你付着顶配的价钱,换来的,却是一个大部分时间都被死死锁在铁笼里的模型。


Dario说要保护世界,免受「危险AI」之害。

可谁来保护开发者,免受Anthropic之害?

参考资料:

https://x.com/bridgemindai/status/2072662214704533888?s=20

https://x.com/Hesamation/status/2072692225100612032?s=20

编辑:摩西



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大婚风波未过,香港政府“点名”霍启山,原来他和霍启刚处境一样

大婚风波未过,香港政府“点名”霍启山,原来他和霍启刚处境一样

老琴才是我的外号
2026-07-03 10:35:58
2026中考全部落幕,监考老师集体破防:现在的初中生,真让人揪心

2026中考全部落幕,监考老师集体破防:现在的初中生,真让人揪心

夜深爱杂谈
2026-07-03 20:18:28
黑丝短裙玩擦边,绿源电动车为邪火致歉

黑丝短裙玩擦边,绿源电动车为邪火致歉

ZAKER新闻
2026-07-02 18:18:42
中俄都来吊唁,但最该来的人没来,伊朗知道这时候沉不住气就完了

中俄都来吊唁,但最该来的人没来,伊朗知道这时候沉不住气就完了

呼呼历史论
2026-07-03 18:47:18
中国空调欧洲订单大增,空运一台运费2000元,成本仍较国外购买便宜一半,多从成都和惠州发货

中国空调欧洲订单大增,空运一台运费2000元,成本仍较国外购买便宜一半,多从成都和惠州发货

封面新闻
2026-07-03 09:44:14
万亿赛道,掀起涨停潮

万亿赛道,掀起涨停潮

新浪财经
2026-07-03 18:16:24
中国反兴奋剂中心:游泳运动员王子铭构成兴奋剂违规

中国反兴奋剂中心:游泳运动员王子铭构成兴奋剂违规

界面新闻
2026-07-03 20:10:58
中国男篮19分惨败给日本,胡金秋15+4贺希宁12分,高诗岩表现糟糕

中国男篮19分惨败给日本,胡金秋15+4贺希宁12分,高诗岩表现糟糕

中国篮坛快讯
2026-07-03 21:24:50
男女约会隐秘又安全的12个地方,有几个场合你根本想不到

男女约会隐秘又安全的12个地方,有几个场合你根本想不到

聪明小石头
2026-03-21 09:13:42
什么审美?看看姆巴佩的审美

什么审美?看看姆巴佩的审美

小鱼干影视
2026-07-02 09:00:09
毛主席对华国锋说“你办事,我放心”,到底是不是在指定接班人

毛主席对华国锋说“你办事,我放心”,到底是不是在指定接班人

【历史客栈】
2026-07-03 10:00:35
研究了6万颗恒星后,科学家发现:太阳似乎是被设计出来的!

研究了6万颗恒星后,科学家发现:太阳似乎是被设计出来的!

观察宇宙
2026-07-02 20:05:35
演唱会刚结束,任素汐体面形象遭撕碎,私生活混乱演技再好也没用

演唱会刚结束,任素汐体面形象遭撕碎,私生活混乱演技再好也没用

秋姐居
2026-07-03 19:18:29
男篮73-92不敌日本遭4坏消息!贺希宁杨瀚森引失望,防守成麻烦

男篮73-92不敌日本遭4坏消息!贺希宁杨瀚森引失望,防守成麻烦

篮球资讯达人
2026-07-03 21:28:03
24年无冠!从足球王国到头号笑柄,巴西队到底丢了什么?

24年无冠!从足球王国到头号笑柄,巴西队到底丢了什么?

老垯科普
2026-05-25 22:22:12
北京大妈公交车上打晕患癌姑娘,一巴掌断送退休后的美好幸福生活

北京大妈公交车上打晕患癌姑娘,一巴掌断送退休后的美好幸福生活

嘉琪Feel
2025-07-09 23:05:01
欧洲热成火炉,但日本以空调为代表的白色家电行业似乎已经凉透了

欧洲热成火炉,但日本以空调为代表的白色家电行业似乎已经凉透了

青陆
2026-07-02 15:45:57
5天一到,解放军准时封海,特朗普没想到,中方拒绝给31国留面子

5天一到,解放军准时封海,特朗普没想到,中方拒绝给31国留面子

阿纂看事
2026-07-02 20:45:49
朱时茂陈佩斯现状曝光差距大,一人家财万贯,一人真被倪萍说中了

朱时茂陈佩斯现状曝光差距大,一人家财万贯,一人真被倪萍说中了

小丸说故事
2026-07-01 14:44:40
一女子坐牢20年终于出狱,去办身份证时警察竟泪洒当场

一女子坐牢20年终于出狱,去办身份证时警察竟泪洒当场

故事秘栈
2025-05-27 18:56:51
2026-07-03 22:11:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15596文章数 66945关注度
往期回顾 全部

科技要闻

万亿富豪马斯克 舍不得特斯拉员工敞开用AI

头条要闻

中国男篮73比92不敌老对手日本男篮 世预赛出线存变数

头条要闻

中国男篮73比92不敌老对手日本男篮 世预赛出线存变数

体育要闻

C罗穿已故队友若塔球衣谢场 眼中含泪

娱乐要闻

海来阿木孕期出轨指控掀起全网热议

财经要闻

"千亿"众邦银行被接管:系严重信用风险

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

教育
时尚
数码
本地
房产

教育要闻

长沙两同班同学中考数学满分,一起分享考试经验和学习方法

A-Lin已经这样了,徐佳莹你怎么睡得着!

数码要闻

辰显光电发布全球首款Micro LED透明手表,透光率达65%

本地新闻

国内足球之旅?这座小城给你高分答案

房产要闻

总裁空缺17个月、现金缺口超1000亿:金融局“局外人”入局万科

无障碍浏览 进入关怀版