网易首页 > 网易号 > 正文 申请入驻

Claude翻车:Opus 4.1白天退化,Anthropic承认并回滚更新

0
分享至

闻乐 发自 凹非寺
量子位 | 公众号 QbitAI

发布即拿下各项SOTA的Claude Opus 4.1,也翻车了。

不止一位用户反馈Claude Opus 4.1变得迟钝,于是把官方炸出来承认:Claude Opus 4.1在处理某些请求时确实出现了质量退化。



Claude Opus 4.1到底出现了什么问题?

Claude Opus 4.1白天推理性能下降

实际上,在Anthropic发声明的前几天就有用户发帖表示:Claude Opus 4.1在上午10点到11点这段时间性能非常差。

模型经常像变了个人,在完成处理文稿任务时总是出现很多错误。但是这种质量下滑却在凌晨时消失



有人猜测,导致这一现象的原因可能是Claude Opus 4.1白天采用1.58位量化

这种方式的首要问题在于对模型精度影响较大。

量化本质是将模型参数从标准的16位浮点(FP16)或32位浮点(FP32)降低到低位格式,1.58位量化更是极端,仅用 {-1, 0, 1} 三个值来表示参数。

由于在信息论中,三个可能的值需要log₂(3)≈1.58496 bits来表示,这种量化方式也因此得名。

然而,这样虽然减少了内存使用,却很容易让模型丢失关键信息。

就像在Claude Opus 4.1中,如果白天使用1.58 位量化为大量用户服务,模型在处理复杂问题时,智能水平就会明显下滑,代码逻辑分析出错、文案撰写逻辑混乱,连常规任务表现也不尽人意。

在实际应用中,1.58位量化还可能导致模型稳定性欠佳。当模型参数被强制限定在有限的三个值时,面对复杂多变的输入数据,它的应对能力就会受到制约。

在一些需要对输入数据进行精准处理的场景下,例如医学图像分析、金融风险预测等,模型可能因1.58位量化无法准确捕捉数据特征,给出错误结果,进而影响整个系统的稳定性和可靠性。

除了白天性能下降的问题,在使用限制方面,官方的回应也并不明确。

用户反映有一次使用Claude Opus 4.1不到两小时,就已经达到了使用上限。去询问客服时,得到的反馈一会儿是由于使用时长限制,一会儿又说是使用量。



并且,限额的问题也不止一位用户反映。



甚至有用户反映该模型还会暴露API密钥。



面对这么多吐槽,好在Anthropic官方没让人等太久,出来回应了。

直接承认是推理堆栈出了问题,本来是想提升模型效率,结果没想到影响了响应质量。(没找借口,态度倒是挺实在)

而且解决速度也快已经把Claude Opus 4.1的版本回滚了,还特意提了Claude Opus 4.0也受了同样影响,正在处理,算是把问题考虑周全了。



声明一发,有网友调侃称还是第一次看到“明星公司”承认模型出了问题。



看来Anthropic良好的认错态度还是被广大网友接受了。

不过话说回来,Claude的用户们,你们最近有没有察觉Opus 4.1的质量下滑呢?


[1]https://x.com/TheAhmadOsman/status/1961870729609175088
[2]https://status.anthropic.com/incidents/h26lykctfnsz
[3]https://www.reddit.com/r/Anthropic/comments/1n28ya2/claude_opus_is_all_over_the_place_lately_and_i/

— 完 —

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大陆不急于统一台湾,背后是有大战略?长文分析大陆对台四大战略

大陆不急于统一台湾,背后是有大战略?长文分析大陆对台四大战略

阿胡
2024-01-17 10:53:34
一位大爷的法国旅游照火了!网友:大爷玩一趟,法国文旅一年白干

一位大爷的法国旅游照火了!网友:大爷玩一趟,法国文旅一年白干

有趣的火烈鸟
2026-01-08 11:14:12
汪小菲又说台湾扣留他孩子不让回北京了

汪小菲又说台湾扣留他孩子不让回北京了

名字是浮云
2026-01-08 12:30:08
震惊!东莞一工厂春节放假前结清工资,网友:这才是把员工当人

震惊!东莞一工厂春节放假前结清工资,网友:这才是把员工当人

火山詩话
2026-01-08 07:27:21
6年了,郭麒麟的反击几乎断送了朱亚文的演艺生涯

6年了,郭麒麟的反击几乎断送了朱亚文的演艺生涯

小熊侃史
2025-12-25 11:24:12
“AI火了,我们却快完了!”顶级开源框架Tailwind之父含泪裁掉75%兄弟:半年后,这个项目可能就没了

“AI火了,我们却快完了!”顶级开源框架Tailwind之父含泪裁掉75%兄弟:半年后,这个项目可能就没了

InfoQ
2026-01-08 13:32:50
吉林决战轰18-4逆转福建:威尔逊23+9包揽最后5分 邹阳16+13

吉林决战轰18-4逆转福建:威尔逊23+9包揽最后5分 邹阳16+13

醉卧浮生
2026-01-08 21:26:24
男性长期禁欲,性能力会更加强?医生提醒:可能要付出这几个代价

男性长期禁欲,性能力会更加强?医生提醒:可能要付出这几个代价

医者荣耀
2025-12-17 12:05:09
大腿离队本以为摆烂,换帅后7战5胜!落魄豪强一夜成前8最大黑马

大腿离队本以为摆烂,换帅后7战5胜!落魄豪强一夜成前8最大黑马

后仰大风车
2026-01-09 08:23:51
公安部:按照过紧日子等要求,因地制宜开展警察节活动

公安部:按照过紧日子等要求,因地制宜开展警察节活动

南方都市报
2026-01-08 11:06:17
影后辛芷蕾,这张照片摄影师得加鸡腿,抓拍的太到位了

影后辛芷蕾,这张照片摄影师得加鸡腿,抓拍的太到位了

徐帮阳
2025-12-23 18:33:38
媒体:太子集团创始人陈志被捕并遣送中国

媒体:太子集团创始人陈志被捕并遣送中国

澎湃新闻
2026-01-07 21:05:09
翟晓川:对位最头疼的是马尚;第一个教我打球的后卫是李学林

翟晓川:对位最头疼的是马尚;第一个教我打球的后卫是李学林

懂球帝
2026-01-08 20:23:30
无视国际法,美军扣押俄护航油轮,西方集体失声,普京或以牙还牙

无视国际法,美军扣押俄护航油轮,西方集体失声,普京或以牙还牙

阿芒娱乐说
2026-01-08 10:52:42
男子胸背痛怀疑心梗,急诊外科医生按换气过度综合征治疗无果;患者去世医方被定主责,警方刑事立案

男子胸背痛怀疑心梗,急诊外科医生按换气过度综合征治疗无果;患者去世医方被定主责,警方刑事立案

大风新闻
2026-01-08 14:41:04
为什么感觉美国在走向衰落?那是因为你是中国人

为什么感觉美国在走向衰落?那是因为你是中国人

扶苏聊历史
2025-12-19 10:02:54
高铁竞标竟有内幕:西门子和日本私下密谋涨价,刘志军如何应对

高铁竞标竟有内幕:西门子和日本私下密谋涨价,刘志军如何应对

红豆讲堂
2024-10-07 03:55:03
平局能接受!中国U23避免对伊拉克3连败:下场不输就有戏

平局能接受!中国U23避免对伊拉克3连败:下场不输就有戏

邱泽云
2026-01-09 01:09:27
为什么会挪用老百姓的钱?

为什么会挪用老百姓的钱?

生命可以承受之轻
2026-01-06 13:12:26
河南一大爷实拍“素颜巴黎”照片火遍全网,埃菲尔铁塔被调侃像“电线塔

河南一大爷实拍“素颜巴黎”照片火遍全网,埃菲尔铁塔被调侃像“电线塔

大象新闻
2026-01-07 19:53:19
2026-01-09 09:03:00
量子位 incentive-icons
量子位
追踪人工智能动态
11988文章数 176356关注度
往期回顾 全部

科技要闻

内存一天一个价,华强北老板们却高兴不起来

头条要闻

男子与女友吵架飙车泄愤撞死1家3口 当时讨论鹦鹉学舌

头条要闻

男子与女友吵架飙车泄愤撞死1家3口 当时讨论鹦鹉学舌

体育要闻

世乒赛银牌得主,说自己梦里都是孙颖莎

娱乐要闻

抗战剧《马背摇篮》首播,获观众好评

财经要闻

郁亮的万科35年:从"宝万之争"到"活下去"

汽车要闻

从量变到"智"变 吉利在CES打出了五张牌

态度原创

艺术
旅游
本地
时尚
公开课

艺术要闻

毛主席致陈委员信:笔法与结体,谁更难掌握?

旅游要闻

贵州六盘水:“南国雪乡”引客来

本地新闻

1986-2026,一通电话的时空旅程

60+女性穿搭指南来了:4招告别“大妈感”,解锁冬日优雅气质

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版