网易首页 > 网易号 > 正文 申请入驻

马斯克说漏嘴了!Claude Opus参数5T,Sonnet 1T

0
分享至

西风 发自 凹非寺
量子位 | 公众号 QbitAI

哦豁,马斯克一个“不小心”,把Claude参数抖出来了???

长话短说:Sonnet 1T、Opus 5T。



起因是老马发帖表示,xAI的Colossus 2超算正在训练7个模型,其中最大的一款,参数量直接冲到了10万亿

完整清单:

Imagine V2
2个1万亿(1T)参数的变体模型
2个1.5 万亿(1.5T)参数的变体模型
6万亿(6T)参数模型
10万亿(10T)参数模型

P.S. Colossus 2,就是老马巨硬计划(Macrohard)的一部分。据2025年8月披露的信息,Colossus 2已经安装了119台风冷式冷水机组,提供约200MW的冷却能力,足以支持约11万个GB200 NVL72 GPU。

按照当时规划,Colossus 2第一阶段部署11万个英伟达GB200 GPU,最终目标是超过55万个GPU,峰值功率需求预计超过1.1GW。

这次发推文,也是马斯克为数不多地对外公开Colossus超算的具体训练计划。



消息一出,网友开启好奇宝宝模式,马斯克也是心情不错的样子,看到提问也回复了不少。

比如有人问“训练一个10T模型,大概要花多久?”,马斯克说预训练阶段大约需要2个月



哎,就有这么一段对话出现了。

Grok 4.2的参数量,仅为xAI目前在训最大模型的5%。也就是5000亿(500B)对比10万亿(10T),后者是前者20倍。
Grok 4.2真的是总参数量500B吗?还是说只是在一个更大的MoE里,激活的参数量是500B亿?

面对疑问,老马又亲自回应了:

总参数量就是0.5T(5000亿)。现在的Grok,参数量是Sonnet的一半、Opus的十分之一。以它的规模来说,是非常强的模型。



网友一眼瞄到显眼信息,这不就是说Sonnet是1T,Opus是5T。

于是有人追问:

纯好奇,你(马斯克)怎么知道Sonnet、Opus大小?



对此老马闭麦了,网友提出的点倒不无道理,“顶尖人才在这么几家公司间流动,似乎也没什么秘密能藏太久”。



Claude各版本参数,来自网友推测

自打Claude系列模型问世,Anthropic就一直严格保密参数规模,不管是Opus还是Sonnet,愣是一点没披露。

越不说,网友讨论得越起劲。

我们用AI总结了一下网友们分析讨论的不同版本的Claude参数规模。

你还别说,你还真别说。最新模型Claude 4.6 Sonnet ~1-2T、Claude 4.6 Opus ~1.5-2.5T/2-5T,还真和老马手滑泄露的“Sonnet1T、Opus5T”对上了。



具体来看网友都讨论出来了啥。

目前主流推测方法有四类:

  • 推理成本与吞吐量反推法:模型推理成本与激活参数量呈近似线性关系,而总参数量则可通过架构类型和行业经验系数推算。
  • 性能基准对标法:通过与已知参数的开源模型在标准化基准上的表现对比,推断闭源模型的参数规模。
  • 内部文件泄露与传闻分析法:官方意外暴露的信息&一些小道消息。
  • 架构特性分析法:通过对模型行为特性的观察,推断其采用的架构类型,进而缩小参数估计范围。

首先来看Claude 3系列,2024年3月发布,这是首个形成清晰产品矩阵的Claude系列,包含三个定位不同的版本。



小杯Haiku、中杯Sonnet以及大杯Opus,成本和性能依次递增。



对于它们的参数规模,LifeArchitect.ai创始人Alan D. Thompson曾给出估算:

Claude 3 Haiku (~20B)、Claude 3 Sonnet (~70B)、Claude 3 Opus (~2T)。



对于Claude 3 Sonnet,Reddit社区后续也展开了持续讨论,也有网友基于性能等推测Claude 3 Sonnet参数量在150-250B之间。



再来看Claude 3.5,这是Claude的一次重大升级,多个关键指标吊打GPT-4o。

不过,Anthropic最初只发布了独苗Claude 3.5 Sonnet。



其速度是Claude 3 Opus的两倍,成本却仅为后者的1/5。



关于模型参数量,微软等曾发布了一篇论文。



其中指出据行业估算,Claude 3.5 Sonnet参数约175B。

顺带附上其它模型估算参数:ChatGPT约175B、GPT-4约1.76T、GPT-4o约200B、o1-mini约100B、o1-preview约300B。



之后,Anthropic跳过了3.5命名,未发布3.5 Opus,在Claude Sonnet 3.7后直接进入4系列,发布了两个模型:

Claude Opus 4和Claude Sonnet 4



圈内对于Claude 4的参数估计,存在较大分歧。

行业估算Claude Opus 4参数约在300–500B之间,Claude Sonnet 4约在50B-100B之间。

接下来Claude Opus 4.1发布。

其编程性能再次突破,超越Claude Opus 4,在Agent任务和推理方面也进一步升级。



不过发布时,官方表示计划在未来几周对模型进行更大规模升级与改进,看来4.1真就只是一次小更新,替代Opus 4。

甚至网友讨论,Anthropic可能本来不想发模型,但是奈何GPT-5/Gemini-3的消息太多,为了保持市场竞争力所以先更新一波。

这可能也是关于其参数讨论并不多的原因之一。

Hacker News有网友认为,其可能是Anthropic尝试超大参数规模的实验性产品,后续4.5版本反而缩小了参数规模以优化效率。

Anthropic对Opus 4/4.1进行了蒸馏,得到了Opus 4.5。这也是该模型的运行速度比Opus 4快约3倍,同时API调用成本仅为后者的三分之一的核心原因。
整个AI行业的发展方向,正在摒弃万亿参数规模的超大模型。当下的核心命题是提升现有参数规模的利用效率。
Opus 4.5参数量撑死也就在2T左右。Opus 4/4.1的参数量或许能达到约6T(MoE架构)。



再往下就是4.5系列了。

Claude Sonnet 4.5先发布,计算机操作方面,在OSWorld测试中取得了60.2分的SOTA成绩,比Sonnet 4提升了近一半。

Claude Opus 4.5后脚跟上,前端开发、视觉能力显著提升,更擅长使用电脑;在深度研究、PPT制作与电子表格处理等日常任务方面的表现也全面升级。



今年2月刚发布的最新4.6系列,各项能力再上一个台阶。

Anthropic表示,对填写复杂Excel、网页清单等计算机操作任务,Sonnet 4.6已经接近人类水平。



而Opus 4.6,在GDPval-AA(一项评估金融、法律和其他领域经济价值知识工作任务的性能指标)上,比GPT-5.2高出144Elo;编程依旧独领风骚,在Agent编程评估Terminal-Bench 2.0中取得了最高分,并在“人类最后考试”中领先所有其它前沿模型。

越往后,技术迭代步入深水区,底层技术和模型架构还一个劲地搞创新,想估算模型参数量,越来越难了。

最近,一篇发表在Substack的技术逆向工程分析,通过OpenRouter在Google Vertex和Amazon Bedrock上的Token吞吐数据,估算了Claude Opus 4.5和4.6的激活参数量。



作者署名unexcitedneurons,他以3个开源MoE模型为校准基准,推算出Vertex平台的有效内存带宽约为4.0–4.5TB/s,进而得出:

Opus 4.6在FP8精度下的激活参数量为93–105B。

若假设模型采用FP8精度稠密层+FP4精度混合专家层的配置,Opus 4.6的激活参数量约为127–154B。

结合不同专家稀疏度方案,最终他认为,Opus 4.5绝非网传的10T+规模,它是一款体量小得多的模型,由Claude Opus 4/4.1蒸馏而来,参数量规模应落在1.5T-2T之间。

这一点也能从API定价中得到印证,Claude Opus 4.1的输入/输出定价为每百万Token 15美元/75美元,而Claude Opus 4.5/4.6目前的定价仅为每百万Token 5美元/25美元,价格直接降至原先的三分之一。

作者也提到,Claude Opus 4/4.1参数量大概率在5T-6T左右。

除了已发布模型的模型外,前几天Anthropic团队因权限配置失误,把自家未发布模型泄露了。

模型Claude Mythos(内部代号Capybara)。

泄露文件中,曾多次使用质的飞跃这种说法来形容Mythos,在具体能力上,相较于Claude Opus 4.6,Mythos在软件编码、学术推理和网络安全等测试中的得分显著更高。

Claude Mythos,被称为是迄今为止公司开发过的最强大的AI模型。



传言称模型参数达10T。

参考链接:
[1]https://x.com/lifetimization/status/2042285703162397167
[2]https://www.reddit.com/r/ClaudeAI/comments/1ixuxln/estimate_of_model_size_for_claude_37/
[3]https://lifearchitect.substack.com/p/the-memo-special-edition-claude-3
[4]https://arxiv.org/pdf/2412.19260v1
[5]https://medium.com/@bob.mashouf/claude-4-vs-llama-4-benchmarking-55b99c17d3f7
[6]https://news.ycombinator.com/item?id=47319205
[7]https://unexcitedneurons.substack.com/p/estimating-the-size-of-claude-opus

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
人伦之乱,正在悄悄毁掉无数家庭!看完一身冷汗

人伦之乱,正在悄悄毁掉无数家庭!看完一身冷汗

三农老历
2026-05-08 19:20:12
5月,遇到这水果别手软,一次买20斤,晒干后美味翻倍,营养解馋

5月,遇到这水果别手软,一次买20斤,晒干后美味翻倍,营养解馋

阿龙美食记
2026-05-13 14:06:46
87岁刘诗昆:住美国600平豪宅,和三婚妻子儿女双全,享天伦之乐

87岁刘诗昆:住美国600平豪宅,和三婚妻子儿女双全,享天伦之乐

悄悄史话
2026-04-22 12:38:34
大国晚宴上的唯一浙江企业家

大国晚宴上的唯一浙江企业家

台州交通广播
2026-05-16 06:49:42
我朋友是赵露思粉丝,我问她为什么赵露思要跑去泰国开演唱会

我朋友是赵露思粉丝,我问她为什么赵露思要跑去泰国开演唱会

小鲸叫我照顾海
2026-05-14 23:46:14
特朗普前脚刚走,夏巴兹后脚就到!中方首次掏出压箱底的杀手锏?

特朗普前脚刚走,夏巴兹后脚就到!中方首次掏出压箱底的杀手锏?

一家说
2026-05-16 12:51:47
上海楼市再次“爆量”!

上海楼市再次“爆量”!

睿见投资
2026-05-16 14:00:09
地震了,10国军方统一战线,联手围剿俄罗斯,普京反手祭出通缉令

地震了,10国军方统一战线,联手围剿俄罗斯,普京反手祭出通缉令

老谢谈史
2026-05-16 17:39:42
日本公安和中国公安区别

日本公安和中国公安区别

擦菠萝的海绵宝宝
2026-05-10 07:40:09
辛纳累瘫了!激战近3盘仍未能终结梅总,比赛阴雨延期,鲁德笑了

辛纳累瘫了!激战近3盘仍未能终结梅总,比赛阴雨延期,鲁德笑了

搏击江湖
2026-05-16 06:56:22
元首会晤释放缓和信号,为何不签联合公报,根源在四大核心分歧

元首会晤释放缓和信号,为何不签联合公报,根源在四大核心分歧

爱看剧的阿峰
2026-05-16 11:15:04
安徽多地纪委监委通报:2人被查,2人被处理!

安徽多地纪委监委通报:2人被查,2人被处理!

凤凰网安徽
2026-05-16 16:39:21
马克龙被妻子打耳光,是跟42岁美女演员互发暧昧短信,被抓包了?

马克龙被妻子打耳光,是跟42岁美女演员互发暧昧短信,被抓包了?

爱吃醋的猫咪
2026-05-16 19:04:21
特朗普贴身助理,34岁单身娜塔莉·哈普果然漂亮

特朗普贴身助理,34岁单身娜塔莉·哈普果然漂亮

三叔的装备空间
2026-05-16 08:32:33
今年首场明显降雨要来了!预计持续时间——

今年首场明显降雨要来了!预计持续时间——

BRTV新闻
2026-05-16 18:11:38
1.1亿压哨成交!别被FIFA降价骗了,亚洲依然是世界杯最大冤大头

1.1亿压哨成交!别被FIFA降价骗了,亚洲依然是世界杯最大冤大头

夜白侃球
2026-05-16 08:30:16
特朗普走了,黄仁勋还留在北京当“吃播”

特朗普走了,黄仁勋还留在北京当“吃播”

三叔的装备空间
2026-05-15 22:35:14
中国最好吃的6个城市,50岁前要去一次

中国最好吃的6个城市,50岁前要去一次

简食记工作号
2026-05-14 00:06:06
CCTV5不直播!樊振东冲击欧冠决赛,搭档莫雷加德,国乒再获重奖

CCTV5不直播!樊振东冲击欧冠决赛,搭档莫雷加德,国乒再获重奖

体育就你秀
2026-05-16 15:25:16
从傲慢到沉默再到承认,三天中国行后,鲁比奥给了解放军一个排名

从傲慢到沉默再到承认,三天中国行后,鲁比奥给了解放军一个排名

小樾说历史
2026-05-16 11:17:23
2026-05-16 19:51:00
量子位 incentive-icons
量子位
追踪人工智能动态
12635文章数 176463关注度
往期回顾 全部

科技要闻

涨的是车价,要的是老命

头条要闻

7人蒙面当街抢走幼童主谋竟是孩子生父 母亲奔波寻子

头条要闻

7人蒙面当街抢走幼童主谋竟是孩子生父 母亲奔波寻子

体育要闻

马刺2号,少年老成,这集看过?

娱乐要闻

谢霆锋北京街头骑行被偶遇,侧颜帅炸

财经要闻

造词狂魔贾跃亭

汽车要闻

高尔夫GTI刷新纽北纪录 ID. Polo GTI迎全球首秀

态度原创

教育
手机
亲子
艺术
公开课

教育要闻

一图讲透提前批!

手机要闻

小米卢伟冰回应为什么没有出iPhone Air形态的产品

亲子要闻

一个姐姐半个妈,姐姐贴心守护弟弟,懂事得让人心疼

艺术要闻

23幅 张祖英油画作品集

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版