网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

刚刚，马斯克新模型撞车Claude，口碑崩了

2026-02-18 07:12:23　来源: AppSo

广东举报

0

分享至

完成 300 亿美元融资后，Anthropic 交出了第一份 AI 答卷。就在刚刚，Claude Sonnet 4.6 正式发布，定位是「史上最强 Sonnet」。

编程、计算机操作、长上下文推理、智能体规划，全面升级。价格没变，还是每百万 token 3 美元输入/15 美元输出，但性能直接逼近 Opus 级别。

在与 Opus 4.5 的对比测试里，用户有 59% 的时间更偏好 Sonnet 4.6。理由也很实在：过度工程化更少、幻觉更少、多步骤任务执行更稳。

计算机操作能力是这次升级的重头戏。

在 OSWorld 基准测试上，Sonnet 系列过去 16 个月持续进步，现在处理复杂电子表格、填写多步骤网页表单已接近人类水平。

这个能力戳中的是一个真实痛点：很多企业的老旧软件没有现代 API 接口，过去只能专门开发连接器，现在模型直接像人一样看屏幕、点鼠标就行了，省掉了一大截工程成本。

顺带一提，Excel 中的 Claude 插件这次也同步升级，新增了 MCP 连接器支持，对金融从业者来说，这个更新很实用。

Sonnet 4.6 另一个亮点是支持 100 万 token 超大上下文，足以在一次请求里塞进完整代码库、数十篇论文或一堆合同。

在 Vending-Bench Arena 这个模拟企业运营的评估里，Sonnet 4.6 摸索出一套有意思的策略：前期大举投资产能，最后阶段猛转盈利导向，靠这个转折时机甩开其他模型。支撑这套打法的，正是它的长期规划能力。

对普通用户来说，Free 和 Pro 方案的默认模型已经切换为 Sonnet 4.6，claude.ai 和 Claude Cowork 同步更新。

开发者方面，API 模型标识是 claude-sonnet-4-6，支持自适应思考、扩展思考，上下文压缩功能可以在对话快撑爆上下文时自动总结旧内容，省 token 又省心。

✊ 而就在 Sonnet 4.6 发布的同期，马斯克旗下 xAI 的 Grok 4.20 测试版也正式上线了 grok.com。

Grok 4.20 支持并行调度 4 个专业智能体——Grok、Harper、Benjamin、Lucas——协同执行任务。然而整体口碑两极分化严重，且过往预期拔得太高，导致不少用户期望落空，差评偏多。

后续马斯克罕见连发多条推文灭火「救场」。他解释称，目前的 Grok 4.20 只是参数量 500B 的小型基础模型，尚处公测阶段。他还强调，Grok 4.20 的底层架构具备每周自我迭代的能力，递归式智能增长空间很大。

按他的说法，公测结束后，Grok 4.20 的智能和速度将比 Grok 4 提升约一个数量级。但这个承诺能否兑现，只能说拭目以待吧。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

浙江男子花860万买了套排屋，收房时傻眼，院子里有一个“凸起”，业主：跟老家的厕所一样，开放商：不利因素已公示

极目新闻 2026-04-30 10:33:16
7294 跟贴 7294
国防部回应外界推测中国对日将有大动作

北京青年报 2026-04-30 16:41:25
5292 跟贴 5292

阳台外贴满“吵”！深圳一小区居民抓狂：凌晨睡不了，孩子被迫回老家

南方都市报 2026-04-30 15:18:54
358 跟贴 358

男子在山里航拍，发现多人为摘洋槐花砍槐树，几十棵粗树被锯断

星视频 2026-04-30 13:26:30
107 跟贴 107
上海迪士尼回应游客劝阻吸烟被打：园区没有禁烟；被打男子发声：对方已赔钱和解

中国新闻周刊 2026-04-27 14:25:00
15250 跟贴 15250

物业费收不齐，亏损止不住：一年超200个物业撤场，困局何解？

新京报 2026-04-30 09:46:07
689 跟贴 689

62岁天津大爷，“chua一下”就火了

中国新闻周刊 2026-04-30 11:20:55
951 跟贴 951
中国船员滞留霍尔木兹60天：奖发到位大部分愿继续干

潇湘晨报 2026-04-30 16:26:46
12361 跟贴 12361

卫冕冠军赵心童10比13不敌墨菲止步八强，“克鲁斯堡魔咒”仍在延续，吴宜泽闯进四强，成为中国军团独苗

鲁中晨报 2026-04-30 09:07:20
777 跟贴 777
瑞士欲设"1000万人口上限" 超半数民众支持

极目新闻 2026-04-30 12:41:35
653 跟贴 653
洛阳白马寺发布郑重声明：不少游客因通过非官方第三方渠道购买非法倒卖的预约门票，导致无法正常入寺，切勿轻信

极目新闻 2026-04-29 18:10:47
903 跟贴 903
WSBK匈牙利站排位赛5月1日打响张雪机车告别优待资格再战国际赛场

封面新闻 2026-04-30 21:56:05
79 跟贴 79
海关总署：即日起允许符合要求的西班牙开心果和无花果干进口

证券时报 2026-04-30 14:40:08
316 跟贴 316
上海将建世界最高无轴摩天轮“上海之门”，预计今年年底开工

澎湃新闻 2026-04-29 22:34:28
521 跟贴 521
2025年农民工月均收入5075元，比上年增加114元

新京报 2026-04-30 15:06:03
3481 跟贴 3481
福大毕业生称211高校学生盗用其毕业作品参赛获奖！合肥工业大学：正在核实

大风新闻 2026-04-30 15:48:06
294 跟贴 294
文旅部集中整治景区摆渡车，点名龙虎山、长白山、稻城亚丁等

南方都市报 2026-04-27 16:21:12
2136 跟贴 2136
哈啰“臻有钱”平台被指利率踩红线、隐形收费多

红星新闻 2026-04-30 14:27:43
239 跟贴 239
堵！堵！堵！苏B大军出动了！

江南晚报 2026-04-30 18:58:38
0 跟贴 0

G5结束后，NBA夺冠概率更新！火箭0.7%骑士2.4%两队超20%断档领跑

G5结束后，NBA夺冠概率更新！火箭0.7%骑士2.4%两队超20%断档领跑

锅子篮球

2026-04-30 19:43:18

弘一法师：当你开始冷漠、独来独往、杀伐果断——恭喜，你重生了

弘一法师：当你开始冷漠、独来独往、杀伐果断——恭喜，你重生了

杏花烟雨江南的碧园

2026-04-30 13:15:03

730万香港市民钟意首艘核航母，中央将打破惯例叫它“香港号”？

730万香港市民钟意首艘核航母，中央将打破惯例叫它“香港号”？

混沌录

2026-04-30 20:35:32

90后救人夫妻找到！人民日报点名，工作单位曝光，难怪会不顾一切

90后救人夫妻找到！人民日报点名，工作单位曝光，难怪会不顾一切

奇思妙想草叶君

2026-04-29 18:37:49

《黑袍》星光在GTA6“下海”！街头服务“揽客”

《黑袍》星光在GTA6“下海”！街头服务“揽客”

游民星空

2026-04-29 19:43:05

400万辅警的春天来了！劳务派遣将成历史，逐步全面直签！

400万辅警的春天来了！劳务派遣将成历史，逐步全面直签！

职场资深秘书

2026-04-30 16:31:44

有一种“反噬”叫张碧晨和华晨宇，分手7年，两人的境遇天翻地覆

有一种“反噬”叫张碧晨和华晨宇，分手7年，两人的境遇天翻地覆

暖心萌阿菇凉

2026-05-01 01:20:35

霍尔木兹海峡，大消息！特朗普，新动作！油价跳水，黄金、白银，突变！

霍尔木兹海峡，大消息！特朗普，新动作！油价跳水，黄金、白银，突变！

证券时报e公司

2026-04-30 22:44:03

“白骨精”扮演者杨春霞，一生拒谈西游记，至今不肯原谅导演杨洁

“白骨精”扮演者杨春霞，一生拒谈西游记，至今不肯原谅导演杨洁

历史龙元阁

2026-04-30 10:15:20

3800亿五粮液突发爆雷，净利暴跌72%，股价创6年新低

3800亿五粮液突发爆雷，净利暴跌72%，股价创6年新低

蒋东文

2026-04-30 21:16:43

《乘风2026》三公路透，“李小冉毫无运动痕迹”登上热搜

《乘风2026》三公路透，“李小冉毫无运动痕迹”登上热搜

落雪听梅a

2026-05-01 04:58:46

新婚即翻车?阿Sa刚官宣结婚，老公被扒交友app约网红，细节太尴尬

新婚即翻车?阿Sa刚官宣结婚，老公被扒交友app约网红，细节太尴尬

揽星河的笔记

2026-04-30 15:58:00

孙杨趁张豆豆上厕所，偷偷问伊能静的那个问题，真的太下头了

孙杨趁张豆豆上厕所，偷偷问伊能静的那个问题，真的太下头了

舍长阿爷谈事

2026-05-01 02:03:37

黄玉郎自曝与黎姿分手原因，受高人指点放弃忘年恋，曾在一起三年

黄玉郎自曝与黎姿分手原因，受高人指点放弃忘年恋，曾在一起三年

一盅情怀

2026-04-30 16:27:22

朱珠衣领开叉到肚脐，网友吵翻：这到底是敢穿还是不得体？

朱珠衣领开叉到肚脐，网友吵翻：这到底是敢穿还是不得体？

可乐谈情感

2026-05-01 00:44:22

C罗：沙特联赛应开会明确规则，赛季结束后我会说出很多真相

C罗：沙特联赛应开会明确规则，赛季结束后我会说出很多真相

懂球帝

2026-05-01 03:51:11

腰斩的比亚迪

诗与星空

2026-04-30 07:26:56

想不通！一个全明星，连续五年场均得分20+，为啥摆上货架没人要

想不通！一个全明星，连续五年场均得分20+，为啥摆上货架没人要

球毛鬼胎

2026-04-30 13:39:21

扎心了！女儿频繁用生殖器官类词汇辱骂父母，一家长哭诉引发热议

扎心了！女儿频繁用生殖器官类词汇辱骂父母，一家长哭诉引发热议

火山詩话

2026-04-30 07:03:35

97年我跑长途捎了一位尼姑，尼姑下车时送我三句话，三年后全应验

97年我跑长途捎了一位尼姑，尼姑下车时送我三句话，三年后全应验

千秋文化

2026-04-29 19:09:51

让智能手机更好用的秘密

6330文章数 26830关注度

往期回顾全部

财经要闻

易会满被“双开”！

头条要闻

高校招聘被质疑"萝卜岗":36人进体检近半疑为本校老师

头条要闻

高校招聘被质疑"萝卜岗":36人进体检近半疑为本校老师

体育要闻

季后赛场均5.4分，他凭啥在骑士打首发？

娱乐要闻

孙杨博士学历有问题？官方含糊其辞

科技要闻

9000亿美元估值，Anthropic即将反超OpenAI

汽车要闻

专访捷途汪如生：捷途双线作战全球化全面落地

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

时尚

本地

房产

手机

健康

春天穿衣要杜绝老气感！衣服选对、搭配到位，减龄舒适又得体

本地新闻

用青花瓷的方式，打开西溪湿地

房产要闻

熬了6年，涨了2亿，三亚核心区这块地再次上架

手机要闻

颠覆想象！追觅重新定义 “下一代终端”

干细胞治烧烫伤面临这些“瓶颈”

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版