网易首页 > 网易号 > 正文 申请入驻

越升级越便宜,Opus 4.8把变化与担忧一起端上桌

0
分享至

Opus 4.8刚发布,跑分全面超过GPT-5.5和Gemini 3.1 Pro,快速模式价格直接比上代便宜了三分之二。一个前沿模型,性能往上走,价格往下走,这剧情本身就够反常。但更值得琢磨的是另外两件事:dynamic workflows把任务规划从对话窗口里挪到了代码里,用户还能手动调模型的"思考强度"。一边是能力在涨,一边是控制权在往回交,这对每天跟代码打交道的开发者来说,信息量不小。

先拆dynamic workflows。它的本质是让Claude用JavaScript写一段编排脚本,把用户的需求拆成子任务,分给并行运行的subagents去干。关键变化藏在一个细节里:任务计划不再堆在Claude的上下文窗口里,中间结果全存在脚本变量里,最终只把答案送回对话。这意味着上下文不会被越拖越长的规划过程稀释掉,也不容易跑偏。subagents的并发上限是16个,单次运行总数不超过1000个,脚本本身碰不了文件系统和shell,能读写文件的是agents。进度随时保存,中断了可以在同一个session里恢复,已经跑完的agents直接返回缓存结果。


Anthropic放出的案例很有看头。Jarred Sumner用dynamic workflows把Bun从Zig移植到Rust,生成约75万行代码,测试套件通过率99.8%,从第一次commit到merge花了11天。过程是这样的:一个workflow负责给每个struct字段映射正确的Rust lifetime,下一个workflow把每个.rs文件改写成行为一致的移植版本,数百个agents并行干活,每个文件配两个reviewer,后面跟一个修复循环持续跑构建和测试,直到全部通过为止。不过Anthropic也说明了,这个结果已经合入但还没上生产。


第二个变化是思考强度控制。用户现在可以手动调高或调低Claude投入推理资源的程度。调高就"更频繁、更深入地思考",回答质量往上走;调低就更快回应用户,消耗rate limit的速度也变慢。这个设计戳中了一个挺现实的焦虑:很多人已经感觉到AI服务在通过各种额度机制变相涨价,额度消耗速度比预期快得多。现在能自己握个开关,至少知道快慢和消耗是怎么挂钩的。

价格这块,快速模式的变化最直接。Opus 4.8快速模式的速度是正常输出的2.5倍,价格降到每百万输入token 10美元、每百万输出token 50美元。对比Opus 4.7的30美元和150美元,降了整整三倍。常规模式下,Opus 4.8还是每百万输入5美元、输出25美元,跟Opus 4.7持平,而且比GPT-5.5便宜。快速模式已经在Claude Code里通过/fast命令可用,API访问还得去claude.com/fast-mode申请waitlist。企业版需管理员开通,Max和Team计划默认开启。


功能说完,有个点不容忽视。Opus 4.8在整体基准测试上压了GPT-5.5和Gemini 3.1 Pro一头,但agentic terminal coding这项,OpenAI的模型还在前面。所以不是一个模型把所有科目都考了第一的剧本,而是在开发者工作流这个具体战场上摆出了新的棋局。dynamic workflows瞄准的是大规模任务编排,fast mode卡的是延迟敏感的生产环境,方向很清楚。

最后说一下"诚实"这个事。今天的大模型竞赛里,聪明、快速、能写代码已经成了标配,难的是找到一个真能老老实实说"我不知道"的AI。第欧根尼大白天打着灯笼找诚实的人,放今天,人们大概想找的是个诚实的模型。跑分能告诉你谁能写更多代码,但没办法回答模型会不会在搞不定时硬编一个答案。Opus 4.8在跑分上拿了优势,在定价上给了诚意,但诚实这道附加题,还没人交卷。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
男人和女人谁更渴望性?

男人和女人谁更渴望性?

宇宙时空
2026-05-30 13:50:10
中国6000万签下世界杯后,第一个心态崩掉的国家出现:只有2000万

中国6000万签下世界杯后,第一个心态崩掉的国家出现:只有2000万

混沌录
2026-05-19 23:49:35
恩里克欧冠封神!带队2年连克7豪门夺2冠,给姆巴佩开小灶他不听

恩里克欧冠封神!带队2年连克7豪门夺2冠,给姆巴佩开小灶他不听

体育知多少
2026-05-31 05:12:05
56岁天后放话:20年后再穿经典绿裙,詹妮弗·洛佩兹的承诺让全场沸腾

56岁天后放话:20年后再穿经典绿裙,詹妮弗·洛佩兹的承诺让全场沸腾

生活观察员啊
2026-05-31 01:33:38
早知道|巴黎圣日耳曼成第二支卫冕欧冠球队

早知道|巴黎圣日耳曼成第二支卫冕欧冠球队

北青网-北京青年报
2026-05-31 08:10:09
塔帅:加布请缨第5球 赖斯:我们不像拜仁那样踢

塔帅:加布请缨第5球 赖斯:我们不像拜仁那样踢

体坛周报
2026-05-31 06:46:27
央视官宣:世界杯版权分销咪咕+小红书,总价超30亿!抖音没购买

央视官宣:世界杯版权分销咪咕+小红书,总价超30亿!抖音没购买

开成运动会
2026-05-30 23:55:52
工友都劝我别娶非洲本地姑娘,我不信,洞房夜我才彻底明白

工友都劝我别娶非洲本地姑娘,我不信,洞房夜我才彻底明白

千秋文化
2026-05-29 19:46:33
古代犯人发配需要衙役押送,往返几千里路,衙役是不是也很遭罪?

古代犯人发配需要衙役押送,往返几千里路,衙役是不是也很遭罪?

小豫讲故事
2026-05-29 06:00:15
“一米高度”丈量发展温度(视线)

“一米高度”丈量发展温度(视线)

人民网
2026-05-30 09:05:01
《新闻联播》沪甬通道的这一规划图纸,一石激起千层浪

《新闻联播》沪甬通道的这一规划图纸,一石激起千层浪

天袁地访
2026-05-30 12:45:44
66岁安帅暴怒 感觉被耍得团团转 警告内马尔:14天后还有伤就走人

66岁安帅暴怒 感觉被耍得团团转 警告内马尔:14天后还有伤就走人

风过乡
2026-05-30 08:33:24
中超疯狂夜!积分榜乱了:申花爆大冷,成都稳坐榜首,5队仅差1分

中超疯狂夜!积分榜乱了:申花爆大冷,成都稳坐榜首,5队仅差1分

去山野间追风
2026-05-31 04:42:10
王鹤棣没想到,心中这口恶气竟让官媒给出了,沈月也能松口气

王鹤棣没想到,心中这口恶气竟让官媒给出了,沈月也能松口气

LULU生活家
2026-05-30 18:01:01
主持人“鞠萍姐姐”6月1日正式退休

主持人“鞠萍姐姐”6月1日正式退休

极目新闻
2026-05-30 14:28:53
赵睿离开北京,是首钢本赛季最大的遗憾

赵睿离开北京,是首钢本赛季最大的遗憾

茶余饭后说体育
2026-05-30 18:34:31
还敢去全季酒店过夜吗

还敢去全季酒店过夜吗

不正确
2026-05-28 23:04:54
乒乓德甲官网:樊振东全程掌控节奏,5500名球迷观赛不少来自中国

乒乓德甲官网:樊振东全程掌控节奏,5500名球迷观赛不少来自中国

杨华评论
2026-05-31 04:27:37
警惕年轻人找不到工作正在被娱乐化、污名化!

警惕年轻人找不到工作正在被娱乐化、污名化!

灯锦年
2026-05-16 12:56:25
女子网约车排泄后续,身份嚣张,司机财路被断,处理结果窝囊至极

女子网约车排泄后续,身份嚣张,司机财路被断,处理结果窝囊至极

童童聊娱乐啊
2026-05-30 19:30:05
2026-05-31 08:24:49
摸鱼算法
摸鱼算法
致力于用最前沿的AI技术,换取更多发呆时间的三十岁青年。
4271文章数 45关注度
往期回顾 全部

科技要闻

车圈大佬发声:价格战远去,但竞争仍残酷

头条要闻

两名9岁女孩被困电梯近2小时 求救几十次物业无动于衷

头条要闻

两名9岁女孩被困电梯近2小时 求救几十次物业无动于衷

体育要闻

巴黎再度捧起欧冠奖杯 枪手众将黯然神伤

娱乐要闻

张碧晨《歌手》 “活人微死” 自嘲

财经要闻

双汇管不住一头猪

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

家居
教育
时尚
房产
本地

家居要闻

云栖 舒展如流云

教育要闻

氧化还原反应方程式的配平

美回巅峰的她们,带火的这些爆款真的好用吗

房产要闻

红动五月!全国抢入核心资产,广州盯紧凯旋新世界!

本地新闻

用剪纸的方式,打开江苏扬州

无障碍浏览 进入关怀版