网易首页 > 网易号 > 正文 申请入驻

Claude 4 发布:实测代码更强,反华但 Cue 了 Manus

0
分享至

今天凌晨,Claude 4 系列模型发布,包括:

  • Claude Opus 4 (旗舰)

  • Claude Sonnet 4 (主力)

这两款模型同时支持扩展推理(extended thinking)、工具调用、文件读取、并行任务等 Agent 工作流所需核心能力。

实测:能完成较为复杂任务

在 WebApp 上,Sonnet 免费,Opus 4 付费
在 API 上,定价与前代一致,每百万 token:
Opus 输入 $15,输出 $75
Sonnet 输入 $3,输出 $15

编程能力提升

作为旗舰模型的 Claude Opus 4 ,针对复杂编程场景,进行了很多优化:

  • 跨文件编辑能力 :模型可识别项目结构,在多个文件间同步修改,减少遗漏;

  • 复杂指令执行 :更好地解析多条件、分步骤的请求;

  • 长时间任务保持 :具备较强的上下文记忆能力,适合执行耗时较长的流程;

  • 逻辑完整性增强 :在多步推理中更少出现跳步或模板式回答的问题。

根据公开基准测试数据,在 SWE-bench 中得分为 72.5%,在 Terminal-bench 得分为 43.2%。这两个得分均高于 GPT-4.1(67.4%)和 Gemini 1.5 Pro(66.6%)。

另外的,你会发现 Claude Sonnet 4 在 SWE-bench 得分为 72.7%,略高于 Opus 4。
该模型是对 Sonnet 3.7 的升级,提升了响应速度和执行精度,适合在原有场景中替代旧版使用。

除了模型本身外,Claude 4 系列还做了几项关键能力提升:

  • 工具调用能力(beta) :模型可以在中途调用工具(如 Web 搜索、本地文件读取、代码执行),用于补充信息或运行指令,适配更多类 Agent 工作流。

  • 并行工具使用 :多个工具调用可同时进行,任务拆解与执行效率提升,适合复杂任务路径或并发型指令。

  • 内存机制增强 :开发者授权 Claude 访问本地文件后,模型可以创建“记忆文档”,记录上下文关键信息,增强长任务一致性和延续性。

通过记忆剧情,让 AI 玩宝可梦
  • 规避任务“捷径”行为 :Anthropic 表示 Claude 4 系列在容易作弊的任务中,出现“偷懒”行为(如跳过中间步骤)的概率减少了 65% ,使得多步骤任务执行更稳、更可控。比如下面,这种可恶的代码省略:

  • def square_numbers(numbers):     result = []     for n in numbers:         # ...省略:计算平方         result.append(n)  # 本应是 result.append(n ** 2)     return result # 测试 nums = [1, 2, 3, 4] print("Squared:", square_numbers(nums))  # 输出 [1, 2, 3, 4],但本应是 [1, 4, 9, 16]

这些东西吧,它没办法体现在跑分离,但在很多编程自动化领域,会非常受用。

Claude Code 更新

Claude Code 已正式开放,方便开发者可以把 Claude 更深地嵌入日常开发流程。新增内容包括:

  • 支持 GitHub Actions :Claude 可以作为后台 Agent 执行代码任务。

  • 原生集成 IDE :提供 VS Code 和 JetBrains 插件,Claude 的修改建议会直接以“行内标注”的方式呈现在代码中,无需额外切换。

  • Claude Code SDK :开发者可以用它来自定义自己的 Agent,或构建 AI 协同工具。

  • GitHub 实例(Beta) :可以 @Claude Code 参与 PR 审查,自动响应修改建议、修复 CI 报错等。

实测

我一直想跑这么一个任务,但无论 GPT、Gemini 还是之前的 Claude 都没有成功:

生成 3D 演示动画,像中学生演示四冲程发动机的工作原理

但在这个这次的 Claude 4 里跑通了:

过程如下

然后...吐个槽,怎么感觉额度消耗的好快,这就让我去加钱了

在这次发布中,Anthropic 引用了多个第三方开发者工具的反馈,包括 GitHub、Sourcegraph、Augment Code 等。值得注意的是,国产 Agent 工具 Manus 的评价也被收录:

Manus highlights its improvements in following complex instructions, clear reasoning, and aesthetic outputs.

这是目前为止 首次有国产 Agent 工具出现在 Anthropic 的正式发布文档中
考虑到 Anthropic 长期对中国市场较为保守的公开态度(中译中:反华),这条引用颇有趣味。

附1:Anthropic CEO 的万字檄文 附2:相关链接

Claude Webapp
www.claude.ai

Claude API 文档
docs.anthropic.com

Claude Code GitHub 应用
github.com/anthropic/claude-code

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
沉默5天后!菲防长再发声,中国的制裁:成他心里过不去的坎儿

沉默5天后!菲防长再发声,中国的制裁:成他心里过不去的坎儿

瓦伦西亚月亮
2026-06-28 16:46:58
上海403分本科线“引全网怒喷”——凭啥沪爷高考,拿的是站票?

上海403分本科线“引全网怒喷”——凭啥沪爷高考,拿的是站票?

妍妍教育日记
2026-06-26 08:45:06
下周主线已定!光通信全线调整,资金全跑去了这两个方向!

下周主线已定!光通信全线调整,资金全跑去了这两个方向!

证券市场周刊
2026-06-28 15:09:59
越南电车亏损39亿美元:宁要越南烂车,不要中国电车,美国图啥

越南电车亏损39亿美元:宁要越南烂车,不要中国电车,美国图啥

王新喜
2026-06-27 06:48:38
上海市民骑哈啰单车称遭遇“价格刺客”,骑79分钟收费30元!哈啰回应:建议用户骑行前留意价格信息,避免误骑高价车辆

上海市民骑哈啰单车称遭遇“价格刺客”,骑79分钟收费30元!哈啰回应:建议用户骑行前留意价格信息,避免误骑高价车辆

三湘都市报
2026-06-28 19:30:46
黄博文:如果坚持这样打下去,我们一定会成为一支强队的

黄博文:如果坚持这样打下去,我们一定会成为一支强队的

懂球帝
2026-06-28 21:27:47
当着20万人面,亲华总统宣布辞职,下台前感谢中国,承诺不会反水

当着20万人面,亲华总统宣布辞职,下台前感谢中国,承诺不会反水

影孖看世界
2026-06-28 18:01:05
贝林厄姆世界杯火热表现后隔空喊话穆里尼奥:我在皇马踢的不同

贝林厄姆世界杯火热表现后隔空喊话穆里尼奥:我在皇马踢的不同

本泽体育
2026-06-28 15:32:22
申花4-1、西海岸3-1!中超积分榜:第4到第6同分,申花力压上港

申花4-1、西海岸3-1!中超积分榜:第4到第6同分,申花力压上港

中超伪球迷
2026-06-28 21:05:19
A股:大家要准备好了,明天(6月29日),不出意外要这么走了

A股:大家要准备好了,明天(6月29日),不出意外要这么走了

财经大拿
2026-06-28 11:42:42
打脸黄一鸣!大佬承认孩子身份,私密聊天曝出,王思聪显狼狈

打脸黄一鸣!大佬承认孩子身份,私密聊天曝出,王思聪显狼狈

一盅情怀
2026-06-28 13:28:56
俄鹰派敦促对乌进行核打击,布达诺夫:你动核武器试试

俄鹰派敦促对乌进行核打击,布达诺夫:你动核武器试试

史政先锋
2026-06-27 21:48:03
民主刚果3-1战胜乌兹!韩国队正式出局 韩媒解脱:煎熬终于结束了

民主刚果3-1战胜乌兹!韩国队正式出局 韩媒解脱:煎熬终于结束了

风过乡
2026-06-28 09:32:20
农商银行宣布退市!定期存款、养老钱 还能安全取出吗?

农商银行宣布退市!定期存款、养老钱 还能安全取出吗?

牛锅巴小钒
2026-06-28 19:49:59
笑喷!吴艳妮:早上比赛太早我赖床睡过头了 不化妆了直接素颜上场

笑喷!吴艳妮:早上比赛太早我赖床睡过头了 不化妆了直接素颜上场

818体育
2026-06-28 15:08:57
66年首次!泰王携王后公主空降法国,苏提达一袭藏青泰服,太亮眼

66年首次!泰王携王后公主空降法国,苏提达一袭藏青泰服,太亮眼

叮当当科技
2026-06-28 18:28:04
以色列的重大胜利黎巴嫩将彻底铲除真主党

以色列的重大胜利黎巴嫩将彻底铲除真主党

海子侃生活
2026-06-28 09:49:22
小仙女为了8000元“举报全班师生”,老师被停职,全班学生延毕

小仙女为了8000元“举报全班师生”,老师被停职,全班学生延毕

妍妍教育日记
2026-06-28 08:10:07
大佬减仓了。。

大佬减仓了。。

格隆汇
2026-06-28 13:45:06
这件事,比“集体免职”更讽刺的,是长达两年多时间的“沉默”!

这件事,比“集体免职”更讽刺的,是长达两年多时间的“沉默”!

走读新生
2026-06-28 22:09:49
2026-06-28 23:00:49
赛博禅心
赛博禅心
拜AI古佛,修赛博禅心
477文章数 53关注度
往期回顾 全部

科技要闻

DeepSeek最新论文:如何让大模型跑得更快

头条要闻

养老院取名"如家" 没被如家酒店投诉反被一女子投诉

头条要闻

养老院取名"如家" 没被如家酒店投诉反被一女子投诉

体育要闻

韩国可算确定被淘汰了

娱乐要闻

曾沛慈拿下《乘风2026》年度总冠军

财经要闻

省钱,我只服梁文锋

汽车要闻

搭载华为乾崑六件套 东风奕派M8预售19.98万起

态度原创

家居
教育
旅游
游戏
公开课

家居要闻

绿意盎然 自然之境

教育要闻

明日提前批第1次志愿填报!注意事项来啦↘

旅游要闻

以古籍为“导游”,潍坊市图书馆让市民化身城市文旅体验官

分析师:跟风《GTA6》卖80刀?先想想自己配不配

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版