网易首页 > 网易号 > 正文 申请入驻

Anthropic新模型Claude Opus 4.7:刻意弱于Mythos背后的战略逻辑

0
分享至


Anthropic近日发布了新版Claude模型——Opus 4.7,并有意将其能力限制在低于备受期待的Claude Mythos的水平之下。

Anthropic将Opus 4.7定位为对Opus 4.6的"显著升级",在软件工程能力、视觉识别、记忆功能、指令遵循以及金融分析等方面均有所提升。

然而,尚未正式发布(此前曾被意外泄露)的Mythos,似乎已在发布时机上盖过了Opus 4.7的风头。值得关注的是,Anthropic自身也在一定程度上对Opus 4.7进行了"降调处理",直言其"能力不及"Claude Mythos Preview,"综合能力也相对有限"。

此次Opus升级,也恰好发生在Anthropic推出"玻璃翅计划"(Project Glasswing)之后。该安全项目利用Claude Mythos Preview识别并修复网络安全漏洞。

"这在技术史上颇为罕见——一款产品的营销重点竟然在于它'不能做什么',而非'能做什么',"技术分析师卡米·利维(Carmi Levy)表示,"Anthropic的表述明确说明,Opus 4.7是一款更安全的模型,其能力相较Mythos被刻意收窄。"

Anthropic着重强调,Opus 4.7在指令遵循方面相比Opus 4.6有了"大幅提升",能够处理复杂的长期任务,并能"精准关注"指令细节。用户反映,他们已经能够将"最棘手的编程工作"交由该模型完成,且其记忆能力也优于此前版本——它可以在多轮长期会话中记住笔记,并将其应用于新任务,从而减少前期的上下文输入负担。

在视觉能力方面,Opus 4.7拥有较前代模型高出3倍的视觉处理能力,可接受最高分辨率达2576像素的图片,从而支持需要精细视觉细节的多模态任务,例如以智能体形式分析密集截图,或从复杂图表中提取数据。

此外,Anthropic表示,Opus 4.7还具备更强的金融分析能力,可生成"严谨的分析报告和模型",并输出更具专业水准的演示文稿。

在安全性方面,Opus 4.7与前代模型大体持平,在"欺骗、迎合用户以及配合滥用"等不良行为上的发生率较低。但Anthropic也坦承,尽管该模型在诚实性和抵抗恶意提示词注入方面有所进步,但在应对有害提示词等某些方面"略逊于"Opus 4.6,"行为表现尚未完全理想"。

Opus 4.7的发布,正值外界对Claude Mythos高度期待之际。Mythos是一款通用前沿模型,Anthropic称其为迄今训练过的"对齐程度最高"的模型。值得注意的是,在今天发布的博客文章中,Anthropic披露Mythos Preview在几项主要基准测试中的得分高于Opus 4.7,部分项目差距超过十个百分点。

具体而言,Mythos Preview在SWE-Bench Pro和SWE-Bench Verified(智能体编程)、Humanity's Last Exam(多学科推理)以及智能体搜索(BrowseComp)等基准测试中得分更高;而在智能体计算机使用、研究生级别推理和视觉推理方面,两款模型表现相近。

Opus 4.7现已在所有Claude产品及API中上线,并支持Amazon Bedrock、谷歌云Vertex AI和微软Foundry等平台。定价与Opus 4.6保持一致:输入Token每百万收费5美元,输出Token每百万收费25美元。

Info-Tech Research Group高级咨询分析师亚兹·帕拉尼查米(Yaz Palanichamy)指出,Claude Opus正在业界被定位为"实用型前沿"模型,代表着Anthropic"能力最强、最智能且最具多元自动化能力"的产品方向,核心应用场景涵盖复杂编程、深度研究和综合性智能体工作流。

他解释称,该模型的核心产品差异化在于其嵌入算法的协调性与可组合性,能够高效扩展多种实际应用场景。Claude Opus 4.7是一个"偏技术导向"的平台,需要用户进行相当程度的深度个性化定制来优化提示词和输出结果。在应用工程场景方面,它仍然领先于竞争对手谷歌Gemini,尽管Gemini 3.1 Pro拥有更大的上下文窗口(200万Token对比Claude的100万Token);不过他也指出,"某些同类模型在原始推理能力上确实趋于接近"。

利维认为,4.7版本的更新使Opus超越了基础聊天机器人的定位,将其塑造为更接近"复杂技术岗位协作助手"的角色。"它的能力比以往任何时候都更强,对知识工作者而言是更出色的助手。"与此同时,其潜在风险也更低,使其成为一种"经过审慎权衡的折中方案"。

他还指出,Opus 4.7的发布距Opus 4.6问世仅两个月,这本身就是"AI开发周期已极度过热、市场竞争白热化"的信号。

上周,Anthropic还宣布启动"玻璃翅计划",将Mythos Preview应用于主动防御安全领域。该公司正与AWS、谷歌等企业及30余家网络安全机构合作推进该计划,并声称已借助该计划发现"数千个"高危漏洞,涵盖所有主流操作系统和浏览器。

Anthropic有意对Claude Mythos Preview的发布范围加以限制,计划先在"能力相对较弱的模型"上测试新的网络安全防护机制。Opus 4.7便是其中之一,其网络安全能力不及Mythos。事实上,Anthropic坦言,在训练过程中曾刻意进行实验,以"有差别地削减"这部分能力。

Anthropic解释称,Opus 4.7内置了安全防护机制,可自动检测并拦截疑似涉及"违禁或高风险"网络安全用途的请求,相关经验将在未来应用于Mythos模型。

"这在某种程度上是一种承认——新模型在某些方面是被刻意'降智'处理的,目的是强化其网络风险检测与拦截能力,"利维评论道。

从营销角度看,这使Anthropic得以将Opus 4.7定位为能力与风险之间的理想平衡点,同时又避开了限量发行的高端模型所带来的"网络安全包袱"。

利维认为,Mythos或许正是推动Opus 4.7大规模普及的"终极垫脚石"。即便Mythos最终未能公开发布,它也将作为一种"理想的衬托手段",将Opus塑造为"对大多数企业决策者而言最具平衡价值的模型"。

帕拉尼查米对此表示认同,并指出Opus 4.7可以充当一个面向公众的"测试样本",用于实时检验和优化自动化网络安全防护机制,而这些机制最终将成为"更高级别Mythos类前沿模型全面发布的必要前置条件"。

Q&A

Q1:Claude Opus 4.7相比Opus 4.6有哪些主要提升?

A:Opus 4.7在多个方面实现了升级:指令遵循能力"大幅提升",能处理复杂长期任务;视觉能力提升至前代3倍,支持最高2576像素图像,可完成密集截图分析等多模态任务;记忆能力增强,能在多轮会话中记住笔记并应用于新任务;金融分析能力更强,可生成更严谨的分析报告和专业演示文稿。软件工程能力也有显著提升,用户可将复杂编程工作直接交由其完成。

Q2:Anthropic为什么要刻意限制Opus 4.7的能力,让它弱于Mythos?

A:Anthropic的核心考量是安全性与风险控制。公司希望先在能力相对较弱的模型上测试并完善网络安全防护机制,再将这些经验应用于更强大的Mythos。Opus 4.7在训练阶段被有意削减了部分网络安全相关能力,并内置了自动检测和拦截高风险请求的防护措施。这也让Anthropic可以将Opus 4.7定位为能力与安全之间经过审慎权衡的折中方案,适合企业大规模部署。

Q3:Claude Mythos什么时候会正式发布?

A:目前Anthropic尚未公布Mythos的正式发布时间表。Mythos此前曾被意外泄露,当前仅以"Mythos Preview"的形式有限使用,主要用于"玻璃翅计划"等安全项目。Anthropic表示,公司正在通过Opus 4.7等模型积累安全防护经验,并将其作为Mythos更广泛发布的前置条件。部分分析师甚至认为,Mythos有可能永远不会完全对公众开放。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
”经济学家吴晓求教授说:“老百姓都没收入了,还在刺激消费!这种做法是错误的!

”经济学家吴晓求教授说:“老百姓都没收入了,还在刺激消费!这种做法是错误的!

张晓磊
2025-11-07 11:34:05
西方正制造一个可怕的共识,对华战争,可突破道德底线和伦理原则

西方正制造一个可怕的共识,对华战争,可突破道德底线和伦理原则

新车知多少
2026-04-23 18:07:54
煮虾时,用“开水”还是“冷水”?区别很大,做错了虾又老腥味重

煮虾时,用“开水”还是“冷水”?区别很大,做错了虾又老腥味重

阿龙美食记
2026-04-11 14:10:04
省长来到咱园区

省长来到咱园区

法律维权
2026-04-24 02:53:17
1995年,记者意外看到一把日本军刀,发现南京百人斩凶手竟有四人

1995年,记者意外看到一把日本军刀,发现南京百人斩凶手竟有四人

莫地方
2026-04-24 00:45:03
郑丽文和家人的一张合影,时间是1971年,地点是眷村。

郑丽文和家人的一张合影,时间是1971年,地点是眷村。

叶老四
2026-04-15 09:44:36
炸锅!美商务部长亲口承认:中国一块H200芯片都没买,原因不简单

炸锅!美商务部长亲口承认:中国一块H200芯片都没买,原因不简单

普陀动物世界
2026-04-23 17:41:15
记者:CBA赛制频繁变更,对联赛的职业化发展是有损伤的

记者:CBA赛制频繁变更,对联赛的职业化发展是有损伤的

懂球帝
2026-04-23 23:24:51
还是做好准备吧,一美元只能兑换5.5元人民币时代,或许终会到来

还是做好准备吧,一美元只能兑换5.5元人民币时代,或许终会到来

世界圈
2026-03-30 11:27:28
放弃世乒赛后 樊振东首次发文:人性尺度不同 勇于发问的人太稀缺

放弃世乒赛后 樊振东首次发文:人性尺度不同 勇于发问的人太稀缺

念洲
2026-04-23 06:04:23
首次!日本导弹将对舰艇开火!中国:历史会以相似的逻辑重现!

首次!日本导弹将对舰艇开火!中国:历史会以相似的逻辑重现!

小莜读史
2026-04-23 17:15:02
周美青曝马英九真实状况,萧旭岑清白有保证了,邱毅解密事件真相

周美青曝马英九真实状况,萧旭岑清白有保证了,邱毅解密事件真相

兰妮搞笑分享
2026-04-23 18:25:12
马斯克:约400万辆特斯拉HW3车型将无法获得FSD

马斯克:约400万辆特斯拉HW3车型将无法获得FSD

CNMO科技
2026-04-23 07:44:09
为什么2026教育突然松绑了?网友:过度内卷只会影响孩子心理健康

为什么2026教育突然松绑了?网友:过度内卷只会影响孩子心理健康

另子维爱读史
2026-04-21 20:14:40
做完手术人就废了,这5种手术不需要做,别让无知害了自己

做完手术人就废了,这5种手术不需要做,别让无知害了自己

医学科普汇
2026-01-29 06:25:03
纪委监听真相:99%基层干部够不上,3道门槛卡死

纪委监听真相:99%基层干部够不上,3道门槛卡死

朗威谈星座
2026-04-23 01:23:12
明天起 广州两大片区实施临时交通管制

明天起 广州两大片区实施临时交通管制

广州交通电台
2026-04-23 17:35:33
从金球先生到只剩6欧元!半数球星退役5年就破产,原因不在乱花钱

从金球先生到只剩6欧元!半数球星退役5年就破产,原因不在乱花钱

草莓解说体育
2026-04-23 12:09:25
浙江一11岁男孩偷钱买手机,父亲没收后怒找手机店老板抗议,一周后老板又卖他一个更贵的:“忘了”

浙江一11岁男孩偷钱买手机,父亲没收后怒找手机店老板抗议,一周后老板又卖他一个更贵的:“忘了”

大象新闻
2026-04-23 18:50:06
47岁严屹宽:拼命赚钱养娃,衣服超300元嫌贵,心疼妻子不生二胎

47岁严屹宽:拼命赚钱养娃,衣服超300元嫌贵,心疼妻子不生二胎

小冠说娱
2026-04-22 22:14:13
2026-04-24 03:23:00
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
17960文章数 49700关注度
往期回顾 全部

科技要闻

马斯克喊出"史上最大产品",但量产难预测

头条要闻

以色列:只要美国同意 将刺杀伊朗最高领袖

头条要闻

以色列:只要美国同意 将刺杀伊朗最高领袖

体育要闻

给文班剃头的马刺DJ,成为NBA最佳第六人

娱乐要闻

王大陆因涉黑讨债被判 女友也一同获刑

财经要闻

普华永道赔偿10亿 恒大股东见到"回头钱"

汽车要闻

预售30.29万起 岚图泰山X8配896线激光雷达

态度原创

亲子
艺术
旅游
公开课
军事航空

亲子要闻

新华读报|打乒乓球有助提高儿童注意力

艺术要闻

吉达塔盖到第100层,“它是沙特唯一能按期完成的大项目”

旅游要闻

来广州,分享10亿元“中国旅游日”专属优惠福利

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

人民海军成立77周年 主力舰艇亮相上海

无障碍浏览 进入关怀版