Anthropic新模型Claude Opus 4.7：刻意弱于Mythos背后的战略逻辑|算法|玻璃|编程|智能体|多模态|opus|claude

Anthropic新模型Claude Opus 4.7：刻意弱于Mythos背后的战略逻辑

2026-04-23 22:00:31　来源: 至顶头条

北京举报

分享至

Anthropic近日发布了新版Claude模型——Opus 4.7，并有意将其能力限制在低于备受期待的Claude Mythos的水平之下。

Anthropic将Opus 4.7定位为对Opus 4.6的"显著升级"，在软件工程能力、视觉识别、记忆功能、指令遵循以及金融分析等方面均有所提升。

然而，尚未正式发布（此前曾被意外泄露）的Mythos，似乎已在发布时机上盖过了Opus 4.7的风头。值得关注的是，Anthropic自身也在一定程度上对Opus 4.7进行了"降调处理"，直言其"能力不及"Claude Mythos Preview，"综合能力也相对有限"。

此次Opus升级，也恰好发生在Anthropic推出"玻璃翅计划"（Project Glasswing）之后。该安全项目利用Claude Mythos Preview识别并修复网络安全漏洞。

"这在技术史上颇为罕见——一款产品的营销重点竟然在于它'不能做什么'，而非'能做什么'，"技术分析师卡米·利维（Carmi Levy）表示，"Anthropic的表述明确说明，Opus 4.7是一款更安全的模型，其能力相较Mythos被刻意收窄。"

Anthropic着重强调，Opus 4.7在指令遵循方面相比Opus 4.6有了"大幅提升"，能够处理复杂的长期任务，并能"精准关注"指令细节。用户反映，他们已经能够将"最棘手的编程工作"交由该模型完成，且其记忆能力也优于此前版本——它可以在多轮长期会话中记住笔记，并将其应用于新任务，从而减少前期的上下文输入负担。

在视觉能力方面，Opus 4.7拥有较前代模型高出3倍的视觉处理能力，可接受最高分辨率达2576像素的图片，从而支持需要精细视觉细节的多模态任务，例如以智能体形式分析密集截图，或从复杂图表中提取数据。

此外，Anthropic表示，Opus 4.7还具备更强的金融分析能力，可生成"严谨的分析报告和模型"，并输出更具专业水准的演示文稿。

在安全性方面，Opus 4.7与前代模型大体持平，在"欺骗、迎合用户以及配合滥用"等不良行为上的发生率较低。但Anthropic也坦承，尽管该模型在诚实性和抵抗恶意提示词注入方面有所进步，但在应对有害提示词等某些方面"略逊于"Opus 4.6，"行为表现尚未完全理想"。

Opus 4.7的发布，正值外界对Claude Mythos高度期待之际。Mythos是一款通用前沿模型，Anthropic称其为迄今训练过的"对齐程度最高"的模型。值得注意的是，在今天发布的博客文章中，Anthropic披露Mythos Preview在几项主要基准测试中的得分高于Opus 4.7，部分项目差距超过十个百分点。

具体而言，Mythos Preview在SWE-Bench Pro和SWE-Bench Verified（智能体编程）、Humanity's Last Exam（多学科推理）以及智能体搜索（BrowseComp）等基准测试中得分更高；而在智能体计算机使用、研究生级别推理和视觉推理方面，两款模型表现相近。

Opus 4.7现已在所有Claude产品及API中上线，并支持Amazon Bedrock、谷歌云Vertex AI和微软Foundry等平台。定价与Opus 4.6保持一致：输入Token每百万收费5美元，输出Token每百万收费25美元。

Info-Tech Research Group高级咨询分析师亚兹·帕拉尼查米（Yaz Palanichamy）指出，Claude Opus正在业界被定位为"实用型前沿"模型，代表着Anthropic"能力最强、最智能且最具多元自动化能力"的产品方向，核心应用场景涵盖复杂编程、深度研究和综合性智能体工作流。

他解释称，该模型的核心产品差异化在于其嵌入算法的协调性与可组合性，能够高效扩展多种实际应用场景。Claude Opus 4.7是一个"偏技术导向"的平台，需要用户进行相当程度的深度个性化定制来优化提示词和输出结果。在应用工程场景方面，它仍然领先于竞争对手谷歌Gemini，尽管Gemini 3.1 Pro拥有更大的上下文窗口（200万Token对比Claude的100万Token）；不过他也指出，"某些同类模型在原始推理能力上确实趋于接近"。

利维认为，4.7版本的更新使Opus超越了基础聊天机器人的定位，将其塑造为更接近"复杂技术岗位协作助手"的角色。"它的能力比以往任何时候都更强，对知识工作者而言是更出色的助手。"与此同时，其潜在风险也更低，使其成为一种"经过审慎权衡的折中方案"。

他还指出，Opus 4.7的发布距Opus 4.6问世仅两个月，这本身就是"AI开发周期已极度过热、市场竞争白热化"的信号。

上周，Anthropic还宣布启动"玻璃翅计划"，将Mythos Preview应用于主动防御安全领域。该公司正与AWS、谷歌等企业及30余家网络安全机构合作推进该计划，并声称已借助该计划发现"数千个"高危漏洞，涵盖所有主流操作系统和浏览器。

Anthropic有意对Claude Mythos Preview的发布范围加以限制，计划先在"能力相对较弱的模型"上测试新的网络安全防护机制。Opus 4.7便是其中之一，其网络安全能力不及Mythos。事实上，Anthropic坦言，在训练过程中曾刻意进行实验，以"有差别地削减"这部分能力。

Anthropic解释称，Opus 4.7内置了安全防护机制，可自动检测并拦截疑似涉及"违禁或高风险"网络安全用途的请求，相关经验将在未来应用于Mythos模型。

"这在某种程度上是一种承认——新模型在某些方面是被刻意'降智'处理的，目的是强化其网络风险检测与拦截能力，"利维评论道。

从营销角度看，这使Anthropic得以将Opus 4.7定位为能力与风险之间的理想平衡点，同时又避开了限量发行的高端模型所带来的"网络安全包袱"。

利维认为，Mythos或许正是推动Opus 4.7大规模普及的"终极垫脚石"。即便Mythos最终未能公开发布，它也将作为一种"理想的衬托手段"，将Opus塑造为"对大多数企业决策者而言最具平衡价值的模型"。

帕拉尼查米对此表示认同，并指出Opus 4.7可以充当一个面向公众的"测试样本"，用于实时检验和优化自动化网络安全防护机制，而这些机制最终将成为"更高级别Mythos类前沿模型全面发布的必要前置条件"。

Q&A

Q1：Claude Opus 4.7相比Opus 4.6有哪些主要提升？

A：Opus 4.7在多个方面实现了升级：指令遵循能力"大幅提升"，能处理复杂长期任务；视觉能力提升至前代3倍，支持最高2576像素图像，可完成密集截图分析等多模态任务；记忆能力增强，能在多轮会话中记住笔记并应用于新任务；金融分析能力更强，可生成更严谨的分析报告和专业演示文稿。软件工程能力也有显著提升，用户可将复杂编程工作直接交由其完成。

Q2：Anthropic为什么要刻意限制Opus 4.7的能力，让它弱于Mythos？

A：Anthropic的核心考量是安全性与风险控制。公司希望先在能力相对较弱的模型上测试并完善网络安全防护机制，再将这些经验应用于更强大的Mythos。Opus 4.7在训练阶段被有意削减了部分网络安全相关能力，并内置了自动检测和拦截高风险请求的防护措施。这也让Anthropic可以将Opus 4.7定位为能力与安全之间经过审慎权衡的折中方案，适合企业大规模部署。

Q3：Claude Mythos什么时候会正式发布？

A：目前Anthropic尚未公布Mythos的正式发布时间表。Mythos此前曾被意外泄露，当前仅以"Mythos Preview"的形式有限使用，主要用于"玻璃翅计划"等安全项目。Anthropic表示，公司正在通过Opus 4.7等模型积累安全防护经验，并将其作为Mythos更广泛发布的前置条件。部分分析师甚至认为，Mythos有可能永远不会完全对公众开放。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.