后OpenClaw时代！国产Agent模型凭「高配低价」叫板Opus 4.6|调用|智能体|工作流|agent|人工智能模型

后OpenClaw时代！国产Agent模型凭「高配低价」叫板Opus 4.6

2026-05-26 13:32:34　来源: 新浪财经

河北举报

分享至

来源：市场资讯

编辑｜+0、杜伟

今年最出圈的 AI 应用是什么？OpenClaw 一定是绕不开的答案。

回过头看二三月份，「养虾」一度成为流行的社交货币。但它的意义远不止是一款爆款应用：OpenClaw 真正将智能体概念从开发者圈层推向了大众视野，让普通用户第一次直观感受到 Agent 到底能做什么。

当更多人开始理解 Agent 的价值之后，行业的焦点也自然进入到了下一阶段：谁家的 Agent 做得更好、上手起来更容易以及更能负担得起。这些才是决定 Agent 生态走向的关键变量。

谁能在这一节点完成转型，就能在「后 OpenClaw 时代」抢占先机。事实上，国内已经有玩家率先落子。

就在今日，昆仑万维旗下的天工 AI（Skywork）全新发布了 SkyClaw-v1.0 智能体模型，成为其长期深耕云端助理的又一里程碑，也开始了从助手形态向智能体基座模型的架构升级。

作为一款专为 OpenClaw、Claude Code、Hermes、Nanobot 等主流智能体框架深度优化的基座模型，SkyClaw-v1.0 模型在底层能力上实现了质的提升，工具调用精度更准、多轮任务执行更稳、长链路推理更优，能够更好地适配真实场景中复杂、动态的智能体工作流。

与此同时，Skywork 还同步上线了 SkyClaw-v1.0-lite。这一轻量化版本瞄准了高频调用和成本敏感场景，在保持核心智能体能力的同时，大幅优化了推理速度与资源开销，为开发者提供了一个更灵活的部署选择。

两款模型在 X 上抢先亮相以来，热度持续走高。

Nanobot 官方发文，「很高兴能与 Skywork 携手推出 SkyClaw-v1.0！期待看到各位开发者用它创造出无限可能。」

不少海外活跃 AI 博主对它评价颇高，「SkyClaw-v1.0 的训练任务来源于用户的实际操作场景，而不是通用的实验室数据。它在基准测试上超越了 DeepSeek V4 Flash 等模型，稳定性经过了多次验证。这才是打造真正能在实际场景中好用模型的方式。」

「基准测试之争结束了。SkyClaw-v1.0 登场，干净利落地赢下了所有。」

目前，SkyClaw-v1.0 两款模型限时免费开放体验，并已在 5 月 22 日接入到了 Skywork 平台。

天工地址：tiangong.cn
SkyClaw-v1.0 项目地址：https://skyworkai.github.io/skyclaw/
apifree.ai API 地址：https://www.apifree.ai/model/skywork-ai/skyclaw-v1?tab=api

打出这三张牌

很难不选择它

从产品层面来看，SkyClaw-v1.0 确实拿出了有说服力的东西，具体可以拆成三个维度来看：Agent 能力、使用门槛和性价比。

首先，Agent 能力要强。

根据 Skywork 的官方结果，在主流智能体基准以及内部开发的 Claw 任务评估中，包括 PinchBench、Claw-Eval Pass^3 和 Skywork-Claw-Bench（基于 OpenClaw 构建的内部智能体评估套件），SkyClaw-v1.0 和 SkyClaw-v1.0-lite 的表现均优于 Minimax 2.7、DeepSeek V4 Flash 和 Qwen 3.6 35B A3B/27B 模型。

另外，在 OpenClaw 相关任务上，SkyClaw-v1.0 的性能逼近更大规模的开闭源模型，包括 DeepSeek V4 Pro、Claude Opus 4.6 和 Qwen 3.6 Plus。

跑分亮眼之外，SkyClaw-v1.0 在实际应用场景中表现惊艳。

在交互式网页与游戏生成方面，它能够输出功能齐全的网页应用，从物理模拟到完整的游戏。结果不仅渲染正确、动画流畅，用户交互处理得也恰到好处。

宾果消消乐

在深度研究与数据可视化方面，SkyClaw-v1.0 展现出了超越单纯代码生成的综合能力：它能够自主研究现实世界课题，从多个来源收集并交叉验证数据，最终将分析结果整合为交互式、达到出版级质量的仪表盘和报告。

可以说，SkyClaw-v1.0 不只是在评测榜单上跑出了好成绩，也在真实场景中证明了自己作为生产力工具的实际价值。

其次，门槛要低。

对于用户来说，上手 SkyClaw-v1.0 几乎没有额外的学习成本，按需选择使用渠道。在 Skywork 平台，一键选择模型即可使用。另外，通过 AI 模型聚合服务平台 apifree.ai 注册账号并创建 APIKey，就能免费调用。

生态适配也很完善。Nanobot 已经率先完成对 SkyClaw-v1.0 的适配，后续还将上线 OpenRouter。随着更多平台的接入，开发者将能够在自己熟悉的工具链中直接调用模型，无需重新搭建一套工作流。

在 nanobot 中，只需填入 API 密钥即可使用 SkyClaw-v1.0。

最后，性价比要高。

SkyClaw-v1.0 的定价显著低于当前主流 Agent 模型。与 Minimax 2.7 和 Qwen 3.6 系列模型相比，定价仅为它们的一半甚至更低。

SkyClaw-v1.0 打出的这几张牌，直指当前 Agent 模型市场的核心矛盾：性能强的用不起，用得起的不够强，好用的生态封闭。它同时从能力、成本和易用性三个层面给出了一个相对均衡的解，这恰恰是当前市场最稀缺的选项。

一手实测

拿捏住了「快与准」

接下来，我们通过 Claude Code 来调用此次的 SkyClaw-v1.0，上手进行了一些测试。接入过程非常丝滑，配置好 API Key 就能直接跑。

先来做一个小游戏：贪吃蛇。

SkyClaw-v1.0 仅用时 33s 就完成了单文件网页版的基础开发，不仅包含了完整的游戏逻辑、计分系统，并且运行流畅。

再追加进阶需求：「在游戏中增加随机奖励，吃到蛇身边长三格」

依然非常快速，系统在普通食物的基础上增加了一个有 25% 概率掉落的金色星星奖励。

接下来，让 SkyClaw-v1.0 把这个游戏打包成 Windows 桌面可独立运行的 EXE 应用，并附带要求：「色系改成多巴胺色」。这一阶段的测试能够很好地反映 Agent 在面对涉及环境依赖的复杂工程以及排错时的真实能力。

在 UI 需求上，自主定义了包含 12 种高饱和色彩的 CSS 变量，落实了「多巴胺色系」的设计。

在打包环节，采用了 Electron 方案，完成了工程脚手架搭建及依赖安装。

在异常处理方面，遇到报错不陷入死循环，能读懂报错日志，并尝试改变配置（从一个打包器换到另一个）来绕过环境限制。

接下来换一个真实办公场景，这时需求不是单一格式的，这就考验到了模型能不能同时输出文档、PPT 和视频，以及执行任务过程中的全局规划与跨格式协调能力。

这一次，我们直接在 Skywork 中调用 SkyClaw-v1.0，给它一个有难度的复合任务。

让它「制作分别介绍地球四大洋的海底生态视频（每个 10 秒），视频生成后将其作为中间素材，构建一份全球海洋科普专题 PPT。要求将这 4 段视频嵌入到对应的 PPT 页面中，并在视频旁配上基于视频内容自动生成的专业解说词。」

在整个执行链路中，模型需要先生成四段风格统一的视频素材，再把视频作为输入反哺到 PPT 制作中，最后根据视频内容自动撰写解说词。前后环环相扣，任何一步执行不到位可能都会导致最终结果不可用。

从结果来看，包括视频生成质量、PPT 排版完成度以及解说词与视频画面的匹配程度，SkyClaw-v1.0 都表现得面面俱到。

放上一段生成的「太平洋海底珊瑚生态」视频，大家感受一下效果：

完整 PPT 效果如下：

两个案例测下来，我们发现，从理解需求、调用工具、遇错自修以及完整跑通多步骤任务等能力来看，SkyClaw-v1.0 以远低于行业的价格，交付出了接近顶流的 Agent 体验。

技术拆解

三步练出一个顶级 Agent

SkyClaw-v1.0 之所以能在评测与实战中交出亮眼成绩，离不开一套系统化的训练流程。整个过程涵盖环境构建、中期训练与监督微调、强化学习三个阶段，层层递进，构成了一条完整的能力链路。

首先是搭建高质量的训练环境。

团队构建了一个高复杂度的模拟 OpenClaw 环境，其中内置了丰富的高质量工具和技能，以供模型探索调用。

不仅如此，团队还深入分析了真实用户在类 OpenClaw 环境下的实际任务行为，并结合线上高频技能的使用数据和反馈，梳理出工具之间的关系图谱。基于这张图谱，合成大量贴近真实用户需求的复杂任务，确保模型从训练阶段就接触到足够真实与复杂的场景。

有了环境基础，接下来是大规模的中期训练与监督微调。

依托上面经过充分验证的训练环境，团队合成了海量高质量训练数据。而为了把控数据质量，团队建立了严格的过滤和评估机制，在考核最终答案正确性的同时，还会回溯评估模型完成任务的完整轨迹，确保解题过程本身也是合理高效的。

另外，团队进行了大量数据配比实验，找到智能体任务训练数据的最优组合。

最后，团队通过强化学习进一步打磨模型的泛化能力。

由于自建的 OpenClaw 环境天然支持端到端的探索与反馈，模型能够在其中进行充分的强化学习训练。这一阶段的核心目标，除了确保模型在特定任务上表现出色，其在不同智能体框架和陌生任务场景下也要保持稳定的泛化能力。

整体来看，SkyClaw-v1.0 采用的这套技术路径，没有依赖单点突破，而是围绕「真实智能体场景下的可用性」这一目标，实现了数据、训练与优化的贯通。

环境构建解决「用什么数据来练」，中期训练和 SFT 解决「如何练出基础能力」，强化学习解决「如何进一步提升性能上限和泛化性」。

如同此前所有 AI 热点一样，OpenClaw 经历了正常的波动起伏。虽然热度会消退，但趋势不会。Agent 作为当前 AI 发展最重要的方向之一，其地位在短时间内不会改变。

上周的谷歌 I/O 大会是很好的例证，智能体成为贯穿全场的主角，Gemini Spark 的亮相更是直接对标 OpenClaw。这释放出了一个清晰的信号：巨头们正在加速 Agent 技术的消费级落地。

在这样的行业背景下，「一个真正好用且用得起的 Agent」势必将成为市场的香饽饽。但现实是，顶级 Agent 能力几乎被海外御三家（Anthropic、OpenAI 和谷歌）的少数闭源模型垄断，高昂的调用成本导致大量中小开发者和企业望而却步。

换句话说，Agent 的瓶颈不在技术天花板，在于落地门槛。SkyClaw-v1.0 的发布，切中了这一痛点。

它以接近 Claude Opus 4.6 等闭源顶流的 Agent 性能，定价却只有主流模型的一半。结果就是，一个此前因预算有限只能用轻量模型「凑合跑」的开发者，现在可以用同样的成本调用到接近顶级水平的 Agent 能力。

回过头看，此次新发布是昆仑万维在 AI 领域长期布局的又一阶段性成果。自 2022 年确立「All in AGI 与 AIGC」战略以来，昆仑万维基于自主研发的全球领先大模型基座，已构建起短剧和 A I 短剧平台、AI 音乐、AI 游戏、AI SuperAgent、AI 社交五大核心产品矩阵。

其中在 Agent 领域，昆仑万维在今年一、二月先后发布了 Skywork Super Agents Video v1.0、天工 Skywork 桌面版及 SkyClaw 云端智能体。桌面版实现全本地化运行，无需上传数据即可处理多格式内容；SkyClaw 集成 70 余项技能，支持跨设备多端监控。

SkyClaw-v1.0 能够做到高性能与低成本兼顾，与昆仑万维在模型、应用和生态层面的长期积累密不可分。

当 Agent 赛道从狂欢期进入冷静期，最后能留在牌桌上的，一定是把基本功做得最扎实的那一个。SkyClaw-v1.0 交出的这份答卷，正是昆仑万维对这一判断最有力的回应。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.