网易首页 > 网易号 > 正文 申请入驻

后OpenClaw时代!国产Agent模型凭「高配低价」叫板Opus 4.6

0
分享至

来源:市场资讯

编辑|+0、杜伟

今年最出圈的 AI 应用是什么?OpenClaw 一定是绕不开的答案。

回过头看二三月份,「养虾」一度成为流行的社交货币。但它的意义远不止是一款爆款应用:OpenClaw 真正将智能体概念从开发者圈层推向了大众视野,让普通用户第一次直观感受到 Agent 到底能做什么。

当更多人开始理解 Agent 的价值之后,行业的焦点也自然进入到了下一阶段:谁家的 Agent 做得更好、上手起来更容易以及更能负担得起。这些才是决定 Agent 生态走向的关键变量。

谁能在这一节点完成转型,就能在「后 OpenClaw 时代」抢占先机。事实上,国内已经有玩家率先落子。

就在今日,昆仑万维旗下的天工 AI(Skywork)全新发布了 SkyClaw-v1.0 智能体模型,成为其长期深耕云端助理的又一里程碑,也开始了从助手形态向智能体基座模型的架构升级。

作为一款专为 OpenClaw、Claude Code、Hermes、Nanobot 等主流智能体框架深度优化的基座模型,SkyClaw-v1.0 模型在底层能力上实现了质的提升,工具调用精度更准、多轮任务执行更稳、长链路推理更优,能够更好地适配真实场景中复杂、动态的智能体工作流。

与此同时,Skywork 还同步上线了 SkyClaw-v1.0-lite。这一轻量化版本瞄准了高频调用和成本敏感场景,在保持核心智能体能力的同时,大幅优化了推理速度与资源开销,为开发者提供了一个更灵活的部署选择。

两款模型在 X 上抢先亮相以来,热度持续走高。


Nanobot 官方发文,「很高兴能与 Skywork 携手推出 SkyClaw-v1.0!期待看到各位开发者用它创造出无限可能。」


不少海外活跃 AI 博主对它评价颇高,「SkyClaw-v1.0 的训练任务来源于用户的实际操作场景,而不是通用的实验室数据。它在基准测试上超越了 DeepSeek V4 Flash 等模型,稳定性经过了多次验证。这才是打造真正能在实际场景中好用模型的方式。」


「基准测试之争结束了。SkyClaw-v1.0 登场,干净利落地赢下了所有。」


目前,SkyClaw-v1.0 两款模型限时免费开放体验,并已在 5 月 22 日接入到了 Skywork 平台。


  • 天工地址:tiangong.cn

  • SkyClaw-v1.0 项目地址:https://skyworkai.github.io/skyclaw/

  • apifree.ai API 地址:https://www.apifree.ai/model/skywork-ai/skyclaw-v1?tab=api

打出这三张牌

很难不选择它

从产品层面来看,SkyClaw-v1.0 确实拿出了有说服力的东西,具体可以拆成三个维度来看:Agent 能力、使用门槛和性价比。

首先,Agent 能力要强。

根据 Skywork 的官方结果,在主流智能体基准以及内部开发的 Claw 任务评估中,包括 PinchBench、Claw-Eval Pass^3 和 Skywork-Claw-Bench(基于 OpenClaw 构建的内部智能体评估套件),SkyClaw-v1.0 和 SkyClaw-v1.0-lite 的表现均优于 Minimax 2.7、DeepSeek V4 Flash 和 Qwen 3.6 35B A3B/27B 模型。

另外,在 OpenClaw 相关任务上,SkyClaw-v1.0 的性能逼近更大规模的开闭源模型,包括 DeepSeek V4 Pro、Claude Opus 4.6 和 Qwen 3.6 Plus。


跑分亮眼之外,SkyClaw-v1.0 在实际应用场景中表现惊艳。

在交互式网页与游戏生成方面,它能够输出功能齐全的网页应用,从物理模拟到完整的游戏。结果不仅渲染正确、动画流畅,用户交互处理得也恰到好处。


宾果消消乐

在深度研究与数据可视化方面,SkyClaw-v1.0 展现出了超越单纯代码生成的综合能力:它能够自主研究现实世界课题,从多个来源收集并交叉验证数据,最终将分析结果整合为交互式、达到出版级质量的仪表盘和报告。

可以说,SkyClaw-v1.0 不只是在评测榜单上跑出了好成绩,也在真实场景中证明了自己作为生产力工具的实际价值。

其次,门槛要低。

对于用户来说,上手 SkyClaw-v1.0 几乎没有额外的学习成本,按需选择使用渠道。在 Skywork 平台,一键选择模型即可使用。另外,通过 AI 模型聚合服务平台 apifree.ai 注册账号并创建 APIKey,就能免费调用。

生态适配也很完善。Nanobot 已经率先完成对 SkyClaw-v1.0 的适配,后续还将上线 OpenRouter。随着更多平台的接入,开发者将能够在自己熟悉的工具链中直接调用模型,无需重新搭建一套工作流。


在 nanobot 中,只需填入 API 密钥即可使用 SkyClaw-v1.0。

最后,性价比要高。

SkyClaw-v1.0 的定价显著低于当前主流 Agent 模型。与 Minimax 2.7 和 Qwen 3.6 系列模型相比,定价仅为它们的一半甚至更低。


SkyClaw-v1.0 打出的这几张牌,直指当前 Agent 模型市场的核心矛盾:性能强的用不起,用得起的不够强,好用的生态封闭。它同时从能力、成本和易用性三个层面给出了一个相对均衡的解,这恰恰是当前市场最稀缺的选项。

一手实测

拿捏住了「快与准」

接下来,我们通过 Claude Code 来调用此次的 SkyClaw-v1.0,上手进行了一些测试。接入过程非常丝滑,配置好 API Key 就能直接跑。

先来做一个小游戏:贪吃蛇。


SkyClaw-v1.0 仅用时 33s 就完成了单文件网页版的基础开发,不仅包含了完整的游戏逻辑、计分系统,并且运行流畅。


再追加进阶需求:「在游戏中增加随机奖励,吃到蛇身边长三格」


依然非常快速,系统在普通食物的基础上增加了一个有 25% 概率掉落的金色星星奖励。

接下来,让 SkyClaw-v1.0 把这个游戏打包成 Windows 桌面可独立运行的 EXE 应用,并附带要求:「色系改成多巴胺色」。这一阶段的测试能够很好地反映 Agent 在面对涉及环境依赖的复杂工程以及排错时的真实能力。

在 UI 需求上,自主定义了包含 12 种高饱和色彩的 CSS 变量,落实了「多巴胺色系」的设计。

在打包环节,采用了 Electron 方案,完成了工程脚手架搭建及依赖安装。

在异常处理方面,遇到报错不陷入死循环,能读懂报错日志,并尝试改变配置(从一个打包器换到另一个)来绕过环境限制。

接下来换一个真实办公场景,这时需求不是单一格式的,这就考验到了模型能不能同时输出文档、PPT 和视频,以及执行任务过程中的全局规划与跨格式协调能力。

这一次,我们直接在 Skywork 中调用 SkyClaw-v1.0,给它一个有难度的复合任务。

让它「制作分别介绍地球四大洋的海底生态视频(每个 10 秒),视频生成后将其作为中间素材,构建一份全球海洋科普专题 PPT。要求将这 4 段视频嵌入到对应的 PPT 页面中,并在视频旁配上基于视频内容自动生成的专业解说词。」

在整个执行链路中,模型需要先生成四段风格统一的视频素材,再把视频作为输入反哺到 PPT 制作中,最后根据视频内容自动撰写解说词。前后环环相扣,任何一步执行不到位可能都会导致最终结果不可用。


从结果来看,包括视频生成质量、PPT 排版完成度以及解说词与视频画面的匹配程度,SkyClaw-v1.0 都表现得面面俱到。

放上一段生成的「太平洋海底珊瑚生态」视频,大家感受一下效果:

完整 PPT 效果如下:


两个案例测下来,我们发现,从理解需求、调用工具、遇错自修以及完整跑通多步骤任务等能力来看,SkyClaw-v1.0 以远低于行业的价格,交付出了接近顶流的 Agent 体验。

技术拆解

三步练出一个顶级 Agent

SkyClaw-v1.0 之所以能在评测与实战中交出亮眼成绩,离不开一套系统化的训练流程。整个过程涵盖环境构建、中期训练与监督微调、强化学习三个阶段,层层递进,构成了一条完整的能力链路。

首先是搭建高质量的训练环境。

团队构建了一个高复杂度的模拟 OpenClaw 环境,其中内置了丰富的高质量工具和技能,以供模型探索调用。

不仅如此,团队还深入分析了真实用户在类 OpenClaw 环境下的实际任务行为,并结合线上高频技能的使用数据和反馈,梳理出工具之间的关系图谱。基于这张图谱,合成大量贴近真实用户需求的复杂任务,确保模型从训练阶段就接触到足够真实与复杂的场景。

有了环境基础,接下来是大规模的中期训练与监督微调。

依托上面经过充分验证的训练环境,团队合成了海量高质量训练数据。而为了把控数据质量,团队建立了严格的过滤和评估机制,在考核最终答案正确性的同时,还会回溯评估模型完成任务的完整轨迹,确保解题过程本身也是合理高效的。

另外,团队进行了大量数据配比实验,找到智能体任务训练数据的最优组合。

最后,团队通过强化学习进一步打磨模型的泛化能力。

由于自建的 OpenClaw 环境天然支持端到端的探索与反馈,模型能够在其中进行充分的强化学习训练。这一阶段的核心目标,除了确保模型在特定任务上表现出色,其在不同智能体框架和陌生任务场景下也要保持稳定的泛化能力。

整体来看,SkyClaw-v1.0 采用的这套技术路径,没有依赖单点突破,而是围绕「真实智能体场景下的可用性」这一目标,实现了数据、训练与优化的贯通。

环境构建解决「用什么数据来练」,中期训练和 SFT 解决「如何练出基础能力」,强化学习解决「如何进一步提升性能上限和泛化性」。

如同此前所有 AI 热点一样,OpenClaw 经历了正常的波动起伏。虽然热度会消退,但趋势不会。Agent 作为当前 AI 发展最重要的方向之一,其地位在短时间内不会改变。

上周的谷歌 I/O 大会是很好的例证,智能体成为贯穿全场的主角,Gemini Spark 的亮相更是直接对标 OpenClaw。这释放出了一个清晰的信号:巨头们正在加速 Agent 技术的消费级落地。

在这样的行业背景下,「一个真正好用且用得起的 Agent」势必将成为市场的香饽饽。但现实是,顶级 Agent 能力几乎被海外御三家(Anthropic、OpenAI 和谷歌)的少数闭源模型垄断,高昂的调用成本导致大量中小开发者和企业望而却步。

换句话说,Agent 的瓶颈不在技术天花板,在于落地门槛。SkyClaw-v1.0 的发布,切中了这一痛点。

它以接近 Claude Opus 4.6 等闭源顶流的 Agent 性能,定价却只有主流模型的一半。结果就是,一个此前因预算有限只能用轻量模型「凑合跑」的开发者,现在可以用同样的成本调用到接近顶级水平的 Agent 能力。

回过头看,此次新发布是昆仑万维在 AI 领域长期布局的又一阶段性成果。自 2022 年确立「All in AGI 与 AIGC」战略以来,昆仑万维基于自主研发的全球领先大模型基座,已构建起短剧和 A I 短剧平台、AI 音乐、AI 游戏、AI SuperAgent、AI 社交五大核心产品矩阵。

其中在 Agent 领域,昆仑万维在今年一、二月先后发布了 Skywork Super Agents Video v1.0、天工 Skywork 桌面版及 SkyClaw 云端智能体。桌面版实现全本地化运行,无需上传数据即可处理多格式内容;SkyClaw 集成 70 余项技能,支持跨设备多端监控。

SkyClaw-v1.0 能够做到高性能与低成本兼顾,与昆仑万维在模型、应用和生态层面的长期积累密不可分。

当 Agent 赛道从狂欢期进入冷静期,最后能留在牌桌上的,一定是把基本功做得最扎实的那一个。SkyClaw-v1.0 交出的这份答卷,正是昆仑万维对这一判断最有力的回应。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
浙江女子以190万把房子卖给租客,租客觉得贵拒绝了,随后女子170万卖给他人,租客知道后起诉女子,要求赔偿20万!法院判了

浙江女子以190万把房子卖给租客,租客觉得贵拒绝了,随后女子170万卖给他人,租客知道后起诉女子,要求赔偿20万!法院判了

犀利强哥
2026-05-31 21:15:20
郝劭文回台湾定居原因曝光,直播带货曾月赚近亿元,会赚更会做人

郝劭文回台湾定居原因曝光,直播带货曾月赚近亿元,会赚更会做人

以茶带书
2026-05-29 15:26:31
比亚迪版“帕拉梅拉”,续航达2000km,拥有50万的档次仅售15万多

比亚迪版“帕拉梅拉”,续航达2000km,拥有50万的档次仅售15万多

隔壁说车老王
2026-05-28 07:56:52
一包卫生巾牵扯出惊天大案,而破获大案的警察被女死刑犯影响一生

一包卫生巾牵扯出惊天大案,而破获大案的警察被女死刑犯影响一生

莫地方
2026-06-03 01:25:03
入夏,少买黄瓜茄子,多买3样“碱性菜”鲜嫩多汁,夏天吃正合适

入夏,少买黄瓜茄子,多买3样“碱性菜”鲜嫩多汁,夏天吃正合适

江江食研社
2026-06-02 19:48:10
两性关系:55-65岁这十年,惜命最好的方式,不是锻炼,做好这6点

两性关系:55-65岁这十年,惜命最好的方式,不是锻炼,做好这6点

三农老历
2026-04-13 17:10:06
黄仁勋致敬乔布斯,从牛仔裤中掏显卡,感谢马斯克在需要时伸援手

黄仁勋致敬乔布斯,从牛仔裤中掏显卡,感谢马斯克在需要时伸援手

译言
2026-06-02 08:09:32
你经历过最恐怖的事是啥?网友:这年头,变态都是成群结队的

你经历过最恐怖的事是啥?网友:这年头,变态都是成群结队的

带你感受人间冷暖
2026-05-02 11:26:30
这个习惯并非“高素质”!多地已叫停

这个习惯并非“高素质”!多地已叫停

大象新闻
2026-05-29 11:51:09
上海一租客签订合同当日,卧室、卫生间爬出大量蜈蚣,床底都是蜈蚣尸体,吓到不敢住,房东拒绝退还押金,法院判了

上海一租客签订合同当日,卧室、卫生间爬出大量蜈蚣,床底都是蜈蚣尸体,吓到不敢住,房东拒绝退还押金,法院判了

洪观新闻
2026-06-01 11:39:35
扬科维奇上任不到一个月下课?媒体人:礼彬回归长春喜都执教

扬科维奇上任不到一个月下课?媒体人:礼彬回归长春喜都执教

懂球帝
2026-06-02 18:21:09
上海金融女博士罕见发声:如果接下来迎来牛市,建议死啃2560战法

上海金融女博士罕见发声:如果接下来迎来牛市,建议死啃2560战法

股经纵横谈
2026-06-02 20:55:03
北大医学生司力嘉去世,年仅24岁,河南父亲曝死因,就差毕业典礼

北大医学生司力嘉去世,年仅24岁,河南父亲曝死因,就差毕业典礼

阿讯说天下
2026-06-03 03:08:54
1950年我军抓获女匪首,她袖口补丁藏着的布条,老政委看后摔茶缸

1950年我军抓获女匪首,她袖口补丁藏着的布条,老政委看后摔茶缸

磊子讲史
2026-03-18 11:38:06
法网女单太残酷了:随着斯维托丽娜1-2出局,世界前十仅剩2人

法网女单太残酷了:随着斯维托丽娜1-2出局,世界前十仅剩2人

侧身凌空斩
2026-06-02 20:28:22
奚梦瑶的家庭背景如何

奚梦瑶的家庭背景如何

动物奇奇怪怪
2026-06-02 19:43:39
董路再封神!足球小将点球5-4英超劲旅 7战全胜夺意大利杯冠军

董路再封神!足球小将点球5-4英超劲旅 7战全胜夺意大利杯冠军

念洲
2026-06-02 18:43:11
女学霸发明“咯噔字体”,老师低分警告:别用个性挑战考试底线

女学霸发明“咯噔字体”,老师低分警告:别用个性挑战考试底线

蝴蝶花雨话教育
2026-05-07 00:05:04
广厦赢球仍存致命短板:首发99分替补仅2分 超负荷用人能撑住吗

广厦赢球仍存致命短板:首发99分替补仅2分 超负荷用人能撑住吗

醉卧浮生
2026-06-02 22:06:30
郑丽文如愿以偿,闭门会谈1小时,大陆讲出一句话,给出4点建议

郑丽文如愿以偿,闭门会谈1小时,大陆讲出一句话,给出4点建议

福建睿平
2026-04-12 08:17:53
2026-06-03 03:56:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
3441951文章数 7777关注度
往期回顾 全部

科技要闻

烧掉千亿后,美团、阿里、京东谁先止血?

头条要闻

演员魏宗万去世 曾在94版《三国演义》中饰演"司马懿"

头条要闻

演员魏宗万去世 曾在94版《三国演义》中饰演"司马懿"

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君补办婚礼超幸福

财经要闻

智元和宇树的“暗战”愈演愈烈

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

旅游
本地
时尚
艺术
游戏

旅游要闻

北京位列全球数字旅游引领型城市榜首

本地新闻

用剪纸的方式,打开江苏扬州

蓝色系下装看着清爽不闷,裤子、裙子都凉快,随便穿都不出错

艺术要闻

抖音砸60个亿,要盖一座“不像医院”的医院?

离发售不远了!《寂静岭》系列新作已公开游戏评级

无障碍浏览 进入关怀版