Agent模型正在从"回答问题"转向"完成任务"。5月26日,昆仑万维旗下天工AI发布SkyClaw-v1.0及其轻量化版本SkyClaw-v1.0-lite,主打百万token长上下文与复杂工具调用能力,定价不到主流竞品的一半。
这款模型的定位很清晰:不是更好的聊天机器人,而是能放进真实工作流的执行引擎。它支持在OpenClaw、Hermes、Nanobot等主流Agent环境中运行,同时适配Claude Code、Codex等代码Agent框架。核心场景包括文件编辑、测试运行、多轮迭代、交互式应用构建与研究型数据分析。
![]()
从评测数据看,SkyClaw-v1.0在主流Agent benchmark及天工内部Claw任务测试中,表现超过Minimax 2.7、DeepSeek V4 Flash、Qwen 3.6 35B A3B及27B模型。在OpenClaw相关任务上,其表现接近DeepSeek V4 Pro、Claude Opus 4.6、Qwen 3.6 Plus等更大规模模型。
训练方法上,团队聚焦三个环节:搭建可交互工具环境、合成高质量任务轨迹、强化学习优化多步执行。具体而言,训练环境覆盖文件读取、代码编辑、检索、测试、页面观察等高频动作;通过轨迹质量过滤剔除无效工具调用和错误观察解释;强化学习阶段则在自建Claw环境中持续迭代,优化目标从"回答是否好看"转向"任务是否完成、过程是否稳定"。
实际应用中,SkyClaw-v1.0可完成三类任务:一是全形态界面设计落地,生成具备生产级布局、真实导航流程和完整交互状态的应用;二是沉浸式可交互游戏开发,处理动画循环、碰撞检测、游戏规则、状态管理和用户输入;三是研究型网页与数据报告生成,将自然语言需求转化为可交互的网页报告。
接入方式上,SkyClaw-v1.0已于2026年5月22日接入天工Skywork,用户登录tiangong.cn即可直接使用。同时通过APIFree开放接口,支持流式输出、工具调用和多轮对话。SkyClaw-v1.0与SkyClaw-v1.0-lite现已开放2至4周免费试用。
昆仑万维将此次发布定义为AGI产品体系的关键一环——通过百万上下文、Agentic RL、复杂工具调用优化和高性价比API,把Agent能力从"可演示"推进到"可高频调用、可真实交付"的阶段。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.