网易首页 > 网易号 > 正文 申请入驻

千寻智能开源模型Spirit v1.5登顶RoboChallenge!

0
分享至

1月12日,千寻智能自研的具身智能模型Spirit v1.5 在 RoboChallenge评测中取得综合排名第一,在任务得分与成功率两个维度均超越Pi0.5。



为验证榜单成绩来源于自研模型且真实有效,千寻智能同步开源了Spirit v1.5的基模权重、推理代码以及使用样例,接受公众与研究社区的独立检验。通过这一方式,研究者不仅可以复现榜单评测结果,也可以将 Spirit v1.5 作为具身智能基础模型,在此基础上开展进一步研究与创新。

RoboChallenge 是 2025 年新成立的标准化评测体系,由Dexmal、Hugging Face等机构联合发起,聚焦具身智能模型的跨平台能力验证。作为当前具身智能领域强调真实机器人执行能力的重要 benchmark,其评测任务覆盖复杂指令理解、多步骤操作规划以及跨场景执行稳定性等多个维度。Spirit v1.5在该平台取得第一名,显示出其在通用机器人任务与真实执行场景中的综合能力。

RoboChallenge 评测表现概览

从评测结果来看,Spirit v1.5在多项任务中保持较高成功率,尤其在多任务连续执行、复杂指令拆解以及跨构型迁移等维度中表现稳定。截至最新评测周期,其综合得分超过 Pi 0.5 等此前领先模型,位列榜单首位。

RoboChallenge 的评分体系不仅关注任务是否完成,还对模型的执行过程进行评估,包括空间定位、遮挡处理、长时序稳定性以及面对新任务时的迁移效率。这种评测方式对模型的泛化性、稳定性与执行准确性提出了更高要求,也更贴近真实机器人应用场景。

技术架构与关键方法

在模型架构上,Spirit v1.5采用 Vision-Language-Action(VLA)统一建模框架,将视觉感知、语言理解与动作生成整合在同一决策流程中,减少多模块串联带来的信息损耗,并提升长程任务中的整体稳定性。

在训练方法上,Spirit v1.5 的一个核心特点是不依赖高度精选的“干净”演示数据。千寻智能在技术博客中提出,过度脚本化、受控环境下采集的数据,虽然有利于模型快速收敛,但会限制其在真实世界中的泛化能力。

因此,Spirit v1.5 在预训练阶段引入了开放式、多样化的数据采集范式。数据采集不再严格限定任务脚本,而是以“完成有意义目标”为导向,允许操作过程中自然串联多个子任务与原子技能。这种方式使模型在训练阶段接触到更接近真实世界的复杂性,包括遮挡、失败恢复以及任务之间的自然过渡。

相关消融实验显示,在相同数据规模下,基于多样化数据预训练的模型,在新任务上的迁移效率明显高于基于传统演示数据训练的模型,达到相同性能所需的计算资源显著减少。这一结果也解释了 Spirit v1.5 在 RoboChallenge 多构型、未见任务评测中的稳定表现。

开源路线与社区意义

在取得评测成绩的同时,千寻智能选择同步开源 Spirit v1.5模型权重、训练代码以及榜单评测相关实现。通过这一方式,社区不仅可以验证模型性能,也可以将其作为具身智能研究的基础模型进行扩展。

在当前具身智能研究仍高度依赖少数技术路线的背景下,Spirit v1.5为学界和产业界提供了一条不同的数据范式与训练思路,有助于推动更具泛化能力的通用机器人模型探索。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
太惨了!一个机器人机枪手干掉了俄军一个连

太惨了!一个机器人机枪手干掉了俄军一个连

山间听雨
2026-01-18 18:58:17
安东尼奥罕见大轮换!媒体人热议:首发田忌赛马,关键是防线稳定

安东尼奥罕见大轮换!媒体人热议:首发田忌赛马,关键是防线稳定

奥拜尔
2026-01-20 22:20:19
5年后长三角会是啥样?全在这里了——

5年后长三角会是啥样?全在这里了——

上观新闻
2026-01-20 08:14:09
依旧昊布拉克!李昊再献多次精彩扑救,力保城门不失

依旧昊布拉克!李昊再献多次精彩扑救,力保城门不失

懂球帝
2026-01-21 01:59:12
特朗普刚向中国发出邀请,转头就通告全世界:要加征200%关税

特朗普刚向中国发出邀请,转头就通告全世界:要加征200%关税

小陆搞笑日常
2026-01-21 00:02:47
真有戏!切尔西关注门将李昊:20年内已看中第3名中国球员!

真有戏!切尔西关注门将李昊:20年内已看中第3名中国球员!

邱泽云
2026-01-20 17:52:51
斩杀线大佬牢A再爆留学大坑,主持人三妹和复旦大学教授都惊呆了

斩杀线大佬牢A再爆留学大坑,主持人三妹和复旦大学教授都惊呆了

达文西看世界
2026-01-20 14:52:11
失业的人越来越多了

失业的人越来越多了

曹多鱼的财经世界
2025-12-24 14:56:20
从免费听到付费,中国音乐非但没进步,反而把听众“作”没了?

从免费听到付费,中国音乐非但没进步,反而把听众“作”没了?

草莓解说体育
2026-01-20 04:16:58
3重打击彻底蔫了!央媒定性后张本智和封口冠军,父亲遭双重驱逐

3重打击彻底蔫了!央媒定性后张本智和封口冠军,父亲遭双重驱逐

卿子书
2026-01-18 14:02:29
1-2,刘诚宇破门难救主,上海申花不敌韩国劲旅,陈晋一乌龙球酿悲剧

1-2,刘诚宇破门难救主,上海申花不敌韩国劲旅,陈晋一乌龙球酿悲剧

侧身凌空斩
2026-01-20 21:01:05
神舟二十号飞船舷窗裂纹维修细节披露:内部加固 成功返回

神舟二十号飞船舷窗裂纹维修细节披露:内部加固 成功返回

快科技
2026-01-20 14:37:06
3-0!中国U23踢疯了:一战碾碎越南,4大纪录诞生,决赛死磕日本

3-0!中国U23踢疯了:一战碾碎越南,4大纪录诞生,决赛死磕日本

万花筒体育球球
2026-01-21 01:51:37
看完谢苗的新片,我宣布:他可以平替成龙李连杰,扛起动作片大旗

看完谢苗的新片,我宣布:他可以平替成龙李连杰,扛起动作片大旗

星宿影视鸭
2026-01-19 17:15:19
“迷人”的愚蠢——反智盛行的五大原因

“迷人”的愚蠢——反智盛行的五大原因

听哲学
2026-01-18 21:44:12
胆识过人 安东尼奥战越南首发大变脸 雪藏6大主力 田忌赛马玩得溜

胆识过人 安东尼奥战越南首发大变脸 雪藏6大主力 田忌赛马玩得溜

零度眼看球
2026-01-20 23:47:18
贝克汉姆露面了!强大的心理防线,亲身证明布鲁克林控诉的关键点

贝克汉姆露面了!强大的心理防线,亲身证明布鲁克林控诉的关键点

噶噶香的晚餐
2026-01-20 22:41:51
随着中国3-0淘汰越南,亚洲杯决赛对阵和开赛时间出炉,CCTV5直播

随着中国3-0淘汰越南,亚洲杯决赛对阵和开赛时间出炉,CCTV5直播

侧身凌空斩
2026-01-21 01:43:36
高市早苗放话:如果此次选举执政联盟未获半数席位,我将辞任首相

高市早苗放话:如果此次选举执政联盟未获半数席位,我将辞任首相

环球网资讯
2026-01-20 08:49:06
苹果2026年首款新机官宣:1 月 28 日,正式首发上市

苹果2026年首款新机官宣:1 月 28 日,正式首发上市

科技堡垒
2026-01-20 12:29:44
2026-01-21 03:40:49
前沿在线
前沿在线
前沿在线官方账号,传播科技商业新知
100文章数 1关注度
往期回顾 全部

科技要闻

收藏|这可能是CES2026最清醒一份复盘

头条要闻

丹麦首相:主权不谈判 准备贸易战

头条要闻

丹麦首相:主权不谈判 准备贸易战

体育要闻

勇士遭暴击!巴特勒重伤赛季报销

娱乐要闻

网红版闫学晶!600万粉博主阿爆翻车

财经要闻

李迅雷:2026买房不如租房

汽车要闻

奇瑞张贵兵:墨甲不做秀技术的企业 只做痛点终结者

态度原创

家居
房产
教育
数码
公开课

家居要闻

隽永之章 清雅无尘

房产要闻

中旅・三亚蓝湾发布会揭秘自贸港好房子高阶形态

教育要闻

学习不再靠死磕,是从初二开始的

数码要闻

行业唯一!红魔电竞平板3 Pro GOLDEN SAGA发布:镀金VC、24GB+1TB存储

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版