网易首页 > 网易号 > 正文 申请入驻

千寻智能开源模型Spirit v1.5登顶RoboChallenge!

0
分享至

1月12日,千寻智能自研的具身智能模型Spirit v1.5 在 RoboChallenge评测中取得综合排名第一,在任务得分与成功率两个维度均超越Pi0.5。



为验证榜单成绩来源于自研模型且真实有效,千寻智能同步开源了Spirit v1.5的基模权重、推理代码以及使用样例,接受公众与研究社区的独立检验。通过这一方式,研究者不仅可以复现榜单评测结果,也可以将 Spirit v1.5 作为具身智能基础模型,在此基础上开展进一步研究与创新。

RoboChallenge 是 2025 年新成立的标准化评测体系,由Dexmal、Hugging Face等机构联合发起,聚焦具身智能模型的跨平台能力验证。作为当前具身智能领域强调真实机器人执行能力的重要 benchmark,其评测任务覆盖复杂指令理解、多步骤操作规划以及跨场景执行稳定性等多个维度。Spirit v1.5在该平台取得第一名,显示出其在通用机器人任务与真实执行场景中的综合能力。

RoboChallenge 评测表现概览

从评测结果来看,Spirit v1.5在多项任务中保持较高成功率,尤其在多任务连续执行、复杂指令拆解以及跨构型迁移等维度中表现稳定。截至最新评测周期,其综合得分超过 Pi 0.5 等此前领先模型,位列榜单首位。

RoboChallenge 的评分体系不仅关注任务是否完成,还对模型的执行过程进行评估,包括空间定位、遮挡处理、长时序稳定性以及面对新任务时的迁移效率。这种评测方式对模型的泛化性、稳定性与执行准确性提出了更高要求,也更贴近真实机器人应用场景。

技术架构与关键方法

在模型架构上,Spirit v1.5采用 Vision-Language-Action(VLA)统一建模框架,将视觉感知、语言理解与动作生成整合在同一决策流程中,减少多模块串联带来的信息损耗,并提升长程任务中的整体稳定性。

在训练方法上,Spirit v1.5 的一个核心特点是不依赖高度精选的“干净”演示数据。千寻智能在技术博客中提出,过度脚本化、受控环境下采集的数据,虽然有利于模型快速收敛,但会限制其在真实世界中的泛化能力。

因此,Spirit v1.5 在预训练阶段引入了开放式、多样化的数据采集范式。数据采集不再严格限定任务脚本,而是以“完成有意义目标”为导向,允许操作过程中自然串联多个子任务与原子技能。这种方式使模型在训练阶段接触到更接近真实世界的复杂性,包括遮挡、失败恢复以及任务之间的自然过渡。

相关消融实验显示,在相同数据规模下,基于多样化数据预训练的模型,在新任务上的迁移效率明显高于基于传统演示数据训练的模型,达到相同性能所需的计算资源显著减少。这一结果也解释了 Spirit v1.5 在 RoboChallenge 多构型、未见任务评测中的稳定表现。

开源路线与社区意义

在取得评测成绩的同时,千寻智能选择同步开源 Spirit v1.5模型权重、训练代码以及榜单评测相关实现。通过这一方式,社区不仅可以验证模型性能,也可以将其作为具身智能研究的基础模型进行扩展。

在当前具身智能研究仍高度依赖少数技术路线的背景下,Spirit v1.5为学界和产业界提供了一条不同的数据范式与训练思路,有助于推动更具泛化能力的通用机器人模型探索。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
看起来似乎挺有培养价值的!勇士还不如给后场新秀多些表现机会?

看起来似乎挺有培养价值的!勇士还不如给后场新秀多些表现机会?

稻谷与小麦
2026-03-11 00:32:34
艾克森晒自己球衣收藏:含国足、广州、海港球衣

艾克森晒自己球衣收藏:含国足、广州、海港球衣

懂球帝
2026-03-10 21:57:01
贾浅浅《我的娘》才是最正宗“尿”诗,极具画面感,您觉得如何?

贾浅浅《我的娘》才是最正宗“尿”诗,极具画面感,您觉得如何?

读睡
2026-03-10 20:58:12
36万亿美债还不起,特朗普决定“弄死”大债主,为此不惜自曝家丑

36万亿美债还不起,特朗普决定“弄死”大债主,为此不惜自曝家丑

娱乐的宅急便
2026-03-10 19:00:07
一语惊醒梦中人!欧洲高官直言:搞垮中国,就是给美国送霸权!

一语惊醒梦中人!欧洲高官直言:搞垮中国,就是给美国送霸权!

达文西看世界
2026-01-24 11:29:41
3月10日人民币对美元中间价调升176个基点

3月10日人民币对美元中间价调升176个基点

证券时报
2026-03-10 09:43:08
知名投资大佬坠楼身亡

知名投资大佬坠楼身亡

深度报
2026-03-10 22:39:29
特朗普撂挑子不干了,以色列连俄大楼都敢炸,普京把话说得很清楚

特朗普撂挑子不干了,以色列连俄大楼都敢炸,普京把话说得很清楚

谛听骨语本尊
2026-03-10 18:10:22
你可能不知道,中东炮弹满天飞,全靠济南和十堰的卡车续命

你可能不知道,中东炮弹满天飞,全靠济南和十堰的卡车续命

荷兰豆爱健康
2026-03-10 16:25:47
以军空袭伊朗核实验室

以军空袭伊朗核实验室

界面新闻
2026-03-10 14:10:11
伊朗伊斯兰革命卫队称实施“真实承诺4”第34轮打击行动

伊朗伊斯兰革命卫队称实施“真实承诺4”第34轮打击行动

财联社
2026-03-10 20:44:42
超勇士升西部第八!小卡29+7+8快船险胜尼克斯 唐斯35+12+7

超勇士升西部第八!小卡29+7+8快船险胜尼克斯 唐斯35+12+7

醉卧浮生
2026-03-10 12:44:34
伊朗官方电视台:新最高领袖已受伤

伊朗官方电视台:新最高领袖已受伤

华人生活网
2026-03-10 04:33:57
皇马官方:罗德里戈成功接受右膝前十字韧带和外侧半月板手术

皇马官方:罗德里戈成功接受右膝前十字韧带和外侧半月板手术

懂球帝
2026-03-10 19:30:06
傻狍子给伐木累介绍“公共嫂子”

傻狍子给伐木累介绍“公共嫂子”

毒舌扒姨太
2026-03-10 22:46:39
国内商品期货夜盘开盘 原油跌超8%

国内商品期货夜盘开盘 原油跌超8%

证券时报
2026-03-10 21:23:02
我的妈呀!杨幂又变脸了?这也太像谢娜了吧!

我的妈呀!杨幂又变脸了?这也太像谢娜了吧!

章眽八卦
2026-03-10 12:14:10
全智贤状态越来越差,外媒最新高清生图崩了,状态疲惫白头发抢镜

全智贤状态越来越差,外媒最新高清生图崩了,状态疲惫白头发抢镜

萌神木木
2026-03-10 21:07:10
台湾即将有望统一!五大信号正在释放:武力统一或将进入倒计时?

台湾即将有望统一!五大信号正在释放:武力统一或将进入倒计时?

南宗历史
2026-03-08 22:36:31
59元一瓶,48小时破万,江苏一酒厂靠光瓶酒破局,成中产口粮酒

59元一瓶,48小时破万,江苏一酒厂靠光瓶酒破局,成中产口粮酒

影像渭南
2026-03-10 16:42:05
2026-03-11 01:31:00
前沿在线 incentive-icons
前沿在线
前沿在线官方账号,关注AI、机器人、智能车等前沿领域;
112文章数 1231关注度
往期回顾 全部

科技要闻

全民"养虾"背后:大厂集体下场疯狂卖Token

头条要闻

伊朗新最高领袖在袭击中受伤未公开发表讲话 官方回应

头条要闻

伊朗新最高领袖在袭击中受伤未公开发表讲话 官方回应

体育要闻

加兰没那么差,但鲈鱼会用吗?

娱乐要闻

《逐玉》注水风波升级!315评论区沦陷

财经要闻

“龙虾补贴”密集出炉 最高1000万!

汽车要闻

MG4有SUV衍生 上汽乘用车多款新车规划曝光

态度原创

艺术
教育
房产
数码
公开课

艺术要闻

震撼!美国油画家约书亚·拉洛克的作品让人惊叹不已!

教育要闻

苏州大学官宣:面向高中生开放!

房产要闻

信号!千亿巨头入局,三亚开启新一轮大征拆!

数码要闻

3月31日!RTX 50系玩家可体验英伟达DLSS 4.5新特性

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版