网易首页 > 网易号 > 正文 申请入驻

你的模型真的会"举一反三"吗?RoboChallenge Table30 V2正式发布

0
分享至



具身智能正站在一个关键的历史节点上。随着 VLA 与 WMA 模型爆发式增长,行业的核心痛点日益凸显:在单任务精调之外,具身智能模型是否真正具备通用泛化能力,还是仅仅陷入了单一任务的过拟合?

带着这一核心追问,RoboChallenge 正式发布 Table30 V2,它以“面向下一代模型的大规模真机原生泛化评测”为标准,从任务升级、评测升级到系统升级三个维度深度重构:通过引入更严苛的软体、工具使用及双臂协作任务,支持零样本与域外泛化测试,并实现3倍于往届的系统吞吐量。Table30 V2将为全球具身智能研究者打造了一个精准的“泛化标尺”与公平、开放的真机竞技场,同时其预览版将作为 RoboChallenge CVPR 2026 Workshop 竞赛的首秀上线发布。

任务升级:直面真实世界的复杂性与灵巧性


Table30 V2任务集


具身智能的终极目标是处理现实世界中不可预知的复杂场景。Table30 V2 的第一个核心改进,就是重构了任务集。我们在原有基础上,新增了 18 个全新的双臂灵巧操作任务,配合保留的 12 个经典任务,构建了一个包含 30 个高难度任务的综合评估体系。为什么要如此扩展任务难度?因为泛化能力的缺失往往源于对“简单任务”的过度拟合。

• 从硬到软的跨越:我们引入了对绳索、布料等软连续体物体的处理任务。这些物体形变无限、状态不固定,极大地挑战了模型的空间推理与自适应控制能力。

• 工具与空间的深度交互:新增任务要求机器人能够准确使用工具,并理解复杂的工具-物体空间关系。这不仅是对精度控制的考验,更是对模型物理常识的一次深度摸底。

• 双臂协作的必然性:在 Table30 V2 中,我们设计了大量需要双手高度协调的任务,要求模型在动态受限的环境下,实现高精度的同步控制。

• 硬件升级,验证跨平台能力:引入了新一代移动双臂操纵平台 DOS-W1(具有三角尖端夹具),并与经典的 Aloha系统并存,不仅降低了整体硬件的准入门槛,更通过双机型并行的评测机制,严谨地验证了模型在不同硬件配置下的鲁棒性。

评测升级:告别单点突破,迎接全维泛化



在具身智能领域,我们经常看到模型在单个任务上表现优异,却在稍换场景后即刻“翻车”。Table30 V2 通过重构学习与测试协议,彻底终结了“为了比赛而调参”的旧模式。

• 全面转向“多任务”范式:Table30 V2 将全面支持多任务模型,杜绝为每个任务单独训练一个专用模型的“作弊式”优化。我们要求参评者提交具备通用理解能力的单一模型,这与构建通用具身大模型的行业大趋势高度一致。

• 零样本(Zero-shot)测试的引入:这是本次升级的重头戏。我们引入了物体级和环境级两个层面的零样本测试。模型必须在未见过的物体、未见过的背景、甚至动态变化的干扰(如桌面高度微调)下,展示出其真正的理解力,而非单纯的记忆能力。

• 分层次的泛化矩阵(In-Domain vs. Out-of-Domain):从传统的域内评估,升级为包含域外(OOD)的高阶测试。我们不仅测试模型在预期之内的表现,更通过动态调整测试环境(如将桌面换成沙发等不可控变化),挑战模型的边界。这不再是一场简单的分数比拼,而是一次对模型“智能本质”的压力测试。

系统升级:吞吐量提升 300%,打造快节奏反馈循环

对于算法迭代而言,速度就是生命线。为了让科研人员不再因为“等待评估结果”而浪费宝贵的算力,我们对整个底层基础设施进行了彻底的扩容与优化。

• 300% 的吞吐量飞跃:通过大量增购主流机器人硬件,并优化调度算法,我们实现了系统吞吐能力的巨大提升。

• 任务准备的“极速化”:我们放宽了像素级的严苛初始状态要求,转向更符合现实的“粗略对齐”,大幅降低了任务准备的空转时间,确保科研团队能够实时获取反馈,快速迭代模型。

• “时间消耗”作为性能指标:我们在排行榜中新增了“完成时间(Time to Complete)”作为关键评分维度,倒逼研究者优化策略的执行效率,而非盲目堆叠推理时间来换取成功率。

诚邀报名:RoboChallenge CVPR 2026 Workshop 竞赛正式开启

Table30 V2 的发布,不仅是一个基准测试的诞生,更是一次对未来具身智能方向的指引。我们诚挚邀请全球科研团队、实验室及个人开发者,参与 RoboChallenge CVPR 2026 Workshop 竞赛。本次竞赛将作为 Table30 V2 预览版首秀,参赛者有机会在我们的真实机器人集群上验证自己的模型,与全球顶尖的具身智能算法同台竞技。

竞赛结束后,我们将持续面向全球研究者开放评测基础设施,让每一个有想法的团队都能在真实机器上验证自己的模型。泛化,是具身智能的下一座山峰。Table30 V2,邀你同攀。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
教皇利奥罕见发表强硬言论:中东冲突极其恶劣,你们双手沾满鲜血

教皇利奥罕见发表强硬言论:中东冲突极其恶劣,你们双手沾满鲜血

安然有思
2026-04-01 21:31:36
于根伟:赛后更衣室气氛不太好;换上王秋明是因为郭皓消耗比较大

于根伟:赛后更衣室气氛不太好;换上王秋明是因为郭皓消耗比较大

懂球帝
2026-04-05 23:27:46
日本慌了,韩国急了,如今的中国乌鲁木齐,先进制造悄然成势

日本慌了,韩国急了,如今的中国乌鲁木齐,先进制造悄然成势

疯狂的小历史
2026-03-22 10:45:55
美伊还在互扔导弹,中国已步入电磁时代,最新一代电磁枪颠覆战场

美伊还在互扔导弹,中国已步入电磁时代,最新一代电磁枪颠覆战场

标体
2026-04-06 02:36:04
日本专家:不要再中国被忽悠了,其实歼-36根本没有实战能力!

日本专家:不要再中国被忽悠了,其实歼-36根本没有实战能力!

标体
2026-04-05 17:37:57
密谈结束了,泽连斯基离开土耳其,临走前普京致电,新的格局成形

密谈结束了,泽连斯基离开土耳其,临走前普京致电,新的格局成形

只能离开
2026-04-05 20:04:59
35岁傅彪儿子满头白发,住北京豪宅开豪车,酒中藏20年思念

35岁傅彪儿子满头白发,住北京豪宅开豪车,酒中藏20年思念

陈意小可爱
2026-04-06 02:21:59
爸癌症晚期求我别治了!我偏要化疗,最后三个月他在痛苦中熬完的

爸癌症晚期求我别治了!我偏要化疗,最后三个月他在痛苦中熬完的

宝哥精彩赛事
2026-04-05 17:15:04
中超罕见一幕!比赛进行中队医冲入场,主裁遭炮轰:掌控力太差

中超罕见一幕!比赛进行中队医冲入场,主裁遭炮轰:掌控力太差

奥拜尔
2026-04-05 16:22:49
油车换电车1年真实感受:普通人别跟风!买车前没人告诉你的真相

油车换电车1年真实感受:普通人别跟风!买车前没人告诉你的真相

华庭讲美食
2026-03-28 17:08:13
中央明确,今年养老金调整方式或有变,只保留定额调整可行吗?

中央明确,今年养老金调整方式或有变,只保留定额调整可行吗?

傲傲讲历史
2026-04-06 01:08:11
川普又双叒在倒计时 被爆已住院?

川普又双叒在倒计时 被爆已住院?

新浪财经
2026-04-05 11:05:15
风向突变,以德为首的西方国家齐发声:中国已在换电关键领域崛起

风向突变,以德为首的西方国家齐发声:中国已在换电关键领域崛起

随遇而安之心
2026-04-05 16:09:16
56岁虞美人集团董事长与26岁男友大婚:陪嫁5000万,男方身份被扒

56岁虞美人集团董事长与26岁男友大婚:陪嫁5000万,男方身份被扒

老猫观点
2026-03-19 08:35:09
4月7日国内油价或上调,今年油价“六连涨”,或大涨超1.99元/升

4月7日国内油价或上调,今年油价“六连涨”,或大涨超1.99元/升

油价早知道
2026-04-06 01:59:43
“前轮硬生生压过去的!”爸爸开车撞倒1岁宝宝,结局让人揪心又后怕……

“前轮硬生生压过去的!”爸爸开车撞倒1岁宝宝,结局让人揪心又后怕……

环球网资讯
2026-04-05 19:53:58
安理会13票通过,中俄弃权,内塔尼亚胡宣布退群

安理会13票通过,中俄弃权,内塔尼亚胡宣布退群

米师傅安装
2026-04-06 02:39:19
33岁程序员午休健身时猝死,公司:按照公司指定地方进行健身的时间,计入8小时工作时间;人社局:不算工伤!法院判了

33岁程序员午休健身时猝死,公司:按照公司指定地方进行健身的时间,计入8小时工作时间;人社局:不算工伤!法院判了

大风新闻
2026-04-05 15:46:10
特朗普无法再拖两天,伊核电站被炸,决战提前?中方先一步发预警

特朗普无法再拖两天,伊核电站被炸,决战提前?中方先一步发预警

生命之泉的奥秘
2026-04-06 00:21:19
央视怒批,目不识丁、洋相百出,难怪两会上冯远征建议演员多学习

央视怒批,目不识丁、洋相百出,难怪两会上冯远征建议演员多学习

傲傲讲历史
2026-03-05 16:08:43
2026-04-06 04:23:00
智能进化论 incentive-icons
智能进化论
关注AI产业趋势、场景应用
442文章数 80关注度
往期回顾 全部

科技要闻

花200薅5千算力,Claude冷血断供“龙虾”

头条要闻

伊朗官员提开放霍尔木兹海峡条件

头条要闻

伊朗官员提开放霍尔木兹海峡条件

体育要闻

CBA最老球员,身价7500万美元

娱乐要闻

王灿兮否认婆媳不和 晒与杜淳妈合影

财经要闻

谁造出了优思益这头“怪物”?

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

手机
房产
本地
家居
公开课

手机要闻

OPPO Find X9s Pro银色哈苏专业增距镜亮相:观赛神器 颜值拉满

房产要闻

小阳春全面启动!现房,才是这波行情里最稳的上车票

本地新闻

跟着歌声游安徽,听古村回响

家居要闻

温馨多元 爱的具象化

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版