网易首页 > 网易号 > 正文 申请入驻

20亿小参数赶超英伟达旗舰模型,上海世界模型“裸考”登顶国际权威榜单

0
分享至



5月30日,记者从智元机器人获悉,旗下自研世界模型Genie Envisioner-Sim 2.0(简称GE 2.0)凭借优异的综合表现,在全球世界模型评测基准World Arena(世界竞技场)“感知与动作响应”榜单中位列第一。

何为世界模型?简单来说,就是能理解物理世界规律的AI大模型,比如机器人有了世界模型的能力,就知道杯子掉地上会碎、水往低处流、积木搭太高会倒等常识。

World Arena是当前世界模型行业的国际权威评测基准,由清华大学联合普林斯顿大学、香港大学、北京大学等8所全球顶尖高校打造,主要分为“感知与动作响应”和“数据引擎”两个核心赛道,通过16项细分指标和3类机器人实操任务,来考核具身智能对物理规律、三维感知、动作预判等理解能力,具备很强的学术公信力和产业参考价值。

本次智元GE 2.0参与的是“感知与动作响应”赛道评测,与英伟达最新模型DreamDojo、清华联合斯坦福的Ctrl-World团队等国内外AI顶尖团队直接竞争并最终夺冠。


智元GE 2.0多项指标处于领先地位。

记者从披露的技术文档中获悉,GE 2.0仅用20亿(2B)参数的模型,结果比英伟达、微软等超大参数的旗舰模型效果更优秀,也验证了在人形机器人应用方面,轻量化模型的适配性不逊于超大参数模型。

值得一提的是,智元团队并没有专门为比赛做针对性优化,只是用通用版本稍加调整就参赛了,相当于“裸考”拿冠军,说明GE 2.0本身泛化能力很强。

GE 2.0到底厉害在哪里?机器人能在“大脑”里搭建一个虚拟场景,可以反复尝试各种动作,犯了错也不会真的弄坏东西,等熟练掌握技能后,再搬到现实世界中使用。这样既省钱又安全,还能大大加速机器人的学习过程。

技术文档还提到了GE 2.0多个升级之处,比如长时序推演能力突破、数据回流反哺机制、真实世界高度一致性等方面。


智元GE 2.0的技术图示。

很多世界模型有个通病,预测的时间一长,画面就会变模糊、变形,就像做梦到后面越来越离谱。GE 2.0虽然也难以彻底杜绝这一问题,但画面清晰度下降的速度远低于同行产品。长时序推演能力突破,使得GE 2.0预测到50秒的场景,画质依然比不少模型前10秒还要好。

智元研发团队做了大量对比测试还发现,GE 2.0模拟出来的结果和真实世界中的表现高度吻合。不仅整体成功率对得上,团队还逐个案例做了详细比对,用数据图表严格验证了这一点。这也意味着,机器人在虚拟世界里学会的技能,搬到现实中大概率也能用。

同时,GE 2.0还内置了一个“裁判”系统,能自动判断每次虚拟练习的质量高低,把好的经验自动挑出来,反馈给机器人的“行动大脑”,帮它学得更快。实验结果表明,这种“自我进化”的方式确实让机器人处理多个任务的能力更强。

记者获悉,GE 2.0并非是单一模型,而是从具身数据到智能体平台全栈自研系统的一部分。

4月中旬,智元上线全球首个覆盖具身智能全域研究的真实场景数据集AGIBOT WORLD 2026,100%采集自商业空间、酒店、商超等真实世界。紧接着,Genie Sim 3.0仿真平台发布,一句话即可生成虚拟世界,将环境构建速度从小时级缩短至分钟级。另外,VLA基座大模型GO-2和世界模型GE 2.0一起构建出可交互、可训练、可评估的虚拟物理世界。

搭建好数据和仿真的基础后,智元发布零代码应用平台Genie Studio Agent(精灵工作室智能体),将视觉感知、运动控制、导航规划、视觉语言行动模型和强化学习工具链等复杂能力,封装成开箱即用的解决方案。

基于这一全栈自研系统,普通人只需在平台上通过拖拽方式,即可搭建属于自己的机器人应用。

原标题:《20亿小参数赶超英伟达旗舰模型,上海世界模型“裸考”登顶国际权威榜单》

栏目主编:李晔

本文作者:解放日报 查睿

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中央再发铁令!领导干部出现这15种情形 , 将不能再担任现职!

中央再发铁令!领导干部出现这15种情形 , 将不能再担任现职!

细说职场
2026-05-14 21:37:29
穆里尼奥签约皇马,合同至2029年

穆里尼奥签约皇马,合同至2029年

体坛观察猿
2026-05-30 00:25:28
全球首家AI妓院,革了成人行业的命

全球首家AI妓院,革了成人行业的命

广告案例精选
2026-04-02 14:49:22
3次精准预言俄乌走向,这位历史老师的眼光有多毒?

3次精准预言俄乌走向,这位历史老师的眼光有多毒?

麦大人
2025-11-05 15:45:51
中国防长未参会,美防长当众对华提一要求,全球看清美国最怕什么

中国防长未参会,美防长当众对华提一要求,全球看清美国最怕什么

健身狂人
2026-05-30 15:27:25
62岁的我狠心戒烟戒酒一年,复查时医生一番话,让我彻底醒悟

62岁的我狠心戒烟戒酒一年,复查时医生一番话,让我彻底醒悟

千秋文化
2026-03-01 22:14:37
一群赌徒,比华尔街更早知道世界会发生什么

一群赌徒,比华尔街更早知道世界会发生什么

华尔街见闻官方
2026-05-29 10:06:41
再见,杨瀚森,开拓者动手裁员了……

再见,杨瀚森,开拓者动手裁员了……

体育新角度
2026-05-30 10:25:28
活久见!西南大学食堂“亮剑辣度图”走红,网友:你是要笑死我吗

活久见!西南大学食堂“亮剑辣度图”走红,网友:你是要笑死我吗

火山詩话
2026-05-30 08:37:40
鞠萍6月1日正式退休!她离婚又再婚,润滑儿子与两位父亲的关系

鞠萍6月1日正式退休!她离婚又再婚,润滑儿子与两位父亲的关系

乡野小珥
2026-05-31 01:05:00
王鹤棣没想到,心中这口恶气竟让官媒给出了,沈月也能松口气

王鹤棣没想到,心中这口恶气竟让官媒给出了,沈月也能松口气

LULU生活家
2026-05-30 18:01:01
今日四月十五,牢记:1要看,2不动,3不走,4要吃,寓意团圆美满

今日四月十五,牢记:1要看,2不动,3不走,4要吃,寓意团圆美满

小茉莉美食记
2026-05-31 00:40:03
78岁老人与邻居互殴次日凌晨自缢身亡 家属索赔46万元被法院驳回

78岁老人与邻居互殴次日凌晨自缢身亡 家属索赔46万元被法院驳回

闪电新闻
2026-05-30 18:28:58
导弹从天而降炸美基地,以色列48小时内连斩三高官

导弹从天而降炸美基地,以色列48小时内连斩三高官

青春染指红颜梦
2026-05-29 18:55:02
耿同学账号被限流了,动了太多人的奶酪,不应该揭露学术圈的秘密

耿同学账号被限流了,动了太多人的奶酪,不应该揭露学术圈的秘密

江山挥笔
2026-05-30 19:29:12
网红边牧被偷后续,偷狗男被带走,狗肉店老板找到,透露更多内幕

网红边牧被偷后续,偷狗男被带走,狗肉店老板找到,透露更多内幕

呼呼历史论
2026-05-29 20:27:48
霉霉大婚在即细节曝光!双方已签巨额婚前协议,男方点赞“倒插门”贴文要随妻姓?

霉霉大婚在即细节曝光!双方已签巨额婚前协议,男方点赞“倒插门”贴文要随妻姓?

英国报姐
2026-05-30 21:08:49
搞笑图片第1230期:你要是没那金刚钻,能不能就不要揽这瓷器活

搞笑图片第1230期:你要是没那金刚钻,能不能就不要揽这瓷器活

今天的快乐
2026-05-30 20:44:05
比恒大还惨!中国第二大民企倒了,负债7500亿,创始人被带走

比恒大还惨!中国第二大民企倒了,负债7500亿,创始人被带走

芳芳历史烩
2025-12-25 20:32:52
教育部通知:2026初升高将迎来“大变动”,普通家长直言难以置信

教育部通知:2026初升高将迎来“大变动”,普通家长直言难以置信

妍妍教育日记
2026-05-30 10:10:07
2026-05-31 05:28:49
上观新闻 incentive-icons
上观新闻
站上海,观天下
491819文章数 761825关注度
往期回顾 全部

科技要闻

车圈大佬发声:价格战远去,但竞争仍残酷

头条要闻

两名9岁女孩被困电梯近2小时 求救几十次物业无动于衷

头条要闻

两名9岁女孩被困电梯近2小时 求救几十次物业无动于衷

体育要闻

巴黎再度捧起欧冠奖杯 枪手众将黯然神伤

娱乐要闻

张碧晨《歌手》 “活人微死” 自嘲

财经要闻

双汇管不住一头猪

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

数码
家居
健康
本地
教育

数码要闻

华擎RX 9070 XT太极十周年版曝光:黑白金配色首次亮相

家居要闻

云栖 舒展如流云

尝试干细胞疗法如何避免踩坑?

本地新闻

用剪纸的方式,打开江苏扬州

教育要闻

帕德逼近:导数中无敌般的存在

无障碍浏览 进入关怀版