网易首页 > 网易号 > 正文 申请入驻

智元世界模型:机器人的“大脑”,还是市值翻十倍的“样板间”?

0
分享至

8月14日,智元机器人把7月亮相过的世界模型GenieEnvisioner(GE)正式开源,并再次打出“行业首个面向双臂真机的世界模型”的概念。

官方演示里,机器人连续完成做三明治、倒茶、擦桌、用微波炉、装箱等长链条任务,看上去已颇具“人味儿”。

不过,这份“人味儿”能否在已经沸腾的二级市场上再来一次“空中加油”,还要看周一开盘。

此前的7月8日,智元机器人公告,正在通过“协议转让+要约收购”拿下材料供应商上纬新材63.62%的股权。而自公告以来,上纬新材一路走出11个涨停,市值从30亿元最高冲到400多亿元。

可以说,智元还没把世界模型卖进工厂,就已经把自己市值的杠杆放大到了资本市场。

智元GE 视频截图

智元的GE做了什么?

从智元官方发布的信息中可以看出,GE的核心突破在于,构建了基于世界模型的以视觉中心的建模范式。

不同于主流VLA(Vision-Language-Action)方法依赖视觉-语言模型将视觉输入映射到语言空间进行间接建模,GE直接在视觉空间中建模机器人与环境的交互动态。

这种方法完整保留了操控过程中的空间结构和时序演化信息,实现了对机器人-环境动态更精确、更直接的建模。

智元表示,基于3000小时真机数据,GE-Act在跨平台泛化和长时序任务执行上显著超越现有SOTA,也为具身智能打开了从视觉理解到动作执行的技术路径。

此外,智元机器人团队还宣布,将开源全部代码、预训练模型和评测工具。

智元方面表示,这是行业内首个真正面向真实世界双臂机器人的世界模型。GE平台把“预测—控制—评估“环节整合到了一起,标志着机器人从被动执行指令,转变为主动“想象—验证—行动“。

换句话说,机器人能够像人类一样,在实际操作前于“脑海”中模拟并验证动作。

据介绍,借助GE模型,智元机器人已成功实现半身移动任务,包括制作三明治、倒茶、擦拭桌面、使用微波炉加热以及在流水线上进行装箱等五项任务的依次完成。

智元机器人 官方网站

“机器人公司不做大模型将没有未来。”此前,在智元机器人发布首个通用具身基座大模型智元启元大模型之后,智元合伙人、具身业务部总裁姚卯青和智元具身研究中心常务主任任广辉曾这样表示过。

目前的大语言模型,仍普遍存在推理时间长,实时性差等问题。搭载大语言模型的机器人,控制在线决策至少需50毫秒,一般延迟为1至5秒,完全无法满足工业场景3至10毫秒的需要。

而本次智元机器人推出的,就是基于目前大语言模型技术限制而生的世界模型,是以智能体身体与环境的实时感知和交互为基础,构建的用于理解、预测和适应环境动态变化的模型。

具体来说,世界模型能够让智能体通过 “想象” 不同行动策略的未来状态序列,提前规划好步骤,选择最佳方案来执行。

智元AgiBotWorld 视频截图

3000小时数据,其实可有可无?

从传播的角度来看,智元机器人发布的开源世界模型,确实可以说是一次“秀肌肉”。不过如果深入到技术上,事情可能会有不同。

世界模型所需要的的训练数据,远超目前还未铺开的具身智能机器人可以提供的能力。

在今年6月,Meta开源发布的V-JEPA 2世界模型就使用了超过100万小时的互联网视频和图像数据进行预训练,不依赖语言监督;而谷歌旗下DeepMind的Genie3则采用了大量游戏引擎生成的数据集,也有消息称Genie3的训练数据或包含谷歌旗下的知名视频网站YouTube的视频及更多内容(尽管DeepMind称对此“持谨慎态度”)。

与之相比,目前搭载具身智能的机器人普遍还处于探索阶段,能产生的真机数据量级并不大,就以智元机器人本次训练使用的3000小时数据来说,其实对于世界模型能力本身的训练提升作用,微乎其微。

3000小时的真机数据对世界模型本身的能力增益,就像往长江里倒一桶纯净水——有比没有好,但没人靠它涨潮。

其实,关于具身智能机器人的数据需要,行业也存在争论:另一部分观点认为,世界模型的能力提升,与具身智能领域的数据多寡之间,并无强关联。

此前,在2025世界机器人大会上,国内具身智能领域另一龙头企业宇树科技的创始人王兴兴曾表示:“目前全球范围内,大家对于机器人数据问题的关注度,都有点太高了。现在最大的问题其实反而是模型。”

他认为,目前具身智能和机器人的模型架构不够好,也不够统一。

“在大语言模型领域,当有了足够多的好数据时,就能把模型训练得越来越好。但是在具身智能领域,会发现在很多情况下,数据采了却用不起来。大家对模型的关注目前是相对有点少,反而对数据关注有点太高了。”

世界模型是“地基”,具身智能是“楼房”

相关从业人士对观察者网表示,具身智能领域的“数据集不是越大越好”可能需要这样解释:世界模型本身的发展还需要依靠更多的互联网图像、视频,乃至于目前正在发展的AI眼镜等智能硬件产品提供的视觉信息。

而在具身智能领域进行的世界模型侧研发,更多是基于机器人的训练数据进行针对性的优化,对于模型本身的基础性能并没有太大的提升作用,因为具身智能机器人目前还没有办法提供能够满足模型训练需求的数据量。

在这个过程中,世界模型的基础能力是整个系统的 “认知地基”。地基越扎实,模型对真实世界的拟合精度与预测效能就越强,机器人的“大脑”做出正确决策的能力也就越强,其满足实际落地场景所需要的实机训练数据量就有可能减少。

所以,世界模型和具身智能今天虽然被频繁地放在同一个句子里,但它们其实处在两条不同的时间轴上。

世界模型的目标,首先是用来自整个互联网的视频与图像信息去理解、预测乃至生成整个物理世界,它更像通用大模型的下一站:数据胃口以百万小时计,技术阶段上则更类似当年ChatGPT刚出现时的大语言模型,模型架构仍在快速迭代,尚未收敛。

而具身智能的核心诉求,则是让机器人完成具体任务——倒水、装配、擦桌子。现阶段的技术成熟度大约相当于2016年的自动驾驶:硬件基本可用,算法的“大脑”仍需大量工程打磨。

换句话说,世界模型是“认知地基”,需要海量通用视觉数据来夯实;具身智能是“上层建筑”,依赖少量高成本的真机数据来精雕细琢。地基越深,未来楼房可以盖得越高,但地基的混凝土并不来自楼房本身,二者互补却并不同步,一边向下深挖,一边向上搭建。

“地基”夯实尚需时日,“样板间”暴涨是否为时过早?

比技术进展更吸睛的,是另一层面的消息:

此前,有消息称,智元机器人已通过“协议转让+要约收购”的方式拿下了材料供应商上纬新材63.62%股权。

从技术和供应链上来看,上纬新材的主打产品包括PEEK(聚醚醚酮)等轻量化复合材料,可让机器人外壳和关节减重30%以上;智元控股后,既是锁定关键材料供应,又能用机器人实测数据反向优化适配。

从资本视角看,在“具身智能”概念刚刚兴起,领头企业尚且稀缺的A股,智元在借壳上纬新材之后,如今似乎又开始给投资人一个“机器人大脑”来标的。

自7月8日公告以来,上纬新材股价从30亿元市值最高冲到400多亿元,走出11个“20cm”涨停,智元还没把世界模型和具身只能真正落地到工厂,其市值杠杆却被放大到了资本市场。

由此来看,世界模型能不能让机器人“长脑子”尚且未有定论,但股民却在这之前就已经被“点燃”。

数据飞轮、模型瓶颈、合成数据、仿真+真机混合、大模型互联网、分层过渡,种种技术路线上还笼罩着挥之不去的迷雾,而资本却硬生生在这个时候给具身智能领域打上了第三根坐标轴——能否证券化。

智元通过控股上纬新材,把“地基”和“楼房”打包成可交易资产包;其余五派仍停留在技术PPT阶段。当技术路线尚未收敛、Benchmark尚未统一时,资本抢先定价,行业被提前拖入“市梦率”博弈。

现在的情况下,其实可以从对待世界模型的态度分出两派:

•数据飞轮派(智元-姚卯青):开源1000万条真机轨迹,一起把飞轮转起来。

•模型瓶颈派(宇树-王兴兴):硬件够用、数据够多也白搭,架构必须推倒重来。

二级市场用10倍涨幅给“飞轮”投了票,但技术层面,仍无人能具现王兴兴提出的“原生具身大模型”。

智元把GE开源,是一次漂亮的科普;控股上纬新材,是一次成功的资本运作。样板间已搭好,地基仍在打桩,而参观队伍里,一半是工程师,一半是交易员。

世界模型2-5年才能跑出的Benchmark,资本市场2-5天就给出了估值。到底是世界模型成就了机器人,还是机器人概念成就了市值?

答案会写在下一版Benchmark和下一季报里。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
我不是中国人!马来西亚博主疯狂吐槽,别自作多情了,我只是华人

我不是中国人!马来西亚博主疯狂吐槽,别自作多情了,我只是华人

小鋭有话说
2026-05-30 23:12:00
原来有这么多不体面但挣钱的小生意!原来都是闷声发大财啊!

原来有这么多不体面但挣钱的小生意!原来都是闷声发大财啊!

另子维爱读史
2025-12-06 22:09:07
中东,突传大消息!“特朗普大幅度修改条款”!美伊谈判,最新动向!

中东,突传大消息!“特朗普大幅度修改条款”!美伊谈判,最新动向!

证券时报e公司
2026-05-31 10:18:15
和表哥出身湖南黑道,他创建缅甸KK园区,表哥成大佬司机娶小燕子

和表哥出身湖南黑道,他创建缅甸KK园区,表哥成大佬司机娶小燕子

阿胡
2025-01-12 19:30:46
最敬业代言!王力宏演唱会上被夸是法拉利 马上摆手否认:我现在是比亚迪

最敬业代言!王力宏演唱会上被夸是法拉利 马上摆手否认:我现在是比亚迪

快科技
2026-05-31 16:49:12
总决赛G3最大争议哨!布朗反抢绊倒弗格是不是违体?专家给出答案

总决赛G3最大争议哨!布朗反抢绊倒弗格是不是违体?专家给出答案

南海浪花
2026-06-01 07:33:06
驻菲律宾大使强硬喊话:中国人不是好欺负的!

驻菲律宾大使强硬喊话:中国人不是好欺负的!

看看新闻Knews
2026-06-01 11:20:36
赌王三太携女为爱猫庆生,四太现身儿子儿媳婚礼

赌王三太携女为爱猫庆生,四太现身儿子儿媳婚礼

晓銊就是我
2026-06-01 10:06:51
拯救华夏的大英雄:若非这四人挺身而出,中华文明或已断绝

拯救华夏的大英雄:若非这四人挺身而出,中华文明或已断绝

长风文史
2026-05-31 22:12:43
华人遍布全球,为啥唯独泰国华人,几乎把中国文化丢的一干二净?

华人遍布全球,为啥唯独泰国华人,几乎把中国文化丢的一干二净?

白浅娱乐聊
2026-05-31 12:07:16
重庆拟新增2所公办本科大学

重庆拟新增2所公办本科大学

教书心
2026-06-01 07:04:01
摧毁一架特别大飞机,击俄无线电中心!俄罗斯被打得柴油产量锐减

摧毁一架特别大飞机,击俄无线电中心!俄罗斯被打得柴油产量锐减

鹰眼Defence
2026-05-31 16:53:51
基民蒙了,“买的是‘消费’基金,一看重仓的却是科技股”,多只基金陷“风格漂移”争议!监管出手,195只基金今起调整,规模近4000亿元

基民蒙了,“买的是‘消费’基金,一看重仓的却是科技股”,多只基金陷“风格漂移”争议!监管出手,195只基金今起调整,规模近4000亿元

每日经济新闻
2026-06-01 09:18:39
太离谱了,张镇麟最强一战要夺冠,竟被调侃不如崔永熙一根

太离谱了,张镇麟最强一战要夺冠,竟被调侃不如崔永熙一根

宗介说体育
2026-06-01 10:24:37
拒绝巴黎!利物浦 8500 万锁定新帅首签 17 岁青训天才彻底凉了

拒绝巴黎!利物浦 8500 万锁定新帅首签 17 岁青训天才彻底凉了

澜归序
2026-06-01 06:54:53
瞒不住了?比亚迪发布4nm芯片被全网扒,大家其实都弄错了重点!

瞒不住了?比亚迪发布4nm芯片被全网扒,大家其实都弄错了重点!

李将平老师
2026-05-29 20:24:30
骗子内部总结:最难骗的不是聪明人,是这几类普通人基本从不上当

骗子内部总结:最难骗的不是聪明人,是这几类普通人基本从不上当

科学发掘
2026-06-01 05:33:27
再见雷霆!卫冕冠军轰然倒下,我必须承认7个事实:三巨头该散伙

再见雷霆!卫冕冠军轰然倒下,我必须承认7个事实:三巨头该散伙

篮球扫地僧
2026-05-31 14:16:11
曹操杀了杨修后,问其父杨彪为何瘦了,杨彪回了一句话成千古名句

曹操杀了杨修后,问其父杨彪为何瘦了,杨彪回了一句话成千古名句

兴趣知识
2026-05-30 18:54:23
《主角》45-46集:忆秦娥到了无戏可唱的地步,宋雨来考学员班

《主角》45-46集:忆秦娥到了无戏可唱的地步,宋雨来考学员班

两年的海
2026-06-01 08:53:23
2026-06-01 11:52:49
观察者网 incentive-icons
观察者网
全球视野,中国关怀
142246文章数 1850713关注度
往期回顾 全部

科技要闻

关停三年后,天涯社区今起开放访问

头条要闻

牛弹琴:巴黎又乱了火光冲天 马克龙都看得目瞪口呆

头条要闻

牛弹琴:巴黎又乱了火光冲天 马克龙都看得目瞪口呆

体育要闻

哭过之后,文班亚马想给波波维奇打电话

娱乐要闻

张凌赫活动商场玻璃被挤爆5人受伤

财经要闻

网红驱蚊产品,标注化妆品竟含农药成分

汽车要闻

上市三周交付3603台!华境S跻身旗舰大六座第一梯队

态度原创

旅游
房产
数码
游戏
公开课

旅游要闻

逛故宫的游客注意了,坤宁宫明起检修请绕行

房产要闻

红动五月!全国抢入核心资产,广州盯紧凯旋新世界!

数码要闻

七彩虹推出灵创K16游戏本,23999元起

2026年实况足球8怎么下载最安全?告别捆绑病毒,上KK对战平台一键获取

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版