网易首页 > 网易号 > 正文 申请入驻

从VLA到世界模型,具身智能加速“范式转移”

0
分享至


随着具身智能的向前发展,传统的VLA技术路线正在面临越来越多的挑战。

所谓VLA模型,即视觉-语言-动作模型。它的技术逻辑可以简单描述为,将人类指令和外界多模态信息(声音、图像、视频)转化为计算机语言,继而控制机器人行为。

但在VLA模型的训练中,互联网上的静态、非结构化文本和图像数据,并不是训练所需的核心数据。物理世界数据的稀缺与复杂性,成为了制约VLA模型能力跃升的主要瓶颈。

VLA之后,具身智能接下来将往何处去?这成为了具身智能整个行业,都在试图解决的问题。

近日,蚂蚁灵波对外开源了LingBot-Depth、LingBot-VLA 、LingBot-World 以及LingBot-VA系列模型。其中 LingBot-VA 所代表的“边预测、边行动”的具身世界模型范式,正与行业近期的探索形成呼应。而四个模型的开源,则将这套能力拆成可复用的模块与接口,为开发者提供从研究验证到工程试验的基础设施,从而降低具身智能研发与集成门槛。

LingBot-VA开源,首创“自回归视频-动作范式”

蚂蚁灵波开源周中, 具身世界模型LingBot-VA成为了收官之作,其核心突破在于它改变了机器人的思考方式。

传统机器人主要基于“视觉-语言-动作”范式,其决策模式类似于“条件反射”:看到什么,就做什么。这种方式难以应对需要多步骤规划和因果推理的复杂任务。

LingBot-VA则让机器人具备“脑补”能力。


在物理执行动作之前,它会在内部模拟并推演未来几秒的世界状态变化,再根据这个推演结果来决定当前的最佳动作。这使得机器人能够像人一样“先思后行”,显著提升了在复杂、长时序任务中的可靠性和智能水平。

实现这一切的基础在于,LingBot-VA在核心范式上的创新。

LingBot-VA首创了“自回归视频-动作范式”:将大规模视频生成模型与机器人控制深度融合,模型在生成“下一步世界状态”的同时,直接推演并输出对应的动作序列。

具体而言,Mixture-of-Transformers (MoT) 架构让视频流(宽而深,负责视觉推演)与动作流(轻而快,负责运动控制)共享注意力机制又保持独立;闭环推演机制:每一步生成都纳入真实世界的实时反馈(如摄像头数据),形成“预测-执行-感知-修正”的循环,防止幻觉漂移。

最后,异步推理管线让动作预测与电机执行并行处理,大幅降低延迟。

得益于LingBot-VA的技术创新,机器人在制作早餐、插入试管、叠衣物等长时序、高精度、柔性物体操控任务中,成功率相较业界基线模型平均提升约20%;在双臂协同操作基准RoboTwin 2.0上成功率首次超过90%,在长时序终身学习基准LIBERO上达到98.5%的平均成功。

LingBot 系列开源,构建具身智能的通用基础设施

除了LingBot-VA之外,蚂蚁灵波还连续开源了LingBot-Depth(空间感知)、LingBot-VLA以及LingBot-World。这四者共同构成了一套覆盖“感知-理解-模拟-行动”的完整具身智能技术栈。

LingBot-Depth​相当于机器人的“眼睛”,通过高精度空间感知模型,解决透明、反光物体识别难题,透明物体抓取成功率从0提升至50%。

LingBot-VLA​,类似于机器人的“大脑”,让机器人理解指令并规划基础动作。基于2万小时真实机器人数据训练,LingBot-VLA在GM-100基准测试中,成功率超越基线模型Pi0.5。


可以看到,与业内主流的“仿真到现实”(Sim-to-Real)路径不同,蚂蚁灵波更笃信基于真实世界数据训练的价值。

LingBot-VLA覆盖了9种主流双臂机器人构型(包括 AgileX,Galaxea R1Pro、R1Lite 、AgiBot G1等),实现了让同一个“大脑”可以无缝迁移至不同构型的机器人,并在任务变化、环境变化时保持可用的成功率与鲁棒性。

与高精度空间感知模型LingBot-Depth配合,LingBot-VLA还能获得更高质量的深度信息表征,通过“视力”的升级,真正做到“看得更清楚、做的更明白”。

LingBot-World,则是机器人的“数字演练场”。

利用多阶段训练和并行加速,LingBot-World可以实现长达近10分钟的连续、稳定和无损视频生成,以解决视频生成中的常见挑战——“长时漂移”,也即长时间的生成通常会出现物体变形、细节崩溃、主体消失或场景结构崩溃等现象。

同时,LingBot-World在长序列一致性、实时响应性以及对行动和环境动态之间的因果关系进行建模方面表现出色。这使得它能够在数字空间中“想象”物理世界,为人工智能代理提供一个具有成本效益、高保真环境,用于试错学习。

“机器人规模化的主要阻碍不在硬件,而在’反复训练/再训练(retraining)‘,也就是每做一个新任务或换一种机器人,往往就要重新采数据、重新调参,工程成本很高。这也是机器人很难从试点走向大规模部署的原因之一。”

MarkTechPost CEOAsif Razzag表示,蚂蚁灵波发布的一系列模型很有意思,从感知到认知,全栈(full-stack)体系,每个模型互为助力,并且全部开源。

也正是基于这样的设计,全面开源的LingBot系列模型,构建了具身智能完整的通用基础设施,让开发者可以按需选用或组合。这种新的研究范式,在降低具身智能研发门槛的同时,也加速了具身智能从实验室走向产业化的进程。(文 | 科技潜线,作者 | 饶翔宇 编辑 | 钟毅)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
真是人走茶凉!看了三只羊传媒的现状,才明白什么叫兔死狗烹

真是人走茶凉!看了三只羊传媒的现状,才明白什么叫兔死狗烹

天天热点见闻
2026-02-09 08:39:07
春节AI大战,催生AI应用超级大国

春节AI大战,催生AI应用超级大国

定焦One
2026-02-06 23:02:05
重磅发声!美联储,降息大消息!

重磅发声!美联储,降息大消息!

魏家东
2026-02-08 18:04:07
不到24小时,巴拿马果然扛不住了!可以还港口,却有一个前提条件

不到24小时,巴拿马果然扛不住了!可以还港口,却有一个前提条件

夕阳渡史人
2026-02-09 09:46:22
亚洲杯不和谐一幕:王曼昱3-4孙颖莎 比输球更可怕是粉丝狂热态度

亚洲杯不和谐一幕:王曼昱3-4孙颖莎 比输球更可怕是粉丝狂热态度

侃球熊弟
2026-02-08 21:29:38
女子假信佛与多位高僧发生不当关系,秘密录制5600段视频。

女子假信佛与多位高僧发生不当关系,秘密录制5600段视频。

特约前排观众
2026-02-09 00:05:05
大跌后大涨,超9万人爆仓!

大跌后大涨,超9万人爆仓!

每日经济新闻
2026-02-09 00:32:11
四川省人大常委会原委员、经济委员会原主任委员刘中伯被查

四川省人大常委会原委员、经济委员会原主任委员刘中伯被查

上观新闻
2026-02-09 16:17:04
暴力拉升,大面积涨停

暴力拉升,大面积涨停

中国基金报
2026-02-09 12:39:19
兄弟俩从浙江自驾回安徽老家,看错导航到了江苏同名乡镇,两地相距300多公里

兄弟俩从浙江自驾回安徽老家,看错导航到了江苏同名乡镇,两地相距300多公里

极目新闻
2026-02-08 19:28:20
事出反常必有妖,目前广州上海正悄悄出现9大反常现象,让人深思

事出反常必有妖,目前广州上海正悄悄出现9大反常现象,让人深思

深度报
2026-02-08 21:24:43
“情况罕见”!台湾桃园机场10分钟内3个航班发出“Mayday”求救信号

“情况罕见”!台湾桃园机场10分钟内3个航班发出“Mayday”求救信号

环球网资讯
2026-02-09 09:06:06
高市胜选第1天!先谢过特朗普,美日庆祝完,就对中国来了两手?

高市胜选第1天!先谢过特朗普,美日庆祝完,就对中国来了两手?

东极妙严
2026-02-09 13:15:33
为提高成绩,高台跳雪运动员向阴茎注入玻尿酸,这是对体育精神的巨大讽刺

为提高成绩,高台跳雪运动员向阴茎注入玻尿酸,这是对体育精神的巨大讽刺

爆角追踪
2026-02-08 19:23:36
具俊晔放弃遗产继承,让大S儿女承担8300万债务,两个孩子好惨!

具俊晔放弃遗产继承,让大S儿女承担8300万债务,两个孩子好惨!

钱小刀娱乐
2026-02-08 21:53:45
涉嫌严重违纪违法!安庆市公安局原保安监管支队支队长汪东被查

涉嫌严重违纪违法!安庆市公安局原保安监管支队支队长汪东被查

潇湘晨报
2026-02-09 16:37:52
国宝唐鸿胪井碑追索陷入“日本迷宫”

国宝唐鸿胪井碑追索陷入“日本迷宫”

环球网资讯
2026-02-09 06:57:08
日本人均实际工资连续4年 负增长

日本人均实际工资连续4年 负增长

每日经济新闻
2026-02-09 09:16:38
日本众议院选举结果公布

日本众议院选举结果公布

新华社
2026-02-09 06:03:02
日媒:石破茂告诫高市早苗,众议院选举胜利不代表“你可以想做什么就做什么”

日媒:石破茂告诫高市早苗,众议院选举胜利不代表“你可以想做什么就做什么”

环球网资讯
2026-02-09 15:00:37
2026-02-09 17:31:00
钛媒体APP incentive-icons
钛媒体APP
独立财经科技媒体
129366文章数 861751关注度
往期回顾 全部

科技要闻

马斯克终于想通了:先去月球“刷经验”

头条要闻

特朗普称"期待高市实现以实力保障和平政策" 中方回应

头条要闻

特朗普称"期待高市实现以实力保障和平政策" 中方回应

体育要闻

创中国冬奥最佳战绩!19岁速滑新星含泪向天拉勾

娱乐要闻

李亚鹏暂停直播:将投入嫣然医院工作

财经要闻

文玩假拍骗局调查:3500元瓷瓶估值300万

汽车要闻

长安将搭钠电池 好比汽车要装柴油机?

态度原创

手机
旅游
游戏
家居
公开课

手机要闻

消息称因苹果计划推出iPhone Flip小折叠手机 三星显示正在考虑扩大OLED面板产能

旅游要闻

感受传统年味与自然之美,济南推出80余项新春游园活动

梦幻西游全服第一16技能谛听成功售出,王谢合成首颗15级灵尘

家居要闻

山院焕新 雅聚悦亲朋

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版