网易首页 > 网易号 > 正文 申请入驻

放大招!蚂蚁灵波“王炸”模型四连发,机器人要成精了?

0
分享至

四天开源四个模型,蚂蚁灵波直接摊开了一张具身智能的完整底牌。

从【看清】玻璃,到【理解】任务,再到【模拟】世界,最后到【行动】落地 ——一套覆盖感知、决策与仿真与执行的完整技术栈全集开源。

自1月27日起,蚂蚁集团旗下灵波科技(RobbyAnt)发起「开源周」,打出了一套严密的组合拳:

起手即是破局,LingBot-Depth 率先亮相,解决了机器人视觉中“看不透”的顽疾;

紧随其后,LingBot-VLA 接管大脑,让机器人真正具备了理解抽象指令的通感;

第三天,LingBot-World 构建高保真环境,为机器人打造了一个极低成本的试错空间;

而在今天,全球首个自回归视频-动作模型 LingBot-VA 压轴登场,让机器人真正学会“边推演、边行动”。

这套全家桶并非功能的简单堆砌。这四个模型单拎出来,每一个的指标都足以在行业内炸场。

那么,它们究竟强在哪里?


眼睛:破解透明难题,让机器人“看见不可见”

家居机器人撞上玻璃门,工业机械臂抓不到透明零件,这些行业经典痛点,源于传统深度相机在透明与反光材质前的功能性失明。

首日开源的LingBot-Depth 选择了一条巧妙路径:不依赖昂贵硬件升级,而是通过掩码深度建模(MDM)算法,让现有传感器获得超越自身规格的感知能力。

研究团队构建了包含200万组真实场景数据和100万组合成数据的训练集,实现在稀疏深度补全任务中,误差降低约 47%, 室内场景相对误差降低超过 70%。

在真机验证中,启用LingBot-Depth后的机器人抓取完全透明的塑料杯,成功率从0跃升至50%。



项目链接: https://technology.robbyant.com/lingbot-depth

HuggingFace 链接:https://huggingface.co/robbyant/lingbot-depth

技术报告链接:https://github.com/Robbyant/lingbot-depth/blob/main/tech-report.pdf

▍大脑:20000小时真实数据,喂出最强开源VLA基座

有了好眼睛,更需要一个好脑子。但机器人的“脑子”一直有个顽疾:在A机器人上训练的技能,换到B机器人上就宕机;在实验室桌子能完成的任务,换张桌子就抓瞎。

LingBot-VLA的解决方案简单粗暴,用海量、多样化的真实数据,硬生生喂出常识和泛化能力:20000小时真实机器人操作数据,覆盖9种不同构型的双臂机器人。

这一数据量不仅创下开源领域新纪录,更重要的是,研究团队首次在真实机器人任务中系统验证了VLA模型的Scaling Law:随着预训练数据从3000小时逐步扩展到20000小时,模型在下游任务的成功率持续提升,且尚未出现饱和迹象。



技术架构上,LingBot-VLA采用专家混合Transformer设计,并创新性地将LingBot-Depth提供的深度信息通过可学习查询对齐机制注入模型,赋予机器人精确的空间感知能力。

在上海交通大学开源的GM-100真实机器人评测基准中,引入深度信息的LingBot-VLA平均成功率达 17.3%,超越此前公认最强的Pi0.5。



在仿真基准RoboTwin 2.0中,面对高度随机化干扰,其成功率也比π0.5领先近10个百分点。



这验证了一个关键假设:一个在海量、异构真实数据中训练的大脑,能够学会跨越硬件差异的本质操作逻辑,真正实现“一个大脑,适配多个身体”。

项目网站:https://technology.robbyant.com/lingbot-vla

模型:

https://huggingface.co/collections/robbyant/lingbot-vla

https://www.modelscope.cn/collections/Robbyant/LingBot-VLA

数据集:

https://huggingface.co/datasets/robbyant/lingbot-GM-100

GitHub:https://github.com/Robbyant/lingbot-vla

技术报告:https://arxiv.org/abs/2601.18692

▍模拟:高保可交互的“虚拟演练场”开源

在真实世界训练机器人,成本高昂、效率低下、风险不小。于是,有一个能够试错、学习和推演的环境很重要。

LingBot-World 就是在构建一个与物理世界规律一致的 高保真、可交互仿真环境。不止是一个视频生成模型,更是一个物理规律严谨的世界模拟器。

它的强大,让人瞠目:

十分钟超长生成:画面稳定不崩坏,解决了长视频生成的记忆难题。

实时交互:你可以用WASD键盘像玩游戏一样实时探索这个世界,也可以用自然语言下令:“前面放个烟花”、“变成冰雪世界”,世界随之改变。

严格物理规律:猫咪撞到沙发会停下,不会穿模;镜头移开再回来,物体仍在并符合逻辑。


高动态环境下,镜头长时间移开后返回,车辆形态外观仍保持一致



镜头长时间移开后返回,房屋仍存在且结构一致


这意味着,机器人可以在这个虚拟世界里进行无数次零成本的人生模拟,学习技能、试错规划,再将经验无损迁移到现实。

更让社区沸腾的是,相比其他顶尖团队的闭源策略,蚂蚁灵波选择了完全开源 。国内外网友一片惊呼:“对开源社区是巨大胜利!”“这是具身智能的重大进步!”

项目网站:https://technology.robbyant.com/lingbot-world

模型:

https://huggingface.co/collections/robbyant/lingbot-world

https://www.modelscope.cn/collections/Robbyant/LingBot-world

数据集:Code:https://github.com/Robbyant/lingbot-world

技术报告: https://github.com/robbyant/lingbotworld/blob/main/LingBot_World_paper.pdf

▍执行:从“看懂世界”到“改变世界”

接下来,还有一个关键问题悬而未决:如何将世界模型中推演的未来,高效、可靠地变为机器人在物理世界中 执行的当下?

今天开源的 LingBot-VA,正是打通了落地的答案,是全球首个自回归视频-动作一体化世界模型。

它的核心突破在于“边推演,边行动”。

传统的流程是,先让世界模型完整推演一遍任务视频,再让另一个控制模型去学习模仿。而LingBot-VA将二者融合:在每一步,模型根据当前观测,同步生成下一帧的世界画面和达成该画面的机器人动作。

它拥有长期记忆:能记住完整的历史交互,避免在相似状态中陷入循环。例如,在“开右盒-关右盒-开左盒”的任务中,它能清晰区分关盒前后的相同状态,不会卡壳。

它具备少样本快速学习能力:仅需30-50条真实演示,就能快速适应新任务,极大降低了部署成本。

它构建了“预测-执行-感知-修正”的实时闭环:在生成每一步时,都会纳入实时传感器反馈进行修正,确保想象不偏离现实。

在真实机器人评测中,面对制作早餐、高精度插入、柔性衣物折叠等高难度任务,LingBot-VA平均成功率较顶级基线模型提升20%。

在仿真评测中,它更是将双臂协同操作的成功率推至 90%以上,刷新行业纪录。

至此,世界模型赋能具身操作的路径终于形成:Depth提供精准的眼睛,VLA充当通用的“大脑,World构建可无限试错的模拟环境,而VA则赋予实时将想象落地的“手脚”。

一个智能体从感知环境、理解任务、模拟推演到最终执行的完整能力链路,被完全打通。

项目网站:https://technology.robbyant.com/lingbot-va

模型:

https://huggingface.co/collections/robbyant/lingbot-va

https://www.modelscope.cn/collections/Robbyant/LingBot-va

数据集:https://github.com/Robbyant/lingbot-va

技术报告:https://github.com/Robbyant/lingbot-va/blob/master/LingBot_VA_paper.pdf

▍结语与未来

蚂蚁灵波此次四天四模型的体系化开源,背后是清晰的产业判断。

当前机器人行业面临的核心痛点是场景碎片化与硬件非标化。传统的为每款机器人、每个场景定制算法的模式,成本高、周期长、难以规模化。

LingBot系列提供的是一种 “基座+适配”新范式:通过开源经过海量真实数据预训练的通用模型与工具链,企业可以用更少的数据、更低的算力,快速适配自己的特定场景和机器人本体。

通过这次体系化的开源,可以看到蚂蚁灵波的战略定位也愈发明晰:不下场制造机器人躯体,而是专注于打造可规模化复用的最强大脑与核心能力,为行业提供一套标准的智能基座。

另一种程度上,开源也意味着以开放协作定义的新周期刚刚开始。那个属于通用具身智能的未来,正在以更清晰、更务实的路径加速到来。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美国华裔男子残忍弑双亲,棒球棍重击致父母面目全非,笔记本惊现“杀人愿望清单”

美国华裔男子残忍弑双亲,棒球棍重击致父母面目全非,笔记本惊现“杀人愿望清单”

扬子晚报
2026-01-31 10:50:52
“硅基少女”现身上海,全球首款完全仿生具身智能机器人Moya发布

“硅基少女”现身上海,全球首款完全仿生具身智能机器人Moya发布

IT之家
2026-01-31 11:52:08
陕甘之战——汉人最伟大的一场巅峰战役,带领华夏重回世界之巅

陕甘之战——汉人最伟大的一场巅峰战役,带领华夏重回世界之巅

小豫讲故事
2026-01-31 06:00:10
全面反华?澳洲通告全球:达尔文港收归国有,中方打响立威第一枪

全面反华?澳洲通告全球:达尔文港收归国有,中方打响立威第一枪

不似少年游
2026-01-31 07:06:37
黄金暴涨暴跌,最惨烈的一批受害者出现了!

黄金暴涨暴跌,最惨烈的一批受害者出现了!

功夫财经
2026-01-31 09:57:17
爆iPhone 18 Pro将首搭星链卫星通信,无需额外硬件实现“无死角”联网

爆iPhone 18 Pro将首搭星链卫星通信,无需额外硬件实现“无死角”联网

环球网资讯
2026-01-30 15:14:07
我在芬兰见雇主家暖气不热,顺手修了,第5天小镇的人都赶过来了

我在芬兰见雇主家暖气不热,顺手修了,第5天小镇的人都赶过来了

三农老历
2026-01-30 11:25:43
69万元公款误转给云南租客,苏州女职员天塌了:收款人接电话“你们管得着吗”;警方介入,女子赴昆明全额追回,“收到钱后蹲走廊大哭”

69万元公款误转给云南租客,苏州女职员天塌了:收款人接电话“你们管得着吗”;警方介入,女子赴昆明全额追回,“收到钱后蹲走廊大哭”

扬子晚报
2026-01-31 08:02:18
王勃去世前,留下一篇3200字的奇文,至今无人能完美地翻译出来

王勃去世前,留下一篇3200字的奇文,至今无人能完美地翻译出来

铭记历史呀
2026-01-26 19:36:45
又是热卖第一!李亚鹏直播间人气30万+,1600多的普洱茶一抢而空

又是热卖第一!李亚鹏直播间人气30万+,1600多的普洱茶一抢而空

火山诗话
2026-01-31 06:15:08
金晨发文道歉!承认是自己驾车,车祸受伤照片曝光,警方否认骗保

金晨发文道歉!承认是自己驾车,车祸受伤照片曝光,警方否认骗保

乌娱子酱
2026-01-30 18:34:49
难以置信!广东有人在李亚鹏直播间抢购34000多普洱,追问怎么喝

难以置信!广东有人在李亚鹏直播间抢购34000多普洱,追问怎么喝

火山诗话
2026-01-31 11:52:11
网友直接熔毁10公斤金币?在绝对价值面前,纪念意义反而不重要了

网友直接熔毁10公斤金币?在绝对价值面前,纪念意义反而不重要了

收藏大视界
2026-01-30 16:38:22
深夜突发!金价大跳水,日内跌超12%,银价暴跌近35%!美股全线下跌

深夜突发!金价大跳水,日内跌超12%,银价暴跌近35%!美股全线下跌

每日经济新闻
2026-01-31 02:59:05
中国留学生被中外联合追捕!在澳向男婴泼热咖啡,逃回国后被找到

中国留学生被中外联合追捕!在澳向男婴泼热咖啡,逃回国后被找到

听风听你
2026-01-31 02:29:48
最高25℃!湖南今天开始大升温

最高25℃!湖南今天开始大升温

三湘都市报
2026-01-31 15:10:30
震惊!中国籍美发店老板在西班牙被捕,涉嫌向哈马斯转移百万欧元

震惊!中国籍美发店老板在西班牙被捕,涉嫌向哈马斯转移百万欧元

老马拉车莫少装
2026-01-31 01:17:09
万科年报亏820亿!深圳拼死守它,真相远比你想的更吓人

万科年报亏820亿!深圳拼死守它,真相远比你想的更吓人

贩财局
2026-01-31 12:38:38
押赴刑场!缅北女魔头明珍珍伏法了,当初迪拜炫富,现在刑场死囚

押赴刑场!缅北女魔头明珍珍伏法了,当初迪拜炫富,现在刑场死囚

今朝牛马
2026-01-30 20:12:32
特斯拉中国开始大幅度降价清仓,真要没了!

特斯拉中国开始大幅度降价清仓,真要没了!

XCiOS俱乐部
2026-01-31 10:48:12
2026-01-31 16:16:49
机器人大讲堂 incentive-icons
机器人大讲堂
立德机器人平台,是一个集媒体品牌、智库咨询、投资孵化、引智招商为一体的机器人垂直领域服务平台
6223文章数 4574关注度
往期回顾 全部

科技要闻

中国车企和特斯拉的下一战,战场已定

头条要闻

罕见画面公开 多架"黄皮"歼-20战机完成体系化试飞

头条要闻

罕见画面公开 多架"黄皮"歼-20战机完成体系化试飞

体育要闻

新时代得分王!东皇37+三双刷7纪录怒吼释放

娱乐要闻

成龙入驻小红书,怼脸近照没有老年斑

财经要闻

白银,暴跌!黄金,40年最大跌幅!

汽车要闻

新款宾利欧陆GT S/GTC S官图发布 V8混动加持

态度原创

教育
本地
艺术
公开课
军事航空

教育要闻

五年级必会题,最大公因数

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

艺术要闻

15位当代国外画家的16幅具象人物绘画

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

轰-6k在黄岩岛战备警巡示意图公布

无障碍浏览 进入关怀版