网易首页 > 网易号 > 正文 申请入驻

2700GB高质量数据,训出空间智能SOTA,背后秘诀全栈开源

0
分享至

一凡 发自 凹非寺
量子位 | 公众号 QbitAI

什么在限制空间智能落地?

从自动驾驶到具身智能,行业对此的共识是:数据

因为数据不够,模型泛化能力就弱,只能靠硬件来凑。

这在机器人身上体现得尤为明显。机器人要感知空间,常用的硬件是RGB-D相机,它既能看懂RGB图像,又能感知深度,从而获取到三维立体信息,让机器人理解物理世界。

但问题是,机器人的这双眼并不靠谱,遇到镜子、电梯、玻璃门等透明物体或者反光表面,RGB-D相机就容易失效,导致机器人感知异常。

这些场景绕不开,躲不掉,都是机器人走进千家万户,一定会碰到的问题,必须要解决。但因为缺少数据底座,行业过去的解决方式一般是靠堆硬件,补短板,强化感知能力。

这种局面即将迎来改变。因为就在刚刚,具身智能的基建玩家出手,对症下药,推出了一个开源数据基座。基于这个基座训练的模型,都已经实现SOTA了。

空间智能卡在哪儿了?

空间智能给了机器人一双眼睛和小脑,机器人靠它才能实现感知、规划、导航和精细操作。

比如说机器人需要拿起面前的杯子,它不光要看懂这是杯子,还需要知道杯子离自己有多远、边界在哪儿。

问题是,实现空间智能并不容易,需要依靠大规模、高质量的数据。互联网上已有的海量RGB图像,规模确实大但不符合要求,因为它只能“喂”给AI二维信息,AI很难从中生长出三维空间的理解能力。

所以行业这些年一直在给AI补空间理解这门课,路线也不少,有RGB-D相机、激光雷达和3D重建等方法。

其中RGB-D相机路线一直都很受欢迎,因为它就像给AI开了“第三只眼”,不光能测长和宽,还能测量距离,而且不需要复杂后处理,可以实时感知环境。

但RGB-D路线也有不足,主要有两个问题。首先第一个问题是,采集任务本身比较困难,不是说简单地举个相机,找个机位,“咔嚓”一拍就完事儿。不仅需要检查左右图像一致性,还要对RGB图像和深度信息进行时空同步,以及处理不同硬件之间的差异。

这还不算完,获取到RGB-D数据后,第二个问题接着就来了,研究者会发现其实RGB-D相机有时候很不靠谱,碰到玻璃、镜面、金属反光材质和白墙这种低纹理表面就容易失效。

还是以机器人拿杯子为例,咱们日常生活看到的杯子一般都长这样:



而在RGB-D相机的深度传感器下,杯子be like酱婶儿:



在机器人的视角里,两个杯子直接连成了一块,根本难以分辨,也自然无法准确拿取。RGB-D相机的不稳定,进一步导致了高质量RGB-D数据的缺失。

蚂蚁灵波开源空间智能数据基建

为了缓解行业的数据痛点,蚂蚁灵波最近开源了LingBot-Depth-Dataset数据集,其总体规模达到2.71TB,包含300万对标注RGB-D数据,每一对样本都包含一张RGB图像、传感器原始深度图和真值深度图

其中大部分都是真实数据,大约有200万对,140万对是由多台RGB-D相机采集自真实室内场景的数据RobbyReal(如下图所示),以及58万对由机器人在VLA任务中采集的数据RobbyVla



这些真实数据的来源非常广泛,包括住宅、教室、博物馆、商店、医院、健身房和电梯等各种生活场景,数据来源丰富,作为训练底座时就能增强模型的泛化性。

此外还有约100万对由双相机视角渲染生成的合成数据RobbySim



其余部分都是RobbySimVal,含有3.8万条数据,作为仿真数据的验证集。这种虚实融合采集数据的方式,既能覆盖一些边缘场景,也能降低数据采集成本。



规模大、场景丰富,只是数据集可以被行业广泛使用的必要条件,但还不是全部。

LingBot-Depth-Dataset还有一个值得关注的地方在于数据分布的多样性,它在构建时使用Orbbec 335、335L,RealSense D405、D415、D435、D455这6款主流深度相机进行采集,不同相机在成像特性、噪声模式、深度精度上各有差异,使得数据集天然覆盖了多种传感器分布,为下游研究和模型训练提供了更丰富的数据基础。

这意味着这座数据金矿,可以被更多研发团队挖掘,成为空间智能的数据基建。

打造具身智能的“大脑平台”

蚂蚁灵波开源的这套数据基建,缓解了开源社区缺乏真实场景拍摄数据的问题,不仅量大管饱,而且战绩可查

今年年初,蚂蚁灵波发布了LingBot-Depth模型,LingBot-Depth主要基于LingBot-Depth-Dataset数据集训练,在多项权威深度补全基准测试如iBims、NYUv2和DIODE上实现了SOTA



而当LingBot-Depth部署到真实环境后,可以驱动机器人稳健抓取透明和反光物体,这在以往可以说是天方夜谭的事情。



随后,蚂蚁灵波又紧接着开源了LingBot-VLA,打通视觉、语言和动作,驱动机器人做出决策。

紧随其后开源的LingBot-World,则为模型提供了仿真训练场。

当时压轴登场的LingBot-VA,则率先让世界模型直接驱动机器人动作,实现了“边推演,边执行”,引领了具身研究的趋势。



从感知到决策,从模型到数据,蚂蚁灵波正在打造具身智能的“大脑平台”。其最新开源成果,也启发着行业思维转向。

物理AI数据先行

追根溯源来看,这种通过软件方法加强感知能力,而不是一味堆传感器的思想,体现了计算机科学中的软件硬件等效原理

那软件和硬件手段应该如何取舍?与具身智能同属物理AI的自动驾驶行业,已在该问题上形成了共识,值得参考借鉴:

首先最值得重视的是数据和算法架构。前者是AI迭代的基石,后者是指将多个算法整合形成合力,并长期积累的能力。

其次才是堆更多数量和价格更高的传感器。自动驾驶从业者普遍认为,随着数据越来越多,再加上算法架构持续升级,模型的空间感知能力会越来越强,这时再堆传感器,虽然有用,但是提升的效果会越来越弱。

正是有了这样的共识,行业才打下了硬件成本,为自动驾驶商业化繁荣奠定了基础。

自动驾驶的实践已经证明,物理AI落地,优先考虑软件手段,这并不会削弱空间智能,还可以推动商业化。这同样也是蚂蚁灵波开源一系列模型和数据集,给具身智能行业带来的启发:

加强空间智能,数据算法优先,不必追逐昂贵硬件。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
知名女演员陈妍希突发意外致跟腱断裂,决定暂停或调整部分工作,本人晒图报平安

知名女演员陈妍希突发意外致跟腱断裂,决定暂停或调整部分工作,本人晒图报平安

封面新闻
2026-03-31 19:07:05
比亚迪:净减员10万人!

比亚迪:净减员10万人!

品牌头版
2026-03-30 17:00:40
被逼到墙角?莫迪发出最后警告:再不放行化肥,14亿人将迎来危机

被逼到墙角?莫迪发出最后警告:再不放行化肥,14亿人将迎来危机

泠泠说史
2026-03-31 16:36:07
美以袭击伊朗核设施 外交部表态

美以袭击伊朗核设施 外交部表态

财联社
2026-03-31 15:26:07
31号收评:李嘉诚巴菲特同时清仓释放何信号?A股后市将何去何从

31号收评:李嘉诚巴菲特同时清仓释放何信号?A股后市将何去何从

春江财富
2026-03-31 15:47:20
突发!跌入熊市!

突发!跌入熊市!

中国基金报
2026-03-31 16:22:25
山西省委:坚决拥护党中央决定

山西省委:坚决拥护党中央决定

极目新闻
2026-03-31 20:51:15
34岁法国车手,骑张雪机车在顶级赛事中夺冠:曾在圈内人眼里已完全告别主流摩托赛事,“落魄十年”重回巅峰

34岁法国车手,骑张雪机车在顶级赛事中夺冠:曾在圈内人眼里已完全告别主流摩托赛事,“落魄十年”重回巅峰

极目新闻
2026-03-31 20:09:28
王建军被逮捕!

王建军被逮捕!

农民日报
2026-03-31 10:28:33
宋宁峰疑带女儿出轨,两人互发不雅照录音曝光,小三是高露好友

宋宁峰疑带女儿出轨,两人互发不雅照录音曝光,小三是高露好友

古希腊掌管松饼的神
2026-03-31 11:58:42
中国太阳能厂商被指在逆变器安装"自杀开关" 可远程关闭用户设备

中国太阳能厂商被指在逆变器安装"自杀开关" 可远程关闭用户设备

齐天候
2026-03-31 16:23:18
谁也没有想到,伊朗"超级内鬼"会是他?

谁也没有想到,伊朗"超级内鬼"会是他?

麓谷隐士
2026-03-31 20:11:31
特朗普:美国会记住法国“极不配合”对伊军事行动

特朗普:美国会记住法国“极不配合”对伊军事行动

界面新闻
2026-03-31 19:36:10
国乒首败!王皓气惨了,世乒赛或遭弃用,张本智和3-1开门红

国乒首败!王皓气惨了,世乒赛或遭弃用,张本智和3-1开门红

十点街球体育
2026-03-31 19:21:04
已有惨剧发生!张雪机车再回应禁止新手购买820RR:希望少死几个人

已有惨剧发生!张雪机车再回应禁止新手购买820RR:希望少死几个人

快科技
2026-03-31 10:54:10
800万美国民众抗议,特朗普终于承认:就是为了伊朗石油

800万美国民众抗议,特朗普终于承认:就是为了伊朗石油

兵国大事
2026-03-30 21:19:53
“玩具店主买卖枪支案”两当事人各获国赔16万余元,均被羁押279天

“玩具店主买卖枪支案”两当事人各获国赔16万余元,均被羁押279天

大风新闻
2026-03-31 20:54:07
全网震怒!港车在内地肇事逃逸,现场画面曝光!

全网震怒!港车在内地肇事逃逸,现场画面曝光!

港漂圈
2026-03-31 19:45:11
彻底崩了!以色列!噩梦来了!

彻底崩了!以色列!噩梦来了!

大嘴说天下
2026-03-31 18:37:38
郑丽文受邀访问大陆,蒋万安再发声:坚持反对统一,要求对等尊严

郑丽文受邀访问大陆,蒋万安再发声:坚持反对统一,要求对等尊严

阿天爱旅行
2026-03-31 16:37:00
2026-03-31 22:07:00
量子位 incentive-icons
量子位
追踪人工智能动态
12385文章数 176434关注度
往期回顾 全部

科技要闻

华为2025年销售收入8809亿,净利润680亿元

头条要闻

男子玩具店买枪被羁押279天获国赔16万:打官司花40万

头条要闻

男子玩具店买枪被羁押279天获国赔16万:打官司花40万

体育要闻

县城修车工,用20年成为世界冠军

娱乐要闻

《月鳞绮纪》空降 鞠婧祎却被举报偷税

财经要闻

油价暴涨 我们的生活成本会飙升多少?

汽车要闻

腾势Z9GT到底GT在哪?

态度原创

房产
家居
旅游
游戏
本地

房产要闻

重磅!海南城市更新拟出新政!

家居要闻

新婚爱巢 甜蜜情趣拉满

旅游要闻

视频丨开启一场“说走就走”之旅 中国入境游市场热力攀升

R星平台更没用了!账户迁移至官网 为GTA6准备?

本地新闻

用Color Walk的方式解锁城市春日

无障碍浏览 进入关怀版