网易首页 > 网易号 > 正文 申请入驻

智能必须基于世界模型?我们和蚂蚁灵波团队聊了聊

0
分享至





编辑|泽南

大模型的革命行将结束,即将开启的会是物理 AI 时代?

上周,图灵奖得主、深度学习先驱 Yann LeCun 对通用人工智能(AGI)发表了自己的最新观点。他认为语言并不等同于智能,预测文本并不意味着理解现实。真实世界纷繁复杂、充满物理性和因果关系,而如今的大语言模型(LLM)几乎无法触及这些。



LeCun 认为,真正的智能必须能像人类一样,在脑海中进行推演,只有具备了这种「预测未来」的能力,AI 才能进行复杂的规划。

虽然关于 AI 技术理论的争鸣多发生在大洋彼岸,但令人出乎预料的是,在 2026 年开年,率先把物理 AI 这一最前沿的方向推进一步的,却是一家中国公司。

在刚刚过去的一周,蚂蚁集团旗下的蚂蚁灵波科技(Robbyant)以一种近乎「饱和式攻击」的节奏,连续四天开源发布了四款具身智能模型:高精度空间感知模型 LingBot-Depth、具身大模型 LingBot-VLA、世界模型 LingBot-World 到具身世界模型 LingBot-VA。



在机器之心与蚂蚁灵波 CEO 朱兴及首席科学家沈宇军的对话中,我们发现,蚂蚁正在通过一套独特的「逆向思维」,试图探索具身智能(Embodied AI)新路径 —— 从物理交互出发,在真实世界中构建智能。

蚂蚁的 AI First,不止于数字世界

下一个 AI 技术的突破将会是物理世界的 AI:世界模型、因果关系、真正的规划。蚂蚁灵波正在以行动验证这一重要趋势。

朱兴在采访中表示,蚂蚁的 AGI 版图包括数字智能与物理智能,在设立灵波科技前,蚂蚁已布局多家具身智能(Embodied AI)及机器人相关企业,覆盖整机、核心零部件、灵巧手、具身大模型等多个关键环节。2025 年,蚂蚁灵波科技正式成立,承担在具身领域探索 AGI 的使命。经过一年的研发,团队端出了四款具身模型,在一周内集中开源。

朱兴介绍,灵波的工作「从真实硬件出发」,希望从数字世界迈向物理世界,为机器人打造更聪明的大脑。

「我们笃定数字世界的智能还远没有达到上限,语言模型、多模态模型、视频生成模型还会进一步发展」,朱兴说,「蚂蚁的百灵团队负责数字智能的技术演进,灵波也积极参与其中,因为很多基础技术在具身模型的训练中可以复用。同时灵波还负责另一条路径的探索。」

他表示,「物理世界智能跟数字世界智能最大的不同,就是前者可以拿到真实世界的反馈。从真实反馈中学习往往是『智能』产生的必要条件。」

因此,灵波过去一年核心聚焦在具身基模的训练。「我们希望具身智能领域能和大语言模型一样,随着基模能力的提升让物理世界整体智能水涨船高。」

技术路线:真实数据优先

本次发布中最值得玩味的,是蚂蚁灵波对具身智能技术路线的「非主流」选择。

目前,具身智能领域的流行路径之一便是「Sim-to-Real」(从仿真到现实):其核心思路是,为了解决机器人训练数据稀缺、试错成本高等问题,先在仿真的虚拟环境中海量、安全地训练机器人(或 AI 智能体),再将习得的策略「迁移」到现实世界的机器人身上。

然而,蚂蚁灵波对此路径给出了不一样的观点。

「Sim-to-Real 不是我们选择的主技术路线,」沈宇军在采访中表示。「我们坚定认为基模的训练应该更多地使用互联网数据和真实数据。所谓的『真实数据成本高』也只是阶段性的,随着产业发展会有序解决,比如可以通过更低成本更加高效的数采方式等等。」

同时,沈宇军认为「仿真数据很多场景还无法模拟」的挑战是切实存在的 —— 流体、柔性物体、传感器误差,这些仿真很难搞定,解决周期可能比降低真实数据的采集成本更久。

相比于在虚拟温室里「造梦」,蚂蚁灵波选择了一条更艰难但可能更正确的路:互联网数据 + 真实数据。

这一思路在 LingBot-VLA 上得到了验证。基于九种主流构型的超两万小时高质量真机数据的预训练,该模型在权威评测中超越了一系列国际顶尖基线。这项技术引发了 AI 社区的关注,人们认为这是现实世界机器人技术的一大进步。



而作为本次发布的「压轴」,LingBot-VA 则彻底展现了灵波的技术野心。这是全球首个用于通用机器人控制的因果视频 - 动作世界模型。它学会了利用视频生成模型来实现「想象」,结合多模态模型的逻辑推理,再叠加真实环境的反馈。

蚂蚁灵波正在试图构建视频预测与现实世界行动之间的闭环。现在具身智能的 AI 已经可以基于单一模型预测未来的景象,并生成实现该视频所需的操作,仅通过 30-50 次真实世界的演示就能学习新技能,其成功率还要比常见的基准模型(如 π0.5)高出约 20%。



「我们发现,利用物理世界的数据叠加一层预训练,对具身模型能力的提升非常有帮助,」沈宇军表示。这解释了为什么 LingBot-VA 能在业界第一个实现「边推演、边行动」—— 它不是在死记硬背仿真数据,而是在试图理解物理规律。这似乎刚好回应了 Yann LeCun 对于 AI 在物理世界里实现预测的呼吁。

除此之外,在上周发布的深度视觉模型 LingBot-Depth 上,蚂蚁灵波探索了通过深度传感器误差作为掩码来优化深度图的深度补全模型,大幅降低了当前主流视觉深度相机的误差,让机器人「看的更清楚」。

而在 LingBot-World 上,该团队开源了视觉效果堪比谷歌 Genie 3 的实时可交互世界模型,其生成的世界严格遵循物理规律,也为具身智能的模拟打好了基础。

这些技术在全球机器学习社区吸引了大量关注,人们期待来自中国的开源技术可以改变业界现状。



不过在朱兴看来,蚂蚁灵波目前所做的还是打好基础:「具身智能总体技术阶段目前还处于早期,且技术路线也没有收敛,从这点来说(蚂蚁灵波的技术)没有什么是其他家一定做不到的。我们反而更关注模型本身能力的上限探索以及如何让生态伙伴用的更好。我们之所以做基模,很大的考量反而就是为了降低生态伙伴后训练的成本。而我们这次发布,也同步开源了高效的后训练代码,也是这一想法的落地。」

机器人的「DeepSeek 时刻」还在路上

在 2025 年的 1 月,DeepSeek R1 横空出世,用开源证明了低成本 + 强推理的可行性。如今随着灵波等公司的模型开源,具身智能领域是否也会迎来它的 R1 时刻?

对此,朱兴表示:「DeepSeek 时刻对具身智能来说还为时尚早,应该说 ChatGPT 时刻都还没有到来。面向下一步,我们会持续加强对具身世界模型的投入,探索具身智能的新上限。」

但也正是因为如此,蚂蚁灵波可以成为那个「点火者」。通过 InclusionAI 社区,灵波将这四款核心模型全部开源。朱兴的逻辑非常清晰:在路线尚未收敛的早期阶段,开源是推进行业进步的最优解,因此未来蚂蚁灵波的技术还会继续全面开放。

更深层的野心在于生态位。

不同于特斯拉 Optimus「造脑也造驱干」的封闭模式,蚂蚁灵波希望构建起机器人领域的「安卓系统」。「我们更侧重基模研发,初期就坚定选择了跨构型的路径,通过跟行业内相关数据提供商深入合作来满足模型训练数据多样性的需要,」朱兴解释道。

当然,机器人的本体千差万别,基于统一的基础模型,任务执行的成功率还会受到影响。蚂蚁灵波的策略是提供高效的「后训练工具链」,让硬件厂商能用更低的数据量和 GPU 成本,将灵波的「大脑」适配到自己的「身体」上。

这或许才是开源背后的真正商业护城河。

终局猜想

蚂蚁造的具身智能,最终会去哪?

虽然商业模式会「自然而来」,但蚂蚁基因中的服务业属性,或许可以让我们猜测一下灵波「大脑」加持的机器人会是什么样子。从民生服务到普惠金融,蚂蚁的优势在于连接人与服务。

蚂蚁灵波期待随着技术成熟,以具身智能形式呈现的服务能够更好地走入物理世界,更好的服务于人。

当然,眼前的挑战依然巨大。沈宇军表示,从技术角度上看,强化学习(RL)的具体落地范式尚未收敛,AI 推理中至关重要的 System 2(慢思考)的能力仍在探索中,这些都可能是制约下一步技术大规模落地的瓶颈。

但背靠蚂蚁集团 AGI 整体战略,业界一梯队的 AI Infra 支持,以及坚定的资金投入,灵波显然已经做好了打持久战的准备。

随着蚂蚁灵波最近四个模型的连续发布和开源,蚂蚁的 AI 战略实现了从数字世界到物理世界的关键延伸,这标志着其「基础模型 - 通用应用 - 实体交互」的全栈路径已经逐渐清晰。下一步,蚂蚁灵波计划持续探索模型能力的提升,尤其是世界模型跟具身智能的深度结合,并积极拓展生态,协助生态合作伙伴实现落地,让机器人真正走入商业应用。

一个深度融合、开源开放并服务于真实场景的 AGI 生态,正在加速成型。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
影帝这么矮小!五一假期梁朝伟现身南京,身高与随性穿搭引发热议

影帝这么矮小!五一假期梁朝伟现身南京,身高与随性穿搭引发热议

火山詩话
2026-05-02 08:30:27
41岁单核六场晋级!詹皇28+8+7迎里程碑 系列赛得分王不值顶薪?

41岁单核六场晋级!詹皇28+8+7迎里程碑 系列赛得分王不值顶薪?

颜小白的篮球梦
2026-05-02 12:12:34
美国国防部长已下令从德国撤出5000名驻军,撤军工作将在未来6至12个月内完成

美国国防部长已下令从德国撤出5000名驻军,撤军工作将在未来6至12个月内完成

鲁中晨报
2026-05-02 07:55:05
44.4吨钚与9万亿军费:日本“核突破”倒计时,中方已正式出手

44.4吨钚与9万亿军费:日本“核突破”倒计时,中方已正式出手

起喜电影
2026-05-02 12:21:54
51:47!美国投票结果出炉,又一个国家危险了,中国力挺老朋友

51:47!美国投票结果出炉,又一个国家危险了,中国力挺老朋友

近史博览
2026-05-02 10:55:04
雷军估计更绝望了,北京车展181款首发新车,卖给谁呢?

雷军估计更绝望了,北京车展181款首发新车,卖给谁呢?

DearAuto
2026-05-01 11:56:57
美国警告赖清德当局,只要大陆决定武力统一,台湾的结局只有一个

美国警告赖清德当局,只要大陆决定武力统一,台湾的结局只有一个

猫女的小树屋
2026-05-02 10:14:06
4月最后一夜爆雷潮!9龙头亏超百亿,53股巨亏,4大高危板块曝光

4月最后一夜爆雷潮!9龙头亏超百亿,53股巨亏,4大高危板块曝光

慧眼看世界哈哈
2026-05-01 05:59:44
“让我先走,我要去娶我最爱的人,全程1146公里”高速上一车上横幅火了!

“让我先走,我要去娶我最爱的人,全程1146公里”高速上一车上横幅火了!

上观新闻
2026-05-02 10:01:05
商业航天也爆雷!业绩最大降100%,章盟主、社保基金却还在抢筹

商业航天也爆雷!业绩最大降100%,章盟主、社保基金却还在抢筹

长风价值掘金
2026-05-02 11:06:14
火箭惨败出局!乌度卡场下频频摇头 范乔丹气笑了 三分28中5铁哭

火箭惨败出局!乌度卡场下频频摇头 范乔丹气笑了 三分28中5铁哭

颜小白的篮球梦
2026-05-02 12:17:12
新华社消息|商务部:坚决反对美国联邦通信委员会审议通过检测认证和电信领域相关限制措施

新华社消息|商务部:坚决反对美国联邦通信委员会审议通过检测认证和电信领域相关限制措施

新华社
2026-05-01 14:48:10
3亿美元!央视不买世界杯的转播权,没想到球迷一边倒的支持

3亿美元!央视不买世界杯的转播权,没想到球迷一边倒的支持

魔都姐姐杂谈
2026-05-02 08:44:52
陈晓旭的这张照片,真的是护手霜宣传图吗

陈晓旭的这张照片,真的是护手霜宣传图吗

我来我看见
2026-05-02 00:38:35
地球已经装不下追觅这么牛的公司了

地球已经装不下追觅这么牛的公司了

老斯基财经
2026-04-30 11:05:19
俞浩再放狠话:追觅手机要与苹果、三星三分天下

俞浩再放狠话:追觅手机要与苹果、三星三分天下

IT之家
2026-05-02 12:35:08
官方:日本将在北京时间5月31日18点25分和冰岛进行热身赛

官方:日本将在北京时间5月31日18点25分和冰岛进行热身赛

懂球帝
2026-05-01 16:54:06
荷兰发达到什么程度了?人口仅1700万,却拥有12个世界五百强!

荷兰发达到什么程度了?人口仅1700万,却拥有12个世界五百强!

抽象派大师
2026-04-30 00:16:18
太阳报:哈兰德620万镑购10居豪宅,计划建车库存超跑

太阳报:哈兰德620万镑购10居豪宅,计划建车库存超跑

懂球帝
2026-05-02 13:14:49
上海申花遭暴击!盖伊左脚跟腱断裂,将接受手术,或长期缺席

上海申花遭暴击!盖伊左脚跟腱断裂,将接受手术,或长期缺席

奥拜尔
2026-05-02 10:36:52
2026-05-02 14:32:53
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12902文章数 142639关注度
往期回顾 全部

科技要闻

AI热潮耗尽库存,Mac Mini起售调高200美元

头条要闻

男子被诊断为疑似肝癌 辗转其他医院检查均无癌症依据

头条要闻

男子被诊断为疑似肝癌 辗转其他医院检查均无癌症依据

体育要闻

休赛期总冠军,轮到休斯顿火箭

娱乐要闻

白百何罕晒大儿子 18岁元宝越来越帅

财经要闻

雷军很努力 小米还是跌破了30港元大关

汽车要闻

新纪录!零跑汽车4月交付达71387台

态度原创

艺术
健康
家居
公开课
军事航空

艺术要闻

色块与笔触的激情之旅!

干细胞治烧烫伤面临这些“瓶颈”

家居要闻

灵动实用 生活艺术场

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普:对伊战事结束 无限期延长停火

无障碍浏览 进入关怀版