网易首页 > 网易号 > 正文 申请入驻

当一只杯子决定坠落:原力灵机与“收束世界线”的工程学

0
分享至


作者 | 王启隆 责编 |梦依丹

出品 | CSDN(ID:CSDNnews)

物理世界最迷人也最残酷的地方在于,它没有 Ctrl+Z。

在数字世界里,ChatGPT 可以胡说八道,大不了你重新生成一次;Midjourney 画崩了手,你再跑一张图也就是几秒钟的算力成本。但在具身原生·原力灵机技术开放日现场,这家公司试图向我们展示的,是另一种截然不同的“智能焦虑”。


这种焦虑关乎重力,关乎摩擦,关乎因果律。

当你命令一个机器人“收拾桌子”时,如果它的动作偏差了 5 毫米,或者抓握力度小了 1 牛顿,后果可能不是生成了一行乱码,而是一地碎玻璃。

“我们把数据工作定义为 ‘收束世界线’。”

周而进,原力灵机合伙人,用了一个极其硬核科幻的比喻。在他的描述中,具身智能(Embodied AI)的本质,是在无数个平行的、混乱的、熵增的宇宙中,强行找到那条唯一的、杯子稳稳落在桌面上、没有打翻水、也没有捏碎玻璃的“成功轨迹”。

这听起来像是在拍《信条》,但这确实是 2026 年初,这家由一群 AI 1.0 时代老兵(前旷视科技联合创始人唐文斌带队)组成的创业公司,在“百模大战”的余烬中试图开辟的新战场。

他们没有发布千亿参数的聊天机器人,而是拿出了一个仅有 2.4B 参数的具身大模型 DM0,以及一套名为 Dexbotic 2.0 的开发框架。他们的野心很明确:如果说 GPT 是互联网数据的压缩,那么他们想做的是“物理规律的压缩”。

这是一场关于“身体”的保卫战,也是一场对 Scaling Law(尺度定律)的重新审视。


逃离“互联网借智”:为什么机器人需要从头学步?

在很长一段时间里,具身智能领域流行一种“拿来主义”。

大家习惯的做法是:下载一个开源的 VLM,给它装上一双手,然后通过微调告诉它:“嘿,这是苹果,把它拿起来。”

这种做法看似讨巧,利用了互联网大模型海量的泛化知识。但在周而进看来,这就像是让一个读遍了百科全书但从未下过地的“缸中之脑”去踢足球。

“你能想象一个婴儿,是先学会了对话、学会了背唐诗,然后才学会爬、学会找奶瓶的吗?”周而进在采访中反问道,“如果是那样,这个婴儿早就饿死了。”

这就是原力灵机强调的“具身原生”(Embodied Native)概念的起点。

人类的智能发育,是从感知重力、感知距离、感知冷热开始的。我们的语言能力,是建立在对物理世界深刻理解的“地基”之上的。而现在的许多具身模型,地基是悬空的。它们认识“苹果”这个词,能写出苹果的营养成分表,但它们不知道苹果表面的摩擦系数,不知道用力捏会流汁水,不知道圆球体在桌面上会滚动。

为了解决这个问题,原力灵机做了一个大胆的决定:不继承现有的 VLM,而是从零开始训练一个真正懂物理的大模型。


这不仅仅是数据源的替换,更是认知维度的重构。

周而进在现场补充了一个极具洞察力的观点:“自动驾驶其实是具身智能的一个子集,但它的容错率极低。而现在的机器人,需要的不是那种只懂交通规则的脑子,而是包含了室内导航、复杂操作、人机交互的 ‘全能脑’。”

在 DM0 的训练集中,他们引入了三类数据:

  • 互联网数据:提供通用的物体识别和语义理解(这是常识,比如知道“把红色的杯子拿来”中的红色是什么)。

  • 自动驾驶数据:这是目前人类拥有的最大规模的“开放物理世界描述”。它教会模型理解透视、遮挡、运动物体的轨迹预测。

  • 具身原生数据:这是最稀缺的。是机械臂每一次抓取、每一次碰撞、每一次失败的记录。

“以前大家争论是用哪个大模型来改,我们直接跳出这个问题——为什么要改?为什么不从第一行代码就为机器人而写?”

这种“原生”的执念,直接导致了 DM0 在架构上的反常规。


2.4 B 的反击:智能密度与“毫米级”的尊严

在闭源三巨头迈向万亿参数的时代,DM0 的参数量只有 2.4 B(24亿)。

在很多媒体眼中,这甚至算不上“大”模型。但在工业现场,这个数字代表着一种极致的工程美学。

“大家都在问 ‘用哪个大模型最好’,我们问的是 ‘为什么要用大模型’?”周而进解释道。在具身场景下,模型不是用来写诗的,它是用来干活的。

这里涉及到一个核心矛盾:推理延迟 vs 物理响应。

工业流水线上的节拍通常是毫秒级的。一个工件流过来,机器人必须在 0.1 秒内决定怎么抓。如果模型为了追求“博学”,搞了几百亿参数,推理一次需要 2 秒,那黄花菜都凉了。

DM0 的 2.4 B 参数,配合 60ms 的端到端推理延迟(在消费级 5090 显卡上甚至更快),恰好卡在了这个“实用性”的甜点上。

但这引发了另一个质疑:这么小的模型,脑子够用吗?

DM0 把技能点加在了“空间推理思维链”(Spatial CoT)上。

传统的 VLA(视觉-语言-动作)模型,往往只能做到“大概齐”。比如“拿起杯子”,它知道杯子在哪,但手伸过去的时候可能是歪的。

而 DM0 引入了一种特殊的思维链机制。当它接到指令时,它不会直接输出动作,而是先在脑子里构建一个 3D 的空间坐标系,进行Physical Grounding(物理定位)。

这一切,都发生在那个小小的 2.4 B 模型里。它去掉了写代码、讲笑话的冗余神经元,只保留了对物理世界最敏锐的直觉。

在原力灵机联合Hugging Face发起的大规模真机测评体系 RoboChallenge 上,DM0 在 30 多个桌面级任务中拿到了综合得分第一。这证明了:在物理世界里,精准的直觉远比广博的知识更重要。


数据哲学:在熵增的宇宙里寻找确定性

这次沟通会最让我印象深刻的,不是那些跑分,而是他们对“数据”的哲学思考。

“熵在哪里,数据就投向哪里。”

这是范浩强(原力灵机合伙人)提出的数据采集策略。他们似乎不迷信仿真(Simulation),而坚持要搞大量真机实操。

在仿真环境里,物理规律是人写的。F=ma 永远成立,摩擦力永远是恒定的。这是一个低熵的、确定的世界。

但在真实世界里,情况要复杂得多。

比如“抓取一个装满水的软塑料瓶”。

  • 用力太大,水会喷出来,重心会变。

  • 用力太小,瓶子会滑落。

  • 瓶身可能有水珠,摩擦系数瞬间降低。

这种“非结构化的不确定性”,是仿真器模拟不出来的。这就是“熵”最高的地方。

周而进用“平行宇宙”来解释他们的训练目标:“因为你拿起了手机,瓶子可能会被碰掉。你每一个微小的动作差异,都会导致未来世界线的分叉。我们采集数据的目的,就是告诉模型:在这一万种分叉的可能性中,哪一条线是你能把活干完,而且不闯祸的。”

为了捕捉这些“高熵”数据,原力灵机甚至去印尼接过自动化项目,去物流仓库里通过遥操作(Teleoperation)采集数据。

他们发现,那些最难用规则描述的场景——比如把一堆乱七八糟的快递分拣开,或者把缠在一起的数据线解开——恰恰是具身大模型最能发挥价值的地方。

“对于规则清晰的任务(如下围棋),数据等于算力,你可以在仿真里无限自我对弈。但对于规则模糊的任务(如收拾房间),数据等于经验的映射。”

这解释了为什么特斯拉做 Optimus 也要靠人穿着动捕服去叠衣服,而不是在电脑里跑仿真。因为物理世界的“手感”,是算不出来的,只能练出来。


商业化的“冷水澡”:2026 依然不是爆发年

在软件工程里,程序员最喜欢的指令之一叫 try catch。它的意思是:如果代码运行出错了,没关系,捕获这个错误,让程序继续跑,或者优雅地报错。

但在物理世界里,没有 try catch。

当一个重达几百公斤的工业机器人挥舞着机械臂砸向地面,或者一个服务机器人把滚烫的咖啡泼在用户身上时,你无法通过一行代码来“捕获”这个错误。物理世界的异常,往往意味着损坏、赔偿,甚至人身伤害。

现在的具身智能赛道,热得发烫。融资新闻满天飞,人形机器人排队上市。但在这种狂热中,原力灵机的高管们却显得异常冷静,甚至有点“泼冷水”的意味。

“2026 年是闭不了环的。”范浩强直言不讳,“这应该是业界共识。”

他把 2026 年定义为“真应用涌现之年”,但也仅仅是涌现,离规模化复制还有距离。现在大多数的落地,还停留在 POC(概念验证)阶段——在客户的工厂里搭个小棚子,跑个几百次,拍个视频,领导来了演示一下,然后运回去。

这不叫商业化,这叫“高科技路演”。

唐文斌认为,真正的商业闭环,必须回答两个极其朴素的问题:

  1. 流程是否完整闭环?机器人能不能处理 100% 的情况?如果掉了东西怎么办?如果遇到没见过的包装怎么办?在物流场景里,80% 的代码是在处理异常(Exception Handling),而不是在处理正常流程。

  2. 账算不算得过来?你用一个几十万的机器人,替代一个几千块工资的工人,ROI(投资回报率)在哪里?

原力灵机最终锁定的第一战场是——物流分拣与上下料

这是一个完美的靶场:环境相对结构化(仓库),对象极端非结构化(千万种 SKU),允许偶尔抓不住(重抓一次就行),而且是高强度的重复劳动。


做“卖铲子”的人,也做“挖金矿”的人

如果是做纯软件的 AI 公司,发个模型就完事了。但原力灵机花了一整年的时间,开发了一套开源框架 Dexbotic 2.0,还搞了一个评测平台 RoboChallenge。

现场有记者问,你们到底是家什么公司?

他们说,“我们一定是一个机器人公司”。

在媒体沟通会上,汪天才(原力灵机合伙人)把 Dexbotic+RLinf 比作“具身智能的 PyTorch”。

这又是一个反直觉的动作。创业公司通常是做应用的,做基建(Infra)是大厂的活儿。

唐文斌的解释很实在:“因为我们发现,这个行业连个能用的轮子都没有。”

具身智能现在的状态,很像 2012 年之前的深度学习。大家各自为战,每个实验室都有自己的一套代码,数据格式不通,接口不通,连评测标准都不一样。

A 公司的模型只能控制 A 公司的机械臂。

B 大学的仿真数据喂不进 C 公司的模型里。

大家都在重复造轮子,而且造的都是方轮子。

“我们不认为现在的模型结构是终局。我们甚至不认为端到端是唯一的解。”汪天才说。提供一个标准化的框架,是为了让整个行业——包括高校、研究机构、友商——能够在一个统一的语境下对话。

这是一种“修路”的逻辑。虽然修路很苦,不赚钱,但路修好了,跑在上面的车(模型和应用)才能快起来。而原力灵机赌的是,自己造的那辆车(DM0),会是这条路上跑得最快的一辆。

走出金隅智造工场,北京的寒风依旧。

原力灵机这家公司,给人的感觉很复杂。他们身上既有学院派的理想主义(坚持搞开源、搞评测、搞基础理论),又有江湖派的实用主义(去仓库搬箱子、算细账、搞脏活累活)。

他们既想做“卖铲子”的人——通过 Dexbotic 和 RoboChallenge 定义行业标准,成为具身智能时代的“基础设施供应商”;又想做“挖金矿”的人——亲自下场,用 DM0 打造出真正的机器人产品,解决具体的物理世界难题。

这听起来很矛盾,但这或许正是 AI 2.0 时代创业公司的典型样本。

在巨头环伺、资本退潮的当下,单靠讲故事已经拿不到钱了。你必须证明你有仰望星空的能力(搞定 SOTA 模型),同时证明你有脚踏实地的身段(搞定客户的账单)。

2026 年或许不是具身智能的元年,但它很可能是“具身原生”觉醒的一年。

从这一年开始,机器人不再是只会执行死命令的机器,也不再是只会聊天的音箱。它们开始长出自己的眼睛,学会用自己的身体去感知重力、摩擦和碰撞。它们开始在无数次跌倒和失败中,收束那条通往成功的世界线。

而原力灵机,正站在这个十字路口,试图用 2.4 B 的模型和无数行的代码,为这个即将到来的物理智能时代,铺上一块坚实的垫脚石。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
章若楠食品级小脚丫,好嫩呀

章若楠食品级小脚丫,好嫩呀

老吴教育课堂
2026-02-11 19:10:31
TVB前实习记者邬凯宁转身成香港重案组总督察,网友:《陀枪师姐》没骗我,人生真有无限可能

TVB前实习记者邬凯宁转身成香港重案组总督察,网友:《陀枪师姐》没骗我,人生真有无限可能

台州交通广播
2026-02-12 04:33:22
高中锋因伤无缘世界杯,西班牙队损失“攻城锤”

高中锋因伤无缘世界杯,西班牙队损失“攻城锤”

体坛周报
2026-02-11 17:55:10
“冬萍一笑,生死难料”后续:前夫已重启人生,那燕冬萍呢?

“冬萍一笑,生死难料”后续:前夫已重启人生,那燕冬萍呢?

大鱼简科
2026-02-10 16:54:05
湖南小城传来一声怒吼,垄断全球90%产能,堪称春节最大赢家!

湖南小城传来一声怒吼,垄断全球90%产能,堪称春节最大赢家!

青梅侃史啊
2026-02-11 10:43:02
3-1!奥运冠军樊振东狂砍2分!国乒球迷盼回归训练

3-1!奥运冠军樊振东狂砍2分!国乒球迷盼回归训练

好乒乓
2026-02-12 01:17:55
祖巴茨:在给孩子热奶瓶的时候接到了电话,意识到可能被交易

祖巴茨:在给孩子热奶瓶的时候接到了电话,意识到可能被交易

懂球帝
2026-02-11 17:38:43
油价一夜大变!2月11日全国加油站调价后的92、95号汽油价格最新公布

油价一夜大变!2月11日全国加油站调价后的92、95号汽油价格最新公布

沙雕小琳琳
2026-02-11 09:57:12
泽连斯基否认将于近期公布乌总统选举计划

泽连斯基否认将于近期公布乌总统选举计划

新华社
2026-02-12 05:53:01
这可能是中日经济的最后一战,中国两张王牌,日本或将塌方式溃败

这可能是中日经济的最后一战,中国两张王牌,日本或将塌方式溃败

小嶯说故事
2026-01-28 20:39:45
春运用电饭锅抢票?玄学背后的一场“闹剧”

春运用电饭锅抢票?玄学背后的一场“闹剧”

中国网
2026-02-10 22:08:22
远嫁河北三十多年的六旬婆婆,乘28小时火车回四川探望八旬母亲,还带了软柿树苗种在娘家,希望母亲能吃到

远嫁河北三十多年的六旬婆婆,乘28小时火车回四川探望八旬母亲,还带了软柿树苗种在娘家,希望母亲能吃到

黄河新闻网吕梁频道
2026-02-11 08:52:35
中国成最大输家?欧盟印度签订自贸协定,德媒:中国将损失数千亿

中国成最大输家?欧盟印度签订自贸协定,德媒:中国将损失数千亿

户外钓鱼哥阿旱
2026-02-11 12:34:23
文班8分钟25分全美第1热搜!张伯伦降临 冲GOAT 思念科比言论被扒

文班8分钟25分全美第1热搜!张伯伦降临 冲GOAT 思念科比言论被扒

颜小白的篮球梦
2026-02-11 12:23:04
1949年,江青随毛主席赴苏为70岁的斯大林庆寿,可看到最终送出的寿礼后,她不由得陷入尴尬

1949年,江青随毛主席赴苏为70岁的斯大林庆寿,可看到最终送出的寿礼后,她不由得陷入尴尬

文史明鉴
2025-12-31 21:38:18
震惊!学晶风波幕后黑手竟是呼喊多年的学弟!

震惊!学晶风波幕后黑手竟是呼喊多年的学弟!

复转这些年
2026-02-10 19:34:37
波兰发起斩首行动?俄军中将死里逃生,普京大怒,发射数十枚导弹

波兰发起斩首行动?俄军中将死里逃生,普京大怒,发射数十枚导弹

史智文道
2026-02-11 19:29:11
掌舵宁波银行21年,陆华裕即将谢幕

掌舵宁波银行21年,陆华裕即将谢幕

达摩财经
2026-02-11 16:02:23
铁了心对付中国?暴跌58%,俄罗斯大幅加税,中国汽车出口骤降

铁了心对付中国?暴跌58%,俄罗斯大幅加税,中国汽车出口骤降

卷史
2026-02-02 12:01:46
英超最新积分战报:两大豪门意外翻车,热刺连败,掉到第16

英超最新积分战报:两大豪门意外翻车,热刺连败,掉到第16

足球狗说
2026-02-11 06:40:45
2026-02-12 06:39:00
CSDN incentive-icons
CSDN
成就一亿技术人
26318文章数 242230关注度
往期回顾 全部

科技要闻

V4来了?DeepSeek 灰度测试新版本

头条要闻

遭特朗普威胁 卡尼一个电话打过去:47亿美元我们付的

头条要闻

遭特朗普威胁 卡尼一个电话打过去:47亿美元我们付的

体育要闻

搞垮一个冬奥选手,只需要一首歌?

娱乐要闻

大孤山风波愈演愈烈 超50位明星扎堆

财经要闻

广州前首富被判无期 200亿集资窟窿何偿

汽车要闻

比亚迪最美B级SUV? 宋Ultra这腰线美翻了

态度原创

本地
艺术
亲子
旅游
教育

本地新闻

下一站是嘉禾望岗,请各位乘客做好哭泣准备

艺术要闻

世界代表建筑大全,你知道几个?

亲子要闻

寒假在家卷运动,手眼协调练一练

旅游要闻

忻州云中河景区上“新妆”!过年去打卡啊~

教育要闻

高三地理备考:特殊天气系统核心知识点梳理

无障碍浏览 进入关怀版