来源:北京日报客户端
“为什么不从第一行代码就为机器人而写?2026年不是具身智能的元年,而是‘具身原生’的元年。”在北京中关村展示中心举行的“具身原生”主题原力灵机技术开放日上,原力灵机CEO唐文斌在现场提出了这一观点。
唐文斌曾任旷视联合创始人、CTO。他在演讲中直言行业痛点道,“今天的具身模型,像是一个初中毕业才被送进体校的学生——根骨不强,文化课也落下了。”他提出,真正的具身智能不应是后天将各种能力进行嫁接的产物,而应从数据、训练、架构三个维度实现“具身原生”。这意味着,对具身大模型而言,它不仅仅是一个能在机器人上运行的大模型,而应是一个“智能本质和形成机制都根植于物理交互的新AI范式”。
以当日发布的具身大模型DM0为例,该模型非基于其他大模型进行改造而成,而是一款“从0开始”训练的“具身原生”大模型。该模型与大模型企业阶跃星辰联合训练,除融合了多模态互联网信息外,还涵盖了驾驶行为数据、机器人操作、导航等具身场景特有的多传感数据。此外,DM0在预训练阶段系统混合抓取、导航、全身控制三类核心任务,并覆盖多种差异显著的机型,从而使得具身大模型具有较强的跨机型“举一反三”与迁移能力。
一边是融资热潮涌动、演示视频刷屏出圈,机器人不断解锁更复杂的动作能力;另一边却是落地场景受限、稳定性欠佳,成本与安全性等核心问题仍未破局的现实困境。在当天以“Physical AI Next”为主题的圆桌论坛上,围绕具身智能下一步需要突破的难点,智源研究院院长王仲远直言:“具身火热背后,我看到蛮多隐忧。”他提到,尽管硬件进步显著——从前年能走路,到去年能跑,再到如今能稳干活,但模型层面“远没到具身的ChatGPT时刻”,端到端VLA、世界模型……技术路线百花齐放,却无一真正突破了“泛化”瓶颈。
“如果对比自然语言(大模型),我觉得具身智能的‘ChatGPT时刻’(的到来)会更加困难一些。”阶跃星辰创始人兼CEO(首席执行官)姜大昕表示,具身智能的泛化并非单一维度,而是同时发生在场景、任务和目标等多个层面。不同维度的组合导致“我们究竟在哪个维度上定义‘ChatGPT时刻’,还没有形成共识”。
清华大学电子工程系长聘教授汪玉则抛出一个更具想象力的命题:如果未来机器人真的要进入人的生活空间,是否需要“这个屋子本身也要发生变化”?他提出,借鉴车路协同的思路,通过基础设施、物理环境方面的改造,或许能为机器智能的持续进步提供另一条路径。
在唐文斌看来,具身智能的规模化落地并非要通过场景叠加实现,而是要实现“一个场景、一千台、持续运行”,在单一场景中跑通闭环,这才意味着具身智能真正迈过产业化门槛。
来源:北京日报客户端
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.