2025年,世界人工智能大会(WAIC)的空气中弥漫着一种不同以往的气息。聚光灯的焦点,正从云端服务器中纯粹的数字智能,历史性地转向了那些能够行走、感知、并与我们共享物理空间的机器——具身智能。
本届WAIC期间,商汤科技、腾讯、网易灵动、智元机器人等中国科技巨头与创新先锋,不约而同地亮出了各自的王牌,它们的核心直指两大关键词:世界模型与开源生态。这标志着人工智能正从“虚拟世界”走向“物理世界”,从理解像素,到理解并改造原子。
世界模型:为机器灵魂“复刻”一个真实世界
如果说大语言模型赋予了AI“能言善辩”的口才,那么世界模型则致力于为其注入“知行合一”的灵魂。它通过构建一个与真实世界物理规律、时空关系高度一致的虚拟环境,让AI在其中学习、试错、进化,最终将能力泛化至现实。
商汤科技此次发布的“悟能”具身智能平台,正是这一理念的集大成者。其核心引擎商汤具身世界模型,展现了惊人的4D真实世界构建能力。在现场,商汤董事长兼CEO徐立演示了一个搭载该引擎的人形机器人,它不仅能风趣幽默地讲解“长安的荔枝”PPT,还能与人自如问答互动。这背后,是模型对物理世界交互逻辑的深度理解。
更令人惊叹的是,该模型能让机器在真实的街道场景中体验“极品飞车”的快感,这意味着它已能生成时空高度一致的多视角视频,让AI真正理解并编辑现实。而在汽车领域,商汤绝影的“绝影开悟”世界模型已在赋能智己汽车等合作伙伴,通过生成海量高仿真的驾驶数据,加速高级辅助驾驶的迭代与落地。
如果说商汤的世界模型更侧重于对现实世界的“理解与交互”,那么腾讯则将其打造成了赋能“创造”的引擎。
7月27日,腾讯正式发布并全面开源了业界首个可沉浸漫游、可交互的“混元3D世界模型1.0”。用户仅需输入一句“一座中世纪的宏伟城堡”,几分钟内一个可供探索的3D世界便跃然屏上,其生成的标准化Mesh资产可无缝导入Unity、UE等主流开发工具,极大解放了游戏开发者与数字内容创作者的生产力。这一创举不仅获得了Lovart、拓竹科技等商业伙伴的青睐,更通过开源,为全球开发者构建3D内容生态提供了坚实的基础。
一个强大的“大脑”需要一个高效的“神经系统”来连接百骸。当硬件形态各异、应用场景纷繁复杂时,一个标准化的、开放的操作系统便成为产业规模化发展的命脉。
智元机器人在本届WAIC上宣布了“智元灵渠OS”开源计划,联合创始人兼CTO彭志辉将其定位为业界首个具身智能操作系统参考框架,旨在打通从底层硬件驱动到上层智能服务的全链路。
“智元灵渠OS”将采用“分层开源”模式,逐步开放其高性能中间件、智能体服务框架以及全场景工具链,目标是构建一个开发者“朋友圈”,让开发者能像开发手机APP一样,便捷地为各类机器人开发应用,其战略雄心直指成为机器人时代的“Windows”或“鸿蒙系统”。
腾讯则从另一个角度切入,推出了国内首个模块化具身智能开放平台Tairos,并以一个精妙的比喻——“钛螺丝”——来诠释其定位。
腾讯首席科学家、Robotics X 实验室主任、福田实验室主任张正友表示,Tairos致力于成为连接机器人本体与软件能力的“关键固件”,为机器人装上“大脑”。作为一个即插即用的平台,它已吸引了越疆科技、乐聚机器人、帕西尼感知科技、擎朗智能、众擎机器人科技、宇树科技等一批行业领军企业成为首批合作伙伴。在展会现场,搭载了Tairos的宇树G1机器人已能担任导游,而越疆机械臂则能听懂指令为人烹饪,生动展示了该平台强大的赋能与兼容能力。
深入产业肌理:从矿山到工厂,具身智能“真抓实干”
如果说世界模型和操作系统是“庙堂之高”的顶层设计,那么具身智能的真正价值,最终要体现在“江湖之远”的产业实践中。
在这方面,网易灵动给出了一个极为震撼和接地气的答案。其发布的全球首个工程机械具身智能模型“灵掘”,专为露天矿山挖掘机装车场景打造。这不仅是对国家“智能矿山”战略的深度响应,更是将AI从办公室带到了风沙弥漫的矿场。基于100%国产自研的“机械智心”训练框架,“灵掘”在内蒙古的露天煤矿实测中,单机装车效率已达人工的80%,且近70%的作业时间无需人为干预,展现出惊人的稳定性和环境适应性。网易灵动更宣布开源“灵掘”数据集并发起“2027产业协同计划”,联合徐工、三一等主机厂,致力于在2027年实现超30座矿山的无人化运营,其魄力与实干精神,为整个行业树立了典范。
洞察与展望:一个新时代的序曲
纵观本届WAIC的具身智能版图,一幅清晰的产业演进路线图已然展开:
从单点到平台:各家巨头不再满足于打造单一功能的机器人,而是转向构建更为底层的世界模型、操作系统与开放平台,意图掌握产业生态的话语权。
从虚到实,数据飞轮加速:无论是商汤的驾驶数据反哺,还是网易的真实矿山数据驱动,都指向了一个核心——“数据飞轮”。通过在真实场景中采集数据、在世界模型中训练、再到现实中部署验证的闭环,AI的进化速度正在指数级提升。
开源共建,生态为王:从腾讯的“混元3D”到智元的“灵渠OS”,再到网易的“灵掘”数据集,开源成为了共识。这不仅是技术自信的体现,更是加速技术普及、构建开发者生态、抢占行业标准的长远布局。
2025年的WAIC,无疑是具身智能从概念走向现实的转折点。商汤的“悟能”让我们看到了机器人理解世界的深度,腾讯的“混元”与“钛螺丝”描绘了创造世界与连接世界的蓝图,智元的“灵渠OS”在为新世界奠定基石,而网易的“灵掘”则证明了这个新世界已然可以创造真实的产业价值。
这不是科幻电影的预告片,而是一个新时代的序曲。当AI拥有了身体,它便不再是一个工具,而是一个伙伴、一个同事、一个我们物理世界的新成员。比特与原子的边界正在消融,一个由代码和钢筋水泥共同构筑的未来,正以前所未有的速度向我们走来。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.