日前
广州智驾企业小马智行
正式发布其在物理AI领域的
最新技术成果——
PonyWorld世界模型2.0
![]()
小马智行 图源:广州科技创新
消息一出,再次勾起了人们
对物理AI的关注
它到底是什么?
和我们常说的AI有什么区别?
除了小马智行
广州又有哪些企业
对其进行了布局?
今天,跟你聊个明白
![]()
什么是物理AI
大多数时候,我们谈论的AI,无论是能写诗作画的ChatGPT,还是去年风靡全网的DeepSeek,都是大语言模型,其核心是“从文本中学习世界的知识”,它通过学习互联网上海量的文本数据,学会了语言的规律、人类的知识,能生成流畅的文字、回答各种问题、完成文本类的任务。然而,它的所有知识,都来自于人类社会数千年的历史经验,它对现实世界的重力、摩擦力与空间感一无所知。
如果将它们植入一个机械智能体,它能跟你上聊天文下聊地理,情绪价值拉满,但如果让它为你煎一个鸡蛋,对不起,超出能力范围了。
而物理AI(Physical AI),则是能冲破数字桎梏,与现实进行交互的大模型。目前,它的主流技术路径有两个:
1️⃣VLA——看得懂,做得出
VLA全称Vision-Language-Action Model(视觉—语言—动作模型),核心功能是接收图像/视频、自然语言指令,直接输出智能体(如机器人)可执行的动作序列,实现“感知—理解—执行”。
2️⃣世界模型——先预判,再决策
世界模型是智能体构建的内部预测系统,核心是基于历史环境状态与动作输入,预判环境未来的演化趋势,进而帮助智能体优化决策路径。其本质是复刻生物对世界的预判本能,融合神经网络、强化学习等技术,构建对物理世界的动态表征。
![]()
物理AI的广州探索
不难看出
物理AI与智能驾驶、具身智能
简直就是天作之合
小马智行
本次发布的
PonyWorld世界模型2.0
正是该公司在物理AI领域
的最新技术成果
小马智行搭建的世界模型,可以理解为建在云端的“虚拟驾校”,AI在“虚拟驾校”中反复开车、预设各种突发状况,训练驾驶能力。
![]()
小马智行搭建的世界模型 图源:广州科技创新
与1.0相比,2.0实现了超级进化:
自我诊断能力:
AI知道自己“哪里不行”
PonyWorld2.0结合小马智行车端模型的Intention(意图)语义层,实现了对每一次驾驶决策的自动化回溯与归因分析。系统能够自动区分问题根源,并将诊断结果精准反馈至模型训练流程。
定向进化能力:
从“广撒网”到“精准补短板”
基于自我诊断结果,PonyWorld2.0能够自动识别世界模型精度不足的具体场景,并主动生成定向数据采集任务。例如,系统可自动推送指令:“请于特定时段在指定路口重点采集逆光条件下非机动车与行人混行场景数据。”研发与测试团队由此围绕世界模型的“精度需求”高效协作,实现AI引导下的定向数据采集与模型迭代。
训练效率跃升:
专练“难题”,跳过“送分题”
PonyWorld2.0可根据车端模型的薄弱环节,在世界模型中自动生成针对性训练场景,大幅减少无效训练数据的存储与计算开销,显著提升每一轮迭代的效率和效果。
而广州的另一家
自动驾驶科技公司
文远知行
也采取了相似的技术路径
今年1月,文远知行发布自研通用仿真模型——WeRide GENESIS,构建起物理AI与生成AI之间的融合桥梁。
仿真模型在数字世界中高精度还原真实世界的驾驶环境,让自动驾驶车辆在虚拟城市中“直接上路”。通过仿真的方式,AI司机能够经历海量多样的道路、天气与交通场景,练习应对紧急情况或罕见事件的能力。
![]()
WeRide GENESIS可根据实景自动生成对应点云数据,从而创建仿真世界 图源:广州科技创新
值得一提的是,针对真实反映客观世界中复杂且难以预测的交互行为,WeRide GENESIS内建了“AI主体”模块,致力于为每一位交通参与者构建智能行为模型,使其能够模拟从日常驾驶到高风险行为的全谱系反应。
例如,它可以模拟在路口犹豫不决最终又突然加速抢行的驾驶员,或者在车缝中穿梭的外卖骑手。这种对客体不确定性交互的模拟,对自动驾驶系统提升在实际复杂交通流中应变能力极为重要。
WeRide GENESIS同样具备“AI诊断”功能。它能够自动捕捉急刹车造成乘客舒适度降低、遇到复杂路况识别感知延迟或预测偏差等不理想的驾驶行为,分析其根本原因并提供可执行的改进方案。
说到拥抱物理AI
广州还有一家标杆企业——
小鹏集团
近日,小鹏集团发布《2025年环境、社会及管治报告》。《报告》中明确,集团将于2026年实现Robotaxi、人形机器人、飞行汽车三大物理AI应用的量产。这三大应用,其核心大模型都是小鹏的VLA2.0。
如果说传统智驾系统是“按脚本开车”,小鹏VLA2.0则实现了“像人一样思考开车”,其摒弃传统的规则驱动模式,以物理AI大模型理解路况,实现从“特征匹配”到“物理逻辑推理”的跨越。
这种技术架构带来的直观改变,是智驾系统终于能应对现实中的突发状况。
例如,导航未及时更新施工导致封路的状态时,系统14秒内自主推理多条路径的可行性并选择最优解;
路边车辆车门微开时,提前捕捉意图并预留避让空间,实现从容绕行;
夜间及雨雪环境下,摄像头感知力超人眼,模型决策几乎不受影响,可轻松避让深色衣物行人和小动物。
此外,无地图支持下,系统也能通过理解物理环境自主规划路径,即便在乡村土路、无导航园区等人车混行场景,也能平稳通行。
![]()
小鹏VLA 2.0能识别到路边车辆突然打开车门并预留避让空间。 图源:广州科技创新
小鹏的另一款拳头产品人形机器人IRON,通过搭载物理AI大模型,融合了视觉、语言与行动能力,使其能够执行对话、行走和复杂交互等任务。目前,小鹏已与宝钢达成合作,计划今年入驻钢铁厂负责高温管道巡检,替代人类进入危险作业区。
![]()
人形机器人IRON 图源:广州科技创新
![]()
广州为物理AI应用落地
筑牢生态底座
2026年,被科技界视为“物理AI元年”。以小马智行、文远知行、小鹏集团为代表的广州科技企业站在了时代的风口。
物理AI的核心价值,在于打破了“数字AI”与“现实世界”的壁垒——它不再是停留在屏幕里的算法,而是能走进工厂、道路、社区,真正解决实际问题的“实干家”。
对于广州而言,这些企业所取得的突破,不仅彰显了城市在智能网联汽车、机器人等前沿领域的技术积淀,更勾勒出物理AI落地的清晰路径,让“AI+实体经济”不再是空谈。
除了头部企业的引领,广州的产业生态也在为物理AI的发展保驾护航——广州拥有完整的产业链布局,从芯片、传感器等核心零部件,到整车制造、场景测试,再到算法研发、数据服务,已形成了闭环式产业生态。
同时,广州持续出台系列政策支持前沿技术创新,设立智能网联汽车与自动驾驶产业专项资金,搭建测试验证平台,为企业提供场景试点、人才扶持等全方位保障,让物理AI技术有了“落地生根”的土壤。
相信在不久的将来
我们就能看到自动驾驶汽车
穿梭在城市的每一条街道
人形机器人为我们提供家庭服务
飞行汽车解决出行拥堵
而这一切
都离不开今天广州
在物理AI领域的每一步深耕
参考来源
广州科技创新《物理AI是什么?广州企业正在训练另一种“大脑”》
https://mp.weixin.qq.com/s/TO2Umw6wCDcE47XijX2kDQ
![]()
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.