华为近期通过其旗下的哈勃投资,联合华控基金向一家名为“极佳视界”的初创公司注入了亿元级别的A1轮战略融资,这是国内世界模型领域一次备受关注的资本动作。
而且这不仅仅是一笔简单的投资,更像是一次技术领域的选择,“我们不会走向VLA的路径,我们认为看似这样取巧的路径,并不是最终走向真正自动驾驶的路径。”华为智能汽车解决方案BU CEO靳玉志此前在技术路线选择上直言不讳。在他看来,WA路线才是自动驾驶的终局。
![]()
与此同时,在地球的另一端,斯坦福大学教授李飞飞在其题为《从文字到世界:空间智能是AI的下一个前沿》的长文中也明确指出,AI的未来不在于更大的“语言模型”,而在于全新的“世界模型”。
这两者似乎都指向了一点:世界模型。为什么是世界模型?
世界模型:AI认知革命的临界点
世界模型是什么?通俗讲,它是在数字世界里建模物理世界和运行规律的技术:让AI在动手前,先在“脑内”搭建简化的物理沙盒,预测下一秒会发生什么并据此选择执行动作,从而在陌生环境中少试错、更稳健。
李飞飞认为,一个真正的“世界模型”必须具备三大核心能力:生成性、多模态性和交互性。它必须能创造遵守物理定律的空间,处理各种输入,并能预测操作带来的世界状态变化。
当下的AI模型,用李飞飞的话说,本质上是“黑暗中的文字匠”,能言善辩却无实际经验,知识渊博但缺乏现实根基。
最先进的多模态大语言模型在估算距离、方向、大小等任务上,表现往往不比随机猜测好多少。
华为的布局:从WA路线到战略投资
华为此次通过哈勃投资向极佳视界注资亿元级别,绝非偶然。这已是极佳视界在近两个月内完成的第三轮融资,此前公司已完成Pre-A和Pre-A+两轮数亿元融资。
华为看中的是极佳视界技术路线与自身WA战略的高度协同。与VLA路径不同,WA路线强调从视觉直接到决策的一段式端到端,省掉语言中间层,直接通过视觉等信息输入控车。
极佳视界创始人兼CEO黄冠博士表示:“华为也将世界模型列为未来智能世界2035年十大技术趋势之首,这也是投资极佳视界的底层逻辑。”
不仅如此,双方的合作已超越单纯财务投资。据报道,华为已从多个业务线与极佳视界推进战略合作。有供应链消息称,若测试顺利,华为ADS 4.0智驾系统可能在明年下半年引入世界模型模块。
极佳视界:物理AI的先行者
极佳视界成立于2023年,是一家聚焦物理AI的公司,专注于“世界模型驱动的物理世界通用智能”。其核心团队紧密依托清华大学自动化系智能视觉实验室,累计发表顶级AI论文200余篇。
公司的产品包括世界模型平台GigaWorld、具身基础模型GigaBrain、通用具身本体Maker等物理AI全栈软硬件产品。其技术旨在解决当前具身智能面临的三大瓶颈。
高质量数据稀缺问题:世界模型能从少量真实数据中学习,生成大量高保真合成数据,以极低成本填补数据缺口。仿真与现实差距问题:通过融合多模态反馈进行持续优化,显著提升生成数据的真实性与可用性。强化学习训练效果问题:世界模型能作为高保真训练环境,使策略在高度拟真的虚拟场景中迭代。
李飞飞的空间智能愿景
李飞飞认为,空间智能在定义人类如何与物理世界互动中起着根本性的作用,但AI的空间能力仍与人类相距甚远。要实现空间智能,需要的远不止LLM那样的体系,而是更具雄心的“世界模型”。
她创立的World Labs公司最近向少数用户展示了第一个世界模型Marble。该模型能让电影制作人、游戏设计师、建筑师用“提示词”快速创建和迭代3D世界。
一旦AI拥有了空间智能,将带来真正的革命。李飞飞展望,在“世界模型”的加持下,机器人会在模拟环境中学会成千上万种实用技能,然后走进我们的家庭、医院,成为得力的助手和看护。
05 物理AI的“ChatGPT时刻”临近
极佳视界创始人黄冠博士预测,“物理世界的ChatGPT时刻”将在2至3年内到来。具体而言,世界模型将主要解决泛化性,VLA负责解决作业的复杂性,强化学习解决准确率和可靠性。
三者协同起来,就会引领物理AI在100种常见任务中,90%的场景下达到95%的成功率。华为此次投资极佳视界,加之此前对具身智能公司千寻智能的投资,表明华为在空间智能、世界模型上的更全面布局正在连点成线,浮出水面。
全球科技巨头也已纷纷布局世界模型。英伟达推出World Foundation Model - COSMOS;Google DeepMind发布Genie-3;特斯拉亦在其仿真系统中深度集成世界模型技术。
华为哈勃的此次投资,加上此前对具身智能公司千寻智能的布局,表明华为在空间智能领域的战线正在连点成面。
科技巨头们正在为AI铺设一条从“语言的巨人”成长为“行动的王者”的崭新道路。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.