你肯定用过豆包这样的AI。你跟它聊天,它回你;你让它写首诗,它刷刷刷按你所想,现代诗散文诗,七绝五言都没问题。你感觉它挺聪明,像个坐在手机里的“话痨朋友”。
但你可能也会想:既然AI都这么能聊了,那有没有一种AI,不是陪你聊天,而是辅助你开车呢?
还真有。而且它的野心比“帮你开车”大多了——它想帮所有会动的东西,学会怎么自己动。
卓驭把这玩意儿叫“移动物理AI”。名字听起来有点学术,没关系,拆开就简单了。
![]()
不是专给一辆车用的“司机”,而是所有会动的东西都能用的“大脑”
你想象一下现在市面上的智能辅助驾驶,大多数是什么情况:给一辆轿车做一套系统,给一辆重卡做另一套系统,换个国家再重新调一遍。就像一个司机只会在自家小区里开车,出了城就懵,换辆车就更不会开了。
卓驭想干的事不一样。他们的思路是:既然都是在地球上移动,都要遵守同样的物理规律——重力、惯性、摩擦力,那为什么不能做一个通用的“大脑”,给谁都能用?
轿车装上,能自己开;重卡装上,能自己跑高速;物流小车装上,能在社区里穿行送快递;无人机装上,能自己飞;以后机器人装上,能自己走。
这个大脑的核心,卓驭管它叫“原生多模态基础模型”。是卓驭移动物理AI概念的“聪明大脑”。
![]()
这个聪明大脑到底聪明在哪?
第一,它是“原生多模态”的。
什么意思呢?就是你跟它说话,它能听懂文字;它看路,能看懂画面;它动手操作方向盘和刹车,能输出动作。最关键的是,这三种能力不是分开训练、然后硬拼在一起的,而是一开始就一起学。就像一个小孩学东西,他是同时看、听、动手的,不是先学看再学听再学动。
现在行业里流行的VLA模型是怎么做的?先把视觉和动作的训练做好,再把语言能力“嫁接”上去,中间有个翻译步骤。有翻译就有延迟,有延迟就可能有信息损耗。而卓驭这个聪明大脑没有中间商,从看到懂到动,一条直线通到底。
第二,它学会了物理世界的通用规律。
什么意思呢?它看多了互联网上的图片、视频,看多了各种车在路上开的真实数据,也看多了机器人怎么移动的数据以后,自己慢慢就“悟”出了一些道理:球滚出去会掉到地上,前车突然变道可能会挤过来,路边那个牌子上写的字是什么含义。不用人专门教,它自己会。
所以卓驭说它是“懂物理规律的高智商大脑”。就像一个人,不是死记硬背交规,而是真理解了开车是怎么回事。
第三,它不用“一车一模型、一国一版本”。
因为学的是通用的规律,不是某一条路、某一款车的死知识,所以换场景的时候特别省事。从轿车换到重卡,简单适配就行,不用重写一套;从中国开到欧洲,路权规则不一样,简单激活就行,不用推倒重来。
卓驭管这个叫“开箱即用”,想得再远一点,叫“全球零泛化”。这仨词听着像口号,但你细想,这其实就是奔着“一套模型打天下”去的。
![]()
等一下,那它跟之前的端到端是什么关系?
好问题。我们用开车的比喻串一遍整个进化过程:
• 传统方案:像驾校刚出来的新手,全靠死规矩。红灯停绿灯行,行人来了刹车。换个城市、换条路,就紧张得不行。
• 端到端方案:进化为老司机了。不背规则了,凭经验开,凭直觉反应,开得顺多了。但基本上只在自己熟悉的路上开得好。
• VLA模型:这个老司机开始能听懂人话了。你说“前面那辆红车太慢,超过去”,他听懂了,看到了,然后执行。但脑子里还得翻译一下,有那么一丝延迟。
• 原生多模态基础模型:卓驭这个就厉害了。他不光能听懂人话,还能理解物理世界,并且直接做出动作,没有翻译环节。看到球滚出来就知道危险要来了,看到前车不对劲就想减速,看到路牌文字直接理解含义。而且换辆车开、换个国家开,不用从头学一遍。
所以卓驭说它是移动物理AI的核心。而移动物理AI的目标就是:所有会动的东西,都能共享这一个聪明大脑。
![]()
那到底什么算是“会动的东西”?
车上路是正经用途。轿车、重卡、客车,这些都有成熟方案,并且卓驭跟中国前六的商用车品牌都合作了,重卡今年6月份就开始量产。
但有意思的在后面。
比如社区里送快递的物流小车,要在窄路上穿行,要躲电线杆、躲小孩、躲突然冲出来的宠物。这对AI的要求,跟高速上跑的重卡完全不一样,但又有很多底层逻辑是相通的。你总不能给每个小区的每个小车都重新训练一套模型吧?卓驭的做法是:同一个大脑,不同场景下自然适应。
再比如Robotaxi,在城市里自由接单,路况全天候变化。这也不需要另一套大脑。
往远想,无人机、具身机器人,凡是那种需要自己感知环境、自己决定怎么移动的东西,理论上都在这套大脑的覆盖范围之内。
![]()
说回开头的那个问题
AI陪聊这件事,豆包们已经干得很好了。
AI辅助你开车这件事,卓驭已经在路上了。
但卓驭想的比“辅助你开车”更大一圈。它在想的,是AI能不能帮所有东西学会移动。不是给每一件物品各自设一门专属课,各种题海的学,而是直接打造一个聪明的大脑,谁需要,就给谁装。
它现在既能让你的驾驶更简单,也能把重卡平稳地送上高速。过两年,可能你出门打车是它,收快递是它,抬头看到个无人机飞过去,也还是它。
到那时候你会发现,这个AI陪不了你聊天,它太忙了,因为它要帮整个物理世界动起来。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.