
他是中国AI 1.0时代的拓荒者,在深度学习黎明前的黑夜,成为全中国第一个复现AlexNet(深度卷积神经网络模型)、拿到AI“黄金榔头”的人。
他是地平线创始团队成员及前智能驾驶总裁,却在公司2024年成功上市的高光时刻,转身闯进具身智能的无人区,去验证物理世界的Scaling Law。
他是Vbot维他动力的创始人,用60人团队一年量产机器狗,首款智能四足机器人产品发布即引爆,截止1月10日,预订订单量已经达到了6540台,并实现了以C端带动B端的销量破局。
他是余轶南博士,Vbot 维他动力创始人兼CEO,他要打造全球领先的消费级机器人产品。
善友教授说:“他是一个典型的‘少数派’”。这位跨越了软件算法、芯片硬件到机器人本体的“全栈”技术专家,永远不在主战场跟人肉搏,而是凭借极高的战略品味,在每一次技术变革的前夜,精准地站在了未来的入口。
本期「善友探索流」播客,我们邀请到Vbot维他动力创始人兼CEO,同时也是混沌学园六期同学——余轶南博士。在本场深度对谈中,余轶南博士贡献了极具颠覆性的三大商业洞见:
关于生存哲学:硬科技创业不是赌博,而是基于认知的精准判断。只有“锁死下限”,才敢去赌那个“无限的上限”。
关于公司本质:AI公司V.S.科技公司,区别不在技术,而在是否追求Scaling Law(尺度定律)带来的无限增长。
关于组织终局:他用了一个形象又有趣的比喻——“太上老君炼丹”,道破了AI时代的组织真相。未来的公司不需要人海战术,只需要极少数顶级的“炼丹师”和一群务实的“造炉人”。
以下是播客内容精选,完整版请打开小宇宙app收听。
![]()
![]()
AI1.0往事:技术信仰的起点
李善友:你简单说说你的求学、职业经历以及现在在做什么。
余轶南:2007年至2012年,我在中科院攻读博士学位,研究方向是人工智能,当时处于AI1.0时代,也可以说是深度学习的早期阶段。2012年毕业后,我加入百度,跟随余凯(地平线创始人兼CEO),赶上了深度学习快速发展的时期。
2015年,地平线创立,我主要负责智能驾驶业务。地平线是一家专注于AI芯片和人工智能软件算法的公司。我们探索了多个应用场景,包括AIOT、机器人和智能驾驶,最终智能驾驶脱颖而出,成为公司的重要发展方向。2024年底,地平线成功上市,之后我离开地平线,创立了Vbot 维他动力,致力于用AI创新,创造生活空间的机器人。
李善友:你的经历可以简单分为三段,第一段是中科院和百度时期,主要是做研究和技术积累;第二段是在地平线,追随余凯,推动智能驾驶业务的发展;第三段是自己创业,实现自己的理想。
按照这个结构,你先回顾一下第一段,在中科院和百度的研究阶段。
余轶南:那时候行业研究的目标是突破技术瓶颈。当时AI领域虽然有多个研究方向,比如图像识别、语音识别等,但不同领域的技术差异较大。
当时AI还是个小圈子,从业者少,比较冷门,找工作都不容易。直到2012年AlexNet出现,深度学习才开始成为主流。
李善友:AlexNet出现之前,大家的研究状态是怎样的呢?
余轶南:在AlexNet出现之前,各个研究方向技术差异大,没有统一的建模方式。比如图像识别、目标检测、文本理解和语音识别等方向,各自有各自的技术方案。
AlexNet出现后,深度学习的建模方式统一了这些领域,就像过去每种钉子都需要不同的锤子去敲,现在一种锤子就能敲各种钉子。这种统一不仅提高了技术的泛化性,还降低了行业的技术壁垒。
李善友:你亲历了这个过程,确实很有价值。你能回忆一下你第一次接触到 AlexNet,当时是什么样的反应?
余轶南:AlexNet是在ImageNet竞赛中提出的经典模型。2010年的 ImageNet竞赛中,余凯拿到了冠军,那本身就是一项难度极高的成就,ImageNet一直被认为是计算机视觉领域最具挑战性的任务之一。
但从行业整体来看,当时的技术进展仍然相对缓慢,大家更多是在既有框架下做渐进式优化,普遍能感受到瓶颈的存在。
真正的转折出现在 2012 年。AlexNet带来了本质性的性能跃迁,让这个长期被认为极其困难的任务第一次出现了突破性的解法。所以当 10 月份比赛结果和论文公布时,我们都感到非常震惊。
李善友:你还记得你是怎么得知这个消息的吗?
余轶南:当时余凯去参加了NIPS会议(神经信息处理系统大会),比赛结果公布时,我们应该属于春江水暖鸭先知,最早一批得知并理解这一成果的人。
当时我在国内,余凯在北美。我记得那是一个晚上,大概11点或12点,余凯给我发来了比赛结果。我花一个多小时读完文章后,我觉得这似乎真的可行。
我的第一个反应是,我们需要复现它。于是,我立刻联系余凯,说我们需要买GPU。
李善友:那时候你就意识到需要GPU了?
余轶南:对,因为文章里提到需要巨大的算力,还提到使用GPU加速了多少倍。当时他们用了两周时间训练模型,如果用CPU,根本无法完成。所以,我的第一个反应就是买GPU。
当时,我们想快速推进复现工作,多买了一些。那时候没有任何现成的代码,几乎是从零开始写代码。我们一边读论文,一边逐步实现它,难度确实很大。
李善友:今天回头看,你们是不是全中国甚至全世界第一个复现AlexNet的团队?
余轶南:我觉得至少在中国肯定是第一个。全世界不好说,但应该也是最早的一批。
李善友:你当时的心情和周围人的反应如何?尤其是百度内部的反应。
余轶南:当时的感觉就像拿到了一把“黄金榔头”。这种建模方式非常根本,只要定义好输入和输出,它就能发挥巨大的作用。我们意识到这是一把可以解决很多问题的利器。
因为当时百度的业务非常广泛,涵盖图像、语音和自然语言等多个领域。我们想,能不能用这把“黄金榔头”去解决所有业务中的问题?于是我们真地逐个尝试了,并给自己设置了标准:新算法的效果至少比传统算法提升20%以上,才算“敲对”了钉子。
在这个标准下,我们迅速将技术铺开,用模型自动识别替代低效人工录入,并支持商品检索和人脸特效等新功能。甚至在当年,我们就构建了类似今日“基座模型”的雏形,尝试了早期的“看图说话”(Image to Caption)与“文生图”(Caption to Image),用一个通用模型支撑起了全厂的图像与视频识别需求。
![]()
面对新技术的底层决策逻辑
李善友:这很有意思。你不仅迅速接受了新技术,还花了两个月时间将其复现出来。这是你的天赋还是长期积累的素质?
余轶南:我觉得对技术的基本理解应该是:新的东西一定比旧的东西有其独特的优势,尤其是那些带来巨大变革的技术。它一定有本质上的不同。
这是社会发展的规律。如果世界的发展只是沿着过去的路走,那么世界不可能进步。就像儿子总是要走出自己的路,不完全听从父亲的安排。
李善友:但这种“转变”在你身上其实发生了不止一次。如果这么算,从北邮去中科院读博,其实也可以算一次重要的转变。
余轶南:是的,当时是2006年大三下半学期,通信行业非常火爆,北邮的学生找工作时,外企提供的薪水高、工作体面,比如摩托罗拉。而互联网行业当时还处于起步阶段。
但我发现通信行业竞争太激烈,而且外企虽然光鲜亮丽,但未来可能并不乐观。
当时我的博士导师谭铁牛院士去北邮做了一场关于人工智能的讲座,讲到机器人、人脸识别、虹膜识别等内容。我听完后觉得非常有趣。我当时觉得,即使人工智能无法实现商业化,也可以做很长时间的研究,成为一名学者也很不错。但如果人工智能真的实现了,那将是改变世界的东西。
李善友:你在当时就有了那种“改变世界”的心态吗?
余轶南:是的,我当时觉得人工智能要么是玄学,要么是改变世界的技术。我把它当作一种“彩票”,如果它无法实现,我可以继续做研究;如果它实现了,那将带来巨大的变化,对我个人来说也是巨大的机会。
你要赌一件事,这件事肯定有很大的不确定性。但如果你去做这件事,它的下限不会太低,而上限却非常高,那这件事就值得去做。新技术的上限太高了,我几乎没有犹豫。
李善友:这就是你做决策的根本逻辑。
![]()
地平线前夜:10万台GPU催生的“算力信仰”
余轶南:我第二次真正意义上的转变,其实是和余凯一起离开百度去创业,成为地平线创始团队成员。
这是一次比较大的转变,因为我们这些做互联网和AI算法的人,开始涉足机器人和芯片领域,进入智能汽车和AI芯片的赛道。
但这个转变背后也有一个底层逻辑。在百度的三年时间里,我们几乎把所有能用深度学习解决的问题都尝试了一遍,但在应用和部署过程中,我们遇到了一个巨大的问题——算力很难支撑。
百度日活跃用户可能达到上亿级别,要为这样的用户量提供服务,服务器规模至少需要十万台起步。这在当时几乎是不可想象的。
李善友:当时你们已经意识到十万GPU集群的难度了?
余轶南:是的,我们很快算出每个服务需要的算力。另一个问题是训练芯片。当时我们已经意识到英伟达CUDA已经占据了主导地位,全球都在使用它。
所以余凯当时就有了一个想法——做AI推理芯片,做端侧芯片。因为端侧的市场需求比云端要大得多,算力当时被认为是一个非常重要的业务。
很多战略级的判断其实并不复杂,一开始就能看得很清楚。
李善友:所以你们意识到算力是一个关键瓶颈?
余轶南:是的,算力是一个非常重要的商品,需求越大越好,功耗越小越好,成本越低越好,这是一个无止境的追求,天花板极高。这是地平线的底层逻辑,对算力需求更高的场景。
![]()
避开英伟达的云端主战场,死磕端侧推理芯片
李善友:那你们做的端侧AI芯片和算力之间是什么关系呢?
余轶南:端侧和云端都需要越来越强大的算力。
我和余凯都有一个特点,就是不想在主战场竞争。比如现在机器人市场的主战场是人形机器人,但我做Vbot 维他动力没有选择人形机器人;当年AI芯片的主战场是云端训练芯片,但地平线选择了端侧芯片这个细分市场。
李善友:新兴价值网。
余轶南:对,选择一个新兴市场,竞争对手少。这其实是一种创业的“品味”。
李善友:你似乎是一个“少数派”,不在主战场竞争,决策迅速。那么,地平线在端侧选择了多个场景,你为什么坚持做智能驾驶?而且最终只有智能驾驶真正做出来了。
余轶南:其实这件事并不是我坚持的结果。一开始,我们几乎是什么都做,但当时的一些摸索,效果都不理想。
这时我有一个洞察:如果某个业务对AI算力的需求是有限的,那它可能就不是我们想要的方向。因为公司的战略本质上是赌社会对算力的需求会越来越大。但如果某个业务的算力需求本身就有天花板,而且很低,那我们做到一定程度就会停滞,甚至开始卷入其他竞争。
相比之下,智能驾驶是个很好的方向。大家至今都不知道算力需求的天花板在哪里,下一代芯片要达到1000TOPS,甚至2000TOPS,但没人敢拍胸脯说2000TOPS就能实现L4级自动驾驶。也许需要10000TOPS?所以你看,这是一个没有天花板的领域。如果大家认为L4或L5是自动驾驶的终极目标,那实现这个目标需要多少算力?至今无人知晓。
李善友:这是一种第一性原理的思考。
余轶南:是的,底层逻辑决定了你应该在算力这件事上全力冲刺,而不是等待应用的出现。你要先跑到前面,等待应用的出现。
李善友:你要跑到前面,让应用来找你。
余轶南:对。这就是地平线的逻辑。为什么我们当时做安防,最终没有做下去?因为安防对算力的需求其实很低,一两个TOPS就够了。这种情况下,你和其他公司的竞争就会变成其他方面,比如成本控制。因为一两个TOPS的AI芯片太容易实现,所以这个市场机会并不属于我们。
但如果你选择卷高算力,那他们未必能卷过你。不过当时高算力市场还很小。所以你会发现,机会往往来自于那些别人觉得战略正确但又看不上的领域。他们看不上的原因可能是因为市场太小,但你先投入了,所以才有机会赢。
我觉得创业的魅力就在于,你是否比别人更早看到一些东西。
李善友:我完全理解。只有这样才能战胜巨头。因为这个需求本身和供给会形成一个越来越强的正循环。
![]()
真伪AI公司的试金石:Scaling Law
余轶南:我觉得如果你做AI,一定要找到一个场景,让用户对算力的需求大,这样他们越愿意买单。如果你的产品没有对无限算力的需求,那它就不是真正的AI产品,只是一个自动化产品。
李善友:换句话说,如果不是算力和性能之间存在某种“增长规律”,那你的产品就不算AI产品。
余轶南:没错,这几件事是相互关联的。核心问题是,这是一种非线性的东西,它本质上是一种Scaling Law(尺度定律)。在AI领域中,目前主要由算力和数据支撑。如果你的场景对AI算力没有无穷尽的需求,那你就无法形成这种增长规律。
余轶南:现在资本市场对公司的划分主要有两种:一种是有Scaling Law的业务。你的资金是线性增长的,但性能是指数级增长的。比如,同样多花10块钱,你能实现比别人高出5倍的性能。
另一种,如果你的业务是做一个10TOPS算力的产品,然后通过各种优化让产品表现很好,大家会觉得你是一个科技公司。
科技公司和AI公司的区别在于,你是否真正追求和需要Scaling Law。
![]()
创业的发心,为什么要做机器人?
李善友:我们再回到一个问题上,你当初为什么要从地平线出来创业做机器人领域?
余轶南:是我自身的职业追求——我想亲手操盘机器人领域的事业。
当时有两条路径可选:一是留在地平线推进机器人业务,二是出来自主创业。留在地平线的路径清晰且稳妥,沿用智驾业务的成功模式即可:先深耕算法研发,再推出整体解决方案,最后与中型机器人企业建立合作,就像我们当年与长安、理想合作推进智驾业务那样。但继续留在舒适区做To B业务,对我而言已经失去了原本的吸引力。
选择出来创业,确实意味着要直面指数级增长的风险,资金链、产品力、市场反馈,任何一环的失控都可能让公司瞬间崩盘。但我的想法是: 做To B业务很大的痛苦在于“等待”——你要等客户觉醒、等生态成熟。而自己下场,我就不需要再“等别人”,我能以最快的速度直面市场,亲自把产品闭环的节奏拉到极致。
![]()
C端市场,为什么首批种子用户比技术壁垒更重要?
李善友:项目正式启动了,相当于“孩子”顺利诞生了。这次销售情况怎么样?
余轶南:销售情况相当不错。这次所有用户都是付费购买的。要知道,在中国愿意花10000块钱买一台四足机器人的人,底色都非常出色,基本都是核心科技爱好者。
李善友:这就是种子用户群体。
余轶南:对。触达这群用户后,可以灵活拓展不同产品。这群用户才是最关键的不变量,远比技术层面的不变量更重要。真正决定长期发展的,还是这群核心用户。
教授:就像现在开新能源车的人,已经有了“我们”的群体意识,甚至会对开燃油车的人有认知差异。
余轶南:新能源汽车用户的群体特征就很明显。几乎所有新能源车用户,本质上都是特斯拉的粉丝,特斯拉先圈定了这一大波核心人群,之后蔚小理、小米等品牌才从这个群体中分化出自己的用户。不管买哪款新能源车,大家都默认特斯拉是行业标杆,这种品牌认知太关键了。所以如果特斯拉推出机器人,最早买单的肯定还是这群核心用户。
教授:对,这群人有了品牌归属感,你只要切入这个群体,就能依托他们发展。对做机器人行业来说,能进入这样一个有凝聚力的群体,太宝贵了。
余轶南:用户对品牌的认知,远比技术、渠道这些因素更重要。
从结果来看,我觉得市场表现非常合理,甚至B端市场超出了我的预期。
B端方面,我们的客户主要分几类:第一类是地产商,他们旗下有众多小区物业,希望利用我们的产品来提升物业服务,比如快递巡检和小区内的交互服务;第二类就是教育机构,我们聚焦下沉教育科研市场,涵盖大学、职业学院、初高中等,使用者不需要太强的编程能力,只需把机器人本体当作训练载体即可;第三类是各类园区、景区,这类需求和地产商的需求逻辑较为接近;第四类是线下门店,比如耐克的儿童门店,会用机器人吸引孩子、营造氛围。
这些市场并非突然涌现,而是原本就存在。核心竞争力其实在于产品是否能实现10倍性价比的提升——不只是性能,还包括外观、成本等综合维度,只要综合价值比原有产品高出10倍,B端客户就会迅速转向我们。
![]()
未来AI组织的形态:“太上老君”式架构
李善友:你之前提过,自动驾驶领域的人纷纷出来做机器人,这背后似乎藏着一个更重要的趋势。为什么自动驾驶领域的从业者会集体转向机器人赛道呢?
余轶南:我觉得原因很简单。自动驾驶行业基本上已经进入收官阶段了。能站稳脚跟的就那么几家企业,新入局者再无机会。这是其一。
其二,即便完成了端到端技术落地,后续还要经历五年的深耕期,整个产业的想象空间已经大幅收缩,缺乏足够的增长预期。
同时,行业还存在组织冗余的问题,人才供给严重过剩。因为随着端到端技术的成熟,原本需要“人海战术”的研发模式已经被彻底颠覆了。
自动驾驶的组织结构可以分为端到端技术落地前后两个阶段。端到端之前,行业普遍采用“大感知、大环境模型、大规控”的架构,每个板块下又细分出诸多子任务,再往下还有负责基础设施、数据、仿真、实车测试的团队。这种结构的人才密集区,就集中在这些细分任务板块。像地平线、Momenta这样的企业,这部分人员加起来大概有五百多人。
但当技术迭代到端到端阶段后,这些细分任务被高度整合压缩,不再需要大量人员分别训练模型,原本负责这些工作的人就面临转型问题。
而机器人赛道刚好资本涌入、企业增多、岗位充足,所以他们大多转向了这里,相当于把2015到2020年自动驾驶领域的发展路径,在机器人赛道重新走一遍。
李善友:你之前对AI公司和科技公司的定义非常精准——核心看算力、模型与应用之间是否形成正向循环。按这个定义来看,现在什么样的公司算是AI公司?
余轶南:AI类企业的人才结构特点,我把它比作“太上老君式组织结构”。
我们可以把AI模型研发比作《西游记》里的炼丹:
太上老君:这是公司的灵魂人物,负责定战略、给配方。
炼丹仙童:这是核心层。他们思维极度敏捷,守着丹炉、把控火候(训练模型)。一家公司有10个这样顶尖的“仙童”就足够了。
修炉采药:这是基建层。负责“修炉造炉”,就像提升“三味真火”的效能一样(搭建基础设施,提升算力效能)和“寻药采药”(清洗处理数据)。
首先,大模型公司肯定属于AI公司,它们对算力有持续需求,且形成了算力、模型与应用的循环。
而机器人公司中,大部分还是采用传统组织结构,本质上属于科技公司,真正采用“太上老君式组织结构”、符合AI公司定义的极少,核心原因是机器人的本体技术尚未定型。
AI公司的成立有个前提:硬件和基础设施必须先收敛。大模型公司能成为AI公司,就是因为它们无需操心计算、网络和用户触达问题,用户通过手机APP或网页就能便捷使用,触达门槛极低。
但机器人行业和汽车行业类似,必须先把本体(硬件)做好,才有后续AI技术的落地基础;如果本体都没打磨成熟,AI技术再先进也无从施展。所以机器人行业必然要经历两个阶段,目前大部分企业都还处在“先做好本体”的阶段。
李善友:那你规划的路径是什么?
余轶南:我们肯定是先做好本体,再推进AI技术落地。AI相关的工作可以后续持续深化,但本体必须优先打磨到位,这是基础中的基础。
李善友:你的每一段经历似乎都在为当下的事业铺路,而且每一次转型都实现了跨越式提升。
余轶南:确实是这样。其实从我读研究生开始,所做的一切本质上都是在为做机器人积累,相当于一直在围绕这个目标铺垫。
李善友:没错,但这件事早做也不行,时机很关键。必须先有大模型AI、自动驾驶AI的技术积淀,才能支撑起机器人的落地。如今来看,机器人其实是物理AI的第一大应用场景——自动驾驶目前还未完全达到这个层面,未来或许有机会,但机器人的优势在于算力基础足够扎实。
真正能让你与竞争对手拉开差距的,正是你之前提到的这一点:让模型与算力相互赋能,形成越迭代越智能的正向循环。
余轶南:对,就是这个道理。
李善友:一方面抓住技术端的正向循环,另一方面抓住用户群体,激发他们的群体心智——这群人已经形成了强烈的群体认同感和“我们”的归属感,与他们共同成长。核心就是这两大板块:技术端和市场端,把这两点做好,前景就非常广阔。那你接下来的精力是不是应该多放在第二代产品上?
余轶南:现阶段我想把更多精力放在第一代产品上。这一点,我借鉴了地平线的成功经验——地平线的第一款产品征程2,我们花了很长时间深耕,把它铺到了各个场景,通过这个过程建立起了广泛的用户群体和合作关系,后续产品再推向市场时,就很容易切入。
李善友:后续产品也能快速跟上。
余轶南:创业就像打江山,先圈定用户地盘更重要。用户是有限资源,一旦用户选择了我们的产品,就大概率不会再选择竞争对手。所以现阶段的核心,还是先把用户侧跑通,把用户端的增长速度和市场势能做起来。
打开小宇宙 app订阅混沌创办人李善友的播客节目,每两周的周四准时上新,我们期待与你相见!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.