网易首页 > 网易科技 > 网易科技 > 正文

对话Aibee林元庆:机器人只是起点,Physical AI的“ChatGPT时刻”还要5-10年

0
分享至

出品 | 《态度AGI》栏目

作者 | 袁宁

编辑 | 丁广胜

很多人在讲大模型、讲智能体,讲得最多的还是屏幕里的 AI;具身智能最近也很火,而目前看到的很多是“具身”,而不是“智能”。真正落到线下世界里的 AI,反而很少人讲了。这大概是和爱笔智能 CEO 林元庆聊完之后,我最强烈的感受。

线上的世界已经被反复定义:模型、Agent、推理、多模态、代码生成、工作流自动化……过去两年,几乎所有 AI 叙事都围绕这些概念展开。相比之下,线下世界显得沉默得多。购物中心里的人流,新能源汽车门店里的接待,机场停机坪上的飞机和保障车辆,城市路口的车流与红绿灯,它们都仍然以一种很“物理”的方式存在着——复杂、笨重、昂贵,也不太性感。

林元庆偏偏做的就是这件事,把 AI 从屏幕里带到这些场景之中。

如果只看履历,林元庆很容易被归类为一位典型的技术型创业者:清华大学硕士、宾夕法尼亚大学博士学位。在顶级国际会议和期刊发表论文50+ 篇,引用次数过万。2010年 ImageNet 冠军,作为 ImageNet 早期的核心贡献者,与李飞飞教授在2011-2014年间有多项深度学术合作。

同时,在吴恩达离开后接任百度研究院院长。那正是百度把“深度学习”作为公司级战略押注的阶段。彼时被引入的核心人物,后来几乎构成了中国 AI 产业早期的重要骨架:创办地平线的余凯、前 Facebook 资深科学家徐伟、Rutgers 大学教授张潼,以及此后百度 AI 体系中长期担任关键角色的王海峰等。

但三个小时的对话之后,这种“技术创业者”的标签开始变得不太准确。

更贴近的描述是,他仍然站在技术里,但已经被业务反复塑形。他讲问题时有很强的结构感,对行业和技术都有清晰判断。他从技术切入,却很快落到客户和场景;也会从一线问题出发,再回到技术能力本身。谈话里,技术只是其中一部分,更多时候,他在讲客户、行业、产品化和现金流,同时也在反复推演一个更长期的问题:空间智能、三维理解,以及物理世界 AI,什么时候会迎来属于自己的“ ChatGPT 时刻”。

在爱笔智能成立的2017年,林元庆看到的是一个被 AI 甩在后面的世界:线上世界已经开始用 AI 驱动电商、搜索、推荐,线下的大多数垂直行业却还没被真正数字化,更谈不上智能化。

他给公司起名爱笔智能(Aibee),AI To B。名字几乎直白得没什么修饰,但也因此显出一种罕见的笃定:他从一开始就知道自己想做什么,而且直到今天也没改。

这家公司做的事情也和当下许多 AI 创业叙事不太一样。它不轻,不快,不像一个靠模型能力一夜之间“涌现”出来的故事。很多人说更像“大炮打蚊子”,它要做空间扫描、摄像头部署、算法工程化、BI、数据服务、客户陪跑,链条长,落地慢,还是典型的脏活累活。

但在林元庆看来,这些脏活累活恰恰构成了某种壁垒,也构成了他们对未来的押注。如果物理世界AI 真的会迎来自己的“ ChatGPT 时刻”,那今天这一切笨重的积累,就不是绕路,而是地基。

爱笔今天有四条 AI 赋能的主行业:购物中心、连锁门店、机场和枢纽、双智城市。而底层其实是一套能力,对三维物理空间的感知和理解。过去他们叫“线下空间的数字化和智能化”,也就是现在的“空间智能”。

如果说大语言模型带来了语言世界的突破,那他更关心的是另一个问题:物理世界什么时候会迎来自己的“ ChatGPT ”时刻?

他说,这件事不会明年就发生,不会突然发生,但很可能会是未来5到10年 AI 里最前沿、最难、也最重要的 AI 方向。爱笔做的所有这些脏活累活,说到底,都是在为那个时刻做准备。

但在这些关于“未来”的判断之外,这家公司也已经走到了一个更现实的阶段。林元庆提到,去年公司已经非常接近盈亏平衡和正现金流,而今年,他预计一定会实现盈利,并开始推进上市相关的准备。

在他看来,只要把现有的四个主线领域继续做深,爱笔有机会成为一家年收入五十亿到一百亿元、同时具备较高毛利和稳定盈利能力的 AI 公司。这个规模不算巨大,但在国内 AI 行业里,真正同时做到“有体量、有利润、还能持续”的公司,仍然很少。同时,这家公司把物理世界AI大模型,即物理世界的“ ChatGPT时刻 ”,看成是自己的诗和远方。

以下是网易《态度》栏目和林元庆的对话,经不改变原意的编辑。

AI赋能垂直行业,已经帮助很多实体门店业绩提升50%以上

网易《态度》栏目:回到最开始。2017年,您为什么会决定创业,做这样一件在外界看来又重、又脏、又累的事?

林元庆:爱笔原来起的名字其实就是 AI To B,Aibee。我们一开始就下了个很明确的使命,到今天也没变:AI 升级赋能垂直行业,打磨极致 AI 技术。

那个时候我们已经看到,AI 在互联网公司里面已经非常厉害了,甚至已经成为很多核心业务的主驱动力。像电商、外卖、搜索,那时候其实已经很明显了。

但你2017年往互联网外面一看,大部分垂直行业,特别是线下实体行业,AI 的赋能几乎还是很弱的。可能有些人脸识别之类的技术,但离真正赋能业务还差得很远。

所以我们当时就想,要找到一些行业,真正帮这个行业做实质性的升级,而不只是做一些看起来有意思的工具。

后来也有人说,爱笔这家公司是在“大炮打蚊子”。但我一直觉得,如果这些蚊子都打不下来,大炮其实也没有用。

我们后来选的这些行业——零售、购物中心、门店、机场、枢纽、城市——一方面体量够大,另一方面技术场景也非常丰富。你如果做 AI To B,这个行业不能只有一两家主要公司,否则你还不如直接加入它们。我们要找的是那种足够大、足够分散、又确实需要数字化升级的行业。

现在回头看,我觉得我们当时选的方向是非常好的。当然不能说是最优,但我觉得很对。

网易《态度》栏目:您现在一天大概怎么安排?

林元庆:公司里我直接看的东西其实比较多。

一个是产研,也就是产品和技术研发,这是一大块。我们现在基本上有4条大的产品线,更准确地说其实是4条行业线:购物中心、连锁门店、机场和枢纽、城市。每一条线下面又会有具体产品。每条线都会有产研负责人,也会有市场负责人,因为每条线本身都比较独立在运行。

我非常紧密地跟进每条线的产研进展。比如我们一个季度开始会定 OKR,定这条线这个季度产研要做到什么程度;每两周会有一次比较完整的 review,平时周中也会有小的 follow up,去看研发进展。这一块大概会花掉我差不多三分之一的时间。

另外一块其实是市场和客户。很多人可能很难想象,但我在爱笔其实有非常多客户对接,特别是跟客户高层去打交道。这里面不只是市场推广,更重要的是我自己也在学习。因为我原来的背景确实比较纯技术,所以要想办法扎进一个行业,去看它最核心的业务逻辑是什么。

比如一条业务线,它最核心的业务逻辑到底是什么?在这种情况下,AI 到底怎么能给它的核心业务带来赋能?并且这种赋能得是比较可量化、可闭环的,不能只是一些 nice to have 的东西。对企业来说,nice to have 用处不大。

这一块大概会花掉我一半左右的时间。

剩下可能五分之一到六分之一,是公司内部管理。但其实管理工作也都融在前面这些事里,比如 OKR review,本身也是管理。

创业到现在第九年了,我基本上一直都是这么过来的。一般周一、周二在北京,周三到周五大概率出差,周五晚上回到北京,周六&周日是和各产品线的产研 review 和市场进展 review。一周7天,差不多都是这么过来的。

网易《态度》栏目:这其中有一个词是“赋能业务”。这个词现在也经常被说得很空。你理解的“赋能”到底是什么?

林元庆:我觉得最重要的是,你不能只看客户今天哪里疼,而是要往前看。

今天很多企业当然也在讲降本增效,但这不够。更关键的是去看这个行业如果往前走5到10年,它最核心的业务会怎么变化,它需要什么样的升级,然后 AI 有没有机会去帮助它实现这个升级。

比如商业地产这几年就在发生非常大的变化。以前更多是建设、盖楼,现在越来越重运营,整个行业都在从开发商往运营商转。再比如进入存量市场之后,竞争会变得更激烈,大家拼的是谁的精细化运营能力更强,谁的管理半径能更大,谁能把一个商管团队从管20个购物中心做到管60个。

AI 在这里面的意义就很明确了,它不只是帮你节省一点人工,而是帮助你形成下一阶段的组织能力。

所以我现在花很多时间去跟客户交流、去行业一线学习。因为你只有把这个行业5年后的趋势看清楚,今天的技术落点才不会是浅的。否则你做的很多东西,最后就是个工具。

我一直觉得,AI 最终不应该只是个工具,它应该和企业能力融合在一起,变成这个企业在行业里的核心竞争力。

网易《态度》栏目:现在爱笔的业务主线是什么?

林元庆:现在我们自己深耕的,主要就是4条业务线。

第一条是 AI 赋能购物中心。这块我们现在做得最深。包括 AI 精准客流、AI 停车、AI导航( AR/VR 导航)、AI 大屏、AI 智能体,我们内部叫“ 5件套”。这几个产品在购物中心行业里,应该都处在代际领先的位置,而且市场上只有我们能一体化地把这几套都提供出来。

第二条是AI赋能连锁门店。最开始其实做过很多行业,服装、化妆品、儿童乐园、银行、汽车都做过。后来2021年我们做了聚焦,重点做新能源汽车门店。现在全国新能源汽车门店里,差不多接近一半的门店采用的是爱笔的 AI 精准客流方案。

第三条是AI赋能机场和枢纽。比如首都机场、通州副中心交通枢纽,这几年我们在这个行业里落地了很多系统。全国 Top20客流量的机场里面,已经和我们合作的有16家。

第四条是 双智城市。这块是从海淀开始做的。以前我们偏室内,后来海淀发现我们的能力很适合用在城市治理、智慧交通上,于是就慢慢把这套“空间智能”的能力延伸到了路口、道路、摄像头联动这些场景里。

但如果从底层去看,这些其实不是4套技术,而是同一套底层技术:在三维空间里理解物体、理解状态、理解交互,再把这些能力转化成上层业务。

所以我们后来把原来那个很长的说法“线下空间的数字化和智能化”,简化成“空间智能”。

网易《态度》栏目:经营层面来看呢?营收和业务结构?

林元庆:从营收结构上看,前两年大致是智慧门店占三分之一,购物中心占三分之一,机场和枢纽再加上双智城市占三分之一左右。

从经营层面来看,公司的状态也在往我们想要的方向走。去年我们已经非常接近盈亏平衡,也非常接近正现金流,虽然还没有完全达到,但已经很接近了。今年肯定会是盈利的一年。随着公司走到这个阶段,我们也会开始准备上市相关的事情。

我一直在讲,爱笔真正重要的,是要逐步把自己的闭环建立起来。这个闭环是:资金带来技术研发,技术形成产品,产品进入场景,更多的场景赋能产生更多数据以及更多的商业变现,而更多的资金和数据进一步促进技术的研发。这个闭环一旦真正跑起来,公司就会越来越稳,越来越有力量。

从这个角度看,我对爱笔的业务还是很有信心的。哪怕我们只把现在这四个领域做好,我觉得就有机会把公司做成一家年收入五十亿到一百亿元、而且高毛利、很稳定的 AI 公司。这个规模当然不能说是特别巨大,但在国内,我目前还没有看到哪家 AI 公司,已经真正做到这样一个既有收入体量、又有高毛利、同时还能稳定盈利的状态。当然,盈利可以投入到长远的技术研发。

网易《态度》栏目:我看到爱笔可能一个最容易被理解的案例,就是帮某珠宝门店把业绩提升146%,租金收入提升约5倍。这个事到底怎么做到的?

林元庆:这个案例其实挺典型的。

我们做的是一套叫 AI 精准客流 的方案。它不像传统客流系统简单数人头,而是像线上产品经理看 UV、PV、转化率一样,去看线下门店的“转化漏斗”。

比如一间门店门口路过多少人?多少人进店?进店的人里有多少人停留8分钟以上,我们把这个叫“深逛”?深逛的人里有多少最终成交?成交多少笔,再乘上客单价,就是销售额。

你一旦有了这个链路,门店业绩不好就不再是个模糊问题,而能往前追:到底是哪一环转化率低?

但前提是,这个数据得足够准。比如这家珠宝门店,客流量本来就不大,如果把店员进进出出都算成顾客,整个数据就废了。我们现在能把这个颗粒度做到非常细非常精准,这个在行业里应该是很少有人能做到的。

当时那个案例,我们和购物中心、品牌方、店长一起前后做了差不多3个月。第一轮分析发现,它的“深逛率”很低——进来的人不少,但很多两分钟就走了。跟周边同类珠宝业态比,也明显偏低。

所以爱笔这套系统有点像 X 光机。它先告诉你,薄弱环节在哪。后面爱笔团队、购物中心运营团队、店长,甚至这个品牌的区域经理,在一起去分析到底问题出在哪。

最后大概归结成两件事:

第一,货不够匹配客群。进来的客群偏年轻,但产品风格偏老派。

第二,接待能力不够。珠宝这种店,店员的接待非常关键。

他们前面也试过一些方法,比如做邀约,但效果都一般。后来真正有效的,是两件事:一是做店员培训,以老带新;二是货品做了几轮迭代,每轮迭代之后都看数据反馈。

最后这家店业绩提升了146%。租金收入为什么会提升约5倍?因为现在购物中心很多是“固定租金 + 提成”的模式,业绩超过某条线以后,商场才会开始分成。所以当业绩被拉上来以后,租金收入的弹性会非常明显。

我一直觉得,线下这件事特别有意思。线上20年如一日都在做这种基于数据的优化,但线下以前几乎没有这个能力。爱笔做的,就是把这种能力带到了线下。

网易《态度》栏目:听下来你们不只是采数据,也做分析和落地,这个中间环节是不是也很关键?

林元庆:对,这个其实非常关键。很多 AI 公司做到数据这一步,觉得已经很好了。但还非常难的是:你怎么让 B 端客户真的把数据用起来。

我们前面有差不多5年时间,做了很多非常完整的数据分析系统。现在回头看,那些系统很完整,但不一定真适合客户去落地。

大概从2023年开始,我们在这件事上想得更清楚:方法论必须足够简单,足够容易理解,最好是全国都能通用的一套做法。哪怕做到这个程度,我们还是需要一个专门做“数据价值”的团队,去陪客户把这套方法论落下来。

比如刚才那个购物中心,我们有两位同学几乎在现场待了一年。后来这套方法论才慢慢标准化。现在这个团队其实只有4个人,但已经可以覆盖大部分购物中心客户,去告诉他们这些数据该怎么看、怎么用。

所以爱笔不是把一堆 BI 扔给客户就结束了。我们的目标是,最后客户真的能用这套系统实现运营效率的提升,最终实现业绩的提升。

别人报价2到3亿,我们最后做了800万

网易《态度》栏目:很多 To B 公司会越做越重,最后靠堆人。爱笔怎么避免这件事?

林元庆:我们一直非常警惕这个问题。

从外面看,爱笔链条确实很长。一个落地项目从空间扫描、点位设计、安装部署,到软件、算法、BI、后续数据应用,几乎都是我们在做。你会觉得很重。

但反过来,这么做也有好处:因为链条都在自己手里,所以整套系统可以做到非常优化,而且可以真正产品化。

我觉得爱笔的产品化有两层。

第一层是底层技术的产品化。虽然我们做了多个行业,但底层核心其实是一套技术,也就是空间智能。

第二层是业务侧的产品化。比如购物中心客流分析,在万达、华润、太古,基本都是高度标准化的产品;停车、导航也是一样。

所以,我们真正给客户做的定制化其实很少。很多公司做 To B 喜欢去做大总包,什么都接,甚至连打印机都卖。爱笔不是,我们非常拒绝这种模式。我们尽量做的是封装好的我们自己的产品。我们重产品化,而不是重项目制。

这也是为什么我们过去几年的增长还比较健康。疫情后的2023、2024年,我们大概每年增长30% 左右;2025年差不多增长接近60%;今年预计80% 到100%。背后不是靠拼命堆项目,而是靠产品化交付带来的内生增长。

网易《态度》栏目:您刚提到产品化。比如空间扫描、三维重建,这件事听起来成本很高,爱笔为什么能把成本做到这么低?

林元庆:因为我们把很多原来靠人做判断的环节,真正用算法替代掉了。

以前做一个10万平米购物中心的三维建模,行业里成本大概要300万到500万。我们现在能做到10万元以下。

原理上是这样的:我们不是只采一层数据,而是一次性采集6层数据,包括点云、图像、Wi-Fi 指纹、蓝牙指纹、地磁、气压计等。以前没有算法的时候,数据采得越多,工作量越大;但当你有很强的融合算法以后,数据越多,反而越能互相校验。

比如某一层重建信息不够充分,我可以看另外一层的信息,来判断这里应不应该拼接。原来这些都是靠很有经验的人去做判断,现在可以算法自动去做。

所以核心不是简单压低价格,而是技术上把原来的人工判断彻底替代掉了。

网易《态度》栏目:您刚刚讲成本优化,让我很好奇爱笔底层技术到底是怎么一步一步做出来的。

林元庆:这个过程其实很磨人,但也很有壁垒。

我们最早做购物中心 AI 精准客流的时候,要处理每个摄像头每一帧的数据。一个大购物中心可能有几百个摄像头,计算量非常大。

2018年底(创业一年后),我们大概把这套功能第一次做出来。当时一个购物中心一天的数据,需要150台8卡 GPU 服务器(共1200卡)跑10天。在2018年,我们用的还是1080Ti 这种卡。

很多人觉得这么重的事情根本不可能落地,但我们当时就判断,这套系统一定可以优化下来。

到了2019年暑假结束,我们把它优化到12台 GPU 服务器一天跑完一天数据,相当于提升了差不多100倍的计算效率。再到2019年11月,我们把90% 的计算塞到摄像头的 AI 芯片去算,就变成1台 GPU 服务器了。后面再往下做,到2022、2023年,基本上跟 GPU 有关的计算都挪到摄像头端上去了,最后变成了0台 GPU 服务器。

如果从计算成本看,当年150台卡那套方案,差不多对应的是2000多万元硬件,而且还得10天跑1天数据。今天如果用芯片去算,可能只要20万左右,算是1000倍的算力成本节省。

这个过程我们当年用的方法,其实就是去年 DeepSeek 出来之后现在大家熟悉的蒸馏、量化、剪枝这些技术。您看,2019年我们就在深度做这些技术了。您可以理解成,我们一直在用数据&训练去换计算效率。

所以爱笔的技术壁垒,不只是算法本身,而是:算法能不能工程化,能不能把成本压下来,能不能真的落地。

网易《态度》栏目:您刚刚提到双智城市,感觉更大也更抽象。能不能展开讲讲?它和以前讲的智慧城市到底有什么区别?

林元庆:以前大家说智慧城市,更多还是偏安防、偏公安那套,技术也比较浅,很多时候就是识别,尤其是人脸识别,再加上一些简单识别。

现在我们讲的双智城市,我理解是要从技术框架上升级到对城市三维空间的理解,也就是空间智能。这个区别很大。

以海淀为例。去年我们帮海淀把所有路上的部分——楼里没做——完成了三维建模。以前很多公司给海淀报过价,大概是2到3个亿,我们最后大概是800万做下来的。

做完三维建模以后,我们又把海淀路上接近2万个摄像头,统一到这套坐标系里。以前每个摄像头只是个编号,现在每个摄像头都有自己的坐标、角度、视域,它看的是空间的哪一块区域,全都清楚了。

这样一来,这些摄像头瞬间就是联动的。比如一辆车从一个摄像头驶出,一定会进入下一个摄像头的视野。你在路口做红绿灯控制的时候,就不再只是知道大概有多少车排队,而是能知道每辆车在三维空间里的实时状态,车头朝哪边、有没有堵进路口、是不是反溢出。

我们在联想东桥做的 AI 控制红绿灯,把拥堵系数下降了30% 多。这个路口的物理条件完全没变,但爱笔的这套系统上线之后,日均车辆通过量提升了大概14%,早高峰车辆平均速度提高了约40%,晚高峰提高了约90%。

所以我觉得,新的智慧城市不是更大的摄像头系统,而是对三维物理世界更深的理解能力。

未来5到10年,AI最前沿的大机会是物理世界AI

网易《态度》栏目:现在大家都在讲大模型、多模态、具身智能、Physical AI。你怎么看爱笔在现在的位置?

林元庆:大语言模型出来以后,对我们当然有很多直接帮助。比如智能体,我们已经在购物中心、客户交互这些场景里大量在用了。以后用户到购物中心,不一定再去找小程序,也不一定要读很多说明文档,他可以直接问:我怎么积分最划算、停车位在哪、去哪个店最近、帮我找车、帮我排队。这些都已经能做很多事情了。

但从更大的趋势看,我们一直有一个判断:大模型这一波技术浪潮之后,更大的机会在物理世界的理解上。

如果把 AI 的主要方向粗分一下,自然语言理解这块,已经到了它的“ ChatGPT 时刻”;语音因为大模型带动,也算基本解决了。可计算机视觉还没有到它自己的“ ChatGPT 时刻”。

我理解的视觉“ ChatGPT 时刻”是什么?是摄像头看这个世界,能像人眼一样去理解:桌子上有水、有书,这个瓶子里装的是水,这个桌子能承重,它不会掉下去……这种理解是非常丰富的,而且是带空间信息和时间信息的。

这个事情今天还很远。

所以我觉得,未来5到10年,AI 最前沿、最有挑战的一块,就是对三维物理世界的理解。你可以叫空间智能,也可以叫物理世界 AI,或者具身智能的“智能”部分,本质上是一个事情。

网易《态度》栏目:现在具身智能很热。您怎么看具身智能和空间智能的关系?

林元庆:我觉得如果把具身智能拆开看,实际上就是两大块:

第一块是“具身”的部分,也就是身体、控制、小脑、灵巧手这些;

第二块是“智能”的部分,也就是对三维物理世界的感知和理解。

过去几年,身体这部分其实发展很快,机器人跳舞、翻跟头、灵巧手都很厉害。但为什么很多机器人在台上能翻跟头,却下不了台阶?核心问题不是身体不够强,而是对环境的感知还不够强。

你真正走进现实世界,不同环境的台阶不是标准化的,环境是开放的、复杂的。如果对这个世界的感知&理解不够深,机器人的应用一定是有限的。

所以我说,空间智能这块如果发展得不好,具身智能的应用会很受限。只是它不是说一定要等5到10年后才突然发生,我觉得技术进展会是渐进式的。比如今天你可能先能解决下台阶,明天再解决更复杂场景,但大的方向上,这一块是必经之路。

网易《态度》栏目:现在市场上也有一些公司在讲“空间智能”概念,比如做3D 生成、空间设计、仿真的公司。你们怎么区分自己和他们?

林元庆:我觉得空间智能现在大致有两个方向。

一个方向偏生成,也就是你对物理世界有一定先验理解以后,去生成三维空间、三维场景,这一类公司大家更容易理解,视觉冲击也更强。

另一个方向偏感知和理解,尤其是对现实世界、真实世界的感知和理解。爱笔主要做的是这一块。我们从一开始做三维建模,到后面做人、车、飞机等物体在三维空间里的追踪和理解,走的一直是这条线。

我自己的判断是,现在这两个方向还是分开的,但大概2到3年左右,它们会慢慢汇合。因为你能生成,说明你其实对这个世界有很强的先验模型,能帮助更好地感知和理解物理世界;而你感知得越好,也越能反过来帮助积累更多的物理世界的先验,进而帮助生成。它们本质上是相辅相成的。

只是现在这个行业还比较早期,所以大家还在分头推进。

网易《态度》栏目:您刚才提到偏感知&理解的空间智能,好像和具身智能公司做得还不一样?

林元庆:是的,这个领域是有2个不同的视角来实现的。

一种是 第一视角(egocentric),也就是摄像头装在机器人、车、设备上,它在动;另一种是我们现在做得更多的,叫环境视角或第三视角(exocentric),也可以理解成是上帝视角,摄像头装在环境里,它不动。

我有一个很重要的判断:如果物理世界的视觉有“ ChatGPT 时刻”,第三视角至少会比第一视角早1到2年。

为什么?因为环境视角有很多天然约束条件。摄像头装上以后,它一辈子就看这个地方。这样我们就更容易构建自学习、自标注、自训练的框架。对物理世界AI 来说,这个能力非常关键。因为如果你永远靠人工标注数据去训练,根本走不到计算机视觉的“ ChatGPT时刻“。

而第三视角在这件事上,至少比第一视角容易100倍以上。

所以爱笔现在的卡位其实是很明确的:我们在做环境视角下,对三维物理世界的理解,而且已经有了非常大量的真实世界数据。到今天,我们每天真正深度处理、理解的视频时长,已经超过50万小时。这在国内创业公司里,我觉得肯定是数一数二的。

技术创业者必须同时理解技术和商业

网易《态度》栏目:现在智能体特别热,包括龙虾的爆火。你觉得它对爱笔的业务会带来什么变化?

林元庆:我觉得会非常大。现在大家最直观感受到的是 AI 在 Coding 上很强,但我认为接下来一个影响可能更大的方向,是数据分析和数据可用性。

很多行业不是没有数据,而是数据太难用。BI 系统里什么都有,但一个普通运营人员很难读懂,也常常没时间读(因为平时要忙的事情已经很多)。你让一个购物中心的营管员天天去做复杂数据分析,这不现实。

但如果有一个足够强的 Agent 层,后面这些数据读取、理解、归因、形成建议的工作,它都可以帮你分析出来。比如一个营管员早上打开系统,Agent 直接告诉他:你负责的女装区今天哪些门店有问题,问题出在哪个漏斗环节,建议怎么处理。

这件事的意义非常大。因为原来“使用数据”的成本,不一定是钱,而是人的时间和精力。现在这个成本在快速下降,甚至可能降到零。

所以对爱笔来说,这是巨大的机会。我们本来就在做线下空间的数据化,如果上面再叠一层强 Agent,这些数据的价值会被释放得非常大。

网易《态度》栏目: 现在外界有一种观点,说 Agent 会把传统软件杀死。您怎么看?

林元庆:我觉得问题“软件会不会死”,在于是比较传统的软件开发。但更有意思的是,相比于互联网时代,AI 时代的信息架构会发生根本变化,这是软件业的巨大新机会。

互联网时代,平台公司要把信息尽量都收集到自己这里,然后统一服务用户。这个模式过去非常成功。但它有两个问题:

第一,它不可能真正实时,全世界收集一遍出差需要几个月的时间;

第二,很多本地、线下的数据,根本收集不上来。

到了 AI 时代,情况会变。因为有了 Agent,每个本地节点都可以有自己的 Agent。比如一个购物中心自己就有一个 Agent,它最清楚自己现在有没有停车位、哪家店在做什么活动、会员积分怎么最划算、停车场的哪条路最堵。

未来外部平台不一定要把这些数据全部抓走,它可以直接和本地 Agent 去对接,用自然语言的现实(而不是传统的API接口的形式),Agent-to-Agent  (A2A) 地沟通。这样一来,数据是实时的,权限也更清晰。你问停车位,我可以告诉你;你问某家店今天销售额多少,我不会告诉你。

所以我觉得,未来更像是一个分布式、实时的 Agent 网络。而爱笔在这个体系里的价值,是帮这些线下场所——购物中心、机场、停车场等——把它们自己的 Agent 能力建起来,让它们能和所有外部平台对接。

这个变化比“某个软件形态会不会消失”更本质。

网易《态度》栏目:以前大家会把你归成科学家创业者。你自己怎么看这些年从技术人到创业者的变化?对今天的 AI 创业者,您有什么建议?

林元庆:其实我到今天还是很技术。我还会看论文,也会花很多时间参与技术讨论。包括刚才我们聊的很多技术判断,我自己都在参与。

但技术创业确实有一个非常大的挑战:你不能只懂技术。技术能不能研发出来,这只是第一道坎。

第二道坎技术要变成产品,这里面会涉及标准化、成本、工程化、交付等等。

产品做出来以后,能不能真正赋能业务,这是第三道坎。赋能业务以后,能不能占领市场,这是第四道坎。占领市场以后,能不能形成壁垒,这是第五道坎。

然后后面还有团队/组织、融资、竞争、周期、宏观环境这些一堆因素。

所以技术创业特别难。很多人以为技术做出来就结束了,但其实那只是开始。后面是一层一层的转化漏斗。

如果说有什么经验,我觉得一是要对技术趋势和应用趋势有自己比较清晰的理解框架;二是团队要形成共识。因为创业这件事不可能十全十美,很多时候就是所有人都要一起牺牲眼前、一起扛。

把目标放到10年后,但非常现实地走每一步

网易《态度》栏目:如果把时间拉到未来10年,爱笔的目标是什么?阶段性重点又是什么?

林元庆:我觉得可以分成业务和技术两条线。

先说业务。我们现在自己亲自深耕的 AI赋能的行业,基本就这四个:购物中心、连锁门店、机场枢纽、双智城市。原则上不会再扩很多行业了,顶多以后再多一两个,但不会很多。

我们的目标是,把这几个行业彻底打透,真的形成“爱笔做了以后,这个行业就很难再有第二家进来”的状态。中国市场做好以后,再往海外走。像机场,我们现在已经开始往中东走了,阿曼机场的 AI 赋能的一期已经做完,后面二期三期也在顺利推进中。

在业务形态上,我们也看得比较清楚:最开始是项目制,然后走向产品化交付,再往上是数据服务,再往上,有机会变成平台型业务。

比如我们现在在看的一个平台型方向,就是自主代客泊车( AVP )。如果未来2028到2030年这个趋势起来,那么购物中心和机场的停车场,需要一套环境侧能力:一方面提供上帝视角感知去和车端感知融合,另一方面管理这些 AVP 车辆。爱笔今天已经在很多停车场里落了数字化基础设施,我们希望未来 AVP 真来了,这些设施不需要重建,可以直接复用。而爱笔是为整个 AVP 行业提供场端智能的全国性的平台型企业。

再说技术。我们一直觉得,空间智能的终极态,或者说物理世界 AI 大模型,是爱笔未来10年的诗和远方。

当然今天你说直接去做这套训练系统,得投入非常大的资源,对创业公司不现实。所以我们的打法会更务实一点:基于我们1.0阶段已经积累下来的数据、算法和优化能力,先走一条比较轻量的路。

我们内部现在分为两个阶段来做。因为我们已经把检测、跟踪、时空理解做得比较好了,所以不一定非要像很多多模态模型那样,从 pixel、patch 开始重新做,那样成本太高。我们希望先把已经做好的物体级别的理解进一步 token 化、结构化,再往上训练,看这条路到底能走多远。

这个事情不是一步到位,但它会不断积累经验。

我跟团队说得很直接:如果未来物理世界AI 真到了 ChatGPT 时刻,我希望爱笔是站在终点的少数几家公司之一。

网易《态度》栏目:AI 变化这么快,但今天聊下来我的感觉反而是要有长期主义,有战略定力。你这种状态是怎么来的?

林元庆:可能跟我的经历有关。

我毕业以后一直在工业界,先在 NEC 美国实验室,后来在百度研究院。工业界研究和学术界不一样,学术界很多时候是在提出问题,工业界更多是在解决真实问题,而且是要能落地的问题。

这段经历让我对技术怎么演进、怎么和应用结合、怎么真正赋能业务,会看得比较透。我自己脑子里一直有一套技术和应用结合的框架。

爱笔从2017年到今天,主线其实一直没怎么变。创业公司里,能做到七八年以后还在做最开始的那件事,而且越做越清晰的,不算特别多。某种程度上,这也说明我们的判断在大方向上是对的。

当然,不代表我们什么都对。我会花很多时间去思考这些事情,也会一直在一线,和客户、行业、技术都保持足够近。因为只有这样,你的判断才会不断被现实校正。

所以我觉得所谓战略定力,不是说我很固执,而是我会把大的方向看得比较长,但每一步走法都非常现实。

网易《态度》栏目:最后一个问题。现在回头看爱笔这9年,你最确定的一件事是什么?

林元庆:我最确定的一件事,是我们最初选的方向是对的。不一定是最优,但一定是很好的方向。

我们从一开始就做 AI To B,做垂直行业,做线下空间,做那些很多人觉得又重又累的事情。今天再看,购物中心、连锁门店、机场、城市都在发生很深的变化;大模型、 Agent、具身智能、空间智能,又把这件事的重要性进一步放大了。

爱笔这些年其实就是一点点把基础能力搭起来:算法、工程化、数据、场景、客户、产品化交付、正向现金流、闭环。

这些零部件平时看起来不一定最显眼,但如果未来物理世界 AI 真迎来它的ChatGPT 时刻,你会发现,真正能站在那个时点上的公司,前面很多年大概率都在做这些“脏活累活”。

所以我常跟团队讲,空间智能的终极态,或者说物理世界 AI 大模型,是爱笔到2035年的诗和远方。

*网易科技重磅推出系列对话栏目《态度AGI》。过去三年,AI变革风起云涌,全球科技秩序正在重构,通往AGI的道路或许正在悄然临近。本栏目以AGI为题,将对话100位AI专家、企业家、投资人,试图拨开云雾,与大家一道见证AGI时代的到来。第五十三期专访林元庆:Physical AI的关键,不是生成新世界,而是理解真实世界

*往期回顾

《态度AGI》第一期:对话李开复:大模型创业狂奔一年 中美差距缩小 我十年不套现
《态度AGI》第二期:对话王小川:我们不跟进大模型价格战
《态度AGI》第三期:对话戴文渊:大模型价格战不解决核心问题
《态度AGI》第四期:对话智源研究院院长王仲远:GPT4不是国内大模型的尽头
《态度AGI》第五期:对话朱啸虎:5年后将没有独立的大模型公司存在,因为没有商业模式
《态度AGI》第六期:对话梅花创投吴世春:“中国大模型五虎”想要跑出来非常难
《态度AGI》第七期:对话跃然创新CEO李勇:做大模型应用 如何和巨头错位竞争
《态度AGI》第八期:对话智谱AI CEO张鹏:视频生成是AGI必经之路,超级App将在“不知不觉”中到来
《态度AGI》第九期:对话科大讯飞副总裁、研究院院长刘聪:中国大模型已从追赶对标走向自主原创
《态度AGI》第十期:对话360周鸿祎:魔法对付魔法,大模型安全问题得靠大模型
《态度AGI》第十一期:对话彩云科技CEO袁行远:超越ChatGPT,需要打开“黑盒”
《态度AGI》第十二期:对话傅盛:不看好双足机器人商业化,三五年都没戏
《态度AGI》第十三期:对话宇树创始人兼CEO王兴兴:通用机器人的iPhone时刻还需要3-4年
《态度AGI》第十四期:对话MiniMax创始人闫俊杰:打不赢,就应该被淘汰

《态度AGI》第十五期对话荣耀赵明:AI时代 开放肯定会击败封闭

《态度AGI》第十六期对话昆仑万维首席科学家颜水成:大模型的三个共识与三个分歧

《态度AGI》第十七期对话聂再清:生物医药即将迎来“ChatGPT时刻”,2-3年内实现重大技术飞跃

《态度AGI》第十八期:对话刘作虎:手机是AI应用体验最好的载体
《态度AGI》第十九期:对话realme徐起:AI已成为消费者购机的主要考量因素
《态度AGI》第二十期:对话喻友平:大模型已从“暴风骤雨”到“润物细无声”
《态度AGI》第二十一期:对话月之暗面杨植麟:竞争是做正确的事 当下最关心“留存”
《态度AGI》第二十二期:对话许四清:眼下投AI,就是在不确定里找到必然

《态度AGI》第二十三期:对话讯飞创投合伙人朱永:AI创企已经迈入了价值兑现的关键时刻

《态度AGI》第二十四期:对话王啸:我看好应用层,一直没投基础大模型

《态度AGI》第二十五期:对话投资人姚海波:人形机器人尚未解决“手”和“脑”问题

《态度AGI》第二十六期:没有这双“神仙”手,特斯拉机器人也难成!魔法原子总裁吴长征:90%零件自己造,2025机器人场景落地生死年!
《态度AGI》第二十七期:对话智元合伙人姚卯青:不做大模型的机器人公司没有未来
《态度AGI》第二十八期:对话方小雷:单日面试1.4万人,朱啸虎连投三轮的AI应用什么样?
《态度AGI》第二十九期:半马获亚军,订单暴增800%,对话松延动力创始人姜哲源
《态度AGI》第三十期:对话昆仑万维CEO方汉:大厂争王座,中厂抢地盘
《态度AGI》第三十一期:对话姜大昕:AGI实现路径清晰了,世界模型不远了
《态度AGI》第三十二期:对话高成投资洪婧:SaaS已死?在中国不赚钱?错了!
《态度AGI》第三十三期:傅利叶十年鏖战,要撕掉人形机器人“大玩具”标签
《态度AGI》第三十四期:对话深势科技柯国霖:AI for Science是实现AGI的必经之路
《态度AGI》第三十五期:对话盛景网联彭志强:跳出SaaS亏损黑洞!从“卖工具”到“卖结果”的AI RaaS转型法则
《态度AGI》第三十六期:对话顾嘉唯:售出千万台,卖爆618,他却说“只想做下一代AI终端”

《态度AGI》第三十七期:对话首程控股叶芊:具身智能走过“婴儿期” 2025是交付

《态度AGI》第三十八期:对话XREAL徐驰:AI眼镜只有5岁智商

《态度AGI》第三十九期:对话谷歌全球广告副总裁:搜索广告正在被AI改造,关键词逻辑变了!

《态度AGI》第四十期:对话宇树科技CEO王兴兴:回应关于宇树上市,机器人降价,AI投入以及出货量

《态度AGI》第四十一期:对话VAST创始人宋亚宸:“3D时代的抖音”当属创业者

《态度AGI》第四十二期:专访 | Soul怎么做AI伴侣?CTO陶明:我们不定义关系

《态度AGI》第四十三期:对话Plaud莫子皓:还没投广告 国内产品销量已经第一

《态度AGI》第四十四期:对话灵足时代联创邵元欣:做机器人领域的“英伟达”

《态度AGI》第四十五期:VLA模型仍存在明显缺陷 大晓机器人携ACE范式入

《态度AGI》第四十六期:对话传音阿里夫:方向大于速度|300亿美金市场的“非洲之王”用AI找第二曲线

《态度AGI》第四十七期:破解具身智能“数据荒”,对话鹿明创始人:数据采集效率提升5倍,成本降至1/5

《态度AGI》第四十八期:给机器人做仿真训练 这家创企年营收破亿 预计26年翻4倍

《态度AGI》第四十九期:对话周亚辉:不和字节腾讯卷,要在海外做“AI版Spotify"

《态度AGI》第五十期:对话傅利叶CEO顾捷:意念控制机器人不是科幻 1-2年就落地

《态度AGI》第五十一期:独家对话吴军:AI刚起步,泡沫期或在2028年,绝大部分AI公司终将消亡

《态度AGI》第五十二期:对话枫清科技高雪峰:龙虾之后,企业搞AI没有退路了

延伸阅读
相关推荐
热点推荐
最新车队车手积分榜:德比斯夺冠逼近第2,张雪机车坐稳第3名

最新车队车手积分榜:德比斯夺冠逼近第2,张雪机车坐稳第3名

全景体育V
2026-05-16 19:40:53
马斯克为什么不四处合影,拉关系,结交人脉啊,菜真就那么好吃?

马斯克为什么不四处合影,拉关系,结交人脉啊,菜真就那么好吃?

老方
2026-05-15 11:37:48
张本美和教练喊话孙颖莎!能3-0我徒弟,并给出1句话评价

张本美和教练喊话孙颖莎!能3-0我徒弟,并给出1句话评价

酷侃体坛
2026-05-16 16:08:23
爆大冷!混双小将胜头号种子进决赛!泰国赛国羽3项冲金!附赛程

爆大冷!混双小将胜头号种子进决赛!泰国赛国羽3项冲金!附赛程

佑铭羽球
2026-05-16 23:19:05
周杰伦抱小女儿现身机场,圆脸肉嘟嘟的,天王变身超级奶爸!

周杰伦抱小女儿现身机场,圆脸肉嘟嘟的,天王变身超级奶爸!

原梦叁生
2026-05-15 19:50:47
中方换人出席,金砖会议大吵一架,当着10国面,阿拉格奇斩钉截铁

中方换人出席,金砖会议大吵一架,当着10国面,阿拉格奇斩钉截铁

史行途
2026-05-16 00:31:03
所有动物在交配时都会有快感吗?

所有动物在交配时都会有快感吗?

宇宙时空
2026-05-16 13:54:55
马科斯没想到,参议院会出现枪声,杜系重臣被困,麻烦的还在后面

马科斯没想到,参议院会出现枪声,杜系重臣被困,麻烦的还在后面

晨初浮若
2026-05-15 19:16:48
法国队公布世界杯大名单:卡马文加落选,新星门将入选

法国队公布世界杯大名单:卡马文加落选,新星门将入选

坠入温柔晚风
2026-05-17 02:26:52
山西左权通报公交车侧翻事故:2名学生不幸身亡、2人受伤

山西左权通报公交车侧翻事故:2名学生不幸身亡、2人受伤

界面新闻
2026-05-16 19:46:09
不给阿森纳退路!维拉4-2锁定前五,下轮给曼城放水,争冠有变数

不给阿森纳退路!维拉4-2锁定前五,下轮给曼城放水,争冠有变数

体育知多少
2026-05-16 06:01:52
特斯拉上线全新优惠,真的猛!

特斯拉上线全新优惠,真的猛!

花果科技
2026-05-16 10:54:56
效仿22年阿圭罗!日本队世界杯名单公布,森保一:考虑带南野拓实一同前往

效仿22年阿圭罗!日本队世界杯名单公布,森保一:考虑带南野拓实一同前往

懂个球
2026-05-16 00:00:19
悲催!网传四川一贸易公司半夜倒闭,工资马上发,员工哭诉失业了

悲催!网传四川一贸易公司半夜倒闭,工资马上发,员工哭诉失业了

火山詩话
2026-05-15 14:45:12
形势有多严峻?坐标上海:80末90初程序员都开始失业,评论区炸了

形势有多严峻?坐标上海:80末90初程序员都开始失业,评论区炸了

慧翔百科
2026-05-14 09:00:11
量产“高达”的中国,让日本神话彻底崩塌

量产“高达”的中国,让日本神话彻底崩塌

金错刀
2026-05-16 22:31:54
日本网民的真正破防,开始了

日本网民的真正破防,开始了

这里是东京
2026-05-15 17:19:46
生理旺盛的女性,大多有这3个特征,超准!

生理旺盛的女性,大多有这3个特征,超准!

皓皓情感说
2026-04-25 19:09:10
大学生集中毕业典礼上,郑州市委书记再度向毕业生发出留郑邀约

大学生集中毕业典礼上,郑州市委书记再度向毕业生发出留郑邀约

澎湃新闻
2026-05-16 20:32:28
情侣在瑞士雪山顶“撒欢”,就这么被全世界直播了···

情侣在瑞士雪山顶“撒欢”,就这么被全世界直播了···

新欧洲
2026-04-21 19:37:05
2026-05-17 02:56:49

科技要闻

涨的是车价,要的是老命

头条要闻

又想“抹黑”中国 福克斯新闻“翻车”了

头条要闻

又想“抹黑”中国 福克斯新闻“翻车”了

体育要闻

马刺2号,少年老成,这集看过?

娱乐要闻

谢霆锋北京街头骑行被偶遇,侧颜帅炸

财经要闻

造词狂魔贾跃亭

汽车要闻

大五座SUV卷王!乐道L80上市 租电15.68万元起

态度原创

教育
艺术
旅游
家居
数码

教育要闻

又开始偷偷卷排名的几所大学!

艺术要闻

惊!艾米·亚当斯竟是坠入凡间的仙女?

旅游要闻

重磅!珠海推出260余项活动,释放史上最强文旅红利

家居要闻

110㎡淡而有致的生活表达

数码要闻

科技巨头访华遇618 苹果、高通、英伟达集中促销中

无障碍浏览 进入关怀版
×