![]()
出品 | 网易科技《态度》栏目
作者 | 袁宁
编辑 | 丁广胜
上线首日下载量破20万,三日内突破50万,一路冲上App Store总榜第七、工具类免费榜第一——在2025年底的AI赛道上,“灵光”完成了一场奇袭。
这款由蚂蚁集团于11月18日正式发布的“全模态通用AI助手”,由集团CTO何征宇直接负责、灵光APP负责人蔡伟带队,200人团队,自今年3月起开始立项。
“灵光”表现惊喜,首批上线“灵光对话”、“灵光闪应用”、“灵光开眼”三大功能。它不仅在业内首次在移动端实现了“自然语言30秒生成小应用”,让“手搓应用”从极客专属变为大众可能;更率先支持全代码生成3D、音视频、图表等全模态内容,带来了极具信息美感的可视化互动体验。
它的发布时机也颇为微妙。就在阿里“千问”更新的次日,“灵光”悄然上线,外界普遍将其解读为阿里系在AI领域打出的一套“通用大模型+垂直应用”的组合拳。然而,何征宇在接受网易科技等媒体采访时,却给出了一个出人意料的回答:“发布日期纯属意外,是灵光自己算的。”
这份“意外之喜”显然也超出了团队的预期。对于上线即火爆的表现,何征宇与灵光APP负责人蔡伟坦言“完全没想到”,他们最初对年底用户量的期待,仅仅是20万。据何征宇透露,就连近期罕见现身蚂蚁园区的马云,也对这个目标提出了更高的期望,鼓励团队“要往前冲击一下,冲第一”。
外界对“灵光”充满了疑问:它为何要以独立APP的形式突围,而非直接嵌入支付宝的巨大流量池?在阿里系的AI版图中,它究竟扮演何种角色?面对文心一言、豆包等一众先行者,其差异化优势与底气何在?关于未来商业化,团队又有着怎样的考量?
热度甚至一度让团队措手不及。“灵光”上线第三天,团队紧急组织了一场媒体沟通会。据网易科技了解,从决定到执行,整个筹备过程不足20小时,原因无他——“问的人实在太多了”。
带着这些疑问,我们与蚂蚁集团CTO何征宇、灵光APP负责人蔡伟进行了对话。以下为对话实录,经编辑整理。
一问:灵光上线即火爆,前两天马老师也出现在蚂蚁园区,想问一下,他对灵光这个产品有什么评价?或者看法?
何征宇:先说一下马老师那天来肯定不是因为灵光(笑)。今天早上一起聊,他是希望我们要往前冲击一下,冲个第一,给这个期待。
但是我跟他说,我们本来也没这个期待,我们本来就是准备玩一玩,然后年底到个20万(用户)。他说这个目标太差了。我们年底的目标,年前就已经完成了,昨天刚刚完成。
二问:“灵光”与“千问”前后脚发布,“灵光”与“千问”之间是什么关系?“灵光”用了“千问”的模型吗?很多人认为这是阿里系“通用+垂直”组合拳的体现。“灵光”在蚂蚁,以及整个阿里系的AI版图中,到底扮演什么样的角色?
何征宇、蔡伟:产品发布时间上,我们确实没有约好,但我觉得是一个很好的结果。我们相隔一天发布,我们为什么会选十八号发布?其实是“灵光”自己算的(笑)。
“灵光”用了很多模型,包括千问,以及主流的开源模型。
我理解应该是共赴AGI的战友和兄弟的感觉。因为AGI无论从技术空间还是市场空间来看,都应该是巨大的,而且它也充满不确定性。
我经常打个比方,在沙漠中找水,我一定不会把所有派都派到一个方向上,一定是好几个组一起往外找,谁找到了大家一起用,应该是这样一个状态。
我认为今天来看,灵光还小。我们最大的愿景肯定是很美好的,因为我们认为在AGI时代,我们肯定有一款我们自己的代表产品,可能是蚂蚁财富、可能是灵光。
就像蚂蚁当年从互联网到移动互联网,有了支付宝,然后有了余额宝,有了网商银行一样,有可能是说我们还要在不同的方向去探索。我们的定位或者说战略性的选择,就是我们必须要拥抱那些不确定性,因为不确定性才意味着机会。
三问:为什么要做一款独立的APP,而不是仅仅让AI能力直接嵌入支付宝这个国民级应用?灵光未来会如何与蚂蚁的生态进行联动?
何征宇、蔡伟:我们不是说不选择嵌入。包括你现在看支付宝里面,其实已经有AI了。我觉得今天这件事最关键的是说,你不能为了AI而AI。
支付宝今天其实很多产品后面都用了AGI的技术。你按了一下,说“我叫个代驾,我要回西溪园区”,它就马上给我们分析出来了。其实这些东西是慢慢落地了,只是大家没有发现那些界面上的东西,或者没有单独发现一个品牌,获取力没有那么强。
这也回答了第二个问题,其实我们原来的很多技术已经慢慢渗透到其他业务层了。可能在接下来的几个月里面,你可能会感受到支付宝里有股“灵光味”。
四问:千问公开对标ChatGPT,那么灵光是否也有一个明确的对标对象?是否会与千问或其他产品共同争夺“国民级AI应用”的头把交椅?
何征宇、蔡伟:从产品重构的角度,我不是“对标”是一个特别的目的,它可能是一个阶段之后的结果。在一个高速发展的市场,短暂的第一名可能没那么重要,直接对标一个竞争对手甚至认为是一个错误。
从产品的角度,我还是更愿意用发展的思路前瞻性地看:现在的模型能力是什么?现在的产品表达是什么?那么过了半年、一年多了,它的模型能力能演进到什么程度?相应的产品表达是什么?它能够解决什么样的用户需求?
我们要做的就是找准正确的方向,基于模型的能力向前看,一路狂奔。等模型进展没有那么快的时候,再去看市场的格局。
我觉得我们肯定没有去讨论什么对标。但我跟别人对标一下,甚至希望能对标意味着你的创新已经成功了。我们尝试一个开放性的、有承接的、大家都喜欢的用户产品,就是目标。
刚刚我们讲的20万DAU也只是一个指标,而不是目标。我们用这个指标来验证我们是不是真的做对了,20万下载量,至少说明有20万人喜欢用我们的东西。我们会希望看到有人在这个产品上创作不同的东西,这是我们希望能够看到的,而不是一个简单的数字。
五问:从3月立项到11月上线,8个月的研发周期中,团队是如何在立项当天就确定了现在的核心功能?中间是否经历过路线的牵引和艰难的取舍?
何征宇、蔡伟:在产品的大的方向和布局上,我们可能在3月份就定下来了。当时我们有两个判断:
一个判断是,以现在的模型能力,我们认为用“对话”的方式开始依然是一个天花板足够高、能够承载未来若干年模型能力发展的形式。虽然对话模式从GPT-1,到海外和国内的一些公司,很多人都沿用了,但我我们依然认为这个形式已经被验证了,信息密度也非常高,所以我们仍然会采用主对话这样一种方式。这就有了刚才那三大功能里面的其中的一个:一个是实时话题的问答,还有一个是“闪用”。
第二个判断是关于“开眼”这个功能,更多的还是说,除了这种对话的互动之外,我们有没有实时的互动?其实人和人之间的交流大致就是这两种,一种是你来我往;还有一种就是打电话或者这种实时的交流,这是产品本身在互动方面的一些思考。
但过程中其实有非常多的波折。包括说“闪用”这个事情,3月份的时候我们其实不确定到底在几个月的时候能够做出这样的一款产品。这件事对我们来说也是一个“赌注”。但我认为,这样的一个判断和一个“赌注”,也是在 AGI时代做好一个技术产品的一个核心能力。
对于AGI,尤其是C端的应用,它是个长跑,是个马拉松。8个月的时间相对于我们尝试一款同类应用的目标来说,绝对不是一个蹴而就的。做C端产品一个非常重要的理念是:你不知道它上线之后会火还是不会火,你也不知道你能撑到它会火的那个时候。
六问:灵光的定位似乎更偏向效率工具,而不是情感陪伴。这是否意味着它会和蚂蚁的金融、医疗等垂直AI应用(如蚂蚁财富)产生重叠?未来通用模型是否会最终吞掉所有垂直模型?
何征宇、蔡伟:我个人的观点是,我们更希望把灵光的定位放在效率上。现在大部分的互联网产品可以分散效率类(省时间)和消遣类(杀时间)两类。对于一个产品的起步阶段,它需要有一个主打。因为有很多AI类的产品,它现在主打的功能可能就是陪聊,这个阶段并不是灵光主打的功能。我还是认为要先把长板打得足够长,然后再去补其他的短板,这是一种效率最高、也更容易让用户记住的方式。
蚂蚁上的AI功能和“灵光”的还是不一样的。比如说“AI诊室”真的能帮你诊断、看病,这个我们(灵光)也不准备去发。这些能力我认为是一个非常独特的。那灵光肯定有自己的特色,它可能是在“信息的表达”这一个垂类上选择做的比较突出。最终是用户的最关键,你会用它来做什么?这是最关键的。
七问:蚂蚁有个AGI小组,比较好奇,您是怎么去规划产品和研究这两个方向的?
何征宇:我们觉得AGI是个探索的过程。第二个,我们也不存在说两个目标。
我认为今天的时代红利是什么?就是如果我们能够更高效地转化这种研究优势,把它变成一个独特的产品,我们就有更多的机会。
以这个逻辑来,我刚才前面提到了,我们去加快这个速度,加快这个循环的效率。因为某种意义上,研究其实也需要一些方向。可以做的研究方向太多了,探索的东西太多了,但是其实是需要产品倒过来,或者说从用户视角到我们需要什么样的东西。
我们会集中,我一直讲效率。我们为什么要做扩散?是因为它至少从代码生成(代码生成)的效率来说是非常好的。我们为什么要做代码?代码其实是语言的一个延伸,也是今天我们支撑的这个互联网的基石。在这个上面,我们有各种各样的媒体表达形式,不管是一段音乐、一张图片,还是一个图表,都可以通过代码来表达。那代码这个东西是我们非常坚持的。
对于研究团队或者说我们的工程师团队来说,就是如何把代码的效率做到最大化。你今天看到的灵光所有的东西,其实对研究的要求是很高的。
我很多朋友第一个反应问我,就是你们为什么这么快做?你们是如何能够瞬间文字一样生成一个产品?
其实我们在人工智能上面,包括了语音交互、数据等方面,已经下了很多功夫。所以我想举的这个例子是说,我们不是说从研究成果来,然后到产品,而是从研究到AI到产品是一个整体。核心就是如何让用户获取信息的效率最高。
八问:在灵光之前,市场上已经有了文心一言、豆包等品种。现在入局,是否会觉得“起步稍晚”?面对字节、百度,灵光的底气会是什么?
何征宇、蔡伟:早和晚是相对的。就像抖音推出的时候,快手已经搞了三四年了。我们一直在思考,大时代模型的“iPhone 4时刻”到底是什么时候?
我们目前的判断是,至少今天这个时候,还没有到那个时刻。我们要做的,就是在这个时刻到来的时候,会全力狂奔。把时间目光拉长看,现在仍然是一个非常早期的事情。
我们还是不倾向于以竞争的视角来看待这个问题,因为前面的机会很多。你今天讲的竞争,我认为都不是竞争,只是暂时有人在一个方向上找了一桶油,那里找到了一个苹果。
我们一直在强调,我们到底能帮用户解决什那样的真实需求和问题。比如豆包有个通话功能,灵光今天都没有上,因为我们觉得这个需求方向已经能够帮解决了。我们自己有对比,我们强调的是我们信息获取的效率。这个问题也是个痛点,甚至在今天大家的互联网环境来看都是个痛点,因为知识和信息泛滥。
我们相信,因为我们看到了这个问题,坚持我们的技术理念,我们所有同学都在往这个方向去努力,所以我们一定能走得比别人快,或者走得比别人好。
我认为这是我们最大的底气:我们在中国肯定是一流的工程师团队,并且能够真正朝着一个远大的愿景和方向去演进,而不是搞赛马机制。大家共同努力,这是我们敢于去表达的一个核心的底气。
九问:行业有一个观点,像蚂蚁、谷歌这样拥有庞大生态和应用场景的公司,在AI产业化中比纯粹的大模型公司(如OpenAI)更具优势。您如何看待这两种不同路径的未来?
何征宇、蔡伟:我认为在AI时代面前,其实所有人是平等的。不是说大企业和小企业谁有优势的问题,而是说,谁能清醒地认识现在是一个要充分享受技术红利的时代。
一个时代的开启,一定会小胜大、以少胜多,OpenAI就是这样的故事。但也不代表我们没有机会。我们坚持我们“技术普惠”的那颗心,坚持走这条路,相信我们会得到用户的青睐。
我认为基础大模型跟应用本身是不能分割的,它其实是相辅相成的,可以形成1+1大于2的效果。模型的能力非常重要,应用的能力也非常重要。
我们对灵光的定位仍然是一个技术产品,一个智能的出口。但是除此之外,你不能认为做出了最好的基础模型,然后也没有什么用,它就会自动变成一个过亿日活的应用。模型是基础,但如何将模型能力提升到用户千差万其他上的需求,需要产品、设计、运营、工程等所有角色在能力边界上不断地进行探讨。
十问:关于商业化。目前行业似乎还没有找到非常清晰的路径,灵光对未来的商业模式有什么样的思考?
何征宇、蔡伟:灵光在前天才正式对外发布,所以在商业化上面我们还非常早期。
但是,我觉得这是所有互联网产品的一个规律:当我们创造足够多的用户价值,用户的粘性跟上频次到达一定的水位,总能找到一个好的走向商业化的方式,这是一个自然而然的结果。很多产品商业化不好,本质上是创造的用户价值不够大。
你不可能让一个刚出生两天的孩子出来打工。但是他以后会大学毕业的,大学毕业的时候可以找到一份好的工作。
而且我确实相信未来应该会有一个区别于现在我们所有看到的传统商业模式的新模式出现。这需要我们大家一起来探索。
