![]()
![]()
快手旗下「可灵AI」即将完成一轮超30亿美元的独立融资,投后估值达180亿美元。
据悉,本轮领投方或为具有中东背景的基金,腾讯、阿里等产业资本亦在潜在投资人名单中。可灵AI计划于2026年完成重组与股改,并预计在2027年初正式递交上市申请。
值得注意的是,180亿美元是经过市场“重估”后的定价。快手最初的心理预期为200亿美元,后因资本市场反馈而下调。即便如此,这依然是2026年全球AI视频生成赛道上规模最大的一笔融资。
公开财报显示,可灵去年营收约10.4亿元,仅占快手总营收的0.73%。但进入今年后,其商业化步伐全面提速:一季度收入一举突破6.5亿元,同比狂飙超300%;截至今年3月,其年化经常性收入(ARR)已达5亿美元。同期,可灵全球用户规模突破6000万,累计生成视频超6亿个,并为超3万家企业及开发者提供了API服务。
若以180亿美元的估值与5亿美元的ARR计算,可灵AI当前的市销率(Price/ARR)约为36倍。
![]()
1405办公室的两次豪赌
在快手北京西二旗总部,1405办公室并不是一间宽敞的会议室。但在可灵的叙事里,所有惊险的窄门和转折点,都是在这个房间里敲定的。
大模型把互联网时代的玩法掀翻了。过去大厂习惯了靠A/B测试、靠几百个细分团队进行 bottom-up(自下而上)的赛马,输赢交给概率。但在一个单次训练成本动辄千万美元的品类里,概率成了最奢侈的东西。
创新的方向,退回到极少数领军人物在脑海里做物理推演的爱因斯坦时代。谁的愿景(Vision)更准,谁就能在迷雾里实现“隧穿”。
可灵的第一次惊险跨越,发生在2024年春节后。
当时 OpenAI 毫无预兆地放出 Sora 的 Demo,逼真的质感和物理世界的模拟能力让国内整个多模态行业陷入沉重。假期的空档里,快手社区科学部负责人盖坤给团队布置了任务:如果我们要复现 Sora,技术方案到底是什么?
春节开工的第一周,1405办公室的空气是紧绷的。在完成密集的底层技术对齐后,盖坤拍板了一个极其决绝的决定:全线放弃原有的技术积累,调转船头转向全新的 DiT(Diffusion Transformer)架构。
这个决定在当时看来近乎盲目。因为当时的快手大模型团队在内部默默无闻,资源账单极其难看。他们手里根本没有充足的顶级英伟达显卡,早期的很多训练,全靠从现有资源池里“挤”出来的、公司此前采购的 AMD 芯片或其他异构算力。没有任何一家主流视频模型公司会选择在这样的硬件盐碱地上起步,这变成了一场用高超的工程调优硬补硬件短板的“近身肉搏”。
在算力条件处于绝对劣势的情况下,盖坤在1405办公室里定下了一个让所有人震惊的目标:要在5月底前完成模型和产品的全线就绪,做全球第一个推出可用产品的团队。
“当时我们本来就是 Nobody。博输了还是 Nobody,博赢了就彻底改变命运。”盖坤在接受极客公园访谈时曾这样解释他的“光脚心态”。
但这不完全是一场赌博,背后有一层极其冷静的战略测算:OpenAI 抛出 Sora 大概率是为了阻击 Google,由于战线拉得太长,OpenAI 的核心卡和人大概率会短期内回防语言大模型的迭代。
这意味着,在 Sora 真正变成产品落地前,硅谷给国内留出了一个 6 到 7 个月的真空期。这是唯一的窄门。如果不搏,可灵很快就会滑入“缺乏成果-无法争取资源-逐步边缘化”的慢性死亡。
因为时间卡得太死,内部爆发了极大的反弹和不共识。盖坤最后用了“Disagree and Commit(保留意见,坚决执行)”的方式强压了下去。
2024年6月6日,可灵 1.0 正式上线。
此时,Sora 依然被锁在 OpenAI 的实验室里,国内其他大厂也尚未对视频生成赛道形成共识。百度 CEO 李彦宏曾公开表示不会投入视频生成模型,认为其长期来看无法带来收益;字节跳动则将多模态的优先级押在了视觉理解和图片模型上。
这个宝贵的时间差,让快手抢到了全球多模态赛道最关键的一记先手。
但山峰刚爬到一半,迷雾又来了。第二次命运的博弈发生在2025年,可灵 2.0 发布之后。
彼时可灵已经成了行业的Serious Player,不再是当初那个光脚的Nobody。算法团队内部,两条路的分叉清晰地摆在桌面上。
第一条路是“无限雕花”,沿着 1.0、1.5、2.0 的成熟路径继续往前走,不断内卷文生视频、图生视频的微观精度指标。这条路的风景是确定的,每提升一点指标,业务和资本市场都会给出正向反馈,团队能持续获得安全的、确定性的奖励。
第二条路则是“升维跃迁”,不再纠结于像素层面的修修补补,而是彻底颠覆模型的输入输出方式,将动作、音频、画面打包,走向 All-in-One(AIO)的原生多模态架构。
1405办公室里,这次“不共识”的时间比 1.0 时期长得多。1.0 的阻力来自于“不相信能做成”,而这次的阻力来自于“大家有鞋穿了”。团队开始有了成本意识、投入产出比的算计,以及对现有声誉的顾虑。让一群已经站在小山顶、习惯了看风景的人,重新下到满是技术盲区的山脚去爬另一座看不见顶的山,需要极大的精神消耗。
盖坤选择死守第二条路。在他的技术直觉里,单纯依赖文字和图片输入,用户(甚至是专业级个人用户)根本无法精准驯服 AI,交互介质的落后会直接锁死应用层的天花板。
直到 2025 年行业其他图像技术的推出印证了多模态的终局方向,团队内部的杂音才最终被统一。可灵随后对“动作(Motion)”这一模态进行了重新定义,推翻了学术界主流的火柴人方案,最终将这些前瞻的探索收敛到了如今可灵 3.0 的 AIO 架构中。
后来盖坤复盘这两次技术转向时说,1.0 时期,Sora 的 Demo 已经在前面了,技术方案学术界早有雏形,大家对“能不能做出来”没有疑问,只是在赶工期。
而到了 3.0 阶段,摆在团队面前的选择变了。他们是在选择平滑地走向下一个已知的小高峰,还是去穿越延绵不绝的迷雾山脉,去寻找那个终极目标。
![]()
两年走完六年路
在这场耗时两年的长跑里,可灵用一种近乎自残的迭代速度,走完了硅谷同行需要六年才能趟完的路。
衡量大模型成败的标尺变了。2024年底,可灵邀请贾樟柯、李少红、叶锦添等导演制作了一批纯 AI 生成短片,并顺势成为2025年北京国际电影节 AIGC 单元的独家技术合作伙伴。这是多模态技术第一次向专业影视圈证明,自己不再只是手机屏幕里的玩具。
商业化的账单比想象中来得更早。2025年2月底,上线仅八个月的可灵,累计营收突破1亿元。
但这笔勉强能算作惊喜的数字,很快就被新一轮的军备竞赛吞噬。因为在多模态这块方寸之地上,几乎所有对手都在加速。
2025年4月15日,可灵 2.0 发布。盖坤在会上第一次提出 MVL(多模态视觉语言)概念。其核心逻辑是,由于文字在视觉表达上的贫瘠,用户应当能用图像、视频片段等更丰富的介质直接向模型传达创意。
同月,快手在内部做出了一个极为罕见的组织动作:正式成立可灵 AI 事业部,负责人直接向 CEO 程一笑汇报。这意味着可灵从一个边缘的项目组,正式升格为与主站、商业化、电商、国际化并列的一级部门。这是近三年时间里,快手内部唯一新设的独立事业部。
资源的倾斜很快在产品端兑现。一个月后,可灵 2.1 上线,其高品质版在性能上已经能够媲美 2.0 的大师版,但通过极致的工程优化,其生成价格骤降了 65%。
到了2025年7月,可灵在一年的时间里完成了 30 次高频迭代,全球用户跨过了 4500 万的门槛。然而,就在这个技术与市场的交汇顶点,团队迎来了最剧烈的人事震荡。
8月15日,快手内部宣布调整:由盖坤兼任可灵 AI 技术负责人,原负责人张迪卸任并离职。这位2010年入职阿里、2020年跟随盖坤加入快手的技术副总裁,曾是可灵从 0 到 1 阶段当之无愧的灵魂人物。
大模型时代的残酷之处在于,人才流动的半衰期被缩短到了以月计算。
五个月后,张迪成了阿里淘天集团未来生活实验室负责人。他带队推出的 HappyHorse-1.0,在权威的 Artificial Analysis 榜单上同时超越了字节跳动的 Seedance 和可灵 3.0,登顶双赛道。
从回归阿里到拿出成品,张迪只用了五个月。那个曾经亲手为快手擦亮多模态招牌的人,如今站在了最强劲的竞品阵营里。
快手没有时间为离别伤感。2025年12月,可灵 O1 正式发布,在短短 5 天内连更 5 次,将原本散落在不同环节的生成与编辑任务塞进了一个全能引擎中。a16z 投资合伙人 Justine Moore 在社交平台上评价:“我们终于迎来了视频界的 Nano Banana。”
进入2026年,这场用研发人员心率换取时间差的狂奔终于收拢为一份具体的财务和用户数据。
2026年2月,可灵 3.0 系列上线,正式打通了图片生成、视频生成、编辑及后期等影视级全流程链路;4月,3.0 Omni 发布,业内首个原生 4K 直出功能上线。两年时间,可灵完成了从“可用”到“可控”再到“专业调度”的三次跃迁。
资本和市场给出了最直观的反馈:可灵全球用户正式突破 1 亿,企业客户接近 5 万家。2026年一季度,可灵营收超 6.5 亿元,同比增长超过 300%,截至3月的 ARR(年度经常性收入)已经逼近 5 亿美元。而在一年前,这个数字才刚刚跨过 1 亿美元的门槛。
作为多模态赛道的先驱,硅谷的 Runway 从成立到 ARR 破亿用了大约六年。可灵将这个周期缩短到了两年。
但硬币的另一面同样冰冷:两年走完六年路,代价是快手的利润表被烧穿了一个巨大的洞。
![]()
快手为什么必须放手
可灵两年的狂飙,最终撞上了快手财务报表的物理墙壁。
2026年一季度,快手总收入为337亿元,同比增长仅有3.4%,增速创下上市以来的新低;经调整净利润为33.7亿元,同比大幅下滑26.3%。曾经作为现金流支柱的直播业务,收入同比下跌了13.5%。
核心传统业务在失速,而 AI 却在后方疯狂地吞噬着利润。快手预计全年的资本开支将达到260亿元,其中绝大多数的筹码都被压在了可灵身上。仅一季度,快手的研发开支就达到了36亿元,同比增长9.8%。在财报中,AI 投入被明确指出是“拉低公司整体毛利率的主因”。
在这场拼肌肉的算力军备竞赛里,大厂之间的数字鸿沟正在变成一道天堑。字节跳动2026年的 AI 基础设施支出预计将突破2000亿元,阿里、腾讯同样以千亿级别的体量在向前推进。而快手2025年全年的总收入才1428亿元,经调整净利润仅为206亿元。
《中国企业家》杂志在先前的报道中曾一针见血地指出,可灵在战略上是“不得不拆”,因为快手的体量已经渐渐养不起这个吞噬资金的巨兽。将可灵独立推向资本市场进行外部融资,是快手止血与可灵续命的唯一解。
然而,比资金更让快手感到焦虑的是人才。张迪的离职与回归阿里,仅仅是冰山的一角。
如果把视线放大到整个国内视频生成赛道,会发现一个极具戏剧性的行业底色——核心掌舵人们,几乎都拥有极为相似的阿里背景。
可灵的最高统帅盖坤是当年的首批“阿里星”,博士毕业后便加入阿里,从技术专家一路做到高级总监;已经离职的张迪则在阿里妈妈深耕了十年,直到2020年才跟随盖坤转战快手。而字节跳动 Seedance 2.0 的负责人周畅,同样是前阿里通义千问的技术负责人,在2024年底被字节高价挖走。
这种大牛之间“同门师兄弟”的错综关系,戳破了大模型行业最残酷的现实:多模态的技术壁垒或许并没有想象中那么高不可攀,关键人才的流失与阵营转换,可以在短短五个月内彻底重塑整个行业的竞争格局。
为了在独立重组前留住剩下的人,快手在2025年底第一次为可灵单独设立了独立的期权池。知情人士透露,快手内部甚至定下了对赌条款:如果未来可灵 IPO 时的估值能达到400亿美元,团队的激励方案还会进一步大幅加码。
这与字节跳动给豆包团队破格发放“豆包股”的逻辑如出一辙。在大模型这个人才极度稀缺的时代,把人留住最好也最直接的方式,就是给他一家看得见估值、看得见未来的独立公司。
即便如此,人才在各厂之间的潮汐式流动仍在继续。
而盖坤的表态显得极为坦诚,他将这视为一种大模型时代的组织新常态:“如果目标拉得不够高,优秀的人才觉得没意思自然会走;只有不断探索无人区,才能持续吸引想做大事的人上车。”
![]()
"法师"与"肌肉"
在 1405 办公室里,盖坤不仅做技术决策,也在思考大模型时代的组织生存法则。
他将过去二十年的互联网组织能力划分为三个阶段:第一阶段是产品与运营驱动(如早期的阿里、腾讯),核心是搞定供给侧和网络效应;第二阶段是算法与实验驱动(如 Google、字节与快手的推荐),核心是靠 A/B 测试和自下而上的赛马机制寻找最优解。
“但到了大模型时代,游戏规则变了。”盖坤认为,行业已进入 Vision(愿景)与顶层意志驱动的第三阶段。一次尝试的代价千万美元起步,创新是在无限空间里寻找不存在的路径。组织不能再靠随机赛马,而是由领军人物进行顶层规划,靠极强的 Vision 牵引下重注。
短视频时代拼的是人力试错和极高人效,大模型时代则彻底颠覆。
盖坤打了一个比方:快手在资源上很难和推土机式的试错效率竞争。非要拼肌肉,就像斯巴达 300 勇士冲向十几万大军,哪怕打出神迹,最后也只能光荣战死。“我们必须变‘法师’,靠领先的技术方法论和顶层规划去制造局部优势,这是第二名赶超第一名的唯一路径。”
但“法师”不是牌桌上唯一的角色,行业正呈现出截然不同的赌法。
字节跳动是“APP 工厂 2.0”。Seed 团队做基础模型,Flow 团队做产品应用,多条线并行推进,内部每天都有项目被停。字节相信概率,十个项目里死九个没关系,活下来的那一个就能覆盖全部成本。
阿里则选择用绝对的行政力量进行生态整合。吴泳铭将通义大模型事业部和未来生活实验室合并为 Token Foundry 事业部并由自己直管,把 AI 变成一把手工程。从创造 Token 到应用 Token,阿里试图用组织架构的暴力整合,强行打通“研究的人不懂产品,做产品的人不懂模型”的宿疾。
三种路线,三种赌法。
字节赌概率,阿里赌生态,快手赌的是 Vision。
组织能力的竞争,最终会演变为决策质量的竞争。而在 AI 这个完全开放的世界里,决策质量几乎无法被提前量化,直到结果揭晓的那一刻。
![]()
![]()
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.