![]()
千问(Qwen)技术负责人林俊旸在X上宣布离职24小时后,阿里高层火速批准了他的离职邮件。如果单从时间节点看,林俊旸的离开,很容易被解读为一次“模型迭代失利后的调整”。
过去一年,Qwen模型迭代频繁,春节期间上线原生多模态Qwen3.5,还得到了马斯克的点赞。但Qwen3.5没有像Kimi K2.5持续占据OpenClaw调用量的榜首,也没有像字节的Seedance2.0视频模型火爆出圈。
在这种背景下,一个最容易流传开的原因是,Qwen3.5因为没有达到内部预期,最终导致了技术负责人离开。
但如果把时间线拉长,会发现事情并没有这么简单。
林俊旸的处境,从来不是一次模型发布的成败问题,而是一个更长期的结构性矛盾。阿里在AI上的资源投入与战略决心,没有完全匹配这场技术竞赛的节奏。
换句话说,这或许不是阿里“等不了林俊旸”,而更像是林俊旸不想再等阿里。
作为一个宣称要投入3800亿元AI基建的大厂,资本投入不算少,理论上千问团队获得支持也远超创业公司。但如果把林俊旸放在中国AI产业的坐标系里看,他和他的团队其实处在一个非常微妙的位置。
在字节、腾讯等大厂,负责基础AI体系的技术负责人通常拥有极高的战略权重,不仅主导模型研发,也能直接影响公司在算力、人才和资本上的投入节奏。
字节是最典型的例子。为了推进豆包(Seed)大模型体系,字节重组了AI研发体系,成立了Seed(模型研发)和 Flow(应用开发)两大核心部门。吴永辉管理的Seed,过去一年整体规模维持在1500人左右。根据研究论文披露,其训练基础设施已经部署超过20万张GPU。
腾讯的变化也很明显。去年年底,腾讯正式官宣前OpenAI研究员姚顺雨加入,姚顺雨直接向腾讯总裁刘炽平汇报,负责腾讯混元大模型研发的核心技术工作。
而为了让姚顺雨有足够的空间,此前已有AI infra团队的腾讯,宣布新成立AI infra部、AI Data部和数据计算平台部。与此同时,腾讯开始拿着高薪激进挖人。
但在阿里,我们从阿里内部了解到,林俊旸离职前的千问团队仅有400多人,规模与同级别大厂的AI团队差了一个量级。
同样作为大厂技术负责人,林俊旸长期面临的一个现实问题是,技术体系的资源并不完全由技术本身决定,而是深度绑定在云业务的商业逻辑之中。
看到这层结构性约束,是理解林俊旸处境的关键。
根据多方媒体报道,在林俊旸宣布离开的当天下午,阿里紧急召开内部会议,阿里CEO吴泳铭一边道歉,一边表示并不清楚千问不存在资源有限(算力不足)的问题,不明确的原因则是信息传递流程问题。而林俊旸的直接leader阿里云CTO周靖人则表示,资源一直紧张,在做整体规划。
在这场需要算力、资金和人才持续堆叠的大模型竞赛中,林俊旸带领的团队始终处于“有限资源”下的奋进。而如今内部矛盾公开化,林俊旸不打算再委屈自己了。
01
多模态愿景无法实现
3月4日凌晨,林俊旸在X上表明退出Qwen:“me stepping down. bye my beloved qwen.”
这句带着明显个人情感的告别,随后在互联网上掀起的巨大风浪,也让阿里集团陷入舆论争议,甚至Qwen团队不少成员自曝离职。昨天,网传“千问模型核心团队集体离职”消息,阿里很快辟谣消息不实,目前千问模型团队稳定。
林俊旸对国内外的开发者影响很大。他离职消息发布不到48小时,在X上已经产生600万的曝光量,1600人留言。留言里,除了对他离职的不解外,都是来自全球开发者社区的感谢与致敬——有人称他的经历“传奇”,有人说他的影响“惊人”,还有人称他是“把Qwen模型带向全球开发者和公司的灵魂人物”。
Qwen最初只是阿里通义实验室的一个创新项目,2023年8月开始推出开源模型。过去3年里,从Qwen1到Qwen3.5有数百个版本发布,如今成为全球下载量超10亿的顶级开源大模型,衍生模型也有20万个,成为开源社区里品牌影响力最大的模型。
Qwen在语言模型、语音模型、视觉模型的多模态研究,已经成为许多行业的基础模型。比如预训练视觉语言模型Qwen2.5-VL已经成为国内许多具身智能、自动驾驶vla模型构建的基础,0.8B、2B、7B的小模型,更是成就了很多论文和开源项目。
在Qwen和Wan项目API工程技术负责人wenmeng zhou看来,正是林俊旸早期在各大社区活跃,四处奔走,才让Qwen获得在全球开源社区的地位。
根据开源社区Hugging Face 1月21日的统计数据显示,目前Qwen的衍生模型数量是DeepSeek的100倍。
ACE studio(一款AI音乐生成工具)技术负责人Sean告诉我们,国内大部分创业者都选择使用Qwen构建模型,而不是deepseek,本质上是因为生态好,各种训练框架、推理框架齐全。而且各种算法比较简洁优雅,没有特殊的trick。
Qwen在全球开发者生态圈里,自然具有极高的影响力。不可忽略的现实是,这种衍生模型更多的是服务Qwen的生态,而对阿里巴巴在商业上影响有限,大部分开发者直接部署Qwen的模型,很少付费。
可长远来看,林俊旸坚定开源路线,在于借助开源生态的品牌影响力,或许能为阿里带来更多收入。
现在阿里战略调整,希望将Qwen团队按预训练、后训练、视觉理解、图像等维度拆分,和通义实验室中的团队合并。这打散了林俊旸的计划,意味着他试图统一多模态的技术愿景无法变成现实。
早在今年1月清华大学组织的一场交流会议,林俊旸和月之暗面杨植麟、腾讯姚顺雨、智谱唐杰同台,他当时分享了自己一个更宏大愿景。对他来说,Qwen的目标并不只是服务开发者,他更希望未来的模型能够统一不同模态之间的理解与生成能力——让文本、图像、语音等信息真正融合,形成一种统一的多模态智能。
这也是当前AI领域最困难的问题之一。即使是最早提出“原生多模态”概念的谷歌,也尚未真正实现这一目标。
林俊旸在X上提出离职前几个小时,还发布一条消息说,“final shot(最后一击),这就是我告诉你们的小模型”(Qwen 3.5的0.8B、2B、4B、9B小模型)。当时他或许已经有离职打算。很快,林俊旸在公司尚未审批他的离职前,发出那条消息“bye my beloved qwen”。
02
云厂商的困境
林俊旸不等阿里,也反映出中国云厂商AI模式的困境。
从个人职业选择来看,林俊旸离开阿里似乎只是一次普通的人事变动。但如果把这件事放在中国AI产业的结构里,它更像是一个信号,中国云厂商式的AI组织,有着天然的资源约束。
2026年2月初,阿里内部提出“通云哥”架构,即通义实验室 + 阿里云 + 平头哥芯片组成AI基础设施体系。这意味着模型研发、算力资源、芯片与Infra都被纳入一个统一的商业体系中,技术团队需要与电商、本地生活、支付等业务场景打通,成为整个阿里生态的一部分。
这种结构本身并没有问题,但带来一个新的困境,技术团队的资源并不完全由技术负责人决定。
林俊旸的团队在组织结构上一直存在一个约束,它并不是一个独立的AI研究组织,而是云业务体系的一部分。
“对于云厂商来说,算力本身就是一种可以直接变现的资源。同样一份算力,如果投入到内部大模型研发,是一笔周期漫长、回报不确定的技术投资;但如果提供给外部客户,却可以立刻转化为一笔清晰的云计算收入。”某大厂云相关人士表示。
从商业逻辑出发,大模型时代的云厂商往往面临一种天然的资源冲突,当算力资源有限时,技术团队和商业部门之间的取舍就会变得异常现实。
大模型猎头周成告诉我们,相比之下,字节的AI体系更像是OpenAI+产品团队的组合,吴永辉和他的Seed团队拥有较大的技术自主权,研究目标并不绑定短期商业化,而是瞄准下一代的AI能力。
腾讯AI Lab更接近学术型研究机构,而腾讯还在持续挖角AI人才,例如向字节研究人员提供更高薪酬进行招聘。百度从早期的深度学习研究院,到现在的文心体系,已经形成了一个持续十年的AI研发组织,在组织层面百度仍然给予了文心大模型团队较高的权重。
阿里的AI团队更像是“带KPI的研究院”,林俊旸所处的位置,是其中最复杂的一种。技术负责人不仅要做技术突破,还必须证明这些技术能够带来收入,在这种结构下,技术天才往往会最先感受到组织的边界。
根据财报数据,2025年第三季度阿里云收入约398亿元人民币(约56亿美元),同比增长34%,AI相关产品连续九个季度保持三位数增长。 但与此同时,集团整体增长并不强劲。同一季度,阿里整体收入约2478亿元人民币(约350亿美元),同比仅增长5%,净利润下滑52%。
这意味着,阿里虽然宣布未来三年将投入3800亿元人民币建设AI与云基础设施,但这些投入仍需要平衡集团整体经营压力。
如果把阿里和字节放在一起看,差异就会非常明显。2025年,字节跳动收入被估算为1860亿美元,同比增长约20%,全年利润可能接近500亿美元。而字节AI并不需要依赖云业务盈利,从抖音推荐系统到广告算法、AI视频生成、内容生产工具,字节的技术投入可以直接转化为用户增长和广告收入。
再把中国云厂商和美国科技巨头放在一起比较,差异会更明显。以Google为例,谷歌可以同时维持两个体系:研究型AI+商业型AI,Alphabet正在以极端激进的速度加大AI投入。2025年Alphabet资本开支约910亿美元,2026年预计将提高到1750亿—1850亿美元。
Google的AI研发并不完全依附云业务,公司内部存在多个独立研究体系,Google DeepMind、Google Research、Gemini模型团队。这些团队的目标并不是短期商业化,而是长期技术突破。
这也解释了为什么,在AI时代中国互联网公司的技术负责人,往往比硅谷同行承担更复杂的角色。
当然,这并不意味着阿里在AI上的投入不够坚决。过去两年,阿里持续推进通义千问系列模型、云基础设施升级以及开源生态建设,在国内AI大模型赛道中仍然处于前列。通义千问在企业应用和开发者社区的影响力,已经成为中国大模型生态的重要组成部分。
只是当AI竞争进入算力、团队和资本驱动的新阶段,技术团队对资源的需求正在以指数级增长。如何在业务压力和技术理想之间找到平衡,对任何一家互联网巨头来说,都是一场长期而复杂的考验。
撰写|马舒叶 柳嘉
编辑|八尺
「白鲸实验室」原创文章
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.