去年这个时候,开源大模型圈还是Meta的Llama和Mistral的天下。现在,一个17人的小团队把下载量干到了全球第一,而他们的东家阿里刚刚经历了一场剧烈重组。
事情变得有点意思了。
从"备胎"到"顶流":Qwen的逆袭时间线
2023年初,阿里达摩院的大模型项目还叫"通义千问",对内对外都是一副"跟着OpenAI走"的姿态。团队规模小,算力资源被电商业务挤压,连发布会都开得低调。
转折点出现在2023年8月。Qwen-7B开源,没搞什么宏大叙事,直接扔了个GitHub链接。开发者们试完之后发现:这玩意儿推理速度比同级别的Llama 2快30%,中文理解更是碾压。
下载量开始爬坡。到2024年中,Qwen系列累计下载量突破1.5亿次,超过Llama成为全球最活跃的开源模型家族。
这个数字背后有个细节:团队核心成员只有17人。作为对比,Meta的Llama团队超过百人,Mistral拿了数亿欧元融资后团队扩张到60+。
人少反而成了优势。决策链条短,一个工程师周末改完的优化,周二就能进主分支。Qwen技术负责人林俊旸在内部复盘时说过一句话:「我们没资源做100个方向的探索,只能把力气花在刀刃上。」
阿里重组:是危机还是放手?
2024年底,阿里集团宣布"1+6+N"分拆后的最大调整:云智能集团完全独立,达摩院部分AI研究团队并入阿里云,部分打散到各业务线。
外界解读多为"收缩""降本"。但换个角度看,Qwen团队反而拿到了更清晰的定位——不再背负"为电商赋能"的KPI,专注做开源生态。
一个信号是:2025年1月发布的Qwen2.5-Max,直接对标GPT-4o和Claude 3.5 Sonnet。评测数据上,数学推理(AIME 2024)得分超过DeepSeek-V3,代码能力(LiveCodeBench)逼近Claude。
更关键的是定价。Qwen2.5-Max的API定价比GPT-4o便宜80%,比DeepSeek还低15%。这不是价格战,是开源模型的商业化路径探索:用极致性价比换开发者生态,再从企业定制服务里赚钱。
为什么开发者愿意"叛逃"到Qwen?
我扒了Hugging Face和GitHub上的讨论,发现迁移到Qwen的开发者提得最多的三个点:
第一,中文场景零成本迁移。很多国内团队之前用Llama做基座,中文微调要额外处理tokenization和词表对齐。Qwen原生支持中英双语,省掉的工程量能以周计算。
第二,工具链完整。vLLM、Ollama、Llama.cpp这些主流推理框架,Qwen的适配速度总是最快。有个独立开发者在推特上吐槽:「用Llama 3.1等新功能,得自己改代码;Qwen的新模型出来,第二天就能直接跑。」
第三,许可协议宽松。Qwen的开源协议允许商用,不像Llama 2那样对月活超过7亿的产品额外收费。对于想做AI应用的中小团队,这是真金白银的门槛差异。
当然,也不是没有争议。Qwen的英文能力在部分评测中仍略逊于同规模的Llama,多语言支持(西班牙语、阿拉伯语等)更是明显短板。有欧洲开发者抱怨:「做全球化产品,还是得回Llama。」
Palantir CEO的预言,正在Qwen身上应验
去年Alex Karp在达沃斯说过一段话,当时被当成"反精英主义"的鸡汤:「AI时代只有两种人能活下来——懂手艺的,或者脑子长得不一样的。」
Qwen团队某种程度上是这句话的注脚。17个人里没有一个是OpenAI或DeepMind出来的"明星研究员",核心成员多是阿里内部培养的工程师,有人之前做推荐系统,有人搞过语音合成。
他们的优势不是顶会论文数量,是对工程细节的偏执。Qwen的量化压缩方案能让70B模型在单卡A100上跑起来,这个优化被不少开发者称为"省钱神器"。
阿里重组后,Qwen团队拿到了更独立的预算和决策权。据接近团队的人透露,2025年的重点是多模态(Qwen-VL和Qwen-Audio的迭代)以及长上下文——128K token的上下文窗口已经在内测。
开源模型的战争进入下半场。Meta靠Llama守住北美基本盘,DeepSeek用极致性价比搅动市场,Qwen则卡住了中文生态的咽喉。三家路径不同,但有个共同点:都不再试图"干翻OpenAI",而是在垂直场景里找生存空间。
Qwen技术负责人在最近一次内部分享中提了句:「我们现在的敌人不是闭源模型,是开发者的时间。」
这句话值得细品。当开源模型的性能差距缩小到10%以内,选型决策更多取决于工具链成熟度、社区响应速度、以及——用Karp的话说——「懂手艺」的人能不能快速上手。
阿里这17个人,赌的就是这个。
你现在用的基座模型是哪家的?如果Qwen的下个版本在代码能力上超过Claude 3.5,你会考虑迁移吗?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.