网易首页 > 网易号 > 正文 申请入驻

阿里Qwen团队仅12人,下载量却碾压OpenAI和谷歌

0
分享至

2024年,全球开源模型下载量第一名不是Meta的Llama,不是谷歌的Gemma,而是阿里巴巴的Qwen。更魔幻的是,这个团队最初只有12个人。

这个数字来自Hugging Face的年度统计。Qwen系列模型全年下载量突破3亿次,比第二名高出47%。但直到2023年初,外界几乎没几个人听说过这个名字。

故事得从2022年9月说起。达摩院内部启动了一个"通义千问"项目,负责人林俊旸(Junyang Lin)当时带着11个工程师,目标很简单:做一个能用的中文大模型。没人想到两年后,这个小组的产出会被全球开发者疯狂搬运。

小团队怎么跑赢巨头

2023年4月,Qwen-7B开源。同一天,Meta发布了Llama 2。媒体头条全被后者占据,Qwen的GitHub仓库安静得像凌晨三点的小区。

转折点出现在8月。Qwen-14B发布,同时放出了一个关键决策:所有模型都支持32K上下文长度,而当时Llama 2最长只有4K。开发者开始注意到,这个中国团队的模型在长文本任务上异常能打。

林俊旸后来在技术博客里写过一个细节:「我们没算力堆参数,就把精力放在数据质量和训练效率上。」Qwen-72B的训练成本 reportedly 只有同等规模模型的三分之一,靠的是自研的分布式训练框架和激进的数据清洗策略。

更狠的是发布节奏。2023年8月到2024年6月,Qwen家族从7B一路铺到110B,还顺手开源了视觉模型Qwen-VL、音频模型Qwen-Audio、代码模型CodeQwen。平均每月一个新版本,开发者还没消化完上一个,下一个就端上来了。

开源社区的"自来水"效应

2024年初,两件事让Qwen彻底出圈。

一是Mistral AI的联合创始人Arthur Mensch在推特上转发了一条Qwen-72B的评测结果,配文只有一个词:"Impressive"。当时Mistral刚拿了微软投资,是欧洲最炙手可热的AI独角兽。这条推文被转了4000多次。

二是Hugging Face的Open LLM Leaderboard改版。Qwen-72B在多项基准测试里冲进前三,而排在前面的GPT-4和Claude 3 Opus都是闭源API。开源阵营里,只有Meta的Llama 3能跟它掰手腕。

开发者开始用脚投票。一个典型的场景是:某硅谷初创公司的工程师想在自己服务器上跑大模型,Llama 3需要两张A100,Qwen-72B一张就能跑,效果还差不多。GitHub上陆续出现Qwen的微调教程、量化方案、RAG框架适配,语言从英语、中文蔓延到日语、韩语、阿拉伯语。

阿里内部也经历了一次认知翻转。2023年底,达摩院被拆进阿里云智能集团,Qwen团队一度传出"资源收紧"的消息。但2024年的下载数据让高层改了主意——3月,阿里宣布未来三年投入3800亿人民币搞AI基础设施,Qwen被列为"战略级开源项目"。

技术路线的"非主流"选择

Qwen的架构选择里藏着几个反直觉的决策。

比如位置编码。当大家都在追RoPE(旋转位置编码)的时候,Qwen-1代用的是经典的ALiBi,到2代才切回RoPE,但加了一个自创的"NTK-aware"插值方案。这个改动让模型在超长文本上的外推能力直接翻倍,32K上下文就是这么来的。

再比如分词器。Qwen的词表里有15万个token,其中中文占比超过30%,而Llama 2的中文token只有几百个。这意味着同样一段中文,Qwen的序列长度更短,推理速度更快,成本更低。一个国内AI创业公司的CTO跟我算过账:用Qwen处理中文客服对话,单条成本比GPT-3.5 Turbo低60%。

最争议的是许可协议。Qwen-72B最初用的是自定义的"Qwen License",对商用有一定限制。社区反馈激烈,GitHub issue区吵了200多楼。2024年2月,阿里突然宣布全系模型改用Apache 2.0,完全开放商用。同一天,Qwen的GitHub star数涨了3000多。

restructuring之后的变数

2024年6月,阿里集团完成了一次大规模组织架构调整。达摩院原院长张建锋卸任,阿里云智能集团CEO吴泳铭直接接管AI业务。Qwen团队从达摩院并入阿里云,汇报线变了,办公地点也从杭州西溪搬到了云谷园区。

林俊旸在内部全员会上说了一句话:「以前我们是研究院的项目,现在我们是云产品的核心组件。」语气平淡,但懂行的人听得出分量——这意味着Qwen的KPI从"发论文、刷榜单"变成了"带动云资源消耗"。

变化很快体现在产品层面。2024年下半年,Qwen的更新明显放慢,但阿里云上线了"百炼"大模型平台,把Qwen封装成API、微调服务、行业解决方案。开源模型还在更新,只是不再像去年那样月月发新版。

社区里有老用户抱怨"没以前那味了",也有新用户觉得"终于有企业级支持了"。一个Qwen贡献者在Discord频道里吐槽:「以前提PR第二天就合并,现在要走内部评审流程,平均一周。」

但下载数据还在涨。2024年Q4,Qwen系列在Hugging Face的月均下载量突破4000万次,是年初的3倍。阿里云财报里第一次单独披露了"AI相关收入",虽然没给具体数字,但提到"开源模型带来的客户转化"是增长驱动力之一。

2025年1月,Qwen2.5-Max发布,这是系列里第一个明确对标GPT-4o的旗舰模型。发布当天,林俊旸发了一条很短的推特:「72B的蒸馏版在多项测试里超过了原版的性能,这个方向我们还会深挖。」配图是一张训练loss曲线,下降得近乎垂直。

评论区有人问:你们团队现在多少人?他回了一个数字:不到50。相比OpenAI的1700人、Anthropic的800人,这个规模依然小得离谱。但Hugging Face的实时排行榜上,Qwen2.5-Max的评分已经挤进全球前五,前面只有GPT-4o、Claude 3.5 Sonnet和Gemini 1.5 Pro。

下一个问题是:当开源模型的性能逼近闭源旗舰,云厂商的商业模式还能成立吗?阿里押注的答案是"能",但前提是你要先让用户免费跑起来。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
千元童鞋把脚穿肿?泰兰尼斯遭家长“围攻”,医生警惕影响发育,90%专利竟是外观设计

千元童鞋把脚穿肿?泰兰尼斯遭家长“围攻”,医生警惕影响发育,90%专利竟是外观设计

新浪财经
2026-04-10 17:33:59
郑丽文访大陆最后一天,穿纯白衬衫尽显青春感,压轴造型太冻龄啦

郑丽文访大陆最后一天,穿纯白衬衫尽显青春感,压轴造型太冻龄啦

八八尚语
2026-04-12 11:34:17
她是唯一给文章送花篮的演员,嫁普通人生俩女儿,今43岁被宠成宝

她是唯一给文章送花篮的演员,嫁普通人生俩女儿,今43岁被宠成宝

白面书誏
2026-04-11 16:58:00
争议?王大雷开球听到裁判哨声后顺势倒地 万名河南球迷一起国骂

争议?王大雷开球听到裁判哨声后顺势倒地 万名河南球迷一起国骂

风过乡
2026-04-12 12:23:41
中国篮协:已注意到李沂泽年龄存疑 调查和处理结果将向社会公布

中国篮协:已注意到李沂泽年龄存疑 调查和处理结果将向社会公布

狼叔评论
2026-04-11 23:12:11
接下来你可能会见证人类历史上最大规模的化债历程。

接下来你可能会见证人类历史上最大规模的化债历程。

流苏晚晴
2026-04-11 17:57:14
“常洲”宣布:放假一天,免费!

“常洲”宣布:放假一天,免费!

江南晚报
2026-04-12 09:56:36
百万豪车陪葬后续:死者身份披露,官方介入处置,目击者透露更多

百万豪车陪葬后续:死者身份披露,官方介入处置,目击者透露更多

离离言几许
2026-04-11 16:34:13
东风日产NX8动了理想的蛋糕,李想气的朋友圈飙脏话

东风日产NX8动了理想的蛋糕,李想气的朋友圈飙脏话

智电汽车.
2026-04-12 10:48:15
阿尔忒弥斯2号最牛的不是飞多远,而是无动力返回

阿尔忒弥斯2号最牛的不是飞多远,而是无动力返回

汉宫秋
2026-04-12 06:09:26
洗脸熊创始人回应“意外拍下张雪机车”:整个人都跳起来了,车将放商场供粉丝打卡,500万已捐嫣然医院

洗脸熊创始人回应“意外拍下张雪机车”:整个人都跳起来了,车将放商场供粉丝打卡,500万已捐嫣然医院

极目新闻
2026-04-12 10:14:34
提到本山大叔家的公子赵大牛,他的座驾在沈阳街头可算相当拉风。

提到本山大叔家的公子赵大牛,他的座驾在沈阳街头可算相当拉风。

情感大头说说
2026-04-12 05:21:17
参加会见连正装都不穿了!郑丽文抵达首都第2天更加放松了!

参加会见连正装都不穿了!郑丽文抵达首都第2天更加放松了!

阿龙聊军事
2026-04-12 12:09:16
百亿遗产说扔就扔?73岁迟重瑞现身寺庙,白岩松一语道破小心思

百亿遗产说扔就扔?73岁迟重瑞现身寺庙,白岩松一语道破小心思

流云随风去远方
2026-04-12 03:19:07
芒果台踩雷!赵子琪被淘汰后直播开撕,她的过往连张朝阳都忌惮

芒果台踩雷!赵子琪被淘汰后直播开撕,她的过往连张朝阳都忌惮

小徐讲八卦
2026-04-12 06:23:01
台湾统一方式可能出人意料:77年前毛主席的奇谋,是最佳解决方案

台湾统一方式可能出人意料:77年前毛主席的奇谋,是最佳解决方案

冰雅忆史
2026-04-12 07:05:10
女子被香港机场刁难,百万元雕塑被捏毁,机票作废,第二天更气人

女子被香港机场刁难,百万元雕塑被捏毁,机票作废,第二天更气人

米果说识
2026-04-11 22:20:53
42岁斓曦近况曝光!嫁给歌手程翔生一子,如今婚姻幸福被宠成公主

42岁斓曦近况曝光!嫁给歌手程翔生一子,如今婚姻幸福被宠成公主

代军哥哥谈娱乐
2026-04-12 10:06:38
赵公山发现一男性遗体?救援人员:属实,还未确认身份,已送往殡仪馆

赵公山发现一男性遗体?救援人员:属实,还未确认身份,已送往殡仪馆

红星新闻
2026-04-12 11:53:24
美伊未达成协议后,特朗普转发了一个媒体报道链接,标题为《如果伊朗不屈服,总统持有的王牌是海上封锁》

美伊未达成协议后,特朗普转发了一个媒体报道链接,标题为《如果伊朗不屈服,总统持有的王牌是海上封锁》

都市快报橙柿互动
2026-04-12 12:51:34
2026-04-12 14:11:00
Ping值焦虑
Ping值焦虑
有态度网友ytd
1181文章数 22关注度
往期回顾 全部

科技要闻

理想称遭恶意拉踩,东风日产:尊重同行

头条要闻

媒体:伊朗新领袖"冒死接班"1个月未露面 突然全面亮剑

头条要闻

媒体:伊朗新领袖"冒死接班"1个月未露面 突然全面亮剑

体育要闻

五大联赛首冠出炉?拜仁或提前4轮卫冕德甲

娱乐要闻

46岁赵达官宣结婚!曾与殷桃谈婚论嫁

财经要闻

三轮磋商谈至深夜 美伊谈判三大议题仍待解

汽车要闻

焕新极氪007/007GT上市 限时19.39万起

态度原创

教育
艺术
数码
房产
本地

教育要闻

高二英语不及格状态,马上要上高三,还来得及提分吗?

艺术要闻

2025殊相——中国油画学会创作研修作品展 | 油画选刊(六)

数码要闻

小米电视桌面4.0重磅升级来了!流畅度大提升 多赛事同屏播放

房产要闻

土地供应突然暴跌!2026海口楼市,格局大变!

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

无障碍浏览 进入关怀版