网易首页 > 网易号 > 正文 申请入驻

阿里通义千问3天登顶全球下载榜,开源模型玩了一手截胡

0
分享至

2024年6月,Hugging Face的下载统计页面出现了一个让硅谷工程师集体揉眼睛的数据:Qwen2-72B的单周下载量暴涨340%,直接把Llama 3和Mistral挤到了第二页。没人预料到这个来自杭州的团队能掀翻牌桌——他们的训练预算 reportedly 只有Meta的1/8。

「我们内部做过测算,同等性能下Qwen的推理成本是GPT-4的1/20。」阿里云CTO周靖人在6月底的闭门会上甩出这句话时,在场的企业客户开始低头记笔记。这不是价格战,是成本结构的重构。

被忽视的「小团队」叙事

通义千问的核心研发团队不到150人。对比之下,Meta的AI研究部门超过500人,OpenAI的预训练团队规模更是难以估量。人数劣势倒逼出了一个反直觉的策略:不做全能冠军,专打细分场景。

Qwen2的72B版本在代码生成基准HumanEval上得分86.2,超过Llama 3 70B的81.7;但在通用知识问答上,它刻意让出了5-8个百分点的优势。

这种「偏科」设计来自一个残酷的产品判断——企业客户买模型不是为了聊天,是为了嵌进工作流。代码、数学、多语言翻译,这三块硬骨头啃下来,合同就能签。

阿里内部有个绰号叫「手术刀小组」的工程团队,专门负责把模型压缩到消费级显卡能跑的程度。Qwen2-7B的量化版本可以在单张RTX 4090上全速运行,显存占用压到14GB。这意味着什么?一家20人的创业公司不需要申请云服务额度,就能在本地部署接近GPT-3.5水平的模型。

开源社区的「 Trojan Horse 」

阿里选择Apache 2.0协议是个被低估的决策。Llama 2的社区许可条款里埋着商业规模限制,超过7亿月活要重新谈判;Mistral的早期版本更是玩了一手「开源诱饵」,最强模型始终闭源。

Qwen的许可协议没有收入门槛,没有用户数量天花板,唯一的要求是衍生模型不能叫「Qwen」。这个条件宽松到让Hugging Face的CEO Clem Delangue在推特上公开质疑:「他们到底图什么?」

图的是生态位。2024年Q2的开发者调研显示,在「未来12个月计划深度集成的开源模型」选项中,Qwen以34%的占比首次超过Llama的29%。更隐蔽的数据是衍生模型数量——基于Qwen微调或蒸馏的社区模型在Hugging Face上已经突破1200个,是Llama生态的1.7倍。

这些衍生模型成了阿里最好的销售线索。每当一个医疗AI团队发布了基于Qwen-14B的病理报告生成模型,阿里的企业解决方案团队就会收到自动提醒。开源在这里不是慈善,是低成本的客户识别系统。

组织架构的「隐形杠杆」

2023年底的阿里重组是个关键节点。通义实验室从达摩院独立,直接向集团CEO汇报,预算审批链路缩短了60%。更关键的是考核指标的变化:不再追求论文引用数,只看两个数字——模型下载量和API调用量。

这个转变解释了为什么Qwen2的发布节奏快得反常。6月7日开源72B和7B,6月17日追加110B版本,6月25日放出代码专用模型CodeQwen1.5。三个月走完竞争对手一年的迭代周期。

快也有代价。社区反馈显示,Qwen2-110B的早期版本在多轮对话中会出现「幻觉累积」——每多一轮交互,事实性错误率上升约12%。团队没有回炉重造,而是选择透明化:在模型卡(Model Card)里用加粗字体标注「建议单轮任务场景优先」,同时推送热修复补丁。

这种「带伤上阵」的风格很不像传统大厂做派。但数据证明有效:110B版本的周活跃开发者数在补丁发布后反而增长了23%,用户把这种坦诚解读为「不装」。

硅谷的回应与沉默

OpenAI至今没有官方回应Qwen的崛起。但在6月的内部全员会上,Sam Altman被问及「开源竞争」时,回答被泄露给The Information:「我们观察到中国同行在特定基准上的优化能力很强,但通用智能的护城河不在单个模型。」

Meta的反应更直接。Llama团队负责人Joelle Pineau在6月底的播客中承认,「社区许可的复杂性确实让我们流失了一些企业用户」,并表示「正在评估更灵活的授权方案」。翻译成人话:被截胡了。

Google DeepMind的选择是技术压制。Gemini 1.5 Pro的上下文窗口拉到200万token,是Qwen2的8倍,试图用「一次能读完整本《三体》」的场景定义竞争维度。但定价暴露了底气:同等输入长度下,Gemini的API成本是Qwen的15倍。

成本差距来自工程路径的分野。Qwen团队采用了「稀疏注意力+动态KV缓存」的组合,在长文本场景下把显存占用压到Dense模型的1/4。这不是算法突破,是工程优化的复利——每一轮推理节省的毫秒和MB,乘以亿级调用量,就是利润率的生死线。

2024年7月的第一周,Qwen2的GitHub仓库收到一个来自旧金山的Pull Request,内容是修复一个边缘场景下的分词器bug。提交者邮箱后缀是@anthropic.com。开源战争的有趣之处在于,竞争对手的工程师也会成为你的代码审查员——当模型足够好用,阵营边界就开始模糊。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
郑丽文在北京,有重大表态,赖清德急了,卢秀燕蒋万安回应亮了

郑丽文在北京,有重大表态,赖清德急了,卢秀燕蒋万安回应亮了

小陆搞笑日常
2026-04-10 15:33:56
我已力竭,我已沉默

我已力竭,我已沉默

求实处
2026-04-08 23:20:40
维修费近万元!新买的特斯拉遭老人用钥匙划伤 哨兵模式拍下全过程

维修费近万元!新买的特斯拉遭老人用钥匙划伤 哨兵模式拍下全过程

快科技
2026-04-08 10:11:05
你最接近生理极限的一次经历是什么?网友分享让人目瞪口呆!

你最接近生理极限的一次经历是什么?网友分享让人目瞪口呆!

夜深爱杂谈
2026-04-09 19:39:13
解·释|“传承弘扬西迁精神”,凸显怎样的鲜明底色

解·释|“传承弘扬西迁精神”,凸显怎样的鲜明底色

上观新闻
2026-04-10 09:28:23
美国上周首次申领失业救济人数为219,000人

美国上周首次申领失业救济人数为219,000人

每日经济新闻
2026-04-09 20:39:03
抵达广东!威姆斯正式上任,新岗位曝光,与易建联联手,杜锋期待

抵达广东!威姆斯正式上任,新岗位曝光,与易建联联手,杜锋期待

萌兰聊个球
2026-04-10 10:35:36
总台记者观察丨美伊停火谈判 黎巴嫩成各方博弈焦点

总台记者观察丨美伊停火谈判 黎巴嫩成各方博弈焦点

北青网-北京青年报
2026-04-10 09:24:06
巴萨向欧足联申诉:裁判违反规则,巴萨已多年受害

巴萨向欧足联申诉:裁判违反规则,巴萨已多年受害

体坛周报
2026-04-10 09:40:44
蒋介石孙子召开发布会,提出“两蒋”移灵大陆,2句话让世人唏嘘

蒋介石孙子召开发布会,提出“两蒋”移灵大陆,2句话让世人唏嘘

老谢谈史
2026-03-18 18:33:35
“Token第一股”上市百日盘中市值破千亿,年内涨超470%

“Token第一股”上市百日盘中市值破千亿,年内涨超470%

21世纪经济报道
2026-04-10 15:42:09
追觅俞浩工作群发飙:把宇树所有客户抢过来,2亿招首席科学家

追觅俞浩工作群发飙:把宇树所有客户抢过来,2亿招首席科学家

三言科技
2026-04-10 14:05:08
世乒赛名单引热议!国乒选择梁靖崑放弃温瑞博,媒体人:教练组太糊涂,怪不得男单日渐式微

世乒赛名单引热议!国乒选择梁靖崑放弃温瑞博,媒体人:教练组太糊涂,怪不得男单日渐式微

体坛最前线66
2026-04-09 16:16:06
25岁,萝莉系爱豆,好身材让人挪不开眼

25岁,萝莉系爱豆,好身材让人挪不开眼

技巧君侃球
2026-04-10 18:17:48
老人要买200克黄金,店员报警了!

老人要买200克黄金,店员报警了!

环球网资讯
2026-04-10 17:07:15
北约30国访日团齐聚东京,高市早苗叫板:中国欠日本两笔账?

北约30国访日团齐聚东京,高市早苗叫板:中国欠日本两笔账?

饱饱科普
2026-04-10 17:50:24
爸爸梦到已故儿子说脚被刺扎了,立马驱车来到孩子墓前,眼前的一幕让人惊呆了!

爸爸梦到已故儿子说脚被刺扎了,立马驱车来到孩子墓前,眼前的一幕让人惊呆了!

张晓磊
2026-04-10 11:24:23
利物浦官宣32岁传奇自由身离队!效力9年夺9冠,3大豪门或成下家

利物浦官宣32岁传奇自由身离队!效力9年夺9冠,3大豪门或成下家

我爱英超
2026-04-10 06:35:51
巴基斯坦战机直飞伊朗,警告以色列敢动就击落!

巴基斯坦战机直飞伊朗,警告以色列敢动就击落!

林林爱天堂
2026-04-10 17:21:21
别查了,受不了!巴拿马外长终于急了:请中国尊重我!

别查了,受不了!巴拿马外长终于急了:请中国尊重我!

近史博览
2026-04-10 10:53:36
2026-04-10 18:44:49
固件更新中
固件更新中
有态度网友ytd
1487文章数 14关注度
往期回顾 全部

科技要闻

马斯克狂发大火箭也养不起AI 年亏50亿美元

头条要闻

王毅访问朝鲜会否同金正恩会面 外交部回应

头条要闻

王毅访问朝鲜会否同金正恩会面 外交部回应

体育要闻

17岁赚了一百万美元,25岁被CBA裁员

娱乐要闻

黄景瑜王玉雯否认恋情!聚会细节被扒

财经要闻

创业板改革制度落地 增设第4套上市标准

汽车要闻

搭载第二代刀片电池及闪充技术 腾势N8L闪充版预售35万起

态度原创

艺术
数码
本地
房产
公开课

艺术要闻

于小冬2026年4月油画新作《花季》

数码要闻

哈趣Ace1:职场人的AI效率外脑,百元耳夹竟能重构办公体验

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

房产要闻

突发!29亿疯狂拿地后,三亚绿发100%股权转让!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版