网易首页 > 网易号 > 正文 申请入驻

阿里3人小团队干翻OpenAI:Qwen成全球下载量最高的开源模

0
分享至

全球开发者下载量最高的AI模型,不是OpenAI的GPT,不是Meta的Llama,而是阿里巴巴一个不到10人的团队做出来的。

2025年初,Qwen(通义千问)系列模型的总下载量突破3亿次,Hugging Face上基于Qwen的衍生模型超过9万个。这个数字意味着什么?Llama 3发布时同期衍生模型数量是它的三分之一。

更魔幻的是,这个"最危险的开源模型"背后,核心团队最初只有3个人。

从内部项目到全球基础设施

2023年,阿里云内部启动了一个"小实验"。团队负责人林俊旸带着两名工程师,试图用更少的资源做出能用的开源模型。

他们没有走OpenAI的暴力堆算力路线。Qwen-7B的预训练数据只有2.4万亿token,同期Llama 2 70B用了2万亿——参数少了10倍,数据量却更多。团队把精力花在数据清洗和多语言混合策略上,中文、英文、代码、数学推理四类数据按特定比例动态调整。

结果出人意料。Qwen-7B在MMLU(大规模多任务语言理解)基准测试中得分62.2,超过Llama 2 13B的54.8。小模型打大了。

「我们当时只是想证明,中国团队也能做基础模型。」林俊旸在2024年的一次技术分享中回忆,「没想到开发者直接用疯了。」

开源社区的反应比预期快得多。Qwen-72B发布后48小时内,Hugging Face上出现超过2000个微调版本。日本开发者用它做日语法律助手,德国团队训练出欧洲方言版本,东南亚创业公司直接拿Qwen-1.8B部署到手机端。

为什么开发者选Qwen?

答案藏在细节里。

第一是许可证。Qwen采用Apache 2.0或自定义商业友好协议,允许月活超过1亿的产品免费商用。Llama 2的商用门槛是7亿月活,超过就要找Meta谈判。对中小团队来说,这差了一个数量级的生存空间。

第二是尺寸梯度。Qwen从0.5B到110B全覆盖,开发者可以按需选择。手机端跑1.8B,服务器上72B,云端调110B的API。不像某些模型,要么太大跑不动,要么太小不够用。

第三是工具链完整。vLLM推理加速、llama.cpp本地部署、Ollama一键运行,主流框架全支持。一个中国开发者吐槽:「用某国产模型,光配环境就三天。Qwen?pip install transformers,半小时跑起来。」

但真正的杀招是多语言能力。Qwen-2.5支持29种语言,包括斯瓦希里语、孟加拉语这类"低资源语言"。非洲一个教育科技创业公司创始人说:「我们试过GPT-4,祖鲁语准确率不到40%。Qwen-72B直接到78%,成本是OpenAI的十分之一。」

安全团队的反击:用Python构建AI防线

模型能力越强,攻击面越大。Qwen的流行也带来新问题:攻击者开始用类似技术自动化攻击。

传统防火墙基于规则匹配,攻击者改个域名就能绕过。AI驱动的攻击会学习防御策略,动态调整payload。2024年,某头部云厂商披露,其拦截的钓鱼邮件中,23%由AI生成,语法错误率接近零,传统检测模型漏报率飙升。

防御方被迫升级。Python成为这场军备竞赛的核心语言——不是因为性能最强,而是因为迭代最快。

一个典型场景:用Transformers库加载BERT类模型,对HTTP请求进行实时分类。代码不超过50行,从想法到部署一天完成。换成C++,光写内存管理就要一周。

更复杂的系统用LangChain编排。检测模块、响应模块、日志模块链式调用,攻击样本自动入库,模型每周重训。某金融科技公司安全团队负责人透露,他们的AI防线拦截了87%的0day攻击尝试,误报率控制在0.3%以下。

「这不是算法多先进,是反馈闭环够快。」他说,「攻击者变,我们半天内跟进。传统厂商走流程要两周。」

开源模型的权力转移

Qwen的崛起标志着开源AI的权力结构变化。

过去,开源社区跟在美国大厂后面跑。Llama发布,社区微调;GPT-3.5更新,开源模型模仿架构。现在,Qwen-2.5的代码生成能力在HumanEval基准上超过GPT-4早期版本,多语言数学推理碾压同尺寸竞品。

开发者开始反过来影响上游。Qwen团队每月合并超过100个社区PR,从阿拉伯语优化到量化压缩方案。一个德国开发者提交的GGUF格式支持,让Qwen能在MacBook本地流畅运行,后来被官方采纳为标准方案。

这种协作模式正在重塑行业规则。模型不再是静态产品,而是持续进化的基础设施。阿里巴巴2024年财报首次单独披露AI相关收入,其中超过40%来自基于Qwen的企业服务——不是卖模型,是卖定制能力和部署支持。

林俊旸在2025年QCon北京站的演讲中提到一个细节:某东南亚银行用Qwen-72B搭建了内部合规审查系统,原本需要200人月的规则引擎开发,压缩到6人周完成。项目负责人给团队发了一封邮件,标题是「我们不再需要买Oracle的许可证了」。

当3个人能做出全球下载量最高的模型,当Python脚本能对抗AI生成的攻击,技术民主化到底是让防御更平等,还是让攻击更廉价?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
43岁尼格买提逛集市被偶遇,这胸肌饱满得十分吸睛

43岁尼格买提逛集市被偶遇,这胸肌饱满得十分吸睛

今古深日报
2026-04-13 10:11:47
毛主席从不批评刘伯承和徐向前,一个是不忍批评,另一个无需批评

毛主席从不批评刘伯承和徐向前,一个是不忍批评,另一个无需批评

鹤羽说个事
2026-04-08 22:21:11
越来越多人得病,医生提醒:洗碗时的这几个坏习惯,看看你有吗?

越来越多人得病,医生提醒:洗碗时的这几个坏习惯,看看你有吗?

白话电影院
2026-04-09 14:32:27
拿4亿筑墙!瓦罕走廊已被牢牢封死,中国对塔利班从未放下过戒心

拿4亿筑墙!瓦罕走廊已被牢牢封死,中国对塔利班从未放下过戒心

百科密码
2026-04-10 15:25:10
欧尔班败选,中国近400亿投资安危成焦点!毛焦尔到底是谁?

欧尔班败选,中国近400亿投资安危成焦点!毛焦尔到底是谁?

娱乐小可爱蛙
2026-04-13 13:38:42
菲律宾作出一个重大反华决定,极其恶劣。

菲律宾作出一个重大反华决定,极其恶劣。

安安说
2026-04-13 10:51:14
郑丽文访大陆结束前,为国捐款的张明敏,凭一个举动实现口碑暴增

郑丽文访大陆结束前,为国捐款的张明敏,凭一个举动实现口碑暴增

小娱乐悠悠
2026-04-12 10:34:17
网友吐槽张雪机车业务员太狂了!张雪:提供证据、奖励1万

网友吐槽张雪机车业务员太狂了!张雪:提供证据、奖励1万

快科技
2026-04-13 13:29:04
各国不吃的食物:韩国人不吃香菜,俄罗斯人不吃海参,中国人呢?

各国不吃的食物:韩国人不吃香菜,俄罗斯人不吃海参,中国人呢?

阿纂看事
2026-04-11 19:24:41
怎么会有如此颠倒黑白、罔顾历史的儿童读物?

怎么会有如此颠倒黑白、罔顾历史的儿童读物?

作家加野
2026-04-11 12:46:50
张柏芝电梯照流出,身材太性感了!

张柏芝电梯照流出,身材太性感了!

动物奇奇怪怪
2026-04-12 17:38:06
梅西评分9分!全场最高!多次精彩过人、威胁对手大门!

梅西评分9分!全场最高!多次精彩过人、威胁对手大门!

历史第一人梅西
2026-04-12 15:08:05
“戏混子”没走,比资本家丑孩子更可怕的是“星二代”开始世袭了

“戏混子”没走,比资本家丑孩子更可怕的是“星二代”开始世袭了

流史岁月
2026-01-26 10:58:30
让中国的光刻机“变废铁”,日本对华下狠手,外媒:比美国人还绝

让中国的光刻机“变废铁”,日本对华下狠手,外媒:比美国人还绝

一曲一场談
2026-04-12 21:54:14
冲击三冠王!曼城3-0送切尔西3连败 只落后阿森纳6分下轮两队对决

冲击三冠王!曼城3-0送切尔西3连败 只落后阿森纳6分下轮两队对决

狍子歪解体坛
2026-04-13 01:26:54
中国已无退路了!美军为中美选好了主战场,决心要跟中国打场大战

中国已无退路了!美军为中美选好了主战场,决心要跟中国打场大战

余塩搞笑段子
2026-04-03 10:21:46
具俊晔去玫瑰园看望大S被偶遇,瘦得不成样子,背影像干巴老头

具俊晔去玫瑰园看望大S被偶遇,瘦得不成样子,背影像干巴老头

TVB的四小花
2026-04-13 04:28:29
导弹生产技术转让给中国!只因三次雪中送炭,美俄看了也“眼红“

导弹生产技术转让给中国!只因三次雪中送炭,美俄看了也“眼红“

芳芳历史烩
2026-04-10 20:53:57
老板娘问我她穿丝袜好看吗?我该怎么回答?

老板娘问我她穿丝袜好看吗?我该怎么回答?

太急张三疯
2026-04-13 08:36:29
冠心病如果没有这3个情况,几乎没有大问题!别自己吓自己

冠心病如果没有这3个情况,几乎没有大问题!别自己吓自己

小思古典影视
2026-04-13 13:50:03
2026-04-13 15:16:49
固件更新中
固件更新中
有态度网友ytd
1697文章数 16关注度
往期回顾 全部

科技要闻

传荣耀与字节跳动接洽“豆包手机”合作

头条要闻

牛弹琴:谈判失败美国不惜自残 用的招够狠够损也够蠢

头条要闻

牛弹琴:谈判失败美国不惜自残 用的招够狠够损也够蠢

体育要闻

一支球队不够烂,也是一种悲哀

娱乐要闻

贾玲减重后现身冯巩生日宴 身材未反弹

财经要闻

封锁,还是收费站?

汽车要闻

不止命名更纯粹 领克10/10+要做纯电操控新王

态度原创

本地
旅游
家居
数码
教育

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

旅游要闻

文水县:五万亩梨园花海绚烂迷人

家居要闻

复古风格 自然简约

数码要闻

消息称TCL华星将推出4×双模显示器面板,支持640Hz刷新率

教育要闻

速看!海淀这22所中小幼学校招聘——

无障碍浏览 进入关怀版