网易首页 > 网易号 > 正文 申请入驻

Qwen 3发布,阿里又点燃了AI开源的篝火

0
分享至

文|邓咏仪

编辑|苏建勋

4月28日,AI圈子内的从业者们都在等待一件事:Qwen 3。

从中午开始,Qwen 3即将发布的小道消息,已经满天飞舞。Qwen团队负责人林俊旸也在X上暗示:“看看我们今晚能否完成Qwen 3的工作”。

来源:X(Twitter)

《智能涌现》所在的多个业内讨论群,充斥着不知真假的Qwen 3模型上传截图。AI从业者疯狂刷新GitHub、HuggingFace中的Qwen主页,用AI生成Qwen 3上线海报、现场的模拟图,刷屏各种表情包,狂欢直至深夜还未停歇。

Qwen 3最终在凌晨5点上线。新一代的Qwen 3参数量仅为DeepSeek-R1的1/3,首先是成本大幅下降,性能全面超越R1、OpenAI-o1等全球顶尖模型。

更重要的是,Qwen 3搭载了Claude 3.7等顶尖模型的混合推理机制,将“快思考”与“慢思考”集成进同一个模型,大大减少了算力消耗。

Qwen 3的开源一共涉及8款不同架构和尺寸的模型,从0.6B开始,大到235B,适用于更多类型的移动端设备。除了模型之外,Qwen还顺带推出了Agents的原生框架,支持MCP协议,有着一股“让所有人都要用上Agents”的劲头。

DeepSeek爆火后的1月份,大年初一前夜,阿里急速上线了新模型Qwen2.5-VL和Qwen2.5-Max,迅速秀了一把肌肉的同时,也赋予了阿里集团更浓郁的“AI味儿”。受此情绪的烘托,阿里股价在春节前后阶段大涨超30%。

但比起这次的旗舰级模型Qwen 3,上述模型都只是前奏。

对Qwen 3的万众期待,来自阿里在AI开源社区的盛誉——如今Qwen已经是全球领先的开源模型系列,根据最新数据,阿里通义已开源200余个模型,全球下载量超3亿次,千问衍生模型数超10万个,已超越此前的开源霸主Llama。

如果说DeepSeek是一支精锐的小分队,快速在技术上冲锋;那么Qwen就是一个军团,对大模型布局更早,也更积极做生态,展现了更广的覆盖度和社区活力。

某种程度上,Qwen也是大模型落地的产业风向标。

一个典型的例子是,在DeepSeek R1发布后,很多企业和个人想私有化部署“满血版”DeepSeek(671B),单单硬件成本就要上百万元,落地成本很高。

阿里Qwen家族提供了更多的模型尺寸和类别,能帮助产业界更快验证落地价值。用大白话来讲,开发者不用自己裁剪模型,而是拿来即用,继而快速落地。Qwen 13B及以下的模型,可控性强,的确是如今AI应用领域最受欢迎的模型之一。

DeepSeek R1成为开源历史上的锚点,也深深影响了大模型竞争的走向。不同于此前模型厂商沉迷于刷Benchmark、刷题,中国大厂们迎来必须要证明自己真正技术实力的周期。

Qwen 3的发布,就是这样一个时点。

满血版成本为1/3个DeepSeek R1,性能更强大

2024年9月,阿里云在云栖大会上发布了上一代模型Qwen 2.5。Qwen2.5 一次性开源了从0.5B至72B共6个尺寸的全系列模型,覆盖从端侧到云端的全场景需求,在代码等多个类别中,都能达到SOTA。

所有模型均允许商业使用与二次开发,这也被开发者称为 “真正开放的AI”。

市场风传新一代的Qwen 3会推出基于MoE架构,开源更多尺寸,成本能做到比DeepSeek更低——这些猜测都被一一证实。

Qwen 3 一共开源了8个尺寸的模型,分别为:

  • 两款MoE(混合专家)模型的权重(指模型的决策偏好):30B(300亿)、235B(2350亿)参数
  • 六款Dense(密集)模型:包括包括0.6B(6亿)、1.7B(17亿)、4B(40亿)、8B(80亿)、14B(140亿)、32B(320亿)

每款模型均达到了同尺寸开源模型中的SOTA(最佳性能)。

Qwen 3延续了阿里开源的慷慨风格,依旧采用宽松的Apache2.0协议开源,首次支持119多种语言,全球开发者、研究机构和企业,都免费下载模型并商用。

Qwen 3的最大看点,一是成本大幅下降,同时性能还有大幅提高。

在Qwen 3的训练中,阿里投入了令人惊讶的成本。Qwen 3基于36万亿token进行预训练,这是上一代模型Qwen 2.5的两倍,在全球同等体量的顶尖模型中也能排到前列。

据Qwen团队公开的数据,仅需4张H20即可部署Qwen 3满血版,显存占用仅为性能相近模型的三分之一。

成本降低,但性能反而更高了。

Qwen的推理能力有非常显著的提升。在数学、代码生成和常识逻辑推理方面,Qwen 3均超越先前的推理模型 QwQ(思考模式)和 Qwen2.5 模型(非思考模式)。

而在代码、数学、通用能力等基准测试中,Qwen 3也能与目前的顶尖模型o3-mini、Grok-3 和 Gemini-2.5-Pro等顶尖模型。

△Qwen 3性能图 来源:Qwen 3

另外一个核心亮点,是Qwen模型对智能体(Agents)的全面适配。

如果说,OpenAI的o1模型一脚踢开了推理模型的大门,DeepSeek R1的发布,让所有用户见识到了推理模型的魔力:模型有像人类一样的“思考链”,有思考顺序,不断验证是否正确,推演出认为合适的答案。

但只有深度思考模式的话,弊端也很明显。哪怕询问简单的天气、今天穿什么,DeepSeek会来回地纠结,自我设问,不断验证,经历少则数十秒的过度思考——如果DeepSeek没有将模型的思考链展示给用户,几乎没有用户能够忍受延迟成这样的对话体验。

阿里CEO吴泳铭曾在2024年9月的云栖大会表示:“AI最大想象力不在手机屏幕,而是接管数字世界,改变物理世界”。

智能体是通往这种愿景的重要路径。所以,Qwen3做成混合推理模型是相当关键的:在单一模型内,能无缝切换思考模式(用于复杂逻辑推理、数学和编码)和非思考模式(用于高效的通用对话,比如询问天气、历史知识等简单信息搜索)。

推理与非推理任务的融合能力,实际上是让模型:

  • 能够理解数字世界,更多强调的是非推理能力,如识别、检索、分类,
  • 能够操作数字世界,更多强调的是推理能力,模型能自主规划、决策、编程,典型应用如Manus。

Qwen 3的API可按需设置“思考预算”(即预期最大深度思考的tokens数量),进行不同程度的思考,确保在各种场景下都能达到最佳性能。

在以前的机制中,用户需要手动开关“深度思考”模式,一次对话中可能只能专注一种模式;但Qwen 3的新机制将这个选择交给模型——模型能自动识别任务场景、选择思考模式,减少了用户对模型模式的干预成本,也会带来更丝滑的产品体验。

混合推理是目前比较难的技术方向,需要极其精细、创新的设计及训练,难度远超训练纯推理模型。模型要学习两种不同的输出分布,要做到两个模式融合,且基本不影响任何一种模式下的效果。

热门模型中,现在只有Qwen 3、Claude3.7以及Gemini 2.5 Flash可以做到较好的混合推理。

混合推理会整体提高模型使用的性价比,既提升了智能水平,又整体降低了算力资源消耗。比如,Gemini-2.5-Flash,推理和非推理模式下的价格相差约6倍。

而为了让所有人都能马上开发Agents,Qwen团队几乎是提供了保姆式的工具箱:

  • Qwen 3最近火爆的MCP协议,具备工具调用(Function Calling)能力,两者都是Agents的主要框架
  • 原生的Qwen-Agent 框架,封装了工具调用模板和工具调用解析器
  • API服务也同步上线,企业可以直接通过通过阿里云百炼调用。

如果用装修来举例,这就像Qwen团队把房子建好、完成硬装,还给你提供了部分软装,开发者可以直接用上很多服务。这将大大降低编码复杂性,开发门槛进一步下降,比如很多手机及电脑Agent操作等任务,就可以高效实现。

开源模型进入新一轮竞争周期

在DeepSeek R1获得爆炸性声量,成为全球开源模型的标杆之后,模型发布不再是单纯的产品更新,而是代表公司战略的关键走向。

Qwen 3的发布正值DeepSeek R1后,开源社区的新一轮竞争已经开始:2025年4月,Meta旗下的Llama 4在4月初正式发布,但因为效果不佳而遭诸多批评;而此前屡屡受挫的AI巨头Google,也借着Gemini 2.5 pro,在开源领域扳回一城。

通用大模型层的能力仍在快速变迁中,很难有厂商能够一直保持领先。在这个时点上,大模型团队如何确定自己的发展主线,不只是个技术问题,更是对不同产品路线和商业判断的策略问题。

在Qwen 3的发布上,可以看出一种更务实的开源策略。

比如,Qwen3本次提出的模型尺寸,就比Qwen 2.5时的尺寸划分就更细致。在资源受限的设备(如移动端、边缘计算设备)上实现高效运行,Qwen 3能同时保证一定的性能,满足轻量级推理、对话等需求。

阿里仔细解释了各个模型的适用场景:

  • 最小参数模型(如0.6B及1.7B):支持开发者用于 speculative decoding(推测性解码) 作实验模型用,对科研很友好;
  • 4B模型:推荐在手机端侧应用
  • 8B模型:推荐在电脑或者汽车端侧应用
  • 14B模型:适合作落地应用,普通开发者有几张卡也都能玩转起来
  • 32B模型:开发者和企业最喜欢的模型尺寸,支持企业大规模部署商用

而在旗舰模型上,Qwen 3的模型规模和架构,也是一个更精炼,更容易落地应用的设计。

以Qwen旗舰版模型235B(235亿参数)和DeepSeek R1满血版做直接对比:

  • Qwen 3 235B采用中等规模(235B)与高效激活设计(22B激活,约9.4%),只需4张H20 GPU即可部署;
  • DeepSeek-R1追求超大规模(671B)与稀疏激活(37B激活,约5.5%),推荐16卡H20配置,约200万元。

从部署成本看,Qwen 3是满血版R1的25%-35%,模型部署成本大降六到七成。

DeepSeek R1之后,如果说大模型领域达成了什么共识,那便是——重新将资源、人力投入到模型层的技术突破,让模型能力突破应用能力的上限。

如今大模型领域,重新将目光转向模型能力的突破。

从Qwen发布主题的变化,也能看出如今技术主线的变迁:Qwen 2.5发布时,主题还是《扩展大型语言模型的边界》,而到了Qwen 3,则是《思深,行速》,专注提高模型能力的应用性能,拉低落地门槛,而非单纯扩大参数规模。

现在,通义千问Qwen在全球下载量超过3亿,在HuggingFace社区2024年全球模型下载量中,Qwen占比已经超30%。阿里云的模型开源策略,已经走出另一条更清晰的道路:真正成为应用的土壤。

欢迎交流

欢迎交流

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
阿尔卡拉斯发布关于教练的重大更新:“计划总是需要调整的“

阿尔卡拉斯发布关于教练的重大更新:“计划总是需要调整的“

网球之家
2026-02-07 22:53:13
陈道明曾告诫女儿:宁可嫁个没文化的,也别碰这种“精致流氓”。

陈道明曾告诫女儿:宁可嫁个没文化的,也别碰这种“精致流氓”。

阿废冷眼观察所
2026-02-07 19:59:27
2026东方卫视春晚:五位主持人阵容官宣,资深主播曹可凡王冠缺席

2026东方卫视春晚:五位主持人阵容官宣,资深主播曹可凡王冠缺席

晓今娱
2026-02-08 00:05:07
不向中国供货,代价来了!

不向中国供货,代价来了!

荆楚寰宇文枢
2026-02-06 23:09:13
爱泼斯坦文件:没有搞垮前任和现任美国总统,却要掀翻英国首相?

爱泼斯坦文件:没有搞垮前任和现任美国总统,却要掀翻英国首相?

冰汝看美国
2026-02-07 04:16:24
具俊晔韩综风波升级!节目组证实获本人授权,指责汪小菲造谣大S

具俊晔韩综风波升级!节目组证实获本人授权,指责汪小菲造谣大S

萌神木木
2026-02-07 14:26:57
春节剩10天,街头现5大反常,今年过年真不一样了

春节剩10天,街头现5大反常,今年过年真不一样了

王姐懒人家常菜
2026-02-07 19:57:38
白鹿这身材跟哺乳期了一样

白鹿这身材跟哺乳期了一样

科学发掘
2026-02-07 19:40:36
米兰冬奥|2月7日看点:苏翊鸣大跳台卫冕战面临挑战,谷爱凌出战坡障预赛

米兰冬奥|2月7日看点:苏翊鸣大跳台卫冕战面临挑战,谷爱凌出战坡障预赛

上观新闻
2026-02-07 04:38:06
C罗罢赛真正原因曝光 葡媒称胜利已严重欠薪 若不解决C罗继续罢赛

C罗罢赛真正原因曝光 葡媒称胜利已严重欠薪 若不解决C罗继续罢赛

智道足球
2026-02-07 07:17:01
恩爱24年败给现实,47岁伏明霞风韵犹存,73岁梁锦松早已萎缩衰老

恩爱24年败给现实,47岁伏明霞风韵犹存,73岁梁锦松早已萎缩衰老

喜欢历史的阿繁
2026-02-07 06:32:47
记者卧底揭秘黑茶营销内幕:收身份证、屏蔽信号、话术围攻,以卖茶为名拉人头,领队称“每天来四五千人,30天排满”

记者卧底揭秘黑茶营销内幕:收身份证、屏蔽信号、话术围攻,以卖茶为名拉人头,领队称“每天来四五千人,30天排满”

大风新闻
2026-02-07 12:08:18
日本选举前两天,中国被曝批准稀土出口,日方:对华反制已奏效

日本选举前两天,中国被曝批准稀土出口,日方:对华反制已奏效

前沿天地
2026-02-07 17:19:13
白鹿张凌赫分手实锤?女方翻白眼不理睬,男方眼神卑微疑负了对方

白鹿张凌赫分手实锤?女方翻白眼不理睬,男方眼神卑微疑负了对方

小徐讲八卦
2026-02-07 08:19:32
错怪了C罗!罢赛另有隐情,胜利欠薪严重,找王子讨薪, 球王委屈

错怪了C罗!罢赛另有隐情,胜利欠薪严重,找王子讨薪, 球王委屈

阿泰希特
2026-02-07 10:41:04
从国军俘虏到解放军上将:46年军旅蜕变传奇

从国军俘虏到解放军上将:46年军旅蜕变传奇

呼呼体坛
2026-02-06 20:01:05
依靠大国出口商品,俄将“伊斯坎德尔”导弹产量提高至原来的三倍

依靠大国出口商品,俄将“伊斯坎德尔”导弹产量提高至原来的三倍

老马拉车莫少装
2026-02-03 23:08:41
2026申花首秀!好消息盖伊、拉唐能上 坏消息杨帅 蒋圣龙不能打!

2026申花首秀!好消息盖伊、拉唐能上 坏消息杨帅 蒋圣龙不能打!

80后体育大蜀黍
2026-02-07 22:39:32
巴拿马法院废了合同,长和还在码头干活,这事儿怎么收场?

巴拿马法院废了合同,长和还在码头干活,这事儿怎么收场?

小虎新车推荐员
2026-02-07 20:32:02
突击检查全国武器库!一定要严防被掉包,甲午战争悲剧绝不能重演

突击检查全国武器库!一定要严防被掉包,甲午战争悲剧绝不能重演

爱吃醋的猫咪
2026-01-27 20:31:00
2026-02-08 01:31:00
36氪 incentive-icons
36氪
让一部分人先看到未来
150615文章数 2848043关注度
往期回顾 全部

科技要闻

小米千匹马力新车亮相!问界M6双动力齐报

头条要闻

印度飞饼师傅被认定"外籍专家"领千元慰问费 多方发声

头条要闻

印度飞饼师傅被认定"外籍专家"领千元慰问费 多方发声

体育要闻

主队球迷唯一爱将,说自己不该在NBA打球

娱乐要闻

金晨处罚结果曝光!肇事逃逸被罚款

财经要闻

金价高波动时代来了

汽车要闻

工信部公告落地 全新腾势Z9GT焕新升级

态度原创

数码
教育
家居
时尚
军事航空

数码要闻

冠捷推出26.5英寸AOC G4白色显示器:LGD四代WOLED,2919元

教育要闻

大学生寒假归来,家长崩溃:儿子变成闺女了

家居要闻

现代轻奢 温馨治愈系

今日热点:《惊蛰无声》终极预告;韩国翻拍《解忧杂货店》……

军事要闻

重大转变 特朗普签令调整军售排序

无障碍浏览 进入关怀版