网易首页 > 网易号 > 正文 申请入驻

Qwen3,越过三重门

0
分享至

AI圈新产品的发布,似乎已经很难让人眼前一亮了。

但是,如果是一套产业级的布局,和系统性的组合拳呢?

最近一段时间阿里云的动作,在全球的AI社区,都引起了不小的震动。

接连三天,三款重量级模型的密集发布,通义千问系列,亮出了新肌肉……


Qwen3,墙内开花墙外香

海外的AI开发者圈、AI业内人,对Qwen的评价一向不低。

都说同行相轻,但技术圈,说话还是看数据、看实力。

像海外最大的开发者社区HuggingFace的CEO Clem,就多次在X上重点谈及Qwen3。


Perplexity的CEO,也很认可 Qwen3-coder 的实力:


推特创始人 Jack Dorsey 则是公开表示:qwen3-coder性能强劲,是一款让他觉得“哇”的产品。


再比如备受技术圈关注的Hacker News网站,Qwen3发布的热度排名,高居第一。



我之前翻译过几次文章的a16z合伙人Marco,更是对Qwen3 Coder的效果表示惊讶!


那么,Qwen3到底好在哪?

近期发布的Qwen3家族都有哪些不一样?

Qwen3“三重门”:跨越式升级

7月22日,阿里云率先发布了 Qwen3-235B(Non-thinking)

这款非思考模式的旗舰模型,一经推出便在多个国际评测中展现出卓越性能。

在指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等通用能力方面,Qwen3-235B表现出显著提升。

具体来看,它在GPQA(知识问答)、AIME25(数学推理)、LiveCodeBench(编程能力)、Arena-Hard(人类偏好对齐)以及BFCL(Agent能力)等一系列基准测试中,其性能已经超越了国内的Kimi-K2和DeepSeek-V3等顶级开源模型。

https://qwen.readthedocs.io/en/latest/

更值得关注的是,在某些测试维度上,Qwen3-235B的性能甚至优于闭源的Claude Opus4非思考版本。

此次Qwen3-235B的更新,还特别强调了对多语言长尾知识的覆盖能力,这意味着模型在处理非主流语言和特定领域知识时,表现更为出色。


此外,在主观及开放性任务中,模型对用户偏好的契合度显著增强,能够生成更符合用户期望、质量更高的文本。

在上下文处理方面,Qwen3-235B将长文本能力提升到了 256K tokens,这对于处理长篇文档、代码库或复杂的对话历史具有重要意义。

仅仅一天之后,7月23日,阿里云紧接着发布了 Qwen3-Coder


这款模型被定位为通义千问家族中“最具代码代理能力”的模型。

首批上线的旗舰版本Qwen3-Coder-480B-A35B-Instruct,采用了 480B参数的MoE架构,其中激活参数达到35B。

与Qwen3-235B相似,Qwen3-Coder也原生支持 256K上下文长度,并且可以通过Yarn等技术扩展至1M,为大型代码项目和复杂编程任务提供了充足的处理能力。

在核心能力上,Qwen3-Coder在Agentic Coding(代理式编程)、Agentic Browser-Use(代理式浏览器使用)和基础编程任务上,取得了开源模型中的SOTA表现。


官方数据显示,其整体编程智能已能与Anthropic的 Claude Sonnet 4 相媲美。

为了进一步提升开发者体验,阿里云还同步开源了一款面向代理式编程的命令行工具 Qwen Code

这款工具基于Gemini CLI开发,并针对Qwen3-Coder增强了解析器和工具支持,旨在充分发挥模型在代理式编程任务中的潜力。Qwen3-Coder的发布,无疑为开发者提供了更多选择,也预示着AI辅助编程将进入一个更具智能化和自动化水平的新阶段。

而更引人注目的,是7月25日昨天刚发布的 Qwen3-235B(Thinking)


这款模型被官方称为Qwen3旗舰模型的“超级进化”,其性能表现已经达到可以 比肩Google Gemini 2.5 Pro 的水平。

作为目前全球最强的开源推理模型之一,Qwen3-235B(Thinking)在复杂推理任务中的能力提升,将使其在科学研究、复杂问题解决、逻辑分析等领域展现出巨大潜力。

它的推出,不仅是阿里在通用智能领域深耕的成果,更是对开源模型能力边界的一次重要拓展。

这三款模型,分别在通用智能、智能编码和复杂推理这三大AI核心方向上实现了突破。

它们在多个国际评测中频频位居榜首,无疑巩固了阿里在“全球最强开源模型”领域的地位,并凸显了其在AI产业化进程中的技术实力。

阿里的AI策略与全栈布局

阿里云在AI领域的密集动作,并非偶然。

反映的是其对AI战略的长期投入和全栈部署。

当外界还在讨论单个模型的性能指标时,阿里已经开始以“日更”的节奏,展示其在AI基础设施、模型研发、云平台集成以及生态建设上的协同能力。

这种策略的深层逻辑在于,阿里不仅致力于开发出高性能的模型,更着眼于构建一个完整的AI生态系统。

这与一些专注于单一模型或应用的公司形成对比。


以全球市场为例,Google通过其TPU硬件、Gemini模型和搜索业务构建了自身的AI闭环。

而阿里则通过 阿里云+通义千问+全链自研 的模式,正在形成中国AI的能力闭环。

这意味着从底层芯片、计算框架,到上层模型、应用服务,阿里都具备自研能力,从而实现对整个AI技术栈的深度掌控和优化。

在资本投入上,阿里也展现出了其对AI的决心。

官方数据显示,阿里未来三年将投入 3800亿元人民币 用于云和AI领域。

这笔巨额投资,是中国企业在AI领域最大规模的资本下注,体现了阿里将AI视为核心增长引擎的战略决心。

市场对于阿里的科技属性也正在重新评估。


类似于AWS与Anthropic、Azure与OpenAI的合作模式,阿里正在构建“阿里云+通义千问”的中国式路径。

阿里云作为国内领先的云计算平台,为通义千问系列模型提供了强大的算力支持、数据存储和开发环境。

同时,通义千问模型的不断升级和开源,也反过来丰富了阿里云的AI服务能力,吸引更多开发者和企业用户在其平台上进行创新。

这种协同效应,使得阿里能够提供从基础设施到模型能力的端到端AI解决方案,从而提升其在企业级AI服务市场的竞争力。

相比国内其他厂商在AI模型发布上呈现的“单点低频”特点,阿里“三向齐发+高频更新”的节奏,更反映出其在AI研发体系上的成熟度和体系化能力。

这种能力差距,使得阿里能够更快地响应市场需求,将最新的技术成果快速推向市场,并在全球AI竞争中保持领先地位。

阿里,真正的全球玩家

长期以来,西方科技巨头在AI基础模型领域占据主导地位,且多倾向于闭源发展,例如OpenAI的GPT系列。

然而,中国厂商尤其以阿里为代表,在近年来对开源的拥抱,正在逐步改变这一局面。


根据斯坦福大学2025年《AI指数》报告,中国AI与美国在性能上的差距已缩小至 0.3%,而阿里在全球AI领域的贡献排名第三。

这些数据表明,中国在AI基础研究和模型开发方面,正在快速追赶并缩小与顶尖水平的差距。

当美国顶流模型如GPT-4等逐步走向闭源,限制了外部开发者对其内部机制的了解和创新时,中国厂商却集体加速开源进程,以Qwen为代表的模型,不仅将模型权重和代码开放给全球开发者,还积极构建活跃的社区生态。

在代码能力、推理能力、长文本上下文等关键指标上,Qwen3系列的表现足以与全球顶尖的闭源模型相抗衡,甚至在某些方面展现出超越的潜力。

例如,Qwen3-Coder在Agentic Coding上的表现可以与Claude Sonnet 4媲美,Qwen3-235B(Thinking)则能够比肩Gemini 2.5 Pro。

这些事实表明,中国AI企业已从“技术受限者”的角色,逐步转变为全球AI生态的“输出者”和贡献者。而阿里,无疑是这一转变中的核心推动力量。

当AI开始走向中国创造

阿里云的Qwen3系列模型密集发布,无疑是本周全球AI领域最引人注目的事件之一。

这不仅仅是几款高性能模型的问世,更是阿里在AI战略上深耕细作、持续投入的体现。通过构建全栈式的AI能力,并坚持开源策略,阿里正在为中国乃至全球的AI发展描绘一幅新的图景。

未来,它们有望在更广泛的行业中落地,例如智能客服、自动化编程、科学研究辅助、金融分析和医疗诊断等。

这场由阿里引领的“中国开源”浪潮,正在重塑全球AI的技术格局和商业竞争态势。

它不仅展现了中国在AI技术上的崛起,也为全球AI的普惠和可持续发展提供了新的路径。

中国创造,已经从小商品走向AI!


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
越查越有,释永信落网全家老底被扒,原来他才只是冰山一角!

越查越有,释永信落网全家老底被扒,原来他才只是冰山一角!

阿纂看事
2025-08-08 18:10:48
既然选择了美国,那就请坚持到底!我们绝不插手,就要静静看着!

既然选择了美国,那就请坚持到底!我们绝不插手,就要静静看着!

现代小青青慕慕
2025-12-16 12:16:34
闹大了!日媒:电车渗透率已超50%,中国汽车是不是应该反思?​

闹大了!日媒:电车渗透率已超50%,中国汽车是不是应该反思?​

阿纂看事
2026-01-05 16:05:20
白巧克力:2006年总决赛G6赛前库班警告手握赛点的热火不许带香槟进场

白巧克力:2006年总决赛G6赛前库班警告手握赛点的热火不许带香槟进场

懂球帝
2026-01-23 11:45:08
为什么现在日本对外国人越来越严苛,这些人要负责任……

为什么现在日本对外国人越来越严苛,这些人要负责任……

日本物语
2026-01-23 20:52:30
科斯塔:孔蒂为人尖酸刻薄,整天摆臭脸怕是因为在家没性生活

科斯塔:孔蒂为人尖酸刻薄,整天摆臭脸怕是因为在家没性生活

懂球帝
2026-01-24 01:03:23
为嫣然医院提供新址的山东爱心企业最新回应:不希望通过媒体和流量做这个事,一切等有通知再公布

为嫣然医院提供新址的山东爱心企业最新回应:不希望通过媒体和流量做这个事,一切等有通知再公布

极目新闻
2026-01-23 11:04:18
载有中国游客的旅游大巴在俄发生事故

载有中国游客的旅游大巴在俄发生事故

新华社
2026-01-22 18:23:37
永远热泪盈眶!瓦林卡的澳网告别演出绚烂绽放

永远热泪盈眶!瓦林卡的澳网告别演出绚烂绽放

全网球APP
2026-01-23 19:04:16
Melody 被熏到花容失色 现场崩溃「我手要断了」

Melody 被熏到花容失色 现场崩溃「我手要断了」

ETtoday星光云
2026-01-23 12:22:07
不满意,泰伦-卢:洛城德比快船本该大胜;裁判对湖人太宽容了

不满意,泰伦-卢:洛城德比快船本该大胜;裁判对湖人太宽容了

懂球帝
2026-01-23 22:13:09
陈百祥称自己每场直播收入超8位数,“这简直是天文数字,就站在那里说四五句话”

陈百祥称自己每场直播收入超8位数,“这简直是天文数字,就站在那里说四五句话”

潇湘晨报
2026-01-23 12:09:10
中央定调!又是发钱又是装电梯,2026年红利,看懂的已经行动了

中央定调!又是发钱又是装电梯,2026年红利,看懂的已经行动了

boss外传
2026-01-23 06:00:02
巴萨连续8场在客场或中立场比赛,追平队史纪录

巴萨连续8场在客场或中立场比赛,追平队史纪录

懂球帝
2026-01-24 04:17:30
11.2万吨核航母将亮相,搭配清一色五代战机,俄:领先世界20年

11.2万吨核航母将亮相,搭配清一色五代战机,俄:领先世界20年

近史谈
2026-01-20 11:56:51
演员黄景瑜将上太空旅游,穿越者公司:选他是因为他以硬汉形象著称,公司愿景是实现大众的太空梦

演员黄景瑜将上太空旅游,穿越者公司:选他是因为他以硬汉形象著称,公司愿景是实现大众的太空梦

极目新闻
2026-01-23 12:57:50
胖了一圈的奚梦瑶,面相都变了

胖了一圈的奚梦瑶,面相都变了

木子爱娱乐大号
2026-01-23 18:07:57
斯诺登现状曝光!放弃20万美元年薪,流亡俄10年,如今已生二胎

斯诺登现状曝光!放弃20万美元年薪,流亡俄10年,如今已生二胎

谈史论天地
2026-01-23 18:25:03
输不起?越南主帅回应0-3输中国队真相,亚足联重拳出击补开罚单

输不起?越南主帅回应0-3输中国队真相,亚足联重拳出击补开罚单

詹妹侃体育
2026-01-23 11:04:13
国羽2连胜!陈雨菲2-0进4强,3大种子选手掉队,世界冠军退赛!

国羽2连胜!陈雨菲2-0进4强,3大种子选手掉队,世界冠军退赛!

刘姚尧的文字城堡
2026-01-23 18:06:41
2026-01-24 07:03:00
AI异类 incentive-icons
AI异类
从硅谷到中关村,AI信息与测评
98文章数 5关注度
往期回顾 全部

科技要闻

TikTok守住了算法"灵魂" 更握紧了"钱袋子"

头条要闻

疑在达沃斯受挫 79岁的特朗普转发超80条帖子发泄怒气

头条要闻

疑在达沃斯受挫 79岁的特朗普转发超80条帖子发泄怒气

体育要闻

杜兰特鏖战44分钟累瘫 轰36+7却致命失误

娱乐要闻

演员孙涛澄清闫学晶言论 落泪维护妻子

财经要闻

2026年,消费没有新故事?

汽车要闻

主打家庭大六座 奕境首款SUV将北京车展亮相

态度原创

教育
家居
健康
本地
军事航空

教育要闻

中国家庭普遍做错的教育行为是什么?吴军:追求同质化的教育,孩子的培养不需要盲目跟风

家居要闻

在家度假 160平南洋混搭宅

耳石脱落为何让人天旋地转+恶心?

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

军事要闻

美军首艘“高超导弹战舰”出海测试

无障碍浏览 进入关怀版