网易首页 > 网易号 > 正文 申请入驻

Qwen3,越过三重门

0
分享至

AI圈新产品的发布,似乎已经很难让人眼前一亮了。

但是,如果是一套产业级的布局,和系统性的组合拳呢?

最近一段时间阿里云的动作,在全球的AI社区,都引起了不小的震动。

接连三天,三款重量级模型的密集发布,通义千问系列,亮出了新肌肉……


Qwen3,墙内开花墙外香

海外的AI开发者圈、AI业内人,对Qwen的评价一向不低。

都说同行相轻,但技术圈,说话还是看数据、看实力。

像海外最大的开发者社区HuggingFace的CEO Clem,就多次在X上重点谈及Qwen3。


Perplexity的CEO,也很认可 Qwen3-coder 的实力:


推特创始人 Jack Dorsey 则是公开表示:qwen3-coder性能强劲,是一款让他觉得“哇”的产品。


再比如备受技术圈关注的Hacker News网站,Qwen3发布的热度排名,高居第一。



我之前翻译过几次文章的a16z合伙人Marco,更是对Qwen3 Coder的效果表示惊讶!


那么,Qwen3到底好在哪?

近期发布的Qwen3家族都有哪些不一样?

Qwen3“三重门”:跨越式升级

7月22日,阿里云率先发布了 Qwen3-235B(Non-thinking)

这款非思考模式的旗舰模型,一经推出便在多个国际评测中展现出卓越性能。

在指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等通用能力方面,Qwen3-235B表现出显著提升。

具体来看,它在GPQA(知识问答)、AIME25(数学推理)、LiveCodeBench(编程能力)、Arena-Hard(人类偏好对齐)以及BFCL(Agent能力)等一系列基准测试中,其性能已经超越了国内的Kimi-K2和DeepSeek-V3等顶级开源模型。

https://qwen.readthedocs.io/en/latest/

更值得关注的是,在某些测试维度上,Qwen3-235B的性能甚至优于闭源的Claude Opus4非思考版本。

此次Qwen3-235B的更新,还特别强调了对多语言长尾知识的覆盖能力,这意味着模型在处理非主流语言和特定领域知识时,表现更为出色。


此外,在主观及开放性任务中,模型对用户偏好的契合度显著增强,能够生成更符合用户期望、质量更高的文本。

在上下文处理方面,Qwen3-235B将长文本能力提升到了 256K tokens,这对于处理长篇文档、代码库或复杂的对话历史具有重要意义。

仅仅一天之后,7月23日,阿里云紧接着发布了 Qwen3-Coder


这款模型被定位为通义千问家族中“最具代码代理能力”的模型。

首批上线的旗舰版本Qwen3-Coder-480B-A35B-Instruct,采用了 480B参数的MoE架构,其中激活参数达到35B。

与Qwen3-235B相似,Qwen3-Coder也原生支持 256K上下文长度,并且可以通过Yarn等技术扩展至1M,为大型代码项目和复杂编程任务提供了充足的处理能力。

在核心能力上,Qwen3-Coder在Agentic Coding(代理式编程)、Agentic Browser-Use(代理式浏览器使用)和基础编程任务上,取得了开源模型中的SOTA表现。


官方数据显示,其整体编程智能已能与Anthropic的 Claude Sonnet 4 相媲美。

为了进一步提升开发者体验,阿里云还同步开源了一款面向代理式编程的命令行工具 Qwen Code

这款工具基于Gemini CLI开发,并针对Qwen3-Coder增强了解析器和工具支持,旨在充分发挥模型在代理式编程任务中的潜力。Qwen3-Coder的发布,无疑为开发者提供了更多选择,也预示着AI辅助编程将进入一个更具智能化和自动化水平的新阶段。

而更引人注目的,是7月25日昨天刚发布的 Qwen3-235B(Thinking)


这款模型被官方称为Qwen3旗舰模型的“超级进化”,其性能表现已经达到可以 比肩Google Gemini 2.5 Pro 的水平。

作为目前全球最强的开源推理模型之一,Qwen3-235B(Thinking)在复杂推理任务中的能力提升,将使其在科学研究、复杂问题解决、逻辑分析等领域展现出巨大潜力。

它的推出,不仅是阿里在通用智能领域深耕的成果,更是对开源模型能力边界的一次重要拓展。

这三款模型,分别在通用智能、智能编码和复杂推理这三大AI核心方向上实现了突破。

它们在多个国际评测中频频位居榜首,无疑巩固了阿里在“全球最强开源模型”领域的地位,并凸显了其在AI产业化进程中的技术实力。

阿里的AI策略与全栈布局

阿里云在AI领域的密集动作,并非偶然。

反映的是其对AI战略的长期投入和全栈部署。

当外界还在讨论单个模型的性能指标时,阿里已经开始以“日更”的节奏,展示其在AI基础设施、模型研发、云平台集成以及生态建设上的协同能力。

这种策略的深层逻辑在于,阿里不仅致力于开发出高性能的模型,更着眼于构建一个完整的AI生态系统。

这与一些专注于单一模型或应用的公司形成对比。


以全球市场为例,Google通过其TPU硬件、Gemini模型和搜索业务构建了自身的AI闭环。

而阿里则通过 阿里云+通义千问+全链自研 的模式,正在形成中国AI的能力闭环。

这意味着从底层芯片、计算框架,到上层模型、应用服务,阿里都具备自研能力,从而实现对整个AI技术栈的深度掌控和优化。

在资本投入上,阿里也展现出了其对AI的决心。

官方数据显示,阿里未来三年将投入 3800亿元人民币 用于云和AI领域。

这笔巨额投资,是中国企业在AI领域最大规模的资本下注,体现了阿里将AI视为核心增长引擎的战略决心。

市场对于阿里的科技属性也正在重新评估。


类似于AWS与Anthropic、Azure与OpenAI的合作模式,阿里正在构建“阿里云+通义千问”的中国式路径。

阿里云作为国内领先的云计算平台,为通义千问系列模型提供了强大的算力支持、数据存储和开发环境。

同时,通义千问模型的不断升级和开源,也反过来丰富了阿里云的AI服务能力,吸引更多开发者和企业用户在其平台上进行创新。

这种协同效应,使得阿里能够提供从基础设施到模型能力的端到端AI解决方案,从而提升其在企业级AI服务市场的竞争力。

相比国内其他厂商在AI模型发布上呈现的“单点低频”特点,阿里“三向齐发+高频更新”的节奏,更反映出其在AI研发体系上的成熟度和体系化能力。

这种能力差距,使得阿里能够更快地响应市场需求,将最新的技术成果快速推向市场,并在全球AI竞争中保持领先地位。

阿里,真正的全球玩家

长期以来,西方科技巨头在AI基础模型领域占据主导地位,且多倾向于闭源发展,例如OpenAI的GPT系列。

然而,中国厂商尤其以阿里为代表,在近年来对开源的拥抱,正在逐步改变这一局面。


根据斯坦福大学2025年《AI指数》报告,中国AI与美国在性能上的差距已缩小至 0.3%,而阿里在全球AI领域的贡献排名第三。

这些数据表明,中国在AI基础研究和模型开发方面,正在快速追赶并缩小与顶尖水平的差距。

当美国顶流模型如GPT-4等逐步走向闭源,限制了外部开发者对其内部机制的了解和创新时,中国厂商却集体加速开源进程,以Qwen为代表的模型,不仅将模型权重和代码开放给全球开发者,还积极构建活跃的社区生态。

在代码能力、推理能力、长文本上下文等关键指标上,Qwen3系列的表现足以与全球顶尖的闭源模型相抗衡,甚至在某些方面展现出超越的潜力。

例如,Qwen3-Coder在Agentic Coding上的表现可以与Claude Sonnet 4媲美,Qwen3-235B(Thinking)则能够比肩Gemini 2.5 Pro。

这些事实表明,中国AI企业已从“技术受限者”的角色,逐步转变为全球AI生态的“输出者”和贡献者。而阿里,无疑是这一转变中的核心推动力量。

当AI开始走向中国创造

阿里云的Qwen3系列模型密集发布,无疑是本周全球AI领域最引人注目的事件之一。

这不仅仅是几款高性能模型的问世,更是阿里在AI战略上深耕细作、持续投入的体现。通过构建全栈式的AI能力,并坚持开源策略,阿里正在为中国乃至全球的AI发展描绘一幅新的图景。

未来,它们有望在更广泛的行业中落地,例如智能客服、自动化编程、科学研究辅助、金融分析和医疗诊断等。

这场由阿里引领的“中国开源”浪潮,正在重塑全球AI的技术格局和商业竞争态势。

它不仅展现了中国在AI技术上的崛起,也为全球AI的普惠和可持续发展提供了新的路径。

中国创造,已经从小商品走向AI!


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
这场面20年都没见过!美元血崩,美联储做梦都没想到败得这么快

这场面20年都没见过!美元血崩,美联储做梦都没想到败得这么快

户外钓鱼哥阿旱
2026-01-24 15:57:48
央视曝光“毒蔬菜”!0.08克便可致器官衰竭,已流窜到全国多地

央视曝光“毒蔬菜”!0.08克便可致器官衰竭,已流窜到全国多地

梦史
2026-01-23 10:20:41
大刀能拼过日军刺刀吗?老兵口述:三个端刺刀鬼子,干翻了一个班

大刀能拼过日军刺刀吗?老兵口述:三个端刺刀鬼子,干翻了一个班

磊子讲史
2026-01-08 18:44:12
18.49万!奔驰官宣:新车正式上市

18.49万!奔驰官宣:新车正式上市

高科技爱好者
2026-01-24 22:50:58
德国牵头,北约11国军演剑指美军,马克龙对特朗普下重手

德国牵头,北约11国军演剑指美军,马克龙对特朗普下重手

兵说
2026-01-23 21:13:48
Lululemon新款瑜伽裤因易走光下架后重新上架,中国电商渠道暂未销售,创始人发声:公司已经完全迷失方向

Lululemon新款瑜伽裤因易走光下架后重新上架,中国电商渠道暂未销售,创始人发声:公司已经完全迷失方向

鲁中晨报
2026-01-24 21:59:13
11家公司1月24日夜晚突发大利空,贵金属 算力 跨境电商,减持潮等

11家公司1月24日夜晚突发大利空,贵金属 算力 跨境电商,减持潮等

股市皆大事
2026-01-24 20:05:30
U23国足首发公布 媒体人热议:仍是532 千万别被激怒 死守等奇迹

U23国足首发公布 媒体人热议:仍是532 千万别被激怒 死守等奇迹

风过乡
2026-01-24 22:05:35
热议U23男足首发:防守最重要是冷静,要当心对方角球定位球

热议U23男足首发:防守最重要是冷静,要当心对方角球定位球

懂球帝
2026-01-24 23:03:31
重返国家队?轰21+15蹂躏范子铭,球迷:看罚球就知道基本功扎实

重返国家队?轰21+15蹂躏范子铭,球迷:看罚球就知道基本功扎实

弄月公子
2026-01-24 23:03:10
男单冠军出炉!日本选手3:2惊险夺冠,张本美和顺利收获女单冠军

男单冠军出炉!日本选手3:2惊险夺冠,张本美和顺利收获女单冠军

国乒二三事
2026-01-24 12:32:39
朱芳雨或向CBA公司提出申诉

朱芳雨或向CBA公司提出申诉

体育哲人
2026-01-24 21:03:16
捡走吃掉赔8000元!2023年捡到一只回家煲汤,被人发现时只剩骨头

捡走吃掉赔8000元!2023年捡到一只回家煲汤,被人发现时只剩骨头

万象硬核本尊
2026-01-22 19:47:55
藏匿9年的本·拉登:5米高墙铁丝网防护,致命破绽是院中晾衣绳

藏匿9年的本·拉登:5米高墙铁丝网防护,致命破绽是院中晾衣绳

通鉴史智
2026-01-23 14:52:23
42票赞成、2票反对,美方将禁止对华出口H200芯片,中方先发制人

42票赞成、2票反对,美方将禁止对华出口H200芯片,中方先发制人

小小科普员
2026-01-23 16:40:52
皮尔斯:詹姆斯为湖人带来了一座总冠军和100亿美元,湖人太划算了

皮尔斯:詹姆斯为湖人带来了一座总冠军和100亿美元,湖人太划算了

懂球帝
2026-01-24 15:37:08
高官落马,教育反腐有新动向

高官落马,教育反腐有新动向

行者殷涛
2026-01-24 20:57:57
载入中国足球史册!车企老总宣布:2位球员进球送车,获5年使用权

载入中国足球史册!车企老总宣布:2位球员进球送车,获5年使用权

侃球熊弟
2026-01-24 19:44:42
女子违停竖中指被撞,交警最新回应来了!责任划分引全网热议

女子违停竖中指被撞,交警最新回应来了!责任划分引全网热议

天天热点见闻
2026-01-23 12:57:06
挪威向乌克兰交付大量NASAMS防空导弹

挪威向乌克兰交付大量NASAMS防空导弹

桂系007
2026-01-22 22:45:07
2026-01-24 23:20:49
AI异类 incentive-icons
AI异类
从硅谷到中关村,AI信息与测评
98文章数 5关注度
往期回顾 全部

科技要闻

特斯拉Cybercrab即将落地 每公里不到1块钱

头条要闻

被雪豹咬伤女子从急诊转出 目击者:她没有去摸豹子

头条要闻

被雪豹咬伤女子从急诊转出 目击者:她没有去摸豹子

体育要闻

当家球星打替补,他们在故意摆烂?

娱乐要闻

回归还是顶流 凤凰传奇将现身马年春晚

财经要闻

“百年老字号”张小泉遭60亿债务压顶

汽车要闻

有增程和纯电版可选 日产NX8或于3-4月间上市

态度原创

手机
旅游
艺术
亲子
公开课

手机要闻

华为Pura 80系列开启新年礼遇:至高优惠1500元,到手即享鸿蒙6

旅游要闻

新春红包封面和壁纸,接!

艺术要闻

303米!这座“涌泉”之楼,是绿地在济南拿下的首个“第一高”

亲子要闻

自尊心很强的孩子该怎么疏导

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版