AI圈新产品的发布,似乎已经很难让人眼前一亮了。
但是,如果是一套产业级的布局,和系统性的组合拳呢?
最近一段时间阿里云的动作,在全球的AI社区,都引起了不小的震动。
接连三天,三款重量级模型的密集发布,通义千问系列,亮出了新肌肉……
![]()
Qwen3,墙内开花墙外香
海外的AI开发者圈、AI业内人,对Qwen的评价一向不低。
都说同行相轻,但技术圈,说话还是看数据、看实力。
像海外最大的开发者社区HuggingFace的CEO Clem,就多次在X上重点谈及Qwen3。
![]()
Perplexity的CEO,也很认可 Qwen3-coder 的实力:
![]()
推特创始人 Jack Dorsey 则是公开表示:qwen3-coder性能强劲,是一款让他觉得“哇”的产品。
![]()
再比如备受技术圈关注的Hacker News网站,Qwen3发布的热度排名,高居第一。
![]()
![]()
我之前翻译过几次文章的a16z合伙人Marco,更是对Qwen3 Coder的效果表示惊讶!
![]()
那么,Qwen3到底好在哪?
近期发布的Qwen3家族都有哪些不一样?
Qwen3“三重门”:跨越式升级
7月22日,阿里云率先发布了 Qwen3-235B(Non-thinking)。
这款非思考模式的旗舰模型,一经推出便在多个国际评测中展现出卓越性能。
在指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等通用能力方面,Qwen3-235B表现出显著提升。
具体来看,它在GPQA(知识问答)、AIME25(数学推理)、LiveCodeBench(编程能力)、Arena-Hard(人类偏好对齐)以及BFCL(Agent能力)等一系列基准测试中,其性能已经超越了国内的Kimi-K2和DeepSeek-V3等顶级开源模型。
https://qwen.readthedocs.io/en/latest/
更值得关注的是,在某些测试维度上,Qwen3-235B的性能甚至优于闭源的Claude Opus4非思考版本。
此次Qwen3-235B的更新,还特别强调了对多语言长尾知识的覆盖能力,这意味着模型在处理非主流语言和特定领域知识时,表现更为出色。
![]()
此外,在主观及开放性任务中,模型对用户偏好的契合度显著增强,能够生成更符合用户期望、质量更高的文本。
在上下文处理方面,Qwen3-235B将长文本能力提升到了 256K tokens,这对于处理长篇文档、代码库或复杂的对话历史具有重要意义。
仅仅一天之后,7月23日,阿里云紧接着发布了 Qwen3-Coder。
![]()
这款模型被定位为通义千问家族中“最具代码代理能力”的模型。
首批上线的旗舰版本Qwen3-Coder-480B-A35B-Instruct,采用了 480B参数的MoE架构,其中激活参数达到35B。
与Qwen3-235B相似,Qwen3-Coder也原生支持 256K上下文长度,并且可以通过Yarn等技术扩展至1M,为大型代码项目和复杂编程任务提供了充足的处理能力。
在核心能力上,Qwen3-Coder在Agentic Coding(代理式编程)、Agentic Browser-Use(代理式浏览器使用)和基础编程任务上,取得了开源模型中的SOTA表现。
![]()
官方数据显示,其整体编程智能已能与Anthropic的 Claude Sonnet 4 相媲美。
为了进一步提升开发者体验,阿里云还同步开源了一款面向代理式编程的命令行工具 Qwen Code。
这款工具基于Gemini CLI开发,并针对Qwen3-Coder增强了解析器和工具支持,旨在充分发挥模型在代理式编程任务中的潜力。Qwen3-Coder的发布,无疑为开发者提供了更多选择,也预示着AI辅助编程将进入一个更具智能化和自动化水平的新阶段。
而更引人注目的,是7月25日昨天刚发布的 Qwen3-235B(Thinking)。
![]()
这款模型被官方称为Qwen3旗舰模型的“超级进化”,其性能表现已经达到可以 比肩Google Gemini 2.5 Pro 的水平。
作为目前全球最强的开源推理模型之一,Qwen3-235B(Thinking)在复杂推理任务中的能力提升,将使其在科学研究、复杂问题解决、逻辑分析等领域展现出巨大潜力。
它的推出,不仅是阿里在通用智能领域深耕的成果,更是对开源模型能力边界的一次重要拓展。
这三款模型,分别在通用智能、智能编码和复杂推理这三大AI核心方向上实现了突破。
它们在多个国际评测中频频位居榜首,无疑巩固了阿里在“全球最强开源模型”领域的地位,并凸显了其在AI产业化进程中的技术实力。
阿里的AI策略与全栈布局
阿里云在AI领域的密集动作,并非偶然。
反映的是其对AI战略的长期投入和全栈部署。
当外界还在讨论单个模型的性能指标时,阿里已经开始以“日更”的节奏,展示其在AI基础设施、模型研发、云平台集成以及生态建设上的协同能力。
这种策略的深层逻辑在于,阿里不仅致力于开发出高性能的模型,更着眼于构建一个完整的AI生态系统。
这与一些专注于单一模型或应用的公司形成对比。
![]()
以全球市场为例,Google通过其TPU硬件、Gemini模型和搜索业务构建了自身的AI闭环。
而阿里则通过 阿里云+通义千问+全链自研 的模式,正在形成中国AI的能力闭环。
这意味着从底层芯片、计算框架,到上层模型、应用服务,阿里都具备自研能力,从而实现对整个AI技术栈的深度掌控和优化。
在资本投入上,阿里也展现出了其对AI的决心。
官方数据显示,阿里未来三年将投入 3800亿元人民币 用于云和AI领域。
这笔巨额投资,是中国企业在AI领域最大规模的资本下注,体现了阿里将AI视为核心增长引擎的战略决心。
市场对于阿里的科技属性也正在重新评估。
![]()
类似于AWS与Anthropic、Azure与OpenAI的合作模式,阿里正在构建“阿里云+通义千问”的中国式路径。
阿里云作为国内领先的云计算平台,为通义千问系列模型提供了强大的算力支持、数据存储和开发环境。
同时,通义千问模型的不断升级和开源,也反过来丰富了阿里云的AI服务能力,吸引更多开发者和企业用户在其平台上进行创新。
这种协同效应,使得阿里能够提供从基础设施到模型能力的端到端AI解决方案,从而提升其在企业级AI服务市场的竞争力。
相比国内其他厂商在AI模型发布上呈现的“单点低频”特点,阿里“三向齐发+高频更新”的节奏,更反映出其在AI研发体系上的成熟度和体系化能力。
这种能力差距,使得阿里能够更快地响应市场需求,将最新的技术成果快速推向市场,并在全球AI竞争中保持领先地位。
阿里,真正的全球玩家
长期以来,西方科技巨头在AI基础模型领域占据主导地位,且多倾向于闭源发展,例如OpenAI的GPT系列。
然而,中国厂商尤其以阿里为代表,在近年来对开源的拥抱,正在逐步改变这一局面。
![]()
根据斯坦福大学2025年《AI指数》报告,中国AI与美国在性能上的差距已缩小至 0.3%,而阿里在全球AI领域的贡献排名第三。
这些数据表明,中国在AI基础研究和模型开发方面,正在快速追赶并缩小与顶尖水平的差距。
当美国顶流模型如GPT-4等逐步走向闭源,限制了外部开发者对其内部机制的了解和创新时,中国厂商却集体加速开源进程,以Qwen为代表的模型,不仅将模型权重和代码开放给全球开发者,还积极构建活跃的社区生态。
在代码能力、推理能力、长文本上下文等关键指标上,Qwen3系列的表现足以与全球顶尖的闭源模型相抗衡,甚至在某些方面展现出超越的潜力。
例如,Qwen3-Coder在Agentic Coding上的表现可以与Claude Sonnet 4媲美,Qwen3-235B(Thinking)则能够比肩Gemini 2.5 Pro。
这些事实表明,中国AI企业已从“技术受限者”的角色,逐步转变为全球AI生态的“输出者”和贡献者。而阿里,无疑是这一转变中的核心推动力量。
当AI开始走向中国创造
阿里云的Qwen3系列模型密集发布,无疑是本周全球AI领域最引人注目的事件之一。
这不仅仅是几款高性能模型的问世,更是阿里在AI战略上深耕细作、持续投入的体现。通过构建全栈式的AI能力,并坚持开源策略,阿里正在为中国乃至全球的AI发展描绘一幅新的图景。
未来,它们有望在更广泛的行业中落地,例如智能客服、自动化编程、科学研究辅助、金融分析和医疗诊断等。
这场由阿里引领的“中国开源”浪潮,正在重塑全球AI的技术格局和商业竞争态势。
它不仅展现了中国在AI技术上的崛起,也为全球AI的普惠和可持续发展提供了新的路径。
中国创造,已经从小商品走向AI!
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.