网易首页 > 网易号 > 正文 申请入驻

除夕迎「源神」?Qwen3.5以小胜大,大模型竞赛下半场开始了

0
分享至



编辑|+0、张倩

农历蛇年的最后一天,当所有人都觉得「今年就卷到这里」的时候,Qwen3.5-Plus来了!



它的特点一句话就可以概括:又强又便宜。

「强」体现在,模型发布即登顶。大家现在最关注的几项核心能力 —— 多模态理解、复杂推理、编程、Agent 智能体,Qwen3.5-Plus 在同级开源模型里都没有对手,又一次强化了社区里「最强开源 = 千问」的思想烙印。在多项基准上,它甚至能媲美或超越 GPT-5.2、Gemini-3-pro 等几个第一梯队的闭源模型。



那它有多「便宜」呢?每百万 Token 只要 0.8 元,还没今天你手里拿的一小把瓜子贵。而它对标的 Gemini-3-pro,价格足足是它的 18 倍。

这一定价不是刻意压缩成本的结果,而是由技术决定的。在一系列架构创新的加持下,Qwen3.5-Plus 的参数被极致精简,但性能却更强悍 —— 只用 3970 亿的参数(激活参数只有 170 亿)就超过了万亿参数的 Qwen3-Max。参数少了,跑起来自然轻盈,部署成本直降 60%,推理吞吐量最大提升 19 倍,效率大大提升。

这是第一次,「最强」和「最便宜」出现在了同一个模型上。

在开发者们头疼都快用不起顶级 AI 的今天,Qwen3.5-Plus 这一「源神」的发布似乎让大家打消了顾虑:技术红利不再只属于金字塔尖,而是开始真正向下渗透,成为人们手中用起来没有成本焦虑的趁手工具。



Qwen3.5 可以协助进行网页开发,尤其在构建网页和设计用户界面等前端任务方面表现出色。



通过将 OpenClaw 作为第三方智能体环境集成,Qwen3.5 能够进行网页搜索、信息收集和结构化报告生成。



借助对图像像素级位置信息的建模,Qwen3.5 在物体计数、相对位置判断、空间关系描述等任务中表现更准确。

体验地址:https://chat.qwen.ai/

当然,性能、价格只是结果,真正值得展开讲讲的,是支撑这一切的那套底层技术逻辑。让我们一起看看,Qwen 这次是怎么又一次捅破天花板的。

告别「力大砖飞」

Qwen3.5-Plus 的「以小博大」架构革命

在过去两年的大模型军备竞赛中,行业普遍信奉「大力出奇迹」,参数量从千亿一路狂飙至万亿级别。这种「力大砖飞」的模式虽然推高了性能上限,但也让算力成本和部署门槛水涨船高。

Qwen3.5-Plus 则展示了一种更为灵巧的解法:不拼绝对体量,拼「聪明程度」与底层架构的极致效率。

具体而言,Qwen3.5-Plus 以 397B 的总参数量,实现了对自家万亿参数模型 Qwen3-Max 的性能超越,且多项基准测试媲美 Gemini-3-pro 和 GPT-5.2 等闭源第一梯队模型。

这种「以小胜大」的跨级表现,主要归功于以下四项核心架构创新:

  • 混合注意力机制: 传统大模型在处理长文本时,每个 Token 都需要进行全量的上下文注意力计算,这导致算力消耗随文本长度呈指数级增长。Qwen3.5-Plus 引入的混合机制赋予了模型「有详有略」的阅读能力,能够根据信息权重动态分配注意力资源,实现了精度与效率的双重提升。
  • 极致稀疏的 MoE 架构:不同于每次推理都需要激活全量参数的稠密模型,Qwen3.5-Plus 将 MoE(混合专家)架构推向了极致。在其 397B 的总参数中,每次推理仅需激活 17B 的参数量。这意味着模型只需动用不到 5% 的算力,就能调用全局的知识储备。
  • 原生多 Token 预测:模型打破了传统大模型「逐字吐出」的生成逻辑,在训练阶段就掌握了对后续多个位置进行联合预测的能力。这种「一次想好几步再说」的机制,使其在代码补全、长文本生成等高频场景中,推理速度接近翻倍,为用户带来几乎「秒回」的交互体验。
  • 系统级训练稳定性优化: 为了让上述复杂架构在大规模训练中不翻车,阿里引入了多项深层优化,包括归一化策略与专家路由初始化等。其中最值得一提的是荣获 NeurIPS 2025 最佳论文奖的「注意力门控机制」。它在注意力层的输出端精准调控信息流,既过滤了无效噪音,又防止了关键信息的流失,大幅增强了长上下文的泛化能力。

在这套组合拳的加持下,Qwen3.5-Plus 不仅训练成本大降,算力部署成本较 Qwen3-Max 也降低了 60%,推理吞吐量在 256K 长文本下提升 19 倍,这为大规模提供推理服务奠定了基础,也直接促成了其极致的定价策略。



拒绝「外挂拼装」

Qwen3.5-Plus 的原生多模态「地基」

除了在推理效率上「减负」,Qwen3.5-Plus 的另一大技术看点在于其跨模态理解力的重构。

目前业内许多主打「多模态」的模型,本质上仍是工程上的「拼装」:先训练一个优秀的语言基座,再外挂视觉或音频模块,中间通过适配层进行勉强对齐。这种做法不仅难以实现真正的特征融合,有时还会出现「视觉能力增强,语言能力降智」的尴尬局面。

Qwen3.5-Plus 选择了从地基开始重构,真正实现了「原生多模态」。

从预训练的第一天起,Qwen3.5-Plus 就在文本与视觉混合数据上进行联合学习。模型在统一的参数空间内深度融合视觉与语言特征,没有中间翻译带来的信息损耗,从而具备了「见图知意、读文生境」的直觉理解力。

为了让这种原生融合跑出效率,阿里摒弃了让视觉和语言共享同一套并行策略的传统做法,而是让不同模态「各走各的最优路径」,仅在关键节点进行高效汇合。配合精巧的 FP8/FP32 精度应用策略,该架构成功将激活内存减少约 50%,训练提速 10%。更硬核的是,哪怕同时喂入文本、图像、视频三种数据,它的训练速度也几乎不受影响,依然能保持和只训练纯文本时相当的效率。

研发团队针对纯文本、多模态和多轮对话场景搭建了专门的强化学习框架,将整体训练效率提升了 3 至 5 倍,确保模型能够在海量真实场景中持续进化。

这种底层架构的跃迁,赋予了 Qwen3.5-Plus 超越「简单读图」的广阔能力边界。目前的 Qwen3.5-Plus 不仅能进行图像的像素级空间定位,还能理解长达 2 小时视频的因果时序,甚至能将手绘草图直译为前端代码,或者化身视觉智能体自主操控手机与电脑、跨应用完成多步复杂任务

结合此前在 AI Arena 榜单上位居全球前三、被誉为「国产 Nano Banana Pro」的 Qwen-image-2.0,阿里在多模态理解与生成两条路线上正加速向全面掌握看、听、说、做能力的 AGI 目标迈进。

算不过账的时代结束了

新的竞赛开始了

过去两年,如果你一直在关注大模型的发展,其实会发现一件挺有意思的事:闭源模型是你方唱罢我登场,前三轮流做,明天榜首指不定是谁家。但开源领域就很明朗了,很多关键能力的「天花板刷新」,几乎都发生在 Qwen 发新模型的时候,每一代、每一个尺寸都能稳定输出。这种创新的连续性,意味着它已经形成了一条可以稳定产出的技术路线,比单次跑分高更说明问题。

而这次,Qwen3.5-Plus 又在捅一个新的天花板 —— 顶级智能的「性价比」。当模型性能逐渐逼近闭源第一梯队,同时价格却大幅往下走,事情的性质就开始变了。以前很多企业不是不想用最好的 AI,而是算不过账。现在成本结构一变,决策逻辑自然就松动了。技术扩散往往卡的不是能力,而是门槛。

历史上类似的转折其实出现过很多次。真正改变行业的,往往不是最贵、最极致的系统,而是那个最后变成基础设施的东西。Linux 当年是这样,Android 也是这样:开源降低门槛,生态把它铺开,等你意识到的时候,它已经无处不在了。

而 Qwen3.5-Plus 之所以能捅破这个天花板,背后不只是一个模型,而是一整套从模型到算力再到云的联动。阿里一边把模型能力通过开源释放出来,一边又用阿里云和自研芯片把部署和推理成本继续往下压,本质是在同时解决「用得好吗」和「用得起吗」两个问题。生态里的采用者也越来越多,从李飞飞团队到 Airbnb 这样的公司,都在把它当作实际可用的底座,而不只是研究对象。

所以如果把 Qwen3.5-Plus 只看成又一次模型升级,其实有点低估它了。更值得关注的是,一种新的竞争方式正在成形:不再只是比谁的模型最强,而是比谁能把足够强的能力,变成最多人日常用得到的基础设施。技术真正的大规模落地,往往就是从这种时刻开始的。

文中视频链接:https://mp.weixin.qq.com/s/MZ_BPDKLsF8uT0XyOhCbrw

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
特朗普彻底懵了,海湾国家突然变脸,反对停战,美媒:美国被骗了

特朗普彻底懵了,海湾国家突然变脸,反对停战,美媒:美国被骗了

Ck的蜜糖
2026-03-27 00:20:33
乌克兰通过法律程序,将“俄乌战争”,命名为“乌克兰独立战争”

乌克兰通过法律程序,将“俄乌战争”,命名为“乌克兰独立战争”

我心纵横天地间
2026-01-22 18:41:25
随着雷霆12连胜被终结,湖人137-130,西部最新排名出炉!马刺第2

随着雷霆12连胜被终结,湖人137-130,西部最新排名出炉!马刺第2

薇说体育
2026-03-26 10:48:02
上海宛平南路一套房子爆火!月租7000元,回家像玩密室逃脱...

上海宛平南路一套房子爆火!月租7000元,回家像玩密室逃脱...

黄河新闻网吕梁
2026-03-26 15:14:06
女同主播出轨大哥 被"正宫"直播对质!真实长相曝光

女同主播出轨大哥 被"正宫"直播对质!真实长相曝光

游民星空
2026-03-25 20:08:13
曝张雪峰3段婚姻都是闪婚,前妻缅怀满是惋惜,疯狂健身疑为备孕

曝张雪峰3段婚姻都是闪婚,前妻缅怀满是惋惜,疯狂健身疑为备孕

古希腊掌管松饼的神
2026-03-25 12:00:46
中国禁止AI公司Manus两名高管离境?外交部回应

中国禁止AI公司Manus两名高管离境?外交部回应

澎湃新闻
2026-03-26 15:36:31
《红楼梦》成就的3段姻缘,对对恩爱到白头,活成爱情最好的模样

《红楼梦》成就的3段姻缘,对对恩爱到白头,活成爱情最好的模样

上官晚安
2026-03-26 06:48:44
欠中国的钱,委内瑞拉不还了?美财长:中国已无法继续获得委石油

欠中国的钱,委内瑞拉不还了?美财长:中国已无法继续获得委石油

萌城少年强
2026-01-22 12:47:40
沙特实战封神!中国“天盾”21发全中,15亿美制系统竟惨遭反杀

沙特实战封神!中国“天盾”21发全中,15亿美制系统竟惨遭反杀

素衣读史
2026-03-25 21:26:46
轰21+10!湖人捡漏2米13悍将真香:年薪345万,变三巨头喂饼绝配

轰21+10!湖人捡漏2米13悍将真香:年薪345万,变三巨头喂饼绝配

李喜林篮球绝杀
2026-03-26 11:34:01
巴萨真会看人:从“天才摇篮”到“板凳深渊”,五名球员迷失报告

巴萨真会看人:从“天才摇篮”到“板凳深渊”,五名球员迷失报告

C罗带你侃球
2026-03-25 20:29:45
人民日报痛批大学生 “沉睡” 现象:躺平四年,毕业真的会失业!

人民日报痛批大学生 “沉睡” 现象:躺平四年,毕业真的会失业!

复转这些年
2026-03-25 10:02:32
44岁柳岩一袭蓝裙封神,这若隐若现的腰臀比,谁看了不迷糊?

44岁柳岩一袭蓝裙封神,这若隐若现的腰臀比,谁看了不迷糊?

娱乐领航家
2026-03-26 22:00:03
中国最有名的9条家训,读懂一条旺家三代,建议收藏反复背诵

中国最有名的9条家训,读懂一条旺家三代,建议收藏反复背诵

长风文史
2026-03-25 17:58:23
小小的但有硬派味,丰田酷路泽 FJ 正式发售,约 26.7 万元

小小的但有硬派味,丰田酷路泽 FJ 正式发售,约 26.7 万元

爱范儿
2026-03-26 15:27:20
刚刚!诞生了!CBA第一支季后赛球队...

刚刚!诞生了!CBA第一支季后赛球队...

技巧君侃球
2026-03-26 23:58:26
央媒发话,房子是最大资产,2026房地产要下猛药了?

央媒发话,房子是最大资产,2026房地产要下猛药了?

毒sir财经
2026-03-24 23:51:50
马英九专访中途喊停,原因曝光

马英九专访中途喊停,原因曝光

郭茂辰海峡传真
2026-03-26 21:32:49
中原消费金融为催收“买”借款人手机号码 三大运营商均中标 或涉买卖个人信息惹争议

中原消费金融为催收“买”借款人手机号码 三大运营商均中标 或涉买卖个人信息惹争议

信网
2026-03-26 19:12:37
2026-03-27 01:32:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12608文章数 142594关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

家居
艺术
教育
旅游
公开课

家居要闻

傍海而居 静观蝴蝶海

艺术要闻

都说乌克兰美女多,看完摄影师贝格玛 的作品我信了!

教育要闻

精准研判,提质增效丨我校召开2026届毕业生就业工作研判会

旅游要闻

老外为羊拿铁扎堆魔都街头 法国游客花式夸上海

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版