网易首页 > 网易号 > 正文 申请入驻

除夕迎「源神」?Qwen3.5以小胜大,大模型竞赛下半场开始了

0
分享至



编辑|+0、张倩

农历蛇年的最后一天,当所有人都觉得「今年就卷到这里」的时候,Qwen3.5-Plus来了!



它的特点一句话就可以概括:又强又便宜。

「强」体现在,模型发布即登顶。大家现在最关注的几项核心能力 —— 多模态理解、复杂推理、编程、Agent 智能体,Qwen3.5-Plus 在同级开源模型里都没有对手,又一次强化了社区里「最强开源 = 千问」的思想烙印。在多项基准上,它甚至能媲美或超越 GPT-5.2、Gemini-3-pro 等几个第一梯队的闭源模型。



那它有多「便宜」呢?每百万 Token 只要 0.8 元,还没今天你手里拿的一小把瓜子贵。而它对标的 Gemini-3-pro,价格足足是它的 18 倍。

这一定价不是刻意压缩成本的结果,而是由技术决定的。在一系列架构创新的加持下,Qwen3.5-Plus 的参数被极致精简,但性能却更强悍 —— 只用 3970 亿的参数(激活参数只有 170 亿)就超过了万亿参数的 Qwen3-Max。参数少了,跑起来自然轻盈,部署成本直降 60%,推理吞吐量最大提升 19 倍,效率大大提升。

这是第一次,「最强」和「最便宜」出现在了同一个模型上。

在开发者们头疼都快用不起顶级 AI 的今天,Qwen3.5-Plus 这一「源神」的发布似乎让大家打消了顾虑:技术红利不再只属于金字塔尖,而是开始真正向下渗透,成为人们手中用起来没有成本焦虑的趁手工具。



Qwen3.5 可以协助进行网页开发,尤其在构建网页和设计用户界面等前端任务方面表现出色。



通过将 OpenClaw 作为第三方智能体环境集成,Qwen3.5 能够进行网页搜索、信息收集和结构化报告生成。



借助对图像像素级位置信息的建模,Qwen3.5 在物体计数、相对位置判断、空间关系描述等任务中表现更准确。

体验地址:https://chat.qwen.ai/

当然,性能、价格只是结果,真正值得展开讲讲的,是支撑这一切的那套底层技术逻辑。让我们一起看看,Qwen 这次是怎么又一次捅破天花板的。

告别「力大砖飞」

Qwen3.5-Plus 的「以小博大」架构革命

在过去两年的大模型军备竞赛中,行业普遍信奉「大力出奇迹」,参数量从千亿一路狂飙至万亿级别。这种「力大砖飞」的模式虽然推高了性能上限,但也让算力成本和部署门槛水涨船高。

Qwen3.5-Plus 则展示了一种更为灵巧的解法:不拼绝对体量,拼「聪明程度」与底层架构的极致效率。

具体而言,Qwen3.5-Plus 以 397B 的总参数量,实现了对自家万亿参数模型 Qwen3-Max 的性能超越,且多项基准测试媲美 Gemini-3-pro 和 GPT-5.2 等闭源第一梯队模型。

这种「以小胜大」的跨级表现,主要归功于以下四项核心架构创新:

  • 混合注意力机制: 传统大模型在处理长文本时,每个 Token 都需要进行全量的上下文注意力计算,这导致算力消耗随文本长度呈指数级增长。Qwen3.5-Plus 引入的混合机制赋予了模型「有详有略」的阅读能力,能够根据信息权重动态分配注意力资源,实现了精度与效率的双重提升。
  • 极致稀疏的 MoE 架构:不同于每次推理都需要激活全量参数的稠密模型,Qwen3.5-Plus 将 MoE(混合专家)架构推向了极致。在其 397B 的总参数中,每次推理仅需激活 17B 的参数量。这意味着模型只需动用不到 5% 的算力,就能调用全局的知识储备。
  • 原生多 Token 预测:模型打破了传统大模型「逐字吐出」的生成逻辑,在训练阶段就掌握了对后续多个位置进行联合预测的能力。这种「一次想好几步再说」的机制,使其在代码补全、长文本生成等高频场景中,推理速度接近翻倍,为用户带来几乎「秒回」的交互体验。
  • 系统级训练稳定性优化: 为了让上述复杂架构在大规模训练中不翻车,阿里引入了多项深层优化,包括归一化策略与专家路由初始化等。其中最值得一提的是荣获 NeurIPS 2025 最佳论文奖的「注意力门控机制」。它在注意力层的输出端精准调控信息流,既过滤了无效噪音,又防止了关键信息的流失,大幅增强了长上下文的泛化能力。

在这套组合拳的加持下,Qwen3.5-Plus 不仅训练成本大降,算力部署成本较 Qwen3-Max 也降低了 60%,推理吞吐量在 256K 长文本下提升 19 倍,这为大规模提供推理服务奠定了基础,也直接促成了其极致的定价策略。



拒绝「外挂拼装」

Qwen3.5-Plus 的原生多模态「地基」

除了在推理效率上「减负」,Qwen3.5-Plus 的另一大技术看点在于其跨模态理解力的重构。

目前业内许多主打「多模态」的模型,本质上仍是工程上的「拼装」:先训练一个优秀的语言基座,再外挂视觉或音频模块,中间通过适配层进行勉强对齐。这种做法不仅难以实现真正的特征融合,有时还会出现「视觉能力增强,语言能力降智」的尴尬局面。

Qwen3.5-Plus 选择了从地基开始重构,真正实现了「原生多模态」。

从预训练的第一天起,Qwen3.5-Plus 就在文本与视觉混合数据上进行联合学习。模型在统一的参数空间内深度融合视觉与语言特征,没有中间翻译带来的信息损耗,从而具备了「见图知意、读文生境」的直觉理解力。

为了让这种原生融合跑出效率,阿里摒弃了让视觉和语言共享同一套并行策略的传统做法,而是让不同模态「各走各的最优路径」,仅在关键节点进行高效汇合。配合精巧的 FP8/FP32 精度应用策略,该架构成功将激活内存减少约 50%,训练提速 10%。更硬核的是,哪怕同时喂入文本、图像、视频三种数据,它的训练速度也几乎不受影响,依然能保持和只训练纯文本时相当的效率。

研发团队针对纯文本、多模态和多轮对话场景搭建了专门的强化学习框架,将整体训练效率提升了 3 至 5 倍,确保模型能够在海量真实场景中持续进化。

这种底层架构的跃迁,赋予了 Qwen3.5-Plus 超越「简单读图」的广阔能力边界。目前的 Qwen3.5-Plus 不仅能进行图像的像素级空间定位,还能理解长达 2 小时视频的因果时序,甚至能将手绘草图直译为前端代码,或者化身视觉智能体自主操控手机与电脑、跨应用完成多步复杂任务

结合此前在 AI Arena 榜单上位居全球前三、被誉为「国产 Nano Banana Pro」的 Qwen-image-2.0,阿里在多模态理解与生成两条路线上正加速向全面掌握看、听、说、做能力的 AGI 目标迈进。

算不过账的时代结束了

新的竞赛开始了

过去两年,如果你一直在关注大模型的发展,其实会发现一件挺有意思的事:闭源模型是你方唱罢我登场,前三轮流做,明天榜首指不定是谁家。但开源领域就很明朗了,很多关键能力的「天花板刷新」,几乎都发生在 Qwen 发新模型的时候,每一代、每一个尺寸都能稳定输出。这种创新的连续性,意味着它已经形成了一条可以稳定产出的技术路线,比单次跑分高更说明问题。

而这次,Qwen3.5-Plus 又在捅一个新的天花板 —— 顶级智能的「性价比」。当模型性能逐渐逼近闭源第一梯队,同时价格却大幅往下走,事情的性质就开始变了。以前很多企业不是不想用最好的 AI,而是算不过账。现在成本结构一变,决策逻辑自然就松动了。技术扩散往往卡的不是能力,而是门槛。

历史上类似的转折其实出现过很多次。真正改变行业的,往往不是最贵、最极致的系统,而是那个最后变成基础设施的东西。Linux 当年是这样,Android 也是这样:开源降低门槛,生态把它铺开,等你意识到的时候,它已经无处不在了。

而 Qwen3.5-Plus 之所以能捅破这个天花板,背后不只是一个模型,而是一整套从模型到算力再到云的联动。阿里一边把模型能力通过开源释放出来,一边又用阿里云和自研芯片把部署和推理成本继续往下压,本质是在同时解决「用得好吗」和「用得起吗」两个问题。生态里的采用者也越来越多,从李飞飞团队到 Airbnb 这样的公司,都在把它当作实际可用的底座,而不只是研究对象。

所以如果把 Qwen3.5-Plus 只看成又一次模型升级,其实有点低估它了。更值得关注的是,一种新的竞争方式正在成形:不再只是比谁的模型最强,而是比谁能把足够强的能力,变成最多人日常用得到的基础设施。技术真正的大规模落地,往往就是从这种时刻开始的。

文中视频链接:https://mp.weixin.qq.com/s/MZ_BPDKLsF8uT0XyOhCbrw

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
日媒:放书否认南京大屠杀的APA酒店老板死亡

日媒:放书否认南京大屠杀的APA酒店老板死亡

环球网资讯
2026-02-16 12:01:38
刘大锤爆料白敬亭与宋轶已实质分手,原因:女方想要,男方不给

刘大锤爆料白敬亭与宋轶已实质分手,原因:女方想要,男方不给

喜欢历史的阿繁
2026-02-16 11:00:58
油气田、联合采矿、飞机采购!伊朗谈判桌上抛出经济筹码,以色列却另有想法

油气田、联合采矿、飞机采购!伊朗谈判桌上抛出经济筹码,以色列却另有想法

红星新闻
2026-02-16 19:08:15
钱再多有什么用?52岁刘强东上千亿身家,儿子却是他一生的遗憾

钱再多有什么用?52岁刘强东上千亿身家,儿子却是他一生的遗憾

墨印斋
2026-01-31 16:37:48
中美俄卫星定位精度差距太大!美0.1米,俄1.5米,中国北斗是多少

中美俄卫星定位精度差距太大!美0.1米,俄1.5米,中国北斗是多少

来科点谱
2026-02-16 07:13:02
特朗普又变脸,不打伊朗了,新目标上线,只要英国敢做他就敢做!

特朗普又变脸,不打伊朗了,新目标上线,只要英国敢做他就敢做!

清欢百味
2026-02-17 02:04:19
18家大国企全军覆没!昔日世界第一的中国机床,还有翻身机会吗?

18家大国企全军覆没!昔日世界第一的中国机床,还有翻身机会吗?

谛听骨语本尊
2026-02-02 19:08:32
解放军报:一名战士给父母打电话聊天,多说了些部队的情况,主动找指导员承认错误

解放军报:一名战士给父母打电话聊天,多说了些部队的情况,主动找指导员承认错误

上观新闻
2026-02-14 17:16:03
易梦玲一双金灿灿的大灯,明艳晃眼

易梦玲一双金灿灿的大灯,明艳晃眼

吃瓜党二号头目
2026-02-13 08:13:30
春晚14个亮点!张艺谋唱哭网友,沈腾马丽很无聊,李健王菲全真唱

春晚14个亮点!张艺谋唱哭网友,沈腾马丽很无聊,李健王菲全真唱

杨仔述
2026-02-17 00:31:52
23岁懒死家中,“中国第一懒人”杨锁到底有多懒,守着肉菜被饿死

23岁懒死家中,“中国第一懒人”杨锁到底有多懒,守着肉菜被饿死

荷兰豆爱健康
2026-02-15 23:40:22
东北男子养鹿破产,赌气放生了30头鹿,8年后上山,眼前一幕却让他泪崩了...

东北男子养鹿破产,赌气放生了30头鹿,8年后上山,眼前一幕却让他泪崩了...

品读时刻
2026-02-14 09:03:05
郑钦文赛前两小时退赛,医生说再打可能撕裂肌腱,她扛住了什么?

郑钦文赛前两小时退赛,医生说再打可能撕裂肌腱,她扛住了什么?

林子说事
2026-02-16 14:14:10
王毅外长:今后世上再无“中国台湾省”之外的任何模糊称谓。

王毅外长:今后世上再无“中国台湾省”之外的任何模糊称谓。

南权先生
2026-02-02 15:59:44
郭美美十年两度入狱,爆火后一晚40万,现状如何?

郭美美十年两度入狱,爆火后一晚40万,现状如何?

绚丽的画卷
2026-02-16 21:26:18
菲大肆抓捕中国人,通过反华决议,中方对等反制后,马科斯将访美

菲大肆抓捕中国人,通过反华决议,中方对等反制后,马科斯将访美

罐头告诉猫迷
2026-02-16 23:17:16
网友吐槽张晶:你必须负全责,整届赛事问题不断,有犯规也不申诉

网友吐槽张晶:你必须负全责,整届赛事问题不断,有犯规也不申诉

风过乡
2026-02-16 20:18:14
TOP14位身高170以上的女神,有颜有灯有演技

TOP14位身高170以上的女神,有颜有灯有演技

素然追光
2026-01-02 02:45:02
怪不得解放军不拦,国民党发现不对劲,美国售台坦克果然有问题!

怪不得解放军不拦,国民党发现不对劲,美国售台坦克果然有问题!

一簌月光
2026-02-16 13:06:51
尿毒症患者透析8年,称三年前在医院科室被借款15万元至今未还,许昌中医院通报:不存在对外承包科室的情形

尿毒症患者透析8年,称三年前在医院科室被借款15万元至今未还,许昌中医院通报:不存在对外承包科室的情形

大风新闻
2026-02-16 14:22:03
2026-02-17 05:52:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12313文章数 142567关注度
往期回顾 全部

科技要闻

阿里除夕发布千问3.5,性能媲美Gemini 3

头条要闻

日方宣称向中方提出交涉 中使馆驳斥

头条要闻

日方宣称向中方提出交涉 中使馆驳斥

体育要闻

短道男子接力半决赛失误后 刘少昂多次说"抱歉"

娱乐要闻

王菲六登春晚献唱 水滴钻石耳环再出圈

财经要闻

2025,中国商业十大意外,黄金只排第九

汽车要闻

叫停纯屏操作 工信部拟推车内实体操作件强制国标

态度原创

艺术
亲子
游戏
健康
军事航空

艺术要闻

名家笔下话过年,别有风味!

亲子要闻

小孩收到压岁钱,该怎么办?枕头底下垫红包

PS发布会压轴!《战神》新作只有近30人白金

转头就晕的耳石症,能开车上班吗?

军事要闻

慕安会美国角色逆转 中国议题"打满全场"

无障碍浏览 进入关怀版