网易首页 > 网易号 > 正文 申请入驻

除夕重磅!千问开源Qwen3.5,最大吞吐量提升至19倍

0
分享至

除夕夜,阿里官宣发布并开源新一代千问大模型千问 3.5(Qwen3.5-Plus)。这是继 2025 年除夕发布 Qwen2.5-Max 后,阿里又一次在除夕带来新一代模型。

现在,千问 APP 与 PC 端(qianwen.com)已经同步上线,用户可在页面顶部选择模型新一代模型,来体验千问 3.5 的能力。

去年除夕更新的 Qwen2.5-Max 重点在规模和性能,而这次,千问 3.5 更像是一场从纯文本模型到原生多模态模型的底层架构层面重构。


图丨现在打开千问,已经可调用新模型 Qwen3.5-Plus(来源:千问)

与前几代的千问大语言模型相比,千问 3.5 这次带来哪些模型性能的提升呢?

从预训练来看,千问 3 是在纯文本 Tokens 上进行,而千问 3.5 的预训练则基于视觉和文本混合 token。也就是说,视觉理解不再像从前那样以外挂模块形式存在,而是同语言能力共同在底层建模“作战”。

此外,其还大幅新增了中英文、201 种语言与方语言、STEM 和推理等数据。这意味着,打破了以往的局限性,而是尝试让模型在更密集的世界知识和推理逻辑。

值得关注的是,千问 3.5 以少于 40% 的参数量实现了超万亿的 Qwen3-Max 基座模型的高性能。这背后反应的不是简单的堆参数,而是效率导向的架构优化。


(来源:千问)

在推理、编程、Agent 智能体等全方位基准评估中均表现优异:

·在指令遵循 IFBench 上,以 76.5 分刷新所有模型纪录;

·在 MMLU-Pro 知识推理评测中超越 GPT-5.2,获得 87.8 分得分;

·在博士级难题 GPQA 测评中得分为 88.4 分,高于 Claude 4.5,但与 GPT-5.2 的 92.4 分和 Gemini 3 Pro 相比仍有进步的空间;

·在通用 Agent 评测 BFCL-V4、搜索 Agent 评测 Browsecomp 等基准中,千问 3.5 表现与 Gemini 3 Pro、GPT-5.2 相比性能更优。


(来源:千问)

总体来看,这种原生多模态训练,为千问 3.5 的视觉能力带来了显著提升。千问 3.5 在多项权威测评中,均实现了最佳性能,包括多模态推理(MathVison)、通用视觉问答 VQA(RealWorldQA)、文本识别和文件理解(CC_OCR)、空间智能(RefCOCO-avg)、视频理解(MLVU)等。

可以看到的是,千问 3.5 不再是“语言强、视觉补”,而是在统一架构下形成了一种相对完整的能力矩阵。


(来源:千问)

千问 3.5 之所以能实现性能的显著提升,离不开性对 Transformer 经典架构的突破。

此前,千问团队自研的门控技术成果“Gated Attention for Large Language Models: Non-linearity, Sparsity, and Attention-Sink-Free”,获得全球 AI 顶会 2025 NeurIPS 最佳论文。


(来源:arXiv)

本次千问 3.5 创新的混合架构中已融合该技术,团队结合线性注意力机制和稀疏混合专家 MoE 模型架构,实现了“高参数、低激活”的结构:模型总参数规模达 397B,但每次推理仅激活 17B 参数。这种结构带来的好处可能是,模型在保持高性能能力的同时,推理效率大幅度提升。


(来源:千问)

根据千问官网,千问 3.5 通过训练稳定优化以及多 token 预测等系列技术,实现了 Qwen3.5 性能比肩 Qwen3-Max 模型,并在此基础上对推理效率进一步提升:在 32K 上下文场景中,千问 3.5 推理吞吐量可提升 8.6 倍;而在 256K 超长上下文中,Qwen3.5 推理吞吐量最大能实现 19 倍的提升。

这意味着,在长文本分析、复杂推理、Agent 调度等场景中,成本和延迟大幅下降。


(来源:千问)

基于优异的视觉能力,千问 3.5 还突破性地实现了从 Agent 框架到 Agent 应用,尤其是在提升操作效率方面。例如,能够自主操作手机与电脑,高效完成日常任务,在移动端支持更多主流 APP 与指令,在 PC 端可处理更复杂的多步骤操作,包括跨应用数据整理、自动化流程执行等。

同时,千问团队还构建了一个可扩展的 Agent 异步强化学习框架,基于此端到端可加速 3 到 5 倍,并将插件式智能体 Agent 支持扩展至百万级规模。这也是标志千问从对话模型向行动模型过渡转化。

千问透露,下一阶段的重点将从模型规模转向系统整合:构建具备跨会话持久记忆的智能体、面向真实世界交互的具身接口、自我改进机制。

放眼全球全球的大模型竞争已然不再只是比拼“更大、更准”,而是“更高效、更可执行”。千问 3.5 不仅是一次模型的更新,一场关于模型的效率革命,已经开始了。



参考资料:

https://qwen.ai/blog?id=qwen3.5

https://github.com/qiuzh20/gated_attention

排版:刘雅坤

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
租个“对象”回家过年

租个“对象”回家过年

经济观察报
2026-02-16 16:34:16
从“家暴”质疑到靠老婆翻红,他的暴脾气终于装不下去了!

从“家暴”质疑到靠老婆翻红,他的暴脾气终于装不下去了!

毒舌八卦
2026-02-16 23:51:32
春晚节目单公布:一共3个小品,没有相声!沈腾、马丽不演小品演“贺岁微电影”,宇树科技机器人将表演武术节目!央视记者实探春晚后台

春晚节目单公布:一共3个小品,没有相声!沈腾、马丽不演小品演“贺岁微电影”,宇树科技机器人将表演武术节目!央视记者实探春晚后台

每日经济新闻
2026-02-16 16:08:00
日本首相高市早苗发表贺辞祝贺春节

日本首相高市早苗发表贺辞祝贺春节

东瀛万事通
2026-02-16 18:54:22
8死2伤!江苏烟花爆燃死伤者身份曝光,责任人被控制大量内幕披露

8死2伤!江苏烟花爆燃死伤者身份曝光,责任人被控制大量内幕披露

博士观察
2026-02-16 23:12:50
为啥中国精英盼着中国输?复旦教授:中国一旦追上,绿卡就会贬值

为啥中国精英盼着中国输?复旦教授:中国一旦追上,绿卡就会贬值

大鱼简科
2026-02-15 22:00:23
大新闻!高市早苗除夕当天对华作出不寻常举动,释放强烈政治信号

大新闻!高市早苗除夕当天对华作出不寻常举动,释放强烈政治信号

娱乐督察中
2026-02-17 02:38:22
第9艘!美军又扣押中国油轮,没完了?

第9艘!美军又扣押中国油轮,没完了?

兵国大事
2026-02-16 13:29:55
看了观众对王菲央视马年春晚的评价,李健的话,终于有人信了

看了观众对王菲央视马年春晚的评价,李健的话,终于有人信了

娱最资讯
2026-02-16 22:32:42
江苏8死2伤烟花爆燃1分钟视频流出:大量隐情披露,责任人被控制

江苏8死2伤烟花爆燃1分钟视频流出:大量隐情披露,责任人被控制

博士观察
2026-02-16 13:20:56
你最爽的经历是什么?网友:约过一个比我大好几岁的姐姐

你最爽的经历是什么?网友:约过一个比我大好几岁的姐姐

带你感受人间冷暖
2026-02-16 01:10:39
咱输得起!加拿大选手疑似推人犯规 李文龙回应:他不是故意推的

咱输得起!加拿大选手疑似推人犯规 李文龙回应:他不是故意推的

风过乡
2026-02-16 21:24:20
揭秘春晚“机器人蔡明” 公司负责人:蔡明脸好小,机器人尺寸压缩了30%

揭秘春晚“机器人蔡明” 公司负责人:蔡明脸好小,机器人尺寸压缩了30%

红星新闻
2026-02-16 22:22:42
小米集团跌幅扩大至3%

小米集团跌幅扩大至3%

每日经济新闻
2026-02-16 09:54:04
收视率破36!央视马年春晚首波口碑出炉,观众的评价“一针见血”

收视率破36!央视马年春晚首波口碑出炉,观众的评价“一针见血”

八卦南风
2026-02-16 23:11:18
俄罗斯遭大规模袭击

俄罗斯遭大规模袭击

环球时报国际
2026-02-16 09:29:24
中国驻日本使馆发言人就日方所谓交涉答记者问

中国驻日本使馆发言人就日方所谓交涉答记者问

环球网资讯
2026-02-16 21:46:15
联合国前主席称:中国人的风俗,世界上没有一个国家能够学得来

联合国前主席称:中国人的风俗,世界上没有一个国家能够学得来

梦在深巷aqa
2026-02-15 01:44:17
逼得杨白劳不敢回家过年的高利贷,利率究竟是多少?

逼得杨白劳不敢回家过年的高利贷,利率究竟是多少?

家传编辑部
2026-02-16 12:50:54
太安静了!除夕之夜1000多万新上海人纷纷离开,上海回归到50年前

太安静了!除夕之夜1000多万新上海人纷纷离开,上海回归到50年前

火山詩话
2026-02-16 19:54:07
2026-02-17 05:07:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16276文章数 514615关注度
往期回顾 全部

科技要闻

阿里除夕发布千问3.5,性能媲美Gemini 3

头条要闻

"王菲接班李谷一"上热搜 窦靖童发文"挖嘞个亲娘"

头条要闻

"王菲接班李谷一"上热搜 窦靖童发文"挖嘞个亲娘"

体育要闻

短道男子接力半决赛失误后 刘少昂多次说"抱歉"

娱乐要闻

王菲六登春晚献唱 水滴钻石耳环再出圈

财经要闻

2025,中国商业十大意外,黄金只排第九

汽车要闻

叫停纯屏操作 工信部拟推车内实体操作件强制国标

态度原创

房产
时尚
教育
数码
公开课

房产要闻

三亚新机场,又传出新消息!

记录最近收获很大的一次深度链接

教育要闻

寒假作业 | 写好日记的四种方法

数码要闻

iPhone17e来了!苹果官宣春季发布会:3月4日晚上十点

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版