网易首页 > 网易号 > 正文 申请入驻

吞吐量提升19倍!千问摊牌了:AI春节档大魔王就是在下

0
分享至



选择了除夕这一天,Qwen3.5发布的时间点有些微妙。

马年春节在即,各家原生AI App红包大战已经进入白热化。与其说这是一次红包大战,不如说是一次应用入口的争夺。哪家AI厂商能先把模型能力嵌进现实场景,就可能在AGI竞逐的赛道上抢占先机。

所以,Qwen3.5选择在此时登场,无疑在“红包大战”的氛围中,完成了一次对自身AI技术和能力的背书。

官方数据显示,Qwen3.5-Plus只用了不到3970亿参数,激活仅170亿,性能就超过上一代万亿模型Qwen3.0-Max。

Qwen3.5延续了“发布即开源”的传统,在多模态理解、复杂推理与Agent能力上对标闭源第一梯队,这是一种能力与效率同时兑现的信号。

过去一段时间,行业内对于开源生态的认知在不断刷新。Hugging Face CEO德朗格此前公开表示,开源模型正在以前所未有的速度逼近闭源体系。

而在模型研发的策略上,单纯追求参数规模的时代已逐渐褪去。AI2资深研究员Nathan Lambert曾在一档访谈中提出:“单位算力释放多少智能,正在成为新的竞争核心。”

这一点在Qwen3.5上体现得尤为明显。通过架构层的系统优化,Qwen3.5-Plus推理效率大幅提升,最大推理吞吐量可提升至19倍。这正是AI超级入口背后真正需要的底层支撑。

换言之,Qwen3.5也许是AI春节档真正的“杀手锏”。

当模型足够强、成本足够低、算力栈足够完整,AI才有可能成为现实世界的映射与执行层。

某种程度上,阿里正在尝试构建一套类似Google的AI栈:上层是Qwen模型作为通用智能基座,中层是阿里云作为分发与算力平台,底层是以平头哥为代表的自研芯片体系。

随着AI“三驾马车”的产业布局成型,阿里有望在全球AI竞争格局已经构筑起名为“生态”的护城河。

01

突破开源上限,Qwen让千问充满想象

Qwen3.5不是一次简单迭代。从Qwen2.5补强多模态与长上下文,到Qwen3引入MoE与推理增强,再到Qwen3.5强化综合能力与真实场景表现,Qwen几乎每代都在关键能力上前进一步。

在技术指标上,Qwen3.5-Plus用397B总参数、17B激活规模完成一次“以小胜大”的架构跃迁。其性能媲美Gemini-3-pro、GPT-5.2等顶级闭源模型,同时相较上一代Qwen3-Max,部署成本下降60%、推理速度提升8倍。



据了解,Qwen3.5-Plus的API价格每百万Token低至0.8元,仅为Gemini 3 Pro的1/18。这一效能提升得益于千问团队自研的门控技术成果,结合线性注意力机制与稀疏混合专家MoE模型架构,才实现了近400B总参数,激活仅17B的极致模型效率。

对于在C端持续发力的千问而言,Qwen3.5的这一效能提升的意义不言自明。硅谷知名投资人Elad Gil几周前接受采访时指出,随着 AI 竞争进入成熟阶段,推动 AI 推理成本下降、提高模型部署效率将成为真正的竞争核心。

在春节红包大战的流量高峰下,这种效率跃迁变得尤为关键,想要成为C端的AI头部产品,模型服务一定要有能力承接真实用户的高频使用。

这个春节档,千问App也加入红包战局,以“请客送奶茶”等真实办事场景拉动交互体验,把能力直接推向生活场景,6天时间就帮用户完成了1.2亿笔订单,在全球首次实现大规模真实世界任务执行和商业化验证。

Qwen3.5落地后,有望进一步优化千问App的agent能力,提升“AI办事”的效率和准确性。当Agent能力、多模态理解与复杂推理被同时强化,Qwen正让千问APP的未来充满想象。

另一方面前几代的Qwen大语言模型不同,Qwen3.5在跨模态理解力上实现了能力跃迁,“原生多模态”让视觉与语言在同一空间内学习,减少拼装带来的割裂。

这意味着,Qwen3.5不只是识别图片,而能做像素级定位与精细处理,把视觉信息当作可推理的结构化输入。在视频理解上,Qwen3.5能对图像进行像素级空间定位与代码级精细处理,能理解长达2小时视频中的时序演变与因果关系。

更具产品想象力的是“草图到代码”:Qwen3.5可以把手绘意图直接转成可运行前端,甚至可以作为视觉智能体自主操控手机与电脑,跨应用完成多步骤复杂任务,让模型在创作与开发之间充当翻译器。

出色的视觉能力,让Qwen3.5也实现了从Agent框架到Agent应用的突破。目前,千问团队构建了一个可扩展的Agent异步强化学习框架,端到端可加速3到5倍,并将插件式智能体Agent支持扩展至百万级规模。

事实上,Qwen3.5只是阿里多模态布局的冰山一角。目前,阿里在多模态理解和多模态生成领域均取得了突破性成果。

就在一周前,千问刚刚发布集生图和编辑能力于一身的Qwen-image-2.0,在权威榜单AI Arena中位居全球前三,被誉为国产Nano Banana Pro。如今,随Qwen3.5在视觉理解能力上又实现了突破,Qwen模型矩阵的全模态能力取得了跨越式进展。

到这一步,模型就已经开始具备执行现实操作”的雏形。如果说过去的千问更多承担“回答问题”,那么随着Qwen进入3.5版本,它更可能成为“解决问题”的核心引擎。

02

三驾马车牵引,阿里要做全能AI栈玩家

Qwen3.5所带来的效率跃迁,在本质上改变了模型与算力之间的依赖关系,模型优化的重心也从“规模竞赛”转向“系统协同”。

这一点与Google近年来的AI战略路径不谋而合。Google之所以能长期站在AI第一梯队,不是因为每一代模型都能领先行业,而在于“协同”二字。

在Google的AI战略中,Gemini的迭代一直与Vertex AI平台及TPU硬件协同演进,形成“模型—平台—算力”一体化结构。

阿里正在用“千问—阿里云—平头哥”的三驾马车,打造同一套全栈AI体系:模型负责能力密度,云负责规模化交付,芯片负责自主算力基座,同时增加供给侧的弹性。

在算力侧,平头哥作为阿里自研芯片体系的重要一环,持续推进AI芯片与系统级优化布局。新一代AI芯片如真武810E已在线上部署于阿里云集群,丰富了阿里在算力侧的自主能力,为大模型训练与部署提供更深层次算力集成基础。

根据Omdia的数据,阿里云在中国AI云市场份额已达到35.8%,说明阿里已经具备把模型变成“可交付服务”的平台底盘。

与此同时,全球知名IT研究与咨询机构Gartner在2025年“GenAI技术创新指南”中将阿里云在GenAI云基础设施、工程与模型等多个维度列入“Emerging Leaders(新兴领导者)”象限,意味着其产品成熟度与市场影响力已进入全球主流竞争区间。



纵观全球AI产业,Google与阿里是少数能在模型、平台、算力三条线同时给出体系答案的代表性玩家。

Vertex AI可以把模型能力封装成企业可持续调用的服务,同时提供新的商业化订阅入口。TPU的长期投入则体现了对单位推理成本与算力供给主动权的控制,这是Google AI竞争力的重要来源。

对照这一结构,Qwen3.5的效能提升为阿里云的规模化部署创造了条件,使模型能力可以在更低资源消耗下完成高并发服务。

与Google以闭源平台为核心的路径不同,阿里选择以开源驱动生态扩散,再通过云端承接规模化交付,形成另一种全栈逻辑,既更广泛、更低门槛的创新基础设施。

在开源生态层面,Qwen已成为全球下载量领先的开源模型之一。公开数据显示,其衍生模型数量突破20万,累计下载量超10亿次,Hugging Face开源榜单前列长期由通义系列占据;ModelScope聚集超12万模型,服务超2000万开发者。模型热度正在向产业落地转化。

传统闭源模式下,企业往往必须依赖平台提供方的API和许可,不仅成本随使用规模线性增长,还面临定制能力有限的问题。对比之下,开源模型能够在本地部署、深度微调,可以对不同行业场景进行纵向优化和创新迭代。

利用这种开放路线,阿里云已经迅速进入产业腹地。国家电网基于千问打造“光明电力大模型”,专业能力较基座模型提升20%;工商银行用Qwen-VL-Max落地“商户智能审核助手”,实现多模态风控自动化;宝马、比亚迪、荣耀等厂商把千问能力嵌入智能座舱与终端设备。

庞大的开源生态支持下,Qwen已经嵌入工业生产线、金融风控系统、能源调度平台与消费电子终端之中,成为真实场景背后的智能基座。

“阿里通义千问选择开放路线,打造AI时代的Android。”2025年云栖大会上,阿里巴巴CEO吴泳铭曾这样描述Qwen的未来愿景。如今,Qwen3.5正驱动着这一愿景逐渐照进现实。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
泽连斯基没说谎,俄乌打了四年,乌军确实只有5.5万人阵亡。

泽连斯基没说谎,俄乌打了四年,乌军确实只有5.5万人阵亡。

百态人间
2026-02-13 15:14:03
米兰冬奥奖牌榜:25国获牌,挪威扩大优势,我国连续三天没获奖牌

米兰冬奥奖牌榜:25国获牌,挪威扩大优势,我国连续三天没获奖牌

湘楚风云
2026-02-16 11:46:10
塔利班表态:美若攻伊,将全力配合伊朗,预言伊朗必胜

塔利班表态:美若攻伊,将全力配合伊朗,预言伊朗必胜

老马拉车莫少装
2026-02-16 08:08:23
是滕光正的种?孙怡又怀孕了?在济州岛被偶遇,小腹隆起脸型圆润

是滕光正的种?孙怡又怀孕了?在济州岛被偶遇,小腹隆起脸型圆润

八卦王者
2026-02-15 10:52:14
曾被吹捧上天,如今却沦为笑柄的6个坑人物品,大家别再买了!

曾被吹捧上天,如今却沦为笑柄的6个坑人物品,大家别再买了!

室内设计师有料儿
2025-12-27 17:07:20
俄外长拉夫罗夫:俄将以军事手段应对格陵兰岛“军事化”

俄外长拉夫罗夫:俄将以军事手段应对格陵兰岛“军事化”

澎湃新闻
2026-02-12 12:29:03
戴旭:中国的战士有近30年没打仗了,建议在外部挑衅的时候打一下

戴旭:中国的战士有近30年没打仗了,建议在外部挑衅的时候打一下

音乐时光的娱乐
2026-02-17 00:31:23
2025年爆火的8位网红,个个火得莫名其妙,个个赚得盆满钵满

2025年爆火的8位网红,个个火得莫名其妙,个个赚得盆满钵满

距离距离
2026-01-04 15:25:42
成吉思汗打败花剌子模时,俘虏女人50万,后来是如何处置的?

成吉思汗打败花剌子模时,俘虏女人50万,后来是如何处置的?

铭记历史呀
2026-02-11 12:13:17
两战33+8决赛都没进!被巴恩斯绝杀低头沮丧 文班亚马遭东约坑哭

两战33+8决赛都没进!被巴恩斯绝杀低头沮丧 文班亚马遭东约坑哭

颜小白的篮球梦
2026-02-16 10:02:08
你无意之中撞见过什么秘密?网友:我婆婆和公公外面各自有人

你无意之中撞见过什么秘密?网友:我婆婆和公公外面各自有人

带你感受人间冷暖
2026-02-12 00:05:09
全红婵穿中国红,稳得让人心疼又敬佩!大家觉得呢?

全红婵穿中国红,稳得让人心疼又敬佩!大家觉得呢?

眼界看视野
2026-02-16 16:02:24
60岁郭富城拼了!王一博全开麦炸场,这舞台谁服谁?

60岁郭富城拼了!王一博全开麦炸场,这舞台谁服谁?

心屿漫谈
2026-02-16 21:45:32
50亿打水漂?只剩两户人家!国内最大“空城”古镇,看得人心发慌

50亿打水漂?只剩两户人家!国内最大“空城”古镇,看得人心发慌

GA环球建筑
2025-12-25 10:53:33
放心吧,我们不是日本,也不会有“失去的三十年”

放心吧,我们不是日本,也不会有“失去的三十年”

六爷阿旦
2026-01-19 17:10:26
美国前总统老布什之子喊话:我访华150多次,中国根本没有敌意

美国前总统老布什之子喊话:我访华150多次,中国根本没有敌意

扶苏聊历史
2026-02-03 09:31:52
Lisa萝莉岛演唱会视角曝光,她被曝曾在岛上,伺候权贵和资本大佬

Lisa萝莉岛演唱会视角曝光,她被曝曾在岛上,伺候权贵和资本大佬

花哥扒娱乐
2026-02-10 18:44:40
关于陈熠的实力,那些评价还真不是瞎传,全是有依据的事实。

关于陈熠的实力,那些评价还真不是瞎传,全是有依据的事实。

小光侃娱乐
2026-01-19 08:35:05
夫妻性生活的“黄金时长”是多少?别再被电影骗了!

夫妻性生活的“黄金时长”是多少?别再被电影骗了!

精彩分享快乐
2025-11-29 00:00:03
销量暴跌33%!从年货顶流到无人问津,中国人为啥就不爱吃糖了?

销量暴跌33%!从年货顶流到无人问津,中国人为啥就不爱吃糖了?

鲸探所长
2026-01-28 22:49:13
2026-02-17 04:51:01
字母榜 incentive-icons
字母榜
让未来不止于大。
2236文章数 8042关注度
往期回顾 全部

科技要闻

阿里除夕发布千问3.5,性能媲美Gemini 3

头条要闻

"王菲接班李谷一"上热搜 窦靖童发文"挖嘞个亲娘"

头条要闻

"王菲接班李谷一"上热搜 窦靖童发文"挖嘞个亲娘"

体育要闻

短道男子接力半决赛失误后 刘少昂多次说"抱歉"

娱乐要闻

王菲六登春晚献唱 水滴钻石耳环再出圈

财经要闻

2025,中国商业十大意外,黄金只排第九

汽车要闻

叫停纯屏操作 工信部拟推车内实体操作件强制国标

态度原创

艺术
本地
时尚
公开课
军事航空

艺术要闻

名家笔下话过年,别有风味!

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

记录最近收获很大的一次深度链接

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

慕安会美国角色逆转 中国议题"打满全场"

无障碍浏览 进入关怀版