网易首页 > 网易号 > 正文 申请入驻

训练成本大降超九成!阿里开源下一代基础模型架构,引入混合注意力机制

0
分享至


阿里开源全新架构Qwen3-Next,80B参数新模型只需激活3B即可实现旗舰性能。

9月12日,阿里通义发布下一代基础模型架构Qwen3-Next和基于新架构的模型Qwen3-Next-80B-A3B,包含两个版本:更擅长理解和执行指令的指令(Insctruct)模型,以及更擅长多步推理和深度思考的推理(Thinking)模型。

据介绍,相比Qwen3的MoE(混合专家)模型结构,Qwen3-Next进行了以下核心改进:混合注意力机制、高稀疏度MoE结构、一系列训练稳定友好的优化,以及提升推理效率的多token预测机制(简称MTP,Multiple-Token Prediction)。

在核心技术方面,新模型采用全球首创混合架构,75%用Gated DeltaNet(线性注意力),25%用原创Gated Attention(门控注意力),总参数80B只需激活3B,就可以在性能上媲美Qwen3旗舰版235B模型,算力利用率约为3.7%,帮助用户“极致省钱”。

在训练成本方面,Qwen3-Next模型较今年4月发布的密集模型Qwen3-32B大降超90%,长文本推理吞吐量提升10倍以上。新模型在Qwen3预训练数据的子集15T tokens上进行预训练,仅需Qwen3-32B所用GPU计算资源的9.3%,便能训练出性能更好的Qwen3-Next-Base基座模型,大幅提升了训练效率。

阿里通义团队指出,高稀疏MoE架构是Qwen3-Next面向下一代模型的最新探索。当前,MoE是主流大模型都采用的架构,通过激活大参数中的小部分专家完成推理任务。此前,Qwen3系列的MoE专家激活比约为1比16,而Qwen3-Next通过更精密的高稀疏MoE架构设计,实现了1比50的极致激活比,创下业界新高。

在性能表现方面,Qwen3-Next指令模型的性能表现与参数规模更大的Qwen3-235B-A22B-Instruct-2507持平,思维模型表现优于谷歌闭源模型Gemini-2.5-Flash-Thinking。


Qwen3-Next-80B-A3B-Instruct指令模型性能评测图。来源:阿里通义

目前,新模型已在魔搭社区和HuggingFace开源,开发者也可通过Qwen Chat免费体验,或直接调用阿里云百炼平台提供的API服务。

关于Qwen3-Next模型值得注意的创新点,Pine AI联合创始人、首席科学家李博杰对澎湃新闻记者表示,Qwen3-Next采用了混合注意力机制和高稀疏MoE架构,从而大幅提升效率;除了这两大创新点以外,Qwen3-Next还在预训练时采用了多Token预测技术MTP(Mutiple-Token Prediction),模型推理速度大幅提升。

李博杰表示,虽然以上三种技术创新在学界已有研究,但阿里证明了其在工业界的实用性,同时还保持了开源:“Qwen3-Next第一次证明了这些技术能够放在一起共同运作,并且能够在实际的业务场景中展现出很好的能力表现。从评测结果和模型架构来看,Qwen3-Next已经达到了谷歌Geimini 2.5 flash的水平。”

近期,阿里通义动作频频,包括推出超万亿参数的Qwen3-Max-Preview、文生图及编辑模型Qwen-Image-edit、语音识别模型Qwen3-ASR-Flash等。全球AI开源社区HuggingFace的最新数据显示,通义千问Qwen衍生模型数已超17万,稳坐全球第一开源模型。

9月1日,国际权威市场调研机构沙利文(Frost&Sullivan)发布了最新的《中国GenAI市场洞察:企业级大模型调用全景研究,2025》,报告显示,中国企业级大模型调用呈爆发式增长,2025年上半年日均调用量较2024年底实现363%的增长,目前超10万亿Tokens。其中,阿里通义占比17.7%位列第一,是中国企业选择最多的大模型。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
东体:艾迪即将转战中甲,结束8年申花生涯

东体:艾迪即将转战中甲,结束8年申花生涯

懂球帝
2026-01-07 13:58:45
现代汽车股价上涨超11%,创历史新高

现代汽车股价上涨超11%,创历史新高

每日经济新闻
2026-01-07 10:03:06
中使馆提醒:中国公民尽快撤离!

中使馆提醒:中国公民尽快撤离!

每日经济新闻
2026-01-07 14:51:18
王思聪与秦岚、甘薇联手开医美诊所

王思聪与秦岚、甘薇联手开医美诊所

蓝鲸新闻
2026-01-06 18:11:10
古巴雇佣兵遭遇美军特种兵:死战到底打光最后一人,32人集体阵亡

古巴雇佣兵遭遇美军特种兵:死战到底打光最后一人,32人集体阵亡

趣生活
2026-01-05 21:20:12
体检报告中,若这3个指标都正常,基本可排除很多疾病

体检报告中,若这3个指标都正常,基本可排除很多疾病

财经早餐
2025-08-05 06:38:02
四川3市政府副市长有调整

四川3市政府副市长有调整

雅安生活网
2026-01-07 14:26:42
史上第一富!4.7万亿!马斯克个人财富打破人类纪录

史上第一富!4.7万亿!马斯克个人财富打破人类纪录

牛牛叨史
2025-12-22 22:53:16
纪实:浙江女教师突然失踪6年,13岁儿子凭借一个梦找到母亲

纪实:浙江女教师突然失踪6年,13岁儿子凭借一个梦找到母亲

红豆讲堂
2024-10-25 09:45:59
没选上!32岁武大靖宣布退役,无缘米兰冬奥,曾自曝生活不能自理

没选上!32岁武大靖宣布退役,无缘米兰冬奥,曾自曝生活不能自理

李健政观察
2026-01-07 09:26:02
救命!网扒关晓彤小号帖文!20年的“三个人”就意有所指?

救命!网扒关晓彤小号帖文!20年的“三个人”就意有所指?

借你一生
2026-01-07 09:21:43
涨疯了!一盒100根,价值400万元,堪比上海一套房,龙头股今夜狂飙

涨疯了!一盒100根,价值400万元,堪比上海一套房,龙头股今夜狂飙

每日经济新闻
2026-01-07 00:43:05
坚持改革攻坚,增强高质量发展动力活力(稳中求进、提质增效 实现“十五五”良好开局)

坚持改革攻坚,增强高质量发展动力活力(稳中求进、提质增效 实现“十五五”良好开局)

人民网
2026-01-07 06:31:40
外交部亚洲司司长刘劲松意外“闯入”李在明自拍

外交部亚洲司司长刘劲松意外“闯入”李在明自拍

看看新闻Knews
2026-01-06 20:13:03
若开战!俄罗斯已准备好闪电式反击,并且会打的快,赢得快!

若开战!俄罗斯已准备好闪电式反击,并且会打的快,赢得快!

音乐时光的娱乐
2026-01-07 13:44:07
大风追踪 | 高速公路离家不足30米,村民受噪声困扰十余年,一审获赔3万元

大风追踪 | 高速公路离家不足30米,村民受噪声困扰十余年,一审获赔3万元

大风新闻
2026-01-07 16:12:10
一顿饭11个菜,客厅大得能打球,哭穷的闫学晶害惨“啃老”的儿子

一顿饭11个菜,客厅大得能打球,哭穷的闫学晶害惨“啃老”的儿子

翰飞观事
2025-12-30 11:56:38
姚安娜这事儿真让人想不通,每月掏二十万请全剧组喝咖啡,

姚安娜这事儿真让人想不通,每月掏二十万请全剧组喝咖啡,

小光侃娱乐
2026-01-06 20:45:03
毛主席去世后,华国锋除了依靠叶帅外,还有几个大员是他信任的

毛主席去世后,华国锋除了依靠叶帅外,还有几个大员是他信任的

谈古论今历史有道
2026-01-07 07:45:03
7号收评:沪指录得14连阳!所有人都注意了,大盘后市开始这样看

7号收评:沪指录得14连阳!所有人都注意了,大盘后市开始这样看

春江财富
2026-01-07 15:21:05
2026-01-07 18:15:00
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
869123文章数 5086608关注度
往期回顾 全部

科技要闻

豪掷世界第一"球" 杨元庆亮出联想AI护城河

头条要闻

中方被问是否计划采取行动帮助马杜罗夫妇 外交部回应

头条要闻

中方被问是否计划采取行动帮助马杜罗夫妇 外交部回应

体育要闻

卖水果、搬砖的小伙,与哈兰德争英超金靴

娱乐要闻

2026年央视春晚彩排:沈腾确定回归

财经要闻

农大教授科普:无需过度担忧蔬菜农残

汽车要闻

燃油驾趣+智能电感双Buff 试驾全新奥迪Q5L

态度原创

艺术
家居
亲子
教育
健康

艺术要闻

David Grossmann:不一样的风景画

家居要闻

宁静不单调 恰到好处的美

亲子要闻

儿童面部发育:为什么有的孩子小时可爱,长大丑?

教育要闻

小学数学,巧求面积!

这些新疗法,让化疗不再那么痛苦

无障碍浏览 进入关怀版