网易首页 > 网易号 > 正文 申请入驻

白山云上线Qwen3-Next-80B-A3B双模型!

0
分享至


近日,阿里通义千问发布下一代基础模型架构Qwen3-Next,并开源了基于该架构的Qwen3-Next-80B-A3B系列模型,包含指令版Qwen3-Next-80B-A3B-Instruct和思维版Qwen3-Next-80B-A3B-Thinking,指令版擅长理解和执行指令,思考版擅长多步推理和深度思考。

白山云科技旗下边缘算力云平台“白山智算”(

http://ai.baishan.com/website/model-api
)已第一时间上线这两款模型,用户可通过简单易用的API调用方式迅速体验Qwen3-Next架构带来的“更极致的训练和推理性价比”。

据官方介绍,Qwen3-Next相比Qwen3的MoE模型结构进行了以下核心改进,进一步提升了模型在长上下文和大规模总参数下的训练和推理效率:

混合注意力机制

用75%的Gated DeltaNet(线性注意力)和25%的Gated Attention(门控注意力)的组合替换标准注意力,兼顾效率与精度,长文本处理更稳更快。

高稀疏度MoE结构

模型总参数量达800亿,但每个推理步骤仅激活约30亿参数。相比Qwen3-MoE的128个总专家和8个路由专家,Qwen3-Next扩展到了512总专家,10路由专家与1共享专家的组合,在不牺牲效果的前提下最大化资源利用率。

训练稳定性友好设计

包括零中心化和权重衰减LayerNorm等技术,以及其他增强稳定性以实现鲁棒的预训练和后训练。

多Token预测(MTP)机制

提升预训练模型性能并加速推理,Qwen3-Next特别优化了MTP多步推理性能,通过训练推理一致的多步训练,进一步提高了实用场景下的投机采样(Speculative Decoding)接受率。

多项评测基准上的结果表明,Qwen3-Next-80B-A3B-Instruct与Qwen3-235B-A22B-Instruct-2507表现相当,同时在256K超长上下文处理任务中展现出显著优势;Qwen3-Next-80B-A3B-Thinking在复杂推理任务上表现卓越,不仅优于预训练成本更高的Qwen3-30B-A3B-Thinking-2507与Qwen3-32B-Thinking,更在多项基准测试中超越闭源模型Gemini-2.5-Flash-Thinking。


指令模型测试基准


思维模型测试基准

白山云MaaS服务

提供边缘极速AI体验!

白山云大模型API服务提供预构建、开箱即用的LLM服务,只需一行代码用户即可完成模型切换与集成。基于白山全球边缘云架构进行就近推理,能够为用户带来<300ms的超低延时推理体验。

目前,平台已上架DeepSeek系列、通义千问系列、ChatGLM系列等多款大模型,并提供部分免费模型。开发者可在白山边缘算力云平台上对比选择各类模型,以更简单易用、灵活高效的API调用方式迅速开启AI创新之旅。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
1985年,邓小平视察南京,接见干部,为何下令:许世友不用参加

1985年,邓小平视察南京,接见干部,为何下令:许世友不用参加

浔阳咸鱼
2026-02-21 09:05:07
冠名费缩水7000万!中超赞助商没信心,为保品牌价值连续3年换名

冠名费缩水7000万!中超赞助商没信心,为保品牌价值连续3年换名

体坛鉴春秋
2026-02-20 17:18:08
烧成骨架的残骸,开始反噬电车行业,吹牛造成的恶果

烧成骨架的残骸,开始反噬电车行业,吹牛造成的恶果

柏铭锐谈
2025-10-31 16:38:05
情景自信,与核心自信

情景自信,与核心自信

赖焕庆
2026-02-18 19:42:04
竟然有这么多人生回报率高的小习惯!网友: 简单的事情要重复做

竟然有这么多人生回报率高的小习惯!网友: 简单的事情要重复做

夜深爱杂谈
2026-02-19 22:50:03
美加墨世界杯无内马尔?安帅大概率不带 巴西生涯128场参与138球

美加墨世界杯无内马尔?安帅大概率不带 巴西生涯128场参与138球

智道足球
2026-02-21 08:03:56
这种饮料正在摧毁你的胰岛细胞!很多糖尿病,都和这种饮料有关!

这种饮料正在摧毁你的胰岛细胞!很多糖尿病,都和这种饮料有关!

蜉蝣说
2026-01-29 14:46:50
太阳报:38岁意大利前球员吉达伊突然失踪,之后离奇死亡

太阳报:38岁意大利前球员吉达伊突然失踪,之后离奇死亡

懂球帝
2026-02-20 17:01:32
鬣狗仇敌很多,为何基本没动物吃鬣狗?是因为鬣狗肉臭得没法吃吗

鬣狗仇敌很多,为何基本没动物吃鬣狗?是因为鬣狗肉臭得没法吃吗

向航说
2026-02-20 00:40:03
女子谈释永信过往,她们姐妹住少林寺3天2夜,争着往释永信房间跑

女子谈释永信过往,她们姐妹住少林寺3天2夜,争着往释永信房间跑

江山挥笔
2025-07-29 16:50:59
小妈祖换事件新料!旧照首度曝光,八年坚守每年正月初二参与出游

小妈祖换事件新料!旧照首度曝光,八年坚守每年正月初二参与出游

一盅情怀
2026-02-20 16:47:58
普通家庭养孩子最大的通病:消费型快乐给多了

普通家庭养孩子最大的通病:消费型快乐给多了

洞见
2026-02-02 20:40:04
1000架歼-20和900架歼-16?英国智库:难以战胜2030年的中国空军

1000架歼-20和900架歼-16?英国智库:难以战胜2030年的中国空军

钦点历史
2026-02-20 16:53:54
摩纳哥主帅谈南野拓实:也许对他来说,世界杯值得期待

摩纳哥主帅谈南野拓实:也许对他来说,世界杯值得期待

懂球帝
2026-02-20 11:13:07
泰山边锋叶落归根!于根伟:我要真诚感谢泰山队送人

泰山边锋叶落归根!于根伟:我要真诚感谢泰山队送人

建哥说体育
2026-02-21 08:22:49
蒙古国首都骚乱再起,社会矛盾愈发尖锐,反华到底图啥

蒙古国首都骚乱再起,社会矛盾愈发尖锐,反华到底图啥

素衣读史
2026-01-24 17:12:53
古代的通房丫头,若自身有需求,该如何解决?

古代的通房丫头,若自身有需求,该如何解决?

文史微鉴
2025-10-04 22:34:40
不顾家人反对,执意要嫁撒贝宁的富二代李白,如今才知道她有多赚

不顾家人反对,执意要嫁撒贝宁的富二代李白,如今才知道她有多赚

素衣读史
2025-12-30 15:45:13
马年春节档总票房破35亿元,2026年年度电影总票房破60亿元,或可借道传媒ETF(512980)布局史上最长春节档行情

马年春节档总票房破35亿元,2026年年度电影总票房破60亿元,或可借道传媒ETF(512980)布局史上最长春节档行情

界面新闻
2026-02-21 09:03:02
一名深圳游客在贝加尔湖遇难

一名深圳游客在贝加尔湖遇难

深圳晚报
2026-02-20 22:55:30
2026-02-21 09:40:49
白山云科技
白山云科技
云计算服务商
251文章数 1关注度
往期回顾 全部

科技要闻

智谱上市1月涨5倍,市值超越京东、快手

头条要闻

印度AI峰会问题频出:盖茨"临时"缺席 硅谷大佬拒握手

头条要闻

印度AI峰会问题频出:盖茨"临时"缺席 硅谷大佬拒握手

体育要闻

金牌夫妻!王心迪徐梦桃赛后拥抱太甜了

娱乐要闻

镖人反超惊蛰无声拿下单日票房第二!

财经要闻

一觉醒来,世界大变,特朗普改新打法了

汽车要闻

比亚迪的“颜值担当”来了 方程豹首款轿车路跑信息曝光

态度原创

教育
家居
艺术
亲子
时尚

教育要闻

为什么说要学好英语

家居要闻

本真栖居 爱暖伴流年

艺术要闻

这幅草书让亲戚大吃一惊:书法入门真的要从楷书开始吗?

亲子要闻

天天操不完的心~萌娃搞笑日常

2026纽约秋冬时装周,在春天开启美的新故事!

无障碍浏览 进入关怀版