网易首页 > 网易号 > 正文 申请入驻

阿里千问旗舰推理模型正式发布

0
分享至

据“阿里云”公众号1月26日消息:刚刚,阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking。该模型总参数量超万亿(1T),预训练数据量高达36T Tokens,是目前阿里规模最大、能力最强的千问推理模型。

千问新模型通过总参数、强化学习、推理计算的极致规模扩展,实现了性能的大幅飞跃,在多项关键性能基准测试中刷新全球新纪录。同时,该模型采用全新测试时扩展机制,推理性能提升同时更经济,并大幅增强原生Agent能力,模型对话时可自主调用工具。


目前,开发者可在QwenChat上免费体验Qwen3-Max-Thinking模型,企业可通过阿里云百炼获取新模型API服务,普通用户也可通过千问PC端和网页端试用模型。此外,千问APP也即将接入新模型,所有用户都可免费体验千问最强模型。

体验地址Qwen Chat:https://chat.qwen.ai/ 百炼API:https://bailian.console.aliyun.com/cn-beijing/?tab=model#/model-market/detail/qwen3-max-2026-01-23 千问APP网页版:https://www.qianwen.com/

规模最大、能力最强的千问推理模型

Qwen3-Max-Thinking是目前阿里规模最大、能力最强的千问推理模型,其总参数量超万亿(1T),预训练数据量高达36T Tokens。

此前,预览版Qwen3-Max-Thinking斩获数学推理AIME 25和HMMT 25的国内首个双满分,推理性能已让人惊艳;在此基础上,阿里通义团队进行了更大规模的强化学习后训练,全面提升了正式版Qwen3-Max-Thinking性能。

其中,在涵盖事实知识、复杂推理、指令遵循、人类偏好对齐、Agent能力等19个公认的大模型基准测试中,千问旗舰推理模型刷新了数项最佳表现(SOTA)纪录,整体性能可媲美国际顶尖AI大模型。

测试时扩展机制,推理性能提升且更经济

在关键的模型推理能力提升中,千问新模型采用了一种全新的测试时扩展(Test-time Scaling)机制,推理性能提升的同时还更经济。

业界普遍的推理时计算,只会简单增加并行推理路径,重复推导已知结论很常见,冗余推理效率低下;而千问采用的这一机制,可对此前推理的结果进行“经验提取”式的提炼,并据此进行多轮自我迭代,在相同的上下文中实现更高效的推理计算,因此获得更智能的推理结果。

基于这一推理技术创新,千问推理性能和推理效率大为提升,比如在启用工具的“人类最后的测试”HLE中,千问得分58.3,大幅超过GPT-5.2-Thinking的45.5、Gemini 3 Pro的45.8,录得当前所有模型的最高分。

大幅增强原生Agent能力,对话时自主调用工具

面向即将到来的智能体Agent时代,Qwen3-Max-Thinking还大幅增强了自主调用工具的原生Agent能力。

这种自适应的工具调用能力可在QwenChat上完整体验,Qwen3-Max-Thinking模型会自主选用「搜索」、「个性化记忆」和「代码解释器」等三个核心的Agent工具功能,提供专业人士一样水平的回答,更合用户心意、更智能、更流畅;同时,模型幻觉也大为降低,为解决真实复杂任务打下基础。

该能力源自于通义团队专门设计的训练流程。具体而言,在完成初步的工具使用微调后,团队对模型进一步在大量多样化任务上进行了基于规则奖励与模型奖励的联合强化学习训练,使得Qwen3-Max-Thinking拥有更智能结合工具进行思考的能力。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
你身边有把一手好牌打的稀烂的人吗?网友:都是上辈子欠人家的

你身边有把一手好牌打的稀烂的人吗?网友:都是上辈子欠人家的

带你感受人间冷暖
2026-01-21 00:15:05
曼城再见!8000万“永动机”火速转会!再截利物浦,抢6000万猎物

曼城再见!8000万“永动机”火速转会!再截利物浦,抢6000万猎物

头狼追球
2026-01-27 11:39:01
在美国买了房,房子是你的不假一旦你无力负担房产税照样无家可归

在美国买了房,房子是你的不假一旦你无力负担房产税照样无家可归

忠于法纪
2025-12-23 21:02:38
我出售南京的大平层搬进女儿家,女儿以为我睡熟了,跟女婿密谋

我出售南京的大平层搬进女儿家,女儿以为我睡熟了,跟女婿密谋

朝暮书屋
2026-01-21 17:26:45
张智霖李承铉两家结伴飞北京,20岁魔童比爸爸高,被赞超级大帅哥

张智霖李承铉两家结伴飞北京,20岁魔童比爸爸高,被赞超级大帅哥

李健政观察
2026-01-26 22:28:34
又放厥词,“若美军在台海被攻击,日本不能…”

又放厥词,“若美军在台海被攻击,日本不能…”

观察者网
2026-01-27 10:11:08
1983年严打后,重刑犯都被遣送大西北,最终是什么结局?

1983年严打后,重刑犯都被遣送大西北,最终是什么结局?

观史搜寻着
2025-12-03 22:30:28
现货白银短线拉升,现涨近9%,报112.98美元/盎司

现货白银短线拉升,现涨近9%,报112.98美元/盎司

每日经济新闻
2026-01-27 15:43:41
官方:原申花后卫艾迪加盟中甲宁波职业足球俱乐部

官方:原申花后卫艾迪加盟中甲宁波职业足球俱乐部

懂球帝
2026-01-27 16:14:15
终于“扬眉吐气”了,江苏省这座特大城市民用机场即将开工!

终于“扬眉吐气”了,江苏省这座特大城市民用机场即将开工!

交建动态
2026-01-26 10:30:54
这些城市的“地铁梦”,基本没戏了!

这些城市的“地铁梦”,基本没戏了!

鸣金网
2026-01-27 12:36:19
上海备战广州!李添荣跟队,6人主动加练,弗格回应状态回暖!

上海备战广州!李添荣跟队,6人主动加练,弗格回应状态回暖!

篮球资讯达人
2026-01-27 14:32:56
1923年,戴笠在表弟家睡地铺,飞黄腾达后的处置方式让人大跌眼镜

1923年,戴笠在表弟家睡地铺,飞黄腾达后的处置方式让人大跌眼镜

磊子讲史
2026-01-23 15:21:12
00后新晋女神——神村彩月!天赋异禀,未来可期!

00后新晋女神——神村彩月!天赋异禀,未来可期!

碧波万览
2026-01-10 00:24:45
开年10连胜!斯维托丽娜2-0轻取高芙,生涯首进澳网四强

开年10连胜!斯维托丽娜2-0轻取高芙,生涯首进澳网四强

全景体育V
2026-01-27 17:09:23
不过分吧!男子结婚给28万彩礼要求新娘做GPA检测,女生摔门而去

不过分吧!男子结婚给28万彩礼要求新娘做GPA检测,女生摔门而去

唐小糖说情感
2025-12-12 08:51:45
火爆硅谷的Clawdbot,48小时插件病毒式裂变,一句话让AI执行任务

火爆硅谷的Clawdbot,48小时插件病毒式裂变,一句话让AI执行任务

DeepTech深科技
2026-01-26 13:36:21
“邪修大法”做家务就是快!一分钱不花,家里就窗明几净~

“邪修大法”做家务就是快!一分钱不花,家里就窗明几净~

装修秀
2025-12-19 11:30:03
曝具俊晔放弃大S遗产,6.5亿留给孩子,两家和解,原因竟是马筱梅

曝具俊晔放弃大S遗产,6.5亿留给孩子,两家和解,原因竟是马筱梅

阿纂看事
2026-01-27 17:21:43
山西焦煤集团原董事长武华太一审获刑15年,专题片披露细节

山西焦煤集团原董事长武华太一审获刑15年,专题片披露细节

上观新闻
2026-01-27 13:39:08
2026-01-27 18:35:00
观察者网 incentive-icons
观察者网
全球视野,中国关怀
133277文章数 1849742关注度
往期回顾 全部

科技要闻

马化腾3年年会讲话透露了哪些关键信息

头条要闻

企业30年燃气特许权被单方取消 两级法院判定政府违法

头条要闻

企业30年燃气特许权被单方取消 两级法院判定政府违法

体育要闻

带着母亲遗愿战斗12年,交易添头成了队魂

娱乐要闻

张雨绮被曝代孕,春晚被拒,代言跑路

财经要闻

多地对垄断行业"近亲繁殖"出手了

汽车要闻

标配华为乾崑ADS 4/鸿蒙座舱5 华境S体验车下线

态度原创

亲子
房产
数码
健康
家居

亲子要闻

宝蓝和叔叔玩过家家。宝蓝扮演成“大人”照顾扮演“小孩”的叔叔

房产要闻

实景兑现在即!绿城,在海棠湾重新定义终极旅居想象!

数码要闻

Dynabook发布《攻壳机动队STAND ALONE COMPLEX》联名笔记本

耳石脱落为何让人天旋地转+恶心?

家居要闻

现代古典 中性又显韵味

无障碍浏览 进入关怀版