网易首页 > 网易号 > 正文 申请入驻

阿里发布千问最强推理模型Qwen3-Max-Thinking,性能媲美GPT-5.2、Gemini 3 Pro

0
分享至

阿里巴巴1月26日正式发布千问旗舰推理模型Qwen3-Max-Thinking,在多项权威评测中刷新全球纪录,成为迄今最接近国际顶尖模型的国产AI大模型。这标志着中国大模型从“追平”到“领跑"的关键突破。

据阿里云发布的信息,该模型总参数量超万亿,预训练数据量达36T Tokens,是目前阿里规模最大、能力最强的千问推理模型。在涵盖事实知识、复杂推理、指令遵循、人类偏好对齐、Agent能力等19项公认基准测试中,Qwen3-Max-Thinking整体性能可媲美GPT-5.2-Thinking、Claude Opus 4.5和Gemini 3 Pro等国际顶尖模型。

该模型采用全新的测试时扩展机制,实现推理性能大幅提升的同时更具经济性。在启用工具的HLE(Humanity's Last Exam)评测中,千问得分58.3,大幅超过GPT-5.2-Thinking的45.5和Gemini 3 Pro的45.8,录得当前所有模型的最高分。

阿里巴巴同日宣布,根据Hugging Face数据,Qwen衍生模型数量突破20万,成为全球首个达成此目标的开源大模型。Qwen系列模型累计下载量突破10亿次,被开发者日均下载110万次,稳居全球开源大模型首位。

推理技术实现代际突破

Qwen3-Max-Thinking的核心创新在于测试时扩展机制的应用。阿里云表示,这种机制可对此前推理的结果进行"经验提取"式的提炼,并据此进行多轮自我迭代,在相同的上下文中实现更高效的推理计算。

这一技术路径区别于业界普遍采用的推理计算方式。阿里云指出,传统方法只会简单增加并行推理路径,重复推导已知结论的情况常见,导致冗余推理效率低下。而千问新模型通过"经验提取"机制,可识别并剪枝冗余的逻辑路径,确保算力被用于探索最有价值的分支。

该模型进行了更大规模的强化学习后训练。阿里云数据显示,在此前预览版Qwen3-Max-Thinking斩获数学推理AIME 25和HMMT 25国内首个双满分的基础上,通义团队进一步提升了正式版性能,在多项基准测试中刷新最佳表现纪录。

在HLE这一被称为"人类最后的测试"的评测中,千问得分58.3,较GPT-5.2-Thinking和Gemini 3 Pro分别高出12.8分和12.5分。在AI评测领域,超过10分的差距通常意味着代际级的领先。


原生Agent能力大幅增强

面向智能体时代,Qwen3-Max-Thinking大幅增强了自主调用工具的原生Agent能力。该模型可在对话过程中自主选用搜索、个性化记忆和代码解释器等核心工具功能,提供更符合用户需求的智能回答。

阿里云介绍,这种能力源自通义团队专门设计的训练流程。在完成初步的工具使用微调后,团队对模型在大量多样化任务上进行了基于规则奖励与模型奖励的联合强化学习训练,使Qwen3-Max-Thinking能够更智能地结合工具进行思考。

这一能力的提升带来实际应用价值的改变。模型不再是单纯的"大脑",需要外挂工具导致指令遵循不稳定,而是可以自主判断何时搜索互联网、何时编写代码、何时查阅知识库,并根据反馈动态调整计划。阿里云表示,这种机制大幅降低了模型幻觉,为企业级应用提供了必要的可靠性保障。

目前,开发者可在QwenChat上免费体验Qwen3-Max-Thinking模型,企业可通过阿里云百炼获取新模型API服务。普通用户可通过千问PC端和网页端试用模型,千问APP也即将接入新模型。

开源生态确立全球领先地位

Qwen系列在开源生态的表现展现了中国大模型的全球影响力。根据Hugging Face数据,基于Qwen的衍生模型数量突破20万个,成为全球首个达成此目标的开源家族。其累计下载量突破10亿次,日均下载量达110万次。

这一数据意味着Qwen已完全超越此前被视为开源大模型默认标准的Meta Llama系列。据此前报道,Meta内部代号“牛油果”的秘密项目,在训练新模型时采用了“蒸馏”技术向包括Qwen在内的多方开源模型学习,在技术层面间接承认了Qwen在特定能力上的领先。

Qwen的全球采用份额持续扩大。阿里巴巴采用"全尺寸、全模态"策略,从0.5B到480B的全参数段覆盖,以及对119种语言的支持,使其在东南亚、中东等新兴市场迅速成为首选。

这一开源战略正在转化为实际的市场优势。千问APP上线首周下载量突破1000万,两个月月活突破1亿。该应用全面接入淘宝、支付宝、飞猪、高德等生态,用户可通过语音指令完成订机票、叫外卖等全流程,将AI价值从信息层推向交易层。

全栈布局构建竞争护城河

阿里巴巴在AI领域的布局覆盖算力、模型、应用全栈。在底层算力方面,平头哥研发的PPU在特定推理任务上的性能已与英伟达H20相当,配合倚天710服务器芯片,构建了"一云多芯"的异构算力体系。据市场消息,阿里巴巴已决定支持平头哥未来独立上市。

阿里云已构建起中国最完整的AI基础设施。据摩根士丹利预测,阿里云收入将在三年内翻倍,从2025财年的1180亿元增长至2028财年的2400亿元。其目标是在2026年拿下中国AI云市场增量的80%。

阿里CEO吴泳铭去年宣布,未来三年将投入超过3800亿元用于建设云和AI硬件基础设施。这一投入规模与谷歌、Meta和亚马逊等美股科技巨头的AI资本开支处于同一量级,体现了阿里对AI长期竞争力的战略判断。

Qwen3-Max-Thinking的发布标志着阿里巴巴在AI算法上的顶级实力得到验证,配合其在算力、应用层面的全栈能力,为中国大模型从"追平"到"领跑"的转变提供了关键案例。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美伊停火后伊朗导弹射向以色列

美伊停火后伊朗导弹射向以色列

财联社
2026-04-08 08:27:09
陈丽华辞世遗产落定,“唐僧” 迟重瑞的养老安排令人意外

陈丽华辞世遗产落定,“唐僧” 迟重瑞的养老安排令人意外

皮蛋儿电影
2026-04-07 22:28:39
美官员称美军已暂停在伊朗境内的袭击

美官员称美军已暂停在伊朗境内的袭击

环球网资讯
2026-04-08 07:53:11
为了郑丽文专机能顺利落地,解放军果断亮出底牌,痛击台独要害

为了郑丽文专机能顺利落地,解放军果断亮出底牌,痛击台独要害

健身狂人
2026-04-08 05:00:37
熔断!暴涨2400点!

熔断!暴涨2400点!

中国基金报
2026-04-08 09:13:01
皇马主场沦陷:欧冠晋级形势恶化,姆巴佩破门,维尼修斯屡失良机

皇马主场沦陷:欧冠晋级形势恶化,姆巴佩破门,维尼修斯屡失良机

足球狗说
2026-04-08 04:53:58
悲催!年薪50万的女生婚事,因婚检闹到取消婚礼,起因是她留过洋

悲催!年薪50万的女生婚事,因婚检闹到取消婚礼,起因是她留过洋

火山詩话
2026-04-08 07:10:15
“中国紫檀女王”陈丽华逝世,曾是中国女首富,47岁时倒追“唐僧”迟重瑞,晚年每天生活费10元

“中国紫檀女王”陈丽华逝世,曾是中国女首富,47岁时倒追“唐僧”迟重瑞,晚年每天生活费10元

极目新闻
2026-04-07 12:39:33
太猛了,万科迎来了一场堪称史诗级的大清算

太猛了,万科迎来了一场堪称史诗级的大清算

流苏晚晴
2026-04-07 18:34:27
“休完产假,公司没了” 篮球赛事“路人王”运营公司被曝歇业 有员工称已申请仲裁

“休完产假,公司没了” 篮球赛事“路人王”运营公司被曝歇业 有员工称已申请仲裁

红星新闻
2026-04-07 20:30:50
苏莱曼尼亲属在美被捕的新闻,揭开了“离岸爱国”的内幕

苏莱曼尼亲属在美被捕的新闻,揭开了“离岸爱国”的内幕

清书先生
2026-04-07 17:40:31
警方通报车辆坠河致5死

警方通报车辆坠河致5死

界面新闻
2026-04-07 18:28:58
局面急转直下,在日本最缺石油的时候,俄罗斯补上沉重一击

局面急转直下,在日本最缺石油的时候,俄罗斯补上沉重一击

空天力量
2026-04-07 13:06:20
社保基金会:坚决拥护党中央决定

社保基金会:坚决拥护党中央决定

新京报
2026-04-07 21:41:14
“一盒只加一滴”?北冰洋NFC葡萄汁添加量仅0.005%,公司回应:产品没问题

“一盒只加一滴”?北冰洋NFC葡萄汁添加量仅0.005%,公司回应:产品没问题

红星资本局
2026-04-07 20:40:07
经伊朗这一战,中美之间至少50年内不会爆发战争,理由主要有三点

经伊朗这一战,中美之间至少50年内不会爆发战争,理由主要有三点

南权先生
2026-04-07 15:31:40
山东旋转门事件升级!官媒怒批,知情人曝猛料,不止道歉这么简单

山东旋转门事件升级!官媒怒批,知情人曝猛料,不止道歉这么简单

奇思妙想草叶君
2026-04-07 20:12:16
44岁苍井空老师复出后变这样了?现场红色吊带裙实拍,网友热评:她老公精神力太强大

44岁苍井空老师复出后变这样了?现场红色吊带裙实拍,网友热评:她老公精神力太强大

乔话
2026-04-07 21:11:37
石女征婚!无固定工作、多弟妹待帮扶!网友:这种是debuff加满吧

石女征婚!无固定工作、多弟妹待帮扶!网友:这种是debuff加满吧

火山詩话
2026-04-08 07:39:43
时隔6年,那个曾扬言让中国给全世界道歉,被央视开除的阿丘怎样了

时隔6年,那个曾扬言让中国给全世界道歉,被央视开除的阿丘怎样了

南宗历史
2026-04-07 21:43:27
2026-04-08 10:19:00
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
144202文章数 2653154关注度
往期回顾 全部

科技要闻

造出地表最强AI,却死活不给你用!

头条要闻

美国、伊朗全面停火立即生效 特朗普最新发声

头条要闻

美国、伊朗全面停火立即生效 特朗普最新发声

体育要闻

官宣签约“AI球员”,这支球队被骂惨了...

娱乐要闻

女首富陈丽华离世 被曝生前已分好遗产

财经要闻

特朗普同意停火两周 伊朗:接受停火提议

汽车要闻

不止是大 极狐首款MPV问道V9静态体验

态度原创

游戏
家居
艺术
旅游
教育

《刺客信条:影》藏神秘编码 暗示《黑旗》重制预告

家居要闻

雅致惬意 感知生活之美

艺术要闻

郑丽文书法争议:她的字真的不是自己写的吗?

旅游要闻

水上旅游热度持续攀升 线上引流与景区联动成效明显

教育要闻

六年级添加符号:456=24

无障碍浏览 进入关怀版