网易首页 > 网易号 > 正文 申请入驻

阿里发布千问最强推理模型Qwen3-Max-Thinking,性能媲美GPT-5.2、Gemini 3 Pro

0
分享至

阿里巴巴1月26日正式发布千问旗舰推理模型Qwen3-Max-Thinking,在多项权威评测中刷新全球纪录,成为迄今最接近国际顶尖模型的国产AI大模型。这标志着中国大模型从“追平”到“领跑"的关键突破。

据阿里云发布的信息,该模型总参数量超万亿,预训练数据量达36T Tokens,是目前阿里规模最大、能力最强的千问推理模型。在涵盖事实知识、复杂推理、指令遵循、人类偏好对齐、Agent能力等19项公认基准测试中,Qwen3-Max-Thinking整体性能可媲美GPT-5.2-Thinking、Claude Opus 4.5和Gemini 3 Pro等国际顶尖模型。

该模型采用全新的测试时扩展机制,实现推理性能大幅提升的同时更具经济性。在启用工具的HLE(Humanity's Last Exam)评测中,千问得分58.3,大幅超过GPT-5.2-Thinking的45.5和Gemini 3 Pro的45.8,录得当前所有模型的最高分。

阿里巴巴同日宣布,根据Hugging Face数据,Qwen衍生模型数量突破20万,成为全球首个达成此目标的开源大模型。Qwen系列模型累计下载量突破10亿次,被开发者日均下载110万次,稳居全球开源大模型首位。

推理技术实现代际突破

Qwen3-Max-Thinking的核心创新在于测试时扩展机制的应用。阿里云表示,这种机制可对此前推理的结果进行"经验提取"式的提炼,并据此进行多轮自我迭代,在相同的上下文中实现更高效的推理计算。

这一技术路径区别于业界普遍采用的推理计算方式。阿里云指出,传统方法只会简单增加并行推理路径,重复推导已知结论的情况常见,导致冗余推理效率低下。而千问新模型通过"经验提取"机制,可识别并剪枝冗余的逻辑路径,确保算力被用于探索最有价值的分支。

该模型进行了更大规模的强化学习后训练。阿里云数据显示,在此前预览版Qwen3-Max-Thinking斩获数学推理AIME 25和HMMT 25国内首个双满分的基础上,通义团队进一步提升了正式版性能,在多项基准测试中刷新最佳表现纪录。

在HLE这一被称为"人类最后的测试"的评测中,千问得分58.3,较GPT-5.2-Thinking和Gemini 3 Pro分别高出12.8分和12.5分。在AI评测领域,超过10分的差距通常意味着代际级的领先。


原生Agent能力大幅增强

面向智能体时代,Qwen3-Max-Thinking大幅增强了自主调用工具的原生Agent能力。该模型可在对话过程中自主选用搜索、个性化记忆和代码解释器等核心工具功能,提供更符合用户需求的智能回答。

阿里云介绍,这种能力源自通义团队专门设计的训练流程。在完成初步的工具使用微调后,团队对模型在大量多样化任务上进行了基于规则奖励与模型奖励的联合强化学习训练,使Qwen3-Max-Thinking能够更智能地结合工具进行思考。

这一能力的提升带来实际应用价值的改变。模型不再是单纯的"大脑",需要外挂工具导致指令遵循不稳定,而是可以自主判断何时搜索互联网、何时编写代码、何时查阅知识库,并根据反馈动态调整计划。阿里云表示,这种机制大幅降低了模型幻觉,为企业级应用提供了必要的可靠性保障。

目前,开发者可在QwenChat上免费体验Qwen3-Max-Thinking模型,企业可通过阿里云百炼获取新模型API服务。普通用户可通过千问PC端和网页端试用模型,千问APP也即将接入新模型。

开源生态确立全球领先地位

Qwen系列在开源生态的表现展现了中国大模型的全球影响力。根据Hugging Face数据,基于Qwen的衍生模型数量突破20万个,成为全球首个达成此目标的开源家族。其累计下载量突破10亿次,日均下载量达110万次。

这一数据意味着Qwen已完全超越此前被视为开源大模型默认标准的Meta Llama系列。据此前报道,Meta内部代号“牛油果”的秘密项目,在训练新模型时采用了“蒸馏”技术向包括Qwen在内的多方开源模型学习,在技术层面间接承认了Qwen在特定能力上的领先。

Qwen的全球采用份额持续扩大。阿里巴巴采用"全尺寸、全模态"策略,从0.5B到480B的全参数段覆盖,以及对119种语言的支持,使其在东南亚、中东等新兴市场迅速成为首选。

这一开源战略正在转化为实际的市场优势。千问APP上线首周下载量突破1000万,两个月月活突破1亿。该应用全面接入淘宝、支付宝、飞猪、高德等生态,用户可通过语音指令完成订机票、叫外卖等全流程,将AI价值从信息层推向交易层。

全栈布局构建竞争护城河

阿里巴巴在AI领域的布局覆盖算力、模型、应用全栈。在底层算力方面,平头哥研发的PPU在特定推理任务上的性能已与英伟达H20相当,配合倚天710服务器芯片,构建了"一云多芯"的异构算力体系。据市场消息,阿里巴巴已决定支持平头哥未来独立上市。

阿里云已构建起中国最完整的AI基础设施。据摩根士丹利预测,阿里云收入将在三年内翻倍,从2025财年的1180亿元增长至2028财年的2400亿元。其目标是在2026年拿下中国AI云市场增量的80%。

阿里CEO吴泳铭去年宣布,未来三年将投入超过3800亿元用于建设云和AI硬件基础设施。这一投入规模与谷歌、Meta和亚马逊等美股科技巨头的AI资本开支处于同一量级,体现了阿里对AI长期竞争力的战略判断。

Qwen3-Max-Thinking的发布标志着阿里巴巴在AI算法上的顶级实力得到验证,配合其在算力、应用层面的全栈能力,为中国大模型从"追平"到"领跑"的转变提供了关键案例。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
父亲40年攒下的千亿帝国,儿子4年败光

父亲40年攒下的千亿帝国,儿子4年败光

大猫财经Pro
2026-04-08 16:09:55
重大胜利!美国高层召开新闻发布会,介绍针对伊朗行动的重大战果

重大胜利!美国高层召开新闻发布会,介绍针对伊朗行动的重大战果

小萝卜丝
2026-04-08 22:17:45
奥斯卡向中国球迷报平安:我在恢复当中,希望尽快来中国

奥斯卡向中国球迷报平安:我在恢复当中,希望尽快来中国

懂球帝
2026-04-08 21:40:13
中俄投下反对票!傅聪:不给使用武力开通行证

中俄投下反对票!傅聪:不给使用武力开通行证

看看新闻Knews
2026-04-08 16:59:04
蒙牛跨进运动饮料赛道,一家乳企的边界测试

蒙牛跨进运动饮料赛道,一家乳企的边界测试

36氪
2026-04-08 21:44:36
全红婵遭群聊辱骂再升级!国家一锤定音,主谋被扒,势力大也没用

全红婵遭群聊辱骂再升级!国家一锤定音,主谋被扒,势力大也没用

林雁飞
2026-04-08 20:07:41
国家体育总局回应全红婵遭网暴:已联合开展核查处置 全红婵所属训练中心已向警方报案

国家体育总局回应全红婵遭网暴:已联合开展核查处置 全红婵所属训练中心已向警方报案

闪电新闻
2026-04-08 14:45:59
张雪峰去世15天,原配李丽婧罕见发声,透露张姩菡近况,令人担忧

张雪峰去世15天,原配李丽婧罕见发声,透露张姩菡近况,令人担忧

秋姐居
2026-04-08 17:19:31
诈尸了!哈梅内伊死而复生?特朗普大秀军功,伊朗做出了一个举动

诈尸了!哈梅内伊死而复生?特朗普大秀军功,伊朗做出了一个举动

嫹笔牂牂
2026-04-08 10:15:22
郑丽文抵达上海受高规格接待!蒋万安发声:反对统一,要对等尊严

郑丽文抵达上海受高规格接待!蒋万安发声:反对统一,要对等尊严

混沌录
2026-04-08 19:31:04
河北两名群众、一名辅警为救落水女子不幸牺牲,四人全部遇难,事发地被市民摆满鲜花,当地多方回应

河北两名群众、一名辅警为救落水女子不幸牺牲,四人全部遇难,事发地被市民摆满鲜花,当地多方回应

大风新闻
2026-04-08 18:56:14
贝兹利和队友冲突 宁波赛后宣布解约:外援无特权!

贝兹利和队友冲突 宁波赛后宣布解约:外援无特权!

体坛周报
2026-04-08 21:46:20
张雪妻子谈张雪母亲:成长过程中不管开店还是造车,“都是妈妈援助之手,不需质疑”

张雪妻子谈张雪母亲:成长过程中不管开店还是造车,“都是妈妈援助之手,不需质疑”

界面新闻
2026-04-08 19:42:21
酒局的二场,大家现在也不再去KTV了

酒局的二场,大家现在也不再去KTV了

微微热评
2026-04-08 20:33:28
害女童凶手被揭底!常年分居,村民曝骇人细节,坐牢算轻的

害女童凶手被揭底!常年分居,村民曝骇人细节,坐牢算轻的

哄动一时啊
2026-04-08 20:05:21
阿不都18+10+9!新疆加时逆转天津结束4连败 齐麟25+7爆发

阿不都18+10+9!新疆加时逆转天津结束4连败 齐麟25+7爆发

醉卧浮生
2026-04-08 22:08:38
太可怜了!全红婵被霸凌,282人微信群聊天曝光,体育总局动真格

太可怜了!全红婵被霸凌,282人微信群聊天曝光,体育总局动真格

乌娱子酱
2026-04-08 14:10:45
狂轰21-2逆转!郭昊文20+8+9同曦双杀北控 佩里空砍31+8

狂轰21-2逆转!郭昊文20+8+9同曦双杀北控 佩里空砍31+8

醉卧浮生
2026-04-08 21:38:53
美股三大指数大幅高开 纳指涨超3%

美股三大指数大幅高开 纳指涨超3%

财联社
2026-04-08 21:32:04
陈丽华辞世遗产落定,“唐僧” 迟重瑞的养老安排令人意外

陈丽华辞世遗产落定,“唐僧” 迟重瑞的养老安排令人意外

皮蛋儿电影
2026-04-07 22:28:39
2026-04-08 22:40:49
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
144230文章数 2653160关注度
往期回顾 全部

科技要闻

造出地表最强AI,却死活不给你用!

头条要闻

无法说话、四肢瘫痪女孩误购演唱会门票 申请退票遭拒

头条要闻

无法说话、四肢瘫痪女孩误购演唱会门票 申请退票遭拒

体育要闻

40岁,但实力倒退12年

娱乐要闻

侯佩岑全家悉尼度假,一家四口幸福满溢

财经要闻

天津海河乳业回应直播间涉黄

汽车要闻

20万级满配华为全家桶 华境S是懂家庭的大六座

态度原创

家居
旅游
房产
健康
时尚

家居要闻

自在恣意 侘寂风别墅

旅游要闻

合川有座被国字号认证的古镇,烟火气十足,比想象中的还要惊艳

房产要闻

正式动工!珠城马场地块,签约华尔道夫!

干细胞抗衰4大误区,90%的人都中招

50岁,我妈在恋综抢男人

无障碍浏览 进入关怀版