网易首页 > 网易号 > 正文 申请入驻

阿里千问最强推理模型问世:采用全新测试时扩展机制,性能比肩GPT-5.2

0
分享至


阿里正式发布千问最强AI(人工智能)模型。

1月26日晚间,阿里正式发布预告已久的千问旗舰推理模型Qwen3-Max-Thinking。据介绍,该模型创下数项权威评测全球新纪录,性能媲美GPT-5.2、Gemini 3 Pro,成为迄今为止最接近国际顶尖模型的国内最强AI大模型。通义团队还为其引入了两项核心创新:自适应工具调用能力和测试时扩展技术(Test-Time Scaling)。

从参数来看,千问新模型总参数超万亿(1T),预训练数据量高达36T Tokens,是目前阿里规模最大、能力最强的千问推理模型。该模型进行了更大规模的强化学习后训练,并通过推理技术的系列创新,最终完成模型性能的大幅飞跃。

此前,预览版Qwen3-Max-Thinking已斩获数学推理AIME 25和HMMT 25的国内首个双满分。在此基础上,阿里通义团队进行了更大规模的强化学习后训练,全面提升了正式版Qwen3-Max-Thinking性能。

在多项关键性能基准测试中,千问表现超过了GPT-5.2、Claude Opus 4.5和Gemini 3 Pro等顶尖模型,刷新科学知识(GPQA Diamond)、数学推理(IMO-AnswerBench)、代码编程(LiveCodeBench)等多项关键性能基准测试的全球纪录。



千问在多项关键性能基准测试中的表现。来源:阿里云

据介绍,在关键的模型推理能力提升中,千问新模型采用了一种全新的测试时扩展机制。业界普遍的推理时计算,只会简单增加并行推理路径,重复推导已知结论,造成冗余推理效率低下;而千问采用的这一新机制,可对此前推理的结果进行“经验提取”式的提炼,并据此进行多轮自我迭代,在相同的上下文中实现更高效的推理计算,获得更智能的推理结果。

此外,Qwen3-Max-Thinking还大幅增强了自主调用工具的原生Agent能力。具体而言,通义团队对模型进一步在大量多样化任务上进行了基于规则奖励与模型奖励的联合强化学习训练。模型能够自主选用搜索、个性化记忆和代码解释器等三个核心的Agent工具功能,提供和专业人士一样水平的回答。同时,模型幻觉也大为降低。

目前,普通用户可以通过千问PC端和网页端试用模型,开发者可在QwenChat上免费体验Qwen3-Max-Thinking模型,企业可通过阿里云百炼获取新模型API服务。据了解,千问APP也即将接入新模型,所有用户都可免费体验。

阿里Qwen大模型的研发始于2022年,已经成为全球排名第一的开源大模型。大模型Qwen3-Max发布于2025年9月,是通义千问家族中最大、最强的基础模型。

26日当天,阿里巴巴美股(NYSE:BABA)跌1.07%收于每股171.38美元,总市值4091亿美元;港股(9988.HK)27日盘前涨超2%。

澎湃新闻记者 胡含嫣

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
三星宣布再涨价100%!

三星宣布再涨价100%!

中国半导体论坛
2026-01-26 15:07:00
人为什么会得恶性肿瘤?原来癌症是这样来的,现在知道还不晚

人为什么会得恶性肿瘤?原来癌症是这样来的,现在知道还不晚

医学原创故事会
2026-01-27 00:14:05
CBA裁判专家,给迪亚洛提了一个建议

CBA裁判专家,给迪亚洛提了一个建议

体育哲人
2026-01-26 14:44:44
华为技术专家,入职985母校!

华为技术专家,入职985母校!

TOP大学来了
2026-01-26 20:34:23
1951年,戴笠独子被处决,蒋介石两年后下令:他的子孙全接回台湾

1951年,戴笠独子被处决,蒋介石两年后下令:他的子孙全接回台湾

古书记史
2025-12-11 17:37:45
2025年新生儿仅有792万,一个重要原因是育儿的廉价劳动力已经不足了

2025年新生儿仅有792万,一个重要原因是育儿的廉价劳动力已经不足了

风向观察
2026-01-25 12:07:51
载有美国对台首批军售武器货轮于1月13日从美国正驶往台湾方向

载有美国对台首批军售武器货轮于1月13日从美国正驶往台湾方向

南权先生
2026-01-23 15:42:38
老蒋曾说:亡于日本为亡国奴,亡于共产党,则为奴亦不可得

老蒋曾说:亡于日本为亡国奴,亡于共产党,则为奴亦不可得

老范谈史
2026-01-05 21:19:06
灵隐寺免费后38万人爽约,免票不等于免诚信

灵隐寺免费后38万人爽约,免票不等于免诚信

中国青年报
2026-01-26 21:34:06
在湖人没打出来,但内线新星加盟老鹰后立刻打出了亮眼的表现?

在湖人没打出来,但内线新星加盟老鹰后立刻打出了亮眼的表现?

稻谷与小麦
2026-01-27 11:57:50
山东一周“撸”了13个官儿!

山东一周“撸”了13个官儿!

济宁人
2026-01-26 20:41:33
清水梨纱:上次亚洲杯我们不敌中国,现在要以挑战者心态迎战

清水梨纱:上次亚洲杯我们不敌中国,现在要以挑战者心态迎战

懂球帝
2026-01-26 17:30:12
邻居吓煞!上海这家人装3台燃气热水器,把自己团团围住,窗户封死……

邻居吓煞!上海这家人装3台燃气热水器,把自己团团围住,窗户封死……

手工制作阿爱
2026-01-27 09:47:13
如果你希望儿子自律、优秀、强大,就让他学会吃这3种“高级苦”

如果你希望儿子自律、优秀、强大,就让他学会吃这3种“高级苦”

诗词中国
2026-01-26 19:58:23
不反华了?芬兰首脑抵京,中国用最高规格接待,现场备好一辆专车

不反华了?芬兰首脑抵京,中国用最高规格接待,现场备好一辆专车

万国明信片
2026-01-27 09:28:37
金价狂飙 “牛市神话”未完待续

金价狂飙 “牛市神话”未完待续

北京商报
2026-01-27 00:55:22
《太平年》:守城十日,冯道用两万一千人性命,换一线希望

《太平年》:守城十日,冯道用两万一千人性命,换一线希望

感影的世界
2026-01-27 11:34:34
365万辆汽车积压!不降价真能清库存?真相惊人

365万辆汽车积压!不降价真能清库存?真相惊人

阿芒娱乐说
2026-01-26 10:00:18
用“野路子”掀桌,汽水音乐威胁到谁?

用“野路子”掀桌,汽水音乐威胁到谁?

青橙财经
2026-01-25 22:29:30
随着兰帕德率领头羊爆大冷门1-2,英冠最新积分榜出炉

随着兰帕德率领头羊爆大冷门1-2,英冠最新积分榜出炉

侧身凌空斩
2026-01-27 09:11:06
2026-01-27 12:32:49
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
873336文章数 5087527关注度
往期回顾 全部

科技要闻

理想开始关店“过冬”,否认“百家”规模

头条要闻

斯塔默访华前:英国不必在美国和中国之间做选择

头条要闻

斯塔默访华前:英国不必在美国和中国之间做选择

体育要闻

带着母亲遗愿战斗12年,交易添头成了队魂

娱乐要闻

张雨绮被曝代孕,春晚被拒,代言跑路

财经要闻

金价狂飙 “牛市神话”未完待续

汽车要闻

宾利第四台Batur敞篷版发布 解锁四项定制创新

态度原创

艺术
房产
健康
教育
军事航空

艺术要闻

日本东京国立博物馆中的100幅宋画

房产要闻

重磅!总投资9600亿元,海南2026年重大项目清单曝光!

耳石脱落为何让人天旋地转+恶心?

教育要闻

浙江一县取消中考,初中生100%入普高!

军事要闻

委代总统称遭美威胁:马杜罗已死

无障碍浏览 进入关怀版