网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

炸裂！阿里深夜扔出“王炸”！最强AI大脑诞生，性能直接叫板GPT-5.2！

2026-01-27 23:28:52　来源: 前沿科技学习分享圈

北京举报

0

分享至

一项测试时扩展技术，让中国大模型在深夜的科技圈投下震撼弹，全球AI性能纪录被一夜刷新。

深夜的科技圈，被一则重磅消息点燃。1月26日晚，阿里巴巴正式发布了其预告已久的千问旗舰推理模型——Qwen3-Max-Thinking。

这不仅是阿里迄今为止规模最大、能力最强的千问推理模型，更在多项关键性能基准测试中，直接超越了GPT-5.2、Claude Opus 4.5和Gemini 3 Pro等国际顶尖对手。

01 深夜王炸

就在昨晚，阿里巴巴通义千问团队扔出了一枚“深夜王炸”。Qwen3-Max-Thinking的正式发布，标志着中国大模型技术迈上了一个全新的台阶。

这个模型的总参数超过万亿（1T），预训练数据量高达36T Tokens。它经过了更大规模的强化学习后训练，并通过一系列推理技术的创新，最终实现了模型性能的飞跃式突破。

此前，预览版Qwen3-Max-Thinking已经展示了惊人的潜力，斩获了数学推理AIME 25和HMMT 25的国内首个双满分。而正式版在此基础上，性能得到了全面增强。

通义团队为这个模型引入了两项核心创新：自适应工具调用能力和测试时扩展技术。这两项技术，特别是测试时扩展技术，可能是它能够在多项基准测试中脱颖而出的关键。

02 性能狂飙

在多项关键性能基准测试中，Qwen3-Max-Thinking的表现令人震撼。它刷新了科学知识、数学推理、代码编程等多项关键性能基准测试的全球纪录。

在科学知识测试中，它超越了GPT-5.2；在数学推理领域，它击败了Claude Opus 4.5；在代码编程方面，它的表现也优于Gemini 3 Pro。

这些成绩的背后，是通义团队在模型推理能力上的重大突破。传统的推理计算往往只是简单增加并行推理路径，重复推导已知结论，造成了冗余和效率低下。

而Qwen3-Max-Thinking采用的测试时扩展新机制，能够对之前的推理结果进行“经验提取”式的提炼，并据此进行多轮自我迭代。这意味着在相同的上下文中，它能够实现更高效的推理计算，获得更智能的推理结果。

03 突破创新

除了测试时扩展机制外，Qwen3-Max-Thinking还大幅增强了自主调用工具的原生Agent能力。

通义团队对模型进行了基于规则奖励与模型奖励的联合强化学习训练，让模型能够自主选用搜索、个性化记忆和代码解释器等三个核心的Agent工具功能。

这意味着，当你向它提出问题时，它不仅能给出答案，还能像专业人士一样，知道什么时候需要搜索最新信息，什么时候需要调取相关知识储备，什么时候需要用代码解释器来验证解决方案。

同时，模型的幻觉现象也大为降低。这是AI领域长期面临的难题——模型有时会“自信地”给出错误答案。Qwen3-Max-Thinking在这方面取得的进展，使它的回答更加可靠和准确。

04 全面开放

最令人振奋的是，这个强大的模型并非只供少数人使用。普通用户现在就可以通过千问PC端和网页端试用模型，开发者可以在QwenChat上免费体验Qwen3-Max-Thinking模型。

对于企业用户，可以通过阿里云百炼获取新模型API服务。而据了解，千问APP也即将接入新模型，所有用户都可免费体验。

这意味着，中国企业和开发者将能够第一时间接触并使用到与世界顶尖水平媲美的大模型技术。这种开放和普惠的策略，无疑将加速AI技术在各行各业的应用和创新。

自2022年开始研发以来，阿里Qwen大模型已经成为全球排名第一的开源大模型。而Qwen3-Max-Thinking的发布，无疑是在这一成功基础上的又一次飞跃。

阿里美股在模型发布当天微跌1.07%，但港股27日盘前却涨超2%。资本市场似乎已经开始对这个技术突破作出反应。

当国际巨头还在为模型参数的微小提升而沾沾自喜时，中国团队已经通过架构和机制的创新，实现了质的飞跃。一个能够在测试时自我迭代、自我完善的AI大脑，正在从实验室走向千家万户的电脑和手机屏幕。

这不仅是技术的胜利，更是创新思维的胜利。

AI眼镜处于爆发前夜，有很多值得体验的好产品

欢迎大家进群一起交流使用心得！

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

中国常驻联合国副代表：日本是“国际秩序破坏者”

潇湘晨报 2026-01-27 16:13:22
9374 跟贴 9374
省两会间隙连夜开全省会议，河南为何如此急迫？∣豫观察

大象新闻 2026-01-27 13:05:04
33 跟贴 33

美国芝加哥出现负电价

每日经济新闻 2026-01-27 13:41:01
2851 跟贴 2851

958克坚果礼盒实际只有33克坚果，百草味回应：系经销商私自组合，现已下架

中国能源网 2026-01-27 11:58:04
172 跟贴 172
儿子一道题学不会，杭州妈妈崩溃了：吞下一整罐安眠药！紧急抢救

潇湘晨报 2026-01-27 14:26:41
273 跟贴 273

iPhone Air大降价网友破防：昨天刚买今天就降2000元

大风新闻 2026-01-27 08:14:16
1208 跟贴 1208

实行免票预约后38万人爽约，杭州灵隐景区“升级”惩戒措施

澎湃新闻 2026-01-26 14:57:05
672 跟贴 672
全国9地取消固定分时电价

财联社 2026-01-27 13:58:05
1 跟贴 1

男子花50万向老同学购买“内部黄金” 每克仅100元

环球网资讯 2026-01-27 10:42:48
897 跟贴 897
全是假的！涉及多个品牌，检测结果触目惊心！网友：老人小孩都在吃

环球网资讯 2026-01-27 15:41:14
242 跟贴 242
贺娇龙，被写入新疆政府工作报告

极目新闻 2026-01-27 19:22:24
13 跟贴 13
官方：严格落实春节高速免通行费政策

澎湃新闻 2026-01-27 11:30:01
236 跟贴 236
专家：银价短期或跌回90美元之下

财联社 2026-01-27 16:22:25
116 跟贴 116
中国球员杨瀚森代表撕裂之城混音队入选2026年NBA全明星新秀赛

大风新闻 2026-01-27 14:10:02
75 跟贴 75
商务部新闻发言人就中英经贸合作情况答记者问

界面新闻 2026-01-27 15:38:35
39 跟贴 39
我国将出台应对人工智能影响促就业文件

界面新闻 2026-01-27 10:04:47
625 跟贴 625
米兰冬奥会中国体育代表团成立多名冬奥会冠军领衔

央视新闻客户端 2026-01-27 08:04:25
318 跟贴 318
甘肃统一调整商业用房贷款首付比例，最低降至30%

界面新闻 2026-01-27 12:04:30
3 跟贴 3
河南小伙儿救人，胸外按压600次按断女子六根肋骨，当事人丈夫：没这力度，她可能成植物人，恩情永远还不完

大象新闻 2026-01-28 01:45:07
0 跟贴 0
永辉超市回应北京调改门店停业：物业断水断暖所致

观点机构 2026-01-28 01:51:25
0 跟贴 0
电梯噪声太吵了！浙江一业主家卧室紧挨电梯井，一怒状告开放商和物业侵权

台州交通广播 2026-01-28 02:04:12
0 跟贴 0
70亿分红，没了！

中国新闻周刊 2026-01-27 19:45:05
0 跟贴 0

“走狗、日奸、国贼”苍井空帮中国说了啥，让日本人破防成这样？

“走狗、日奸、国贼”苍井空帮中国说了啥，让日本人破防成这样？

陌上桃花开的

2026-01-28 02:02:52

六旬老人跟团北京5日游，第3天猝死！连续两天凌晨集合，导游临时在车上通知增加游览项目，法院判了

六旬老人跟团北京5日游，第3天猝死！连续两天凌晨集合，导游临时在车上通知增加游览项目，法院判了

扬子晚报

2026-01-24 22:29:57

2026 命最好的 3 大生肖！喜事扎堆降临，第一名富到没朋友

2026 命最好的 3 大生肖！喜事扎堆降临，第一名富到没朋友

人閒情事

2026-01-16 16:18:36

3500万卖出22岁希望之星：瓜帅前锋人手太多，只好放弃培养他

3500万卖出22岁希望之星：瓜帅前锋人手太多，只好放弃培养他

里芃芃体育

2026-01-27 05:00:03

两种葬礼，两种人生，梁小龙和吴孟达的身后事，差距真是一目了然

两种葬礼，两种人生，梁小龙和吴孟达的身后事，差距真是一目了然

杰丝聊古今

2026-01-28 02:05:45

戏子误国！2025年5大翻车明星，都是老艺术家，没一个值得同情

戏子误国！2025年5大翻车明星，都是老艺术家，没一个值得同情

胡一舸南游y

2026-01-26 16:28:41

A股“绩差生”扎堆交卷：超500家公司年报预亏，53家亏损超10亿元

A股“绩差生”扎堆交卷：超500家公司年报预亏，53家亏损超10亿元

第一财经资讯

2026-01-27 20:43:24

心梗去世逐年增多？医生：牢记“3不喝、2不吃、1坚持”，别大意

心梗去世逐年增多？医生：牢记“3不喝、2不吃、1坚持”，别大意

袁医生课堂

2026-01-24 17:33:06

误会太深！王岳伦回应李湘缅北诈骗真相，释放3大信号，风向变了

误会太深！王岳伦回应李湘缅北诈骗真相，释放3大信号，风向变了

无心小姐姐

2026-01-28 01:52:34

这才是40岁左右的女性该有的穿搭

这才是40岁左右的女性该有的穿搭

牛弹琴123456

2025-12-10 20:51:18

乌戈：作为球队主帅我也迅速做出调整，需要把势头保持下去

乌戈：作为球队主帅我也迅速做出调整，需要把势头保持下去

狼叔评论

2026-01-27 22:42:07

单亲妈妈的崩溃！400元海底捞引爆母女大战，养的狗比亲妈还金贵

单亲妈妈的崩溃！400元海底捞引爆母女大战，养的狗比亲妈还金贵

蝴蝶花雨话教育

2026-01-05 09:07:40

俄军空袭致乌克兰24人受伤乌多州停电

俄军空袭致乌克兰24人受伤乌多州停电

财联社

2026-01-27 20:44:14

高市早苗宣布提前大选，日本发现了新问题，中方拒绝派遣外交官

高市早苗宣布提前大选，日本发现了新问题，中方拒绝派遣外交官

报君知史

2026-01-26 20:20:44

理想员工吐槽李想全员会：一句也听不懂，找罗永浩聊就行了……

理想员工吐槽李想全员会：一句也听不懂，找罗永浩聊就行了……

柴狗夫斯基

2026-01-27 11:05:56

雷军宣布每周分享车主提车美照，照片中小米汽车女车主比例很高

雷军宣布每周分享车主提车美照，照片中小米汽车女车主比例很高

映射生活的身影

2026-01-27 00:48:02

到底什么叫洗钱？网友"完美闭环"式回答，感觉错过了一个亿

到底什么叫洗钱？网友"完美闭环"式回答，感觉错过了一个亿

另子维爱读史

2026-01-09 22:18:04

6死7伤！乡政府大楼被炸震惊中央，四川凉山州6.26特大爆炸案始末

6死7伤！乡政府大楼被炸震惊中央，四川凉山州6.26特大爆炸案始末

易玄

2024-09-11 10:52:41

看懂抗美援朝，也就懂了伊朗总统莱希死后，中国为啥在台海掀桌子

看懂抗美援朝，也就懂了伊朗总统莱希死后，中国为啥在台海掀桌子

听风行江湖

2026-01-03 03:50:34

哈里王子全家福曝光：阿奇帅气不输乔治路易，莉莉贝特神似夏洛特

哈里王子全家福曝光：阿奇帅气不输乔治路易，莉莉贝特神似夏洛特

笑傲春秋

2026-01-27 13:56:58

前沿科技学习分享圈

朝看花开满树红，暮看花落树还空。若将花比人间事，花与人间事一同。

1600文章数 369关注度

往期回顾全部

科技要闻

马化腾3年年会讲话透露了哪些关键信息

头条要闻

美报告称中国是其19世纪以来面对过的最强大国家

头条要闻

美报告称中国是其19世纪以来面对过的最强大国家

体育要闻

冒充职业球员，比赛规则还和对手现学？

娱乐要闻

张雨绮风波持续发酵，曝多个商务被取消

财经要闻

多地对垄断行业"近亲繁殖"出手了

汽车要闻

标配华为乾崑ADS 4/鸿蒙座舱5 华境S体验车下线

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

亲子

时尚

房产

艺术

游戏

亲子要闻

双职工家庭，孩子上幼儿园后，无老人帮忙，夫妻俩能独立带娃吗？

这些韩系穿搭最适合普通人！多穿深色、衣服基础，简洁耐看

房产要闻

实景兑现在即！绿城，在海棠湾重新定义终极旅居想象！

艺术要闻

震撼！19世纪油画巨匠的作品美得不可思议！

LPL春季赛：决绝让一追二，AL三局击溃IG，大家的排名都不变

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版