网易首页 > 网易号 > 正文 申请入驻

阿里千问发布最新旗舰模型Qwen3-Max-Thinking,性能据称超GPT-5.2

0
分享至

界面新闻记者 | 宋佳楠

界面新闻获悉,1月26日晚,阿里正式推出千问系列旗舰推理模型Qwen3-Max-Thinking。根据阿里公布的数据,该模型在19项权威基准测试中的表现媲美OpenAI的GPT-5.2-Thinking、谷歌的Gemini 3 Pro等国际顶尖模型,标志着国产大模型在高阶推理领域实现重要突破。

该模型总参数量超万亿,预训练数据量达36T Tokens,经大规模强化学习打磨而成。相较于前代模型,其核心改进集中在两方面。

一是自适应工具调用能力,可按需调用搜索引擎和代码解释器,现已上线Qwen Chat。与早期需要用户手动选择工具的方法不同,Qwen3-Max-Thinking能在对话中自主选择并调用其内置的搜索、记忆和代码解释器功能。这种能力让模型能像专业人士一样自主判断是否调用搜索、记忆或代码解释器,比如解答实时政策问题时自动检索最新信息,处理工程计算时启动代码工具验证结果,无需用户额外指令即可降低“幻觉”风险。

Qwen3-Max-Thinking相关测试数据 图片来源:千问

另一个是测试时扩展技术(Test-Time Scaling),指在推理阶段分配额外计算资源以提升模型性能的技术。据称显著提升推理性能,在关键推理基准上超越Gemini 3 Pro。

一般AI遇到难题,会同时想很多思路,很多是重复的,白白耗算力。该技术则通过“经验提取”式反思,避免传统模型并行推理的冗余计算,在相同算力下聚焦未解决难点,使GPQA科学知识测试得分从90.3提升至92.8,LiveCodeBench编程测试从88.0升至91.4。

针对Qwen3-Max-Thinking的更多性能评估 图片来源:千问

在性能比拼中,该模型在被称为“人类最后的测试”的HLE工具调用基准中,以58.3分远超GPT-5.2-Thinking的45.5分和Gemini 3 Pro的45.8分;IMO级数学推理测试获91.5分登顶,预览版更曾拿下AIME 25与HMMT 25双满分。

目前,普通用户可通过千问PC端、网页端免费体验,企业则能通过阿里云百炼获取API服务。

1月21日,全球最大AI开源社区Hugging Face最新数据显示,阿里千问衍生模型数突破20万个,成为全球首个达成此目标的开源大模型;同时,千问系列模型下载量突破10亿次,平均每天被下载110万次,已完全超越美国Llama,稳居开源大模型全球第一。

阿里CEO吴泳铭去年曾表示,公司正在积极推进三年3800亿的AI基础设施建设计划,并将会持续追加更大的投入。这一投入规模与谷歌、Meta和亚马逊等美股科技巨头的AI资本开支处于同一量级。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
原来马斯克没说错,全球抢的不是芯片,而是中国20万一台的变压器

原来马斯克没说错,全球抢的不是芯片,而是中国20万一台的变压器

云上乌托邦
2026-01-22 13:10:38
苹果正式推送 iOS 26.2.1 等大量新系统版本!

苹果正式推送 iOS 26.2.1 等大量新系统版本!

XCiOS俱乐部
2026-01-27 04:27:57
女子买的新冰箱碎掉了!厂家:换一台!商家:换不了!结局亮了

女子买的新冰箱碎掉了!厂家:换一台!商家:换不了!结局亮了

小柱解说游戏
2026-01-26 13:43:12
丁威迪:我想为火箭效力,我的好友DFS在那,火箭能争夺冠军

丁威迪:我想为火箭效力,我的好友DFS在那,火箭能争夺冠军

懂球帝
2026-01-27 10:09:06
重磅!总投资9600亿元,海南2026年重大项目清单曝光!

重磅!总投资9600亿元,海南2026年重大项目清单曝光!

网易海南房产
2026-01-27 10:14:35
李宗仁归国之后,希望能出任人大副委员长一职,毛主席却给出了三条关键理由,直言此事并不合适

李宗仁归国之后,希望能出任人大副委员长一职,毛主席却给出了三条关键理由,直言此事并不合适

史海孤雁
2025-12-25 16:48:16
“高市下台!”高市早苗选举拉票演讲第一站,遭日本民众抗议

“高市下台!”高市早苗选举拉票演讲第一站,遭日本民众抗议

环球网资讯
2026-01-27 15:17:19
“流氓有文化更可怕”,退休老干部频繁联系女幼师,聊天记录曝光

“流氓有文化更可怕”,退休老干部频繁联系女幼师,聊天记录曝光

妍妍教育日记
2026-01-27 19:58:28
事实证明,“销声匿迹”的宋祖英,早就已经走上了另一条康庄大道

事实证明,“销声匿迹”的宋祖英,早就已经走上了另一条康庄大道

不写散文诗
2026-01-06 18:22:37
哈里王子全家福曝光:阿奇帅气不输乔治路易,莉莉贝特神似夏洛特

哈里王子全家福曝光:阿奇帅气不输乔治路易,莉莉贝特神似夏洛特

笑傲春秋
2026-01-27 13:56:58
强得可怕!夺冠热门踢疯了,狂揽11连胜+赛季不败,高居榜首

强得可怕!夺冠热门踢疯了,狂揽11连胜+赛季不败,高居榜首

乌龙球OwnGoal
2026-01-27 13:35:38
不反华了?芬兰首脑抵京,中国用最高规格接待,现场备好一辆专车

不反华了?芬兰首脑抵京,中国用最高规格接待,现场备好一辆专车

万国明信片
2026-01-27 09:28:37
"穷但人品好"的男人能嫁吗?网友的分享一针见血,评论区吵翻天了

"穷但人品好"的男人能嫁吗?网友的分享一针见血,评论区吵翻天了

夜深爱杂谈
2026-01-27 21:32:47
原来她已离世26年!23岁登春晚一夜成名,却因一个巴掌付出生命

原来她已离世26年!23岁登春晚一夜成名,却因一个巴掌付出生命

法老不说教
2025-12-24 12:22:51
特朗普态度,180度大转弯!

特朗普态度,180度大转弯!

环球时报国际
2026-01-27 21:14:01
76岁上海知青回江西访友,竟发现当年的女友终生未嫁:我对不住你

76岁上海知青回江西访友,竟发现当年的女友终生未嫁:我对不住你

五元讲堂
2026-01-19 11:13:16
1968年,林彪想换北京军区司令,毛主席只问了一句话,林彪彻底哑火

1968年,林彪想换北京军区司令,毛主席只问了一句话,林彪彻底哑火

老杉说历史
2026-01-09 22:00:17
邱清泉唯一留在大陆的儿子,主动放弃前往台湾,后来的结局如何?

邱清泉唯一留在大陆的儿子,主动放弃前往台湾,后来的结局如何?

史之铭
2026-01-27 16:48:34
连遭美国“极限施压”,加拿大总理卡尼为与中国经贸共识辩护

连遭美国“极限施压”,加拿大总理卡尼为与中国经贸共识辩护

环球网资讯
2026-01-27 06:46:06
蹉跎半生的樊振东父母没想到,儿子一则动态,让他们迎来无上荣光

蹉跎半生的樊振东父母没想到,儿子一则动态,让他们迎来无上荣光

以茶带书
2026-01-27 17:20:57
2026-01-27 22:12:49
界面新闻 incentive-icons
界面新闻
只服务于独立思考的人群
1009393文章数 1329446关注度
往期回顾 全部

科技要闻

马化腾3年年会讲话透露了哪些关键信息

头条要闻

国科大星际航行学院正式成立 官网发文诚聘海外英才

头条要闻

国科大星际航行学院正式成立 官网发文诚聘海外英才

体育要闻

冒充职业球员,比赛规则还和对手现学?

娱乐要闻

张雨绮被曝代孕,春晚被拒,代言跑路

财经要闻

多地对垄断行业"近亲繁殖"出手了

汽车要闻

标配华为乾崑ADS 4/鸿蒙座舱5 华境S体验车下线

态度原创

艺术
本地
亲子
游戏
军事航空

艺术要闻

日本东京国立博物馆中的100幅宋画

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

亲子要闻

双职工家庭,孩子上幼儿园后,无老人帮忙,夫妻俩能独立带娃吗?

玩家热议《GTA6》别再加入“马克兔”!会毁了游戏

军事要闻

美海军"林肯"号航母打击群抵达中东地区

无障碍浏览 进入关怀版