网易首页 > 网易号 > 正文 申请入驻

超1万亿参数!阿里史上最大最强模型免费上线,实测几秒完成程序员半天工作

0
分享至

智东西9月6日报道,昨夜,阿里上线Qwen3系列最强模型Qwen3-Max的Preview版本,这也是阿里迄今为止最大的模型,参数量超1万亿。该模型目前已登陆阿里百炼平台,且在通义千问应用及Qwen Chat上免费可用。

据百炼平台介绍,Qwen3-Max-Preview相较2.5系列整体通用能力有大幅度提升中英文通用文本理解能力、复杂指令遵循能力、主观开放任务能力、多语言能力、工具调用能力均显著增强;模型知识幻觉更少

就在昨日,Qwen官方X账号预告了即将推出Qwen3家族中最强大、最聪明的一员。今天,这一模型正式上线,其测评结果也随之公布。

据悉,Qwen3-Max-Preview在通用知识(SuperGPQA)、数学推理(AIME25)、编程(LiveCodeBench v6)、人类偏好对齐(Arena-Hard v2)以及综合性能力评估(LiveBench)评测中,超越了Claude-Opus 4(Non-Thinking),以及Kimi-K2、DeepSeek-V3.1和阿里此前的开源最佳Qwen3-235B-A22B-Instruct-2507。

在AI模型聚合平台OpenRoute上,Qwen3-Max的介绍提及:其在推理、指令执行、多语言支持长尾知识覆盖方面均有显著改进;同时在数学、编程、逻辑科学任务中提供了更高的准确率。该模型支持超过100种语言,具有更强大的翻译和常识推理能力,并针对检索增强生成 (RAG)工具调用进行了优化,但并未包含专门的“思考”模式

智东西第一时间在通义千问网页端上对Qwen3-Max-Preview进行了体验,发现模型在文本理解以及数学、编程能力上效果出色,且响应速度很快。

首先让Qwen3-Max-Preview生成一个小球碰撞模拟器,我们输入提示词:

“一个圆里面有两个小球,一个黑色,一个白色,白色的球随即位置自由下落,碰到边界会反弹,同时再生成一个随机位置的白色小球,黑色小球碰到边界会反弹,碰到白色的球会变大一点,请模拟一下。”

只见Qwen3-Max-Preview很快输出了这个程序,模拟出了两类球的运动过程,最终黑色球膨胀至把白球吞噬。

当我们把难度提升,让Qwen3-Max-Preview进行一个力量与速度种群模拟,并不断优化这个模拟器,发现Qwen3-Max-Preview能够实现快速而准确的模拟,能在几秒钟之内完成一个成熟程序员可能需要大半天才能完成的工作

我们输入提示词:“有两个种群,种群a注重力量的发展,种群b注重速度的发展,请模拟一下两个种群之间的相互作用并给出说明。

如下图所示,即便我给出的提示词非常模糊,Qwen3-Max-Preview依然理解到我的意思,并给出了较准确的模拟。

在上述模拟中,我发现速度型种群被干掉的太快了,于是进一步希望它们能够具备“逃跑”能力。我输入提示词:“注重速度的种群被干掉的太快了,他们每个个体都应该具备一定的躲避危险的能力。

而后,Qwen3-Max-Preview输出了以下“力量与速度种群模拟(增强版)”,准确模拟出了具有躲避危险能力的小球,出现“谁也干不掉谁”的状况。

只会逃跑不会反击,早晚还是被干掉。于是我要求速度型种群具有协作进攻能力,输入提示词:

当速度型种群团结起来的时候,可以可以干掉单个的力量型个体,请加上这个能力再模拟一下。

Qwen3-Max-Preview依然能够很好的实现,输出了“力量与速度种群模拟(协作版)”,模拟出小绿球有了协作能力后能抵御红球的能力,但双方态势依然很僵持。

随着模拟的进行,两边种群越来越少,于是我们进一步要求Qwen3-Max-Preview给它们繁衍的能力,输入提示词:

当它们双方干掉对方个体后,可以积累养分,繁衍自己,继续模拟。

于是,Qwen3-Max-Preview输出了“力量与速度种群模拟(资源与繁衍版)”,从模拟可以看到,两类球都自行开始裂变,在这种情况下,红球已经干不过绿球了。


于是,我又输入:

“发现力量型种群太弱了,它们根本抓不到对面,请给它们也提供团队协作的能力,可以围捕速度型选手。”

Qwen3-Max-Preview输出了“力量与速度种群模拟(双向协作版)”,小绿球和小红球分别形成抱团趋势,从而形成了两边“群殴围攻”的态势。


通过这个有趣的小实验我们发现,Qwen3-Max-Preview在提示词表意很模糊的情况下,也能够顺利理解到用户意图

尤其是“躲避危险”、“团结”、“协作”、“繁衍”等表述是比较抽象的,且对应的实际含义很复杂,实现起来涉及调节的参数很多,但Qwen3-Max-Preview都在几秒钟之内准确理解语义及背后的逻辑,并完成模拟实验的编程,体现其在复杂推理、指令执行、数学、编程等能力方面的出色能力

由百炼平台可知,在定价方面,Qwen3-Max-Preview支持256k上下文,根据输入token数采取阶梯计费

输入0-32k token价格:0.006元/千token输入,0.024元/千token输出。

输入32k-128k token价格:0.01元/千token输入,0.04元/千输出。

输入128k-252k token价格:0.015元/千token输入,0.06元/token输出。

对比Qwen-Max-0919的0.02元/千token输入、0.06元/千token输出的价格,Qwen3-Max-Preview的定价更有层次,性能更高但价格更加实惠。

体验地址:
https://chat.qwen.ai
阿里云百炼API服务:
https://bailian.console.aliyun.com/?tab=model#/model-market

结语:超大Qwen3模型,证明规模化扩展效果

模型层的突破正成为阿里AI转型的第一张王牌。在内部测试和早期用户测评中,Qwen3-Max-Preview表现出更广的知识面,更优秀的对话能力,在Agent任务与指令遵循等方面拥有更强劲的性能。

通义千问大模型开源闭源两手抓,已代表了中国大模型的技术新高度。Qwen3-Max-Preview刷新了阿里大模型参数新纪录,其试图用更加强悍的性能,证明规模化扩展的效果——更大的模型拥有更强的性能。

来源:百炼平台、X平台

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
连杀一家五口的范孟奇被执行死刑!被害人家属李克永远走不出悲痛

连杀一家五口的范孟奇被执行死刑!被害人家属李克永远走不出悲痛

细品名人
2026-05-09 06:38:17
81年彭真会见江青,江青大骂一句,彭真一脸淡定:你还有什么要求

81年彭真会见江青,江青大骂一句,彭真一脸淡定:你还有什么要求

大运河时空
2026-05-09 09:30:03
25岁刘浩存逆袭封神,张艺谋赌赢资源咖争议

25岁刘浩存逆袭封神,张艺谋赌赢资源咖争议

绚丽的画卷
2026-05-09 14:12:21
小巧核弹,你们用力感觉一下!

小巧核弹,你们用力感觉一下!

贵圈真乱
2026-05-09 11:01:30
奥迪高管炮轰友商:刷圈用特调车!换轮胎、改悬挂、单独写软件…

奥迪高管炮轰友商:刷圈用特调车!换轮胎、改悬挂、单独写软件…

柴狗夫斯基
2026-05-09 12:38:15
最新:莫斯科遭受大规模空袭!红场阅兵首次拉起防护网

最新:莫斯科遭受大规模空袭!红场阅兵首次拉起防护网

项鹏飞
2026-05-04 17:29:10
闪电式大清仓,李嘉诚又上演了一场教科书级的资本运作

闪电式大清仓,李嘉诚又上演了一场教科书级的资本运作

识局Insight
2026-05-08 19:25:55
因恶意退货太多,整条街道被商家“拉黑”!网友:还是低估了羊毛党...

因恶意退货太多,整条街道被商家“拉黑”!网友:还是低估了羊毛党...

品牌新
2026-05-09 09:25:01
同样“糊弄消费者”的套路,在国外直接挨捶了

同样“糊弄消费者”的套路,在国外直接挨捶了

走读新生
2026-05-09 11:21:16
无人机炸中俄空管中心:13座机场关闭,1.4万人滞留

无人机炸中俄空管中心:13座机场关闭,1.4万人滞留

桂系007
2026-05-08 22:04:29
闹大了!女孩首次登门男方家,被安排与男友同床,顾虑声誉要分房

闹大了!女孩首次登门男方家,被安排与男友同床,顾虑声誉要分房

火山詩话
2026-05-09 08:11:39
“汉坦病毒”来势汹汹,建议:每家备好6样东西,关键时刻能救命

“汉坦病毒”来势汹汹,建议:每家备好6样东西,关键时刻能救命

岐黄传人孙大夫
2026-05-09 09:08:44
现役交易价值最高的8位球员:詹杜库均落选,东契奇也只排第六!

现役交易价值最高的8位球员:詹杜库均落选,东契奇也只排第六!

你的篮球频道
2026-05-09 13:23:11
一枚纽扣,挖出潜伏在总参大院十年的国民党王牌特工

一枚纽扣,挖出潜伏在总参大院十年的国民党王牌特工

老范谈史
2026-05-08 02:36:29
市值仅戴尔的1/8,留给联想和杨元庆的时间不多了

市值仅戴尔的1/8,留给联想和杨元庆的时间不多了

新商业派
2026-05-08 15:04:19
梁文峰语出惊人:我雇你来,不是让你完成任务,而是让你创造价值

梁文峰语出惊人:我雇你来,不是让你完成任务,而是让你创造价值

荆楚寰宇文枢
2026-05-08 23:16:21
59:0!台地区军购案全员“零反对”通过,这场戏演得太假了!

59:0!台地区军购案全员“零反对”通过,这场戏演得太假了!

达文西看世界
2026-05-09 09:57:25
苦等13年!深圳巨无霸城中村旧改规划公示,周边房价要变天

苦等13年!深圳巨无霸城中村旧改规划公示,周边房价要变天

童童聊娱乐啊
2026-05-08 14:16:35
出货量暴跌35%,小米手机9年来首次跌出前五

出货量暴跌35%,小米手机9年来首次跌出前五

ZAKER新闻
2026-05-08 16:26:28
王楚钦3-2,王励勤全程紧张,没想到周启豪一个举动,让人暖心

王楚钦3-2,王励勤全程紧张,没想到周启豪一个举动,让人暖心

观察鉴娱
2026-05-09 11:03:54
2026-05-09 15:23:00
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11781文章数 117066关注度
往期回顾 全部

科技要闻

美国政府强力下场 苹果英特尔达成代工协议

头条要闻

恒大原总裁夏海钧豪宅被拍卖 年薪2亿被誉"打工皇帝"

头条要闻

恒大原总裁夏海钧豪宅被拍卖 年薪2亿被誉"打工皇帝"

体育要闻

成立128年后,这支升班马首夺顶级联赛冠军

娱乐要闻

50岁赵薇脸颊凹陷沧桑得认不出!

财经要闻

Meta疯狂拥抱人工智能:员工苦不堪言

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

健康
旅游
房产
公开课
军事航空

干细胞能让人“返老还童”吗

旅游要闻

5月15日至10月15日,东、西佘山园延长开放时间→

房产要闻

豪掷6.8亿拿地!何猷君大手笔投资三亚!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美伊突然再次交火 伊朗外长:战争准备程度是1000%

无障碍浏览 进入关怀版