网易首页 > 网易号 > 正文 申请入驻

实测阿里万亿参数大模型:开源路线跑通了吗?

0
分享至

文 | 划重点KeyPoints

划重点:

1、阿里发布史上最大模型,参数量超过1万亿,编程能力直接反超Claude,证明Scaling Law依旧在奏效。 2、阿里“模+云”的策略形成了从技术研发到商业化落地的最短路径,是Qwen能够取得后来者居上成绩的关键之一。 3、阿里开源模式的核心挑战在于如何平衡开放与收益。Qwen未来不仅需要在技术上持续突破,更需要在商业模式和组织能力上证明自己。

昨天Anthropic刚玩了一手“极端措施”,阿里深夜一波大的直接反手一记重拳——推出其史上最大的模型,Qwen3-Max-Preview,参数量足足超1万亿!


用“通义大模型”微信公众号官方的标题来形容它的能力,就是“强得不止一点”。

因为从基准测试结果来看,Qwen3-Max-Preview已经超越了此前自家的Qwen3-235B-A22B-2507。

并且官方还放出了与Kimi K2、Claude Opus 4(Non-thinking),以及DeepSeek-V3.1的对比结果。

从下面的表格中不难看出,Qwen3-Max-Preview已经在SuperGPQA、AIME2025、LiveCodeBench V6、Arena-Hard V2和LiveBench等基准测试中,均超越了其它选手。


尤其是在编程能力方面,此前Claude默认是业内最强,这次Qwen3-Max-Preview直接以大力出奇迹的方式实现了反超,也是让一众网友惊叹不已。


Qwen在X上的推文中似乎也是一语道破“玄机”:Scaling works(规模化扩展是有效的)。

01 实测阿里史上最大模型

目前,Qwen3-Max-Preview已经可以体验,只需在模型下拉选项中选择即可:


体验地址:https://chat.qwen.ai

并且官方的API服务也已经开放:https://bailian.console.aliyun.com/?tab=model#/model-market(搜索Qwen3-Max-Preview)。

在实际效果方面,已经有不少国内外的网友们展开了实测;例如X上的知名博主AK,他就在HuggingFace集成了Qwen3-Max-Preview的项目AnyCoder中,输入了这样的Prompt:

Design and create a very creative, elaborate, and detailed voxel art scene of a pagoda in a beautiful garden with trees, including some cherry blossoms. Make the scene impressive and varied and use colorful voxels. Use whatever libraries to get this done.

然后,据AK的描述,Qwen3-Max-Preview一次性就实现了如下的效果:


当我们在官网中输入这样的Prompt:

Create a beautiful celebratory landing page for the launch of Qwen3 Max.

只需短短几秒钟的时间,Qwen3-Max-Preview就生成了一个完整的庆祝页面,响应速度实测是非常快的:


接下来,我们加大难度,直接上经典的编程问题——弹跳球模拟碰撞。

先小试牛刀一个:

Write a javascript code that shows a ball bouncing inside a spinning hexagon. The ball should be affected by gravity and friction, and it must bounce off the rotating walls realistically, implement it in javascript and html.


可以看到,小球会基于物理规律在六边形的框内运行;并且在用“向上键”去给小球一个力时,它也能立即做出响应。

当我们把球的数量设置到10个,一次性生成的效果也是相当自然:


最后,我们再让Qwen3-Max-Preview生成一个小游戏:

做一个《愤怒的小鸟》的小游戏。



不过虽然是一次性生成成功,但或许因为Prompt过于简单,这个小游戏还是有一些小瑕疵,例如怪物的位置不是很准确;感兴趣的小伙伴可以多次尝试一下。

02 Qwen凭什么后来者居上?

从这次阿里直接从千亿参数模型飙升到万亿规模(近四倍提升),并且一举在众多评测中拿下第一来看,Qwen已然在全球范围内站稳了第一梯队的位置。

但有一说一,纵观整场AI大模型的竞赛,阿里并不是最早在中国推出对标ChatGPT产品的公司,但绝对属于后来者居上的那一个。

相较于国内先行者(如百度),阿里大模型初期可以说是相对低调,不过它的路径却是格外的清晰——用模型开源来构建生态,用自研闭源探索技术前沿。

例如在开源这件事上,从2023年开始,Qwen就以惊人的速度向全球开发者开源多个版本模型。从70亿参数的Qwen-7B到140亿、720亿参数,再到视觉、音频等多模态模型,几乎覆盖所有主流尺寸和应用场景。更关键的是,阿里不仅开源模型权重,还开放商业化授权,极大激发了中小企业和个人开发者的热情。

这一系列动作让它迅速在Hugging Face等全球顶级开源社区建立广泛影响力,吸引了大量开发者围绕Qwen生态创新开发,形成强大社区驱动力。这种广积粮的策略为通义千问赢得了宝贵的开发者心智和应用场景数据,这可以说是闭源模型难以企及的优势。

但在开源之外,阿里内部也从没有停止对模型能力上限的探索。正如官方发布万亿参数模型时所言,Scaling works(规模化扩展有效)。这背后是对Scaling Law的一种笃信——随着模型参数、数据量和计算量指数级增长,模型能力会涌现质的飞跃。

训练Qwen3 Max Preview这样的万亿参数模型,不仅是资源堆砌,更要求在超大规模计算集群稳定性、分布式训练算法效率、数据处理精细度以及工程优化的每个细节上都做到极致。

这背后是阿里数年来在算力基础设施上的巨大投入,以及在AI工程化领域的深厚积累。正是这种大力出奇迹式的饱和投入,让Qwen在编程、推理等核心能力上实现了对Claude Opus等顶级模型的反超。

在开源模型和能力探索之外,阿里云,也是Qwen能够后来者居上的关键一环。

毕竟大模型训练推理是名副其实的算力吞金兽,阿里云为Qwen研发提供了稳定高效的算力基础设施,整合了从数据标注、模型开发、分布式训练到部署推理的全链路工具,极大降低了研发团队工程负担,使其专注算法和模型创新。

并且在模型的应用和普及方面,同样是因为阿里云的MaaS战略,可以让Qwen快速在各行各业中深耕;例如企业客户无需从零训练模型,可直接在阿里云调用Qwen API,或利用平台工具对开源Qwen模型微调,快速构建AI应用。

这种“模+云”的策略形成了从技术研发到商业化落地的最短路径。

03 但也并非完美

虽然阿里在大模型发展的战略和选择促成了它后来者居上的优势,但这并不意味着现阶段的Qwen没有隐患。

因为阿里选择的开源模型引流、云服务变现可以说是一条机遇与挑战并存的道路;它与Meta的Llama系列相似,目标通过开放生态快速抢占市场份额和开发者心智,最终将商业价值导向自家基础设施。

这与OpenAI、Anthropic等闭源+API的精英路线形成鲜明对比,它们优势在于更好保护核心技术,维持技术代差,通过高价值API服务直接获得高额利润。

而阿里开源策略虽能快速普及技术,但这也意味着其最先进模型很难与竞争对手拉开绝对差距,商业模式也更加迂回,需要客户首先认可其云平台价值。

开源模式的核心挑战在于如何平衡开放与收益,当企业可以免费获取并私有化部署性能足够好的开源模型时,他们为官方云服务付费的意愿又会有多强呢?

换言之,阿里云不仅要提供简单模型托管,还必须提供远超开源版本的性能优化、安全保障、以及强大工具链和企业级服务,才能构建足够深的护城河。如何让庞大开源用户群体有效转化为高价值付费云客户,是这条道路上最关键的商业惊险一跃。

除了商业化的挑战之外,在顶尖AI人才争夺进入白热化的今天,任何核心人才流失都可能对团队造成深远影响。

近年来,包括AI框架和基础设施领域关键人物贾扬清在内的一些核心技术人才先后离开阿里,投身创业浪潮或加入其他巨头。虽然对于阿里这样体量的公司而言,个别人员离开未必动摇根基,但负面影响依然存在。

毕竟核心领军人物离开可能影响团队士气,对外传递负面信号,增加后续吸引顶尖人才的难度;在关键技术方向上,领军人物的变动还可能给项目长期战略延续性带来不确定性。

也正像Meta在硅谷持续上演的抢人大战,离开的人才往往成为新竞争对手,他们对原有体系优劣势了如指掌,可能在细分领域构成更精准威胁。

因此,阿里如何在高强度竞争下持续保持对全球顶尖AI人才的吸引力,并建立稳定可持续的人才梯队,是它在未来发展过程中必须面对的严肃课题。

结语

总体来看,阿里通义千问无疑是中国乃至全球大模型领域的顶级力量。它凭借“开源与自研并行”的清晰战略、依托阿里云的强大生态、以及深厚技术人才积累,成功在激烈竞争中占据领先地位。万亿参数模型的发布更是彰显了其在Scaling Law上的决心和实力。

然而,成功之路也伴随着清晰挑战。以开源换生态的商业模式,其盈利能力的持续性仍需市场检验;与OpenAI等闭源巨头的技术代差追逐将是长期过程;而顶级人才的保留与吸引,则是维持创新活力的生命线。

Qwen在未来不仅需要在技术上持续突破,更需要在商业模式和组织能力上证明自己的独特价值。它能否将今天的技术优势转化为明天不可动摇的市场胜势,将是整个行业、包括资本市场关注的焦点。这也是阿里未来市值能否更上一层楼的关键。

1、https://x.com/Alibaba_Qwen/status/1963991502440562976

2、https://chat.qwen.ai/

3、https://x.com/_akhaliq/status/1964001592710975971

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
王一博綦美合的“宝宝巴士”!

王一博綦美合的“宝宝巴士”!

八卦疯叔
2026-03-01 11:10:15
新一轮导弹向以色列发射

新一轮导弹向以色列发射

财联社
2026-02-28 16:30:07
无锡二院!你要火了!

无锡二院!你要火了!

无锡eTV全媒体
2026-03-01 11:46:51
17岁嫁56岁将军,新婚夜扬言"绝不生孩子",却8年怀孕16次

17岁嫁56岁将军,新婚夜扬言"绝不生孩子",却8年怀孕16次

小莜读史
2026-02-27 20:10:59
日本能源面临“灭绝”?高市意外批下16亿资金,普京连夜转变枪口

日本能源面临“灭绝”?高市意外批下16亿资金,普京连夜转变枪口

知法而形
2026-03-01 10:02:37
绞杀开始!荷兰科技专家:当初中国囤的1000台ASML光刻机,起作用了

绞杀开始!荷兰科技专家:当初中国囤的1000台ASML光刻机,起作用了

刘旷
2026-02-28 15:48:42
锡安11分钟右脚踝扭伤退赛:已连续出战35场 创生涯最长纪录

锡安11分钟右脚踝扭伤退赛:已连续出战35场 创生涯最长纪录

醉卧浮生
2026-03-01 12:31:39
绝不妥协!中日大战争议判罚引众怒,裁判身份曝光,篮协该发声

绝不妥协!中日大战争议判罚引众怒,裁判身份曝光,篮协该发声

现代小青青慕慕
2026-03-01 14:02:19
富士康“赌输”了!郭台铭做梦也没有想到,“制裁”会来的这么快

富士康“赌输”了!郭台铭做梦也没有想到,“制裁”会来的这么快

混沌录
2025-08-22 18:23:58
伊朗称重创美军舰!安理会应中俄要求紧急开会!联合国秘书长发表声明

伊朗称重创美军舰!安理会应中俄要求紧急开会!联合国秘书长发表声明

每日经济新闻
2026-02-28 23:06:38
72万个充电桩,年入40亿,常州夫妇边赚钱边收割,如今要上市了

72万个充电桩,年入40亿,常州夫妇边赚钱边收割,如今要上市了

毒sir财经
2026-02-22 10:38:14
油价暴涨背后的杀招!美军重兵围堵伊朗:真实目标是拖中国下水?

油价暴涨背后的杀招!美军重兵围堵伊朗:真实目标是拖中国下水?

近史阁
2026-02-28 22:16:52
刚抢走中企百亿港口 巴拿马便遭强力反制:运河收入每天暴跌83.6万

刚抢走中企百亿港口 巴拿马便遭强力反制:运河收入每天暴跌83.6万

户外钓鱼哥阿旱
2026-02-28 21:03:29
小插曲,申花主帅斯卢茨基现场观战超级杯入场过闸机时遇阻

小插曲,申花主帅斯卢茨基现场观战超级杯入场过闸机时遇阻

懂球帝
2026-03-01 15:50:08
逃离三亚大溃败!一万四天价机票逼疯打工人,中产游客已穷哭

逃离三亚大溃败!一万四天价机票逼疯打工人,中产游客已穷哭

烈史
2026-02-26 14:51:59
身材高挑丰满的成熟女性这样打扮既显身材又有女人味

身材高挑丰满的成熟女性这样打扮既显身材又有女人味

美女穿搭分享
2026-02-21 17:44:34
哈梅内伊遇害,伊朗会怎么报复?

哈梅内伊遇害,伊朗会怎么报复?

红星新闻
2026-03-01 11:51:17
李泽楷:虽然我活成了李嘉诚,但绝不会让梁洛施成为下一个庄月明

李泽楷:虽然我活成了李嘉诚,但绝不会让梁洛施成为下一个庄月明

青途历史
2026-01-13 15:21:32
如果中国美国开起战争,第二天全世界就发现,美国不再是超级大国

如果中国美国开起战争,第二天全世界就发现,美国不再是超级大国

徐醇老表哥
2026-01-27 16:26:32
村支书禹作敏:想当副总理,只接待正部级,93年400警察不敢进村

村支书禹作敏:想当副总理,只接待正部级,93年400警察不敢进村

顾史
2026-02-28 22:04:07
2026-03-01 17:35:00
钛媒体APP incentive-icons
钛媒体APP
独立财经科技媒体
130065文章数 861838关注度
往期回顾 全部

科技要闻

小米超跑概念车全球首秀!杀入顶豪俱乐部

头条要闻

哈梅内伊"回归天国" 美以如何确认其行踪引发内鬼猜测

头条要闻

哈梅内伊"回归天国" 美以如何确认其行踪引发内鬼猜测

体育要闻

火箭输给热火:乌度卡又输斯波教练

娱乐要闻

《江山为聘》:吴谨言陈哲远燃炸朝堂

财经要闻

中东局势升级 如何影响A股、黄金和原油

汽车要闻

理想汽车2月交付26421辆 历史累计交付超159万辆

态度原创

本地
房产
手机
旅游
公开课

本地新闻

津南好·四时总相宜

房产要闻

滨江九小也来了!集齐海侨北+哈罗、寰岛...江东教育要炸了!

手机要闻

小米卢伟冰官宣明日直播

旅游要闻

解锁新春错峰游新玩法!深圳锦绣中华开启元宵特别活动

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版