网易首页 > 网易号 > 正文 申请入驻

中国开源模型首次在人工智能分析智能指数中超越所有谷歌模型

0
分享至



一个重要的里程碑悄然发生了。上周,北京智谱人工智能(Z.AI)发布的GLM-5.2在第三方权威基准"人工智能分析智能指数"(AI Analysis Intelligence Index)中拿下51分,超越谷歌Gemini 3.1 Pro Preview的46分。这是有史以来第一次,一个来自中国的开源模型在这一指数上越过了谷歌所有产品的得分上限。

5分的差距听起来不算惊天动地,但背景让这个数字变得非常不一样。

这个模型到底有多强



GLM-5.2是一个拥有7440亿参数的混合专家架构模型,但每次推理时只激活其中400亿个参数,这种"用多少激活多少"的设计是当前大型模型控制推理成本的主流路线。相比GLM-5.1,这一次的核心升级不在于规模,而在于一项名为IndexShare的训练优化:它让多个稀疏层共享同一套注意力索引,而不是每一步都重新计算,这在处理100万上下文标记的任务时,可以将每个标记的计算量减少近三倍。

上下文窗口从上一代的20万标记扩展至100万标记,这个数字对实际工程应用的意义相当直接。开发者处理大型代码库时,不再需要把项目拆成一段一段分批塞给模型,然后祈祷拼接输出时内容保持连贯。

编程能力的基准数据同样令人印象深刻。在SWE-bench Pro这项衡量代码工程能力的基准上,GLM-5.2得分62.1,超过GPT-5.5的58.6;在以小时为单位考察长期自主工程任务的FrontierSWE测试中,GLM-5.2得分74.4,仅略低于Claude Opus 4.8的75.1,同样领先于GPT-5.5的72.6。

Vercel首席执行官Guillermo Rauch在模型发布后称其为"改变一切"的产品,Answer.AI联合创始人Jeremy Howard则表示,GLM-5.2在细微理解、判断能力和长程上下文可靠性上,已经与Claude Opus 4.8和GPT-5.5处于同一竞技场。

真正值得关注的,是芯片这件事

GLM-5.2整个训练流程全部使用华为昇腾芯片完成,没有任何英伟达硬件参与其中。

这句话的分量,理解起来需要一点背景。过去几年,美国对华芯片出口管制持续升级,A100、H100、H800相继被列为限制出口对象,中国AI实验室被迫在算力受限的条件下寻找出路。外界对这一封锁的主流预判是:它会拖慢中国前沿模型的研发节奏。

GLM-5.2的出现,是对这一预判的一次直接反驳。昇腾910B在原始算力和互联带宽上确实与英伟达顶级产品存在差距,但Z.AI通过算法优化和训练策略弥补了部分硬件短板,最终用约2500万美元的训练成本,其中80%用于训练后处理,交出了这份成绩单。对于这一量级的前沿模型而言,这个成本数字相当克制。

MIT许可证意味着任何人都可以下载权重、商业使用,没有地域限制,也没有使用条款的灰色地带。通过OpenRouter等渠道调用GLM-5.2,每百万输入标记的价格约为1.40美元,而GPT-5.5和Claude Opus的同等价格均为5美元。性能相当,价格却只有三分之一不到,这对预算敏感的开发者和企业来说是相当有力的竞争优势。

谷歌在产品生态、部署规模和企业服务的整合深度上依然保持领先。但在开发者真正用来选择模型的那个维度,也就是单纯的智能表现,中国的开源模型已经走到了谷歌前面。这个排名今后还会变动,但历史第一次发生了,就是发生了。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美伊谈判“各说各话”:特朗普说伊朗在核查问题上做出让步,伊朗称120亿美元资金将执行解冻

美伊谈判“各说各话”:特朗普说伊朗在核查问题上做出让步,伊朗称120亿美元资金将执行解冻

华尔街见闻官方
2026-06-23 20:46:02
国台办回应郑丽文访美表态

国台办回应郑丽文访美表态

中国网
2026-06-24 13:52:23
空调“铝代铜”争议持续发酵 格力、松下、海尔三家立场清晰

空调“铝代铜”争议持续发酵 格力、松下、海尔三家立场清晰

鳌头财经
2026-06-23 17:41:39
603001:四天两板后停牌筹划收购,实控人质押率高达99%

603001:四天两板后停牌筹划收购,实控人质押率高达99%

大众证券报
2026-06-25 00:38:14
事态再升级!一句话蒸发3000万票房,韩红晚节不保,冯小刚遭牵连

事态再升级!一句话蒸发3000万票房,韩红晚节不保,冯小刚遭牵连

秋姐居
2026-06-23 19:28:52
演员张卫健:被父亲打到窒息,两度丧子后,他做出了最正确的决定

演员张卫健:被父亲打到窒息,两度丧子后,他做出了最正确的决定

飘飘然的娱乐汇
2026-06-24 09:05:09
独家对话“纸尿裤风波”第一爆料人王东鉴:如果我错了,道歉、赔偿甚至坐牢,都接受

独家对话“纸尿裤风波”第一爆料人王东鉴:如果我错了,道歉、赔偿甚至坐牢,都接受

每日经济新闻
2026-06-24 00:49:27
C罗进球找曼联铁闸庆祝原因曝光!天字第1号罗粉,爱队长胜过妻子

C罗进球找曼联铁闸庆祝原因曝光!天字第1号罗粉,爱队长胜过妻子

罗米的曼联博客
2026-06-24 09:46:34
世界杯诡局:赢球反陷地狱半区?小组第三或成最优解

世界杯诡局:赢球反陷地狱半区?小组第三或成最优解

星河漫山野
2026-06-24 01:32:56
郑钦文遭逆转无缘巴堡赛八强,新科法网冠军安德列娃被赐一轮游

郑钦文遭逆转无缘巴堡赛八强,新科法网冠军安德列娃被赐一轮游

网球之家
2026-06-24 22:21:27
2026高考450-560分,推荐报考这8所宝藏大学,就业极强!

2026高考450-560分,推荐报考这8所宝藏大学,就业极强!

高三倒计时
2026-06-23 18:18:49
"骗"了我们30年,韩红父亲竟是家喻户晓的他,难怪都不敢得罪她

"骗"了我们30年,韩红父亲竟是家喻户晓的他,难怪都不敢得罪她

探源历史
2026-06-04 09:50:59
俄媒女主持人曾言:若中国愿出兵300万,俄军很快就能打败乌克兰

俄媒女主持人曾言:若中国愿出兵300万,俄军很快就能打败乌克兰

南宗历史
2026-03-17 16:53:10
罗永浩曾痛批iPhone设计属于二流 苹果新CEO调转方向:将设计视为第一优先级

罗永浩曾痛批iPhone设计属于二流 苹果新CEO调转方向:将设计视为第一优先级

快科技
2026-06-22 23:04:05
向佐亲口认了:弟弟被父母封杀结不起婚,姐姐靠自己杀出一条路

向佐亲口认了:弟弟被父母封杀结不起婚,姐姐靠自己杀出一条路

手工制作阿歼
2026-06-25 00:31:59
最新:俄军夏季攻势被曝失败!乌克兰国产航弹首次出击

最新:俄军夏季攻势被曝失败!乌克兰国产航弹首次出击

项鹏飞
2026-06-24 21:07:41
国内50后还剩多少人?真实数据曝光,活到80岁的比例太意外!

国内50后还剩多少人?真实数据曝光,活到80岁的比例太意外!

华庭讲美食
2026-06-10 17:04:25
巴拉圭“胸神”16年后重返世界杯,靠火辣身材爆红,愿为赢球裸奔

巴拉圭“胸神”16年后重返世界杯,靠火辣身材爆红,愿为赢球裸奔

深析古今
2026-06-14 15:32:00
吸取俄罗斯血的教训,台海之战可能成为人类史上第一场零伤亡战争

吸取俄罗斯血的教训,台海之战可能成为人类史上第一场零伤亡战争

精彩一网打尽
2026-06-24 23:59:05
生肖猪:6月28号后家中有要事发生,家族人物不是你,是你家子女

生肖猪:6月28号后家中有要事发生,家族人物不是你,是你家子女

阿龙美食记
2026-06-23 08:28:44
2026-06-25 01:44:49
侃故事的阿庆
侃故事的阿庆
几分钟看完一部影视剧,诙谐幽默的娓娓道来
689文章数 8796关注度
往期回顾 全部

科技要闻

豆包专业版上线:定价68-500元每月

头条要闻

15岁男孩肥胖诱发糖尿病 抢救无效离世

头条要闻

15岁男孩肥胖诱发糖尿病 抢救无效离世

体育要闻

字母哥,会把凯尔特人拆了吗?

娱乐要闻

向佐向佑兄弟合体直播!母子终于和解

财经要闻

逃税23亿:审计署年报直指七家机构

汽车要闻

施鹏泽:为什么奥迪E7X强调座舱气味安全?

态度原创

房产
家居
旅游
教育
军事航空

房产要闻

白鹅潭新增优质宅地!沙涌地块对望太古里,容积率仅 2.14

家居要闻

绿意盎然 自然之境

旅游要闻

赤石河畔绿意浓,深汕小漠纯水岸公园建成开放

教育要闻

北京700分以上高分考生青睐哪些专业?刚刚出炉的官方数据告诉你

军事要闻

伊朗代表:霍尔木兹海峡已免费开放

无障碍浏览 进入关怀版