网易首页 > 网易号 > 正文 申请入驻

硅谷再次失眠!DeepSeek之后,中国大模型扔出又一枚“开源核弹”

0
分享至

当闭源巨头被迫关门,一个中国开源模型正在改写全球AI编程的权力版图。

一年前,DeepSeek R1让硅谷第一次感受到中国AI的冲击波。一年后的今天,历史正在重演。

2026年6月17日,智谱正式发布并开源新一代旗舰模型GLM-5.2。消息传出后,硅谷的线上讨论圈瞬间沸腾。面向开发者的云平台Vercel CEO吉列尔莫·劳奇在X上写道:“对于智谱GLM-5.2在编程方面的出色表现,我感到由衷的赞叹,几乎震惊。这将改变格局。”曾担任Meta、谷歌DeepMind和微软副总裁的马特·韦洛索更是直言:“这是第一款能当日常主力用的开源模型,行业格局要变了。”

这一次,不是因为“便宜”而刷屏——是因为真的强。

一、什么是“长程任务”?AI从“聊天”到“干活”的质变

GLM-5.2最核心的突破,不是一个参数数字,而是一个全新的能力维度——长程任务

过去的AI模型再强,本质上还是“即时问答”——你问一句,它答一句。但GLM-5.2被设计成能像人一样连续工作数小时、自主跑完一个完整的大型工程。

什么意思?用一句话描述需求,它就能自主完成从开发、联调、测试到打包上线的完整软件交付流程,几小时内交付一个网页、手机、小程序都能用的完整应用。过去,这样的工程往往需要一支团队干上数周。

智谱方面说得更直白:“当一个模型不知疲倦地在写软件工程代码,本质上是在学习一名顶级软件工程师的思维方式,然后以机器的耐力将其放大。这是对一个又一个职业的重新定义。”

支撑这一能力的是100万Token无损上下文。模型可稳定处理数百万字长文本、数百页复杂PDF或中大型软件项目完整代码库。在实际测试中,GLM-5.2在一轮连续任务中处理了88万以上token——几乎用满了百万级的上下文窗口。

这不再是“记忆力好”的问题——这是工程级可用的问题。

二、榜单“屠杀”:全球可用模型第一,逼近Opus 4.8

光说概念不够,数字不会骗人。

在大模型盲测平台竞技场(Arena.ai)的编程评估系统Code Arena上,GLM-5.2拿下1595分的高分,排名总榜第二,全球可用模型中排名第一

在专门评测模型“品味”的Design Arena上,GLM-5.2更是取得全球第一的表现。IT之家报道,GLM-5.2在Design Arena单轮HTML网页设计评测中,超过Claude Fable 5等模型,首次登顶总分第一。在91%的会话中使用TailwindCSS,能高效调用chart.js、three.js等第三方库。

在测评“超长程、开放式、高难度软件工程任务”的FrontierSWE基准中,GLM-5.2得分74.4,仅比Anthropic顶级模型Claude Opus 4.8的75.1低约1个百分点,同时超越GPT-5.5的72.6。在Terminal-Bench 2.1中得分81.0,较前代GLM-5.1的63.5大幅提升17.5个百分点

在Artificial Analysis综合榜单上,GLM-5.2取得51分,位列开源模型SOTA

一连串数字背后只有一个结论:开源模型第一次真正站到了闭源巨头的同一梯队

三、MIT开源+国产算力:技术平权不是口号

GLM-5.2的另一重震撼在于它的“开放姿态”。

模型以最宽松的MIT协议开源,允许自由下载、部署与商用。已上线Hugging Face与ModelScope。智谱在声明中写道:“前沿智能不应只属于少数人,也不应被少数规则随时收回。它应该开放、可用、可构建,并服务于每一位开发者。”

这句话的背景极具针对性——GLM-5.2发布的时间点,恰好紧邻Anthropic因美国出口管制暂停Claude Fable 5与Mythos 5全球服务之后。一边是闭源巨头被迫“关门”,一边是开源模型主动“开门”——这个对照本身就构成了一部AI行业当下的寓言。

更值得关注的是,GLM-5.2的训练与线上推理均未依赖海外算力。Day 0即完成与华为昇腾、平头哥、摩尔线程、寒武纪、昆仑芯、沐曦、海光、壁仞等全部主流国产算力平台的推理适配。据透露,下半年昇腾950超节点上市后,也将成为GLM-5.2强劲的算力底座。

在海外最强模型转向封闭、开源替代需求上升的背景下,这一 “开源国模+国产算力”的组合正受到全行业关注。

四、“新御三家”格局:谷歌被挤出去了

这场发布最标志性的意义在于——全球AI编程的权力格局正在被重写。

在AI编程模型领域,此前公认的全球头部玩家长期只有Anthropic(Claude系列)和OpenAI(GPT系列)。此次,GLM-5.2通过全球可用编程模型第一的榜单成绩和开发者“Opus平替”的真实口碑,正在跻身这一顶级俱乐部。

一个由Anthropic、OpenAI、智谱构成的“Coding御三家”格局正在成形。

要知道,此前提到AI界的“御三家”,大概率指向的是Claude、OpenAI和谷歌。但这一次,谷歌的Gemini实实在在地被GLM淘汰掉了

有开发者直言:“这是国内第一款在我工作流上达到Opus级的模型。”海外用户也反馈,GLM-5.2的表现超出预期,与Fable 5的差距比预期中要小得多。如今Fable 5已无法正常使用,海外网友原本以为它的封禁会拉开差距,没想到GLM已经快追上来了。

知乎上,有用户打趣道:以后通过中转站用Opus的用户得面对一个新问题——如果Opus是GLM-5.2冒充的,那用户可能真的分辨不出来。

Zero君深度见解

在梳理完GLM-5.2的全部信息之后,有三个超越榜单分数的判断,值得每一位关注AI产业的人深思。

第一,长程任务是一个比“代码能力”更可怕的赛道切换。

当所有人还在比“谁能写出更漂亮的代码”时,智谱已经把战场迁移到了“谁能独立跑完一个完整工程”。这就像从比“谁会打字”到比“谁能写出一本书”——维度完全不同。GLM-5.2主攻的“长程任务”,本质上是让AI从“工具”变成“协作者”甚至“执行者”。智谱下一步的目标更值得关注——完全自治的智能体系统(Autonomous Agent System),让AI能够7×24小时运转,实现“自动驾驶”级别的数字生产力。从“回答问题”到“完成任务”再到“自主决策”——这条进化链一旦走通,被重构的将不只是编程这个工种。

第二,MIT开源+国产算力,是一套完整的“地缘政治防御工事”。

GLM-5.2最聪明的地方,不是技术本身,而是它构建了一套几乎无法被“卡脖子”的完整闭环:模型开源(不怕被封)、训练未依赖海外算力(不怕被断)、推理适配全部国产平台(不怕被锁)。在Fable 5因出口管制被迫关停的同一周发布这样一款模型,时机和意图都极其精准。这不是巧合,这是战略。

第三,最值得关注的不是“追上Opus”,而是“定价比Opus低80%”。

GLM-5.2每百万tokens的推理价格为1.40/4.40美元,远低于Fable 5的10/50美元。比Opus 4.8低约72%至82%。当一个开源模型在性能上逼近闭源顶级模型、在价格上却只有对方的五分之一时,商业模式的冲击是结构性的。国内开源模型的性能追赶,正在削弱海外闭源模型的定价权和可替代性优势。换句话说——闭源巨头的高溢价时代,可能比所有人预想的都要短。

回到那个让硅谷失眠的问题:中国AI什么时候能追上美国?

特斯拉CEO埃隆·马斯克上周在X上被问及此事时,给出的预测是“可能在2027年一季度”。智谱创始人唐杰很快回应:“不需要那么久。”

GLM-5.2的出现,或许就是那个让“不需要那么久”变得可信的证据。

从DeepSeek到GLM-5.2,中国开源模型正在走出一条与闭源巨头截然不同的路径——不拼算力堆砌、不拼参数军备,而是拼工程化落地、拼开放生态、拼性价比。这条路能不能走到AGI的终点?没有人知道答案。

但至少,硅谷已经无法假装看不见了。

One more thing:

Zero君想问各位读者——你认为GLM-5.2能否真正撼动Claude和GPT在编程领域的统治地位?开源模型 vs 闭源模型,你更看好哪条路线?欢迎在评论区互动讨论。如果你想持续关注AI大模型的最新动态与深度解读,欢迎关注Zero君,一起洞察未来。

本文信息来源:

  1. 1. 智谱AI官方发布GLM-5.2上线公告(2026年6月17日)
  2. 2. Code Arena、Design Arena、FrontierSWE、Terminal-Bench等第三方基准测试公开数据
  3. 3. Artificial Analysis综合榜单及开源模型SOTA排名
  4. 4. 36氪《一手实测智谱最强模型,AI编程“御三家”要成型了?》(2026年6月17日)
  5. 5. 科技日报《智谱GLM-5.2上线并开源》(2026年6月17日)
  6. 6. 央广网《智谱上线并开源新一代旗舰大模型GLM-5.2》(2026年6月17日)
  7. 7. IT之家《超越Claude Fable 5:智谱GLM 5.2登顶Design Arena》(2026年6月20日)
  8. 8. 量子位《刚刚,Fable-5之下,智谱开源的GLM-5.2拿下AI编程第一!》(2026年6月17日)
  9. 9. 中国日报《智谱开源新一代大模型GLM-5.2 跻身全球模型前三》(2026年6月17日)
  10. 10. 凤凰网科技《DeepSeek之后,中国又一开源AI模型引发硅谷热议》(2026年6月22日)
  11. 11. 华尔街见闻《当Fable 5全球下架,GLM 5.2逼近Opus 4.8“意义重大”》(2026年6月17日)
  12. 12. 北京商报《万亿智谱领衔 国产大模型集体跨坎》(2026年6月23日)

本文由Zero君基于公开资料整理分析,个人见解部分仅供参考。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
直线拉升!603078,“地天板”!

直线拉升!603078,“地天板”!

证券时报
2026-07-02 14:33:30
我给局长开了3年车,并娶了他的地下情人,新婚夜我才知道赚大了

我给局长开了3年车,并娶了他的地下情人,新婚夜我才知道赚大了

千秋文化
2026-06-26 20:00:22
海外博主:利兹联已与铃木彩艳就个人条款达成一致,合同5年

海外博主:利兹联已与铃木彩艳就个人条款达成一致,合同5年

懂球帝
2026-07-02 08:13:18
世界杯:葡萄牙vs克罗地亚

世界杯:葡萄牙vs克罗地亚

足球赛事交流解析
2026-07-02 10:00:06
霍华德嘲讽波黑:我觉得他们甚至不用上飞机,因为反正会输美国

霍华德嘲讽波黑:我觉得他们甚至不用上飞机,因为反正会输美国

懂球帝
2026-07-02 01:53:03
艺人疑似高铁车厢脱鞋被拍 业内人士:脱鞋不违规,但违背文明乘车倡议

艺人疑似高铁车厢脱鞋被拍 业内人士:脱鞋不违规,但违背文明乘车倡议

封面新闻
2026-07-01 21:52:25
大龄剩女定下择偶标准,后来发现,全安徽省能嫁的只有李鸿章一人

大龄剩女定下择偶标准,后来发现,全安徽省能嫁的只有李鸿章一人

云霄纪史观
2026-07-01 01:02:56
美军前参谋长严厉警告:若敢打白俄罗斯,30天内泽连斯基必投降

美军前参谋长严厉警告:若敢打白俄罗斯,30天内泽连斯基必投降

云上乌托邦
2026-06-30 23:24:46
客户反映空调不凉快,师傅上门傻眼了:老人怕淋坏外机,竟将其裹了个严严实实,安装维修空调10年了第一次见

客户反映空调不凉快,师傅上门傻眼了:老人怕淋坏外机,竟将其裹了个严严实实,安装维修空调10年了第一次见

天津人
2026-07-01 22:25:53
老牌感冒药“白加黑”停产?厂家称还在生产,去年全国医院销量腰斩

老牌感冒药“白加黑”停产?厂家称还在生产,去年全国医院销量腰斩

红星新闻
2026-07-02 15:07:10
至少4次攻击太空通讯中心!俄版“星链”将取得突破,全力阻止?

至少4次攻击太空通讯中心!俄版“星链”将取得突破,全力阻止?

鹰眼Defence
2026-07-02 17:05:49
一旦取消京牌限购,十几年的车牌泡沫或将瞬间彻底崩盘

一旦取消京牌限购,十几年的车牌泡沫或将瞬间彻底崩盘

沙雕小琳琳
2026-07-02 14:28:11
桃李做快餐、鲍师傅卖西餐,倒闭9万家后,面包房的尽头是饭店?

桃李做快餐、鲍师傅卖西餐,倒闭9万家后,面包房的尽头是饭店?

蓝鲸新闻
2026-07-01 09:45:46
1576. 东方“野鼬鼠”成长记:浅谈中国空军防空压制(SEAD)作战发展之路(上)

1576. 东方“野鼬鼠”成长记:浅谈中国空军防空压制(SEAD)作战发展之路(上)

燃烧的岛群
2026-07-02 09:11:56
公元前36年,穷书生私自伪造圣旨调集四万兵马,奔袭三千里灭一国

公元前36年,穷书生私自伪造圣旨调集四万兵马,奔袭三千里灭一国

磊子讲史
2026-06-12 18:27:28
警惕:上了年纪再过性生活,最怕这2点!保护男性精气,做好4点

警惕:上了年纪再过性生活,最怕这2点!保护男性精气,做好4点

健康之光
2026-07-02 19:40:04
香港TVB“御用恶女”离世,享年81岁,曾出演《精装追女仔》《富贵逼人》等

香港TVB“御用恶女”离世,享年81岁,曾出演《精装追女仔》《富贵逼人》等

情感大头说说
2026-07-02 18:22:42
凯斯勒先签后换交易评级:爵士A+ 湖人C-

凯斯勒先签后换交易评级:爵士A+ 湖人C-

北青网-北京青年报
2026-07-02 19:46:05
不联系不等于不在意:男女一旦有过肌肤之亲,此生心底便终生上锁

不联系不等于不在意:男女一旦有过肌肤之亲,此生心底便终生上锁

加油丁小文
2026-06-15 10:00:25
伊拉克女议员家被曝搜出“黄金内衣”和5700万美元

伊拉克女议员家被曝搜出“黄金内衣”和5700万美元

桂系007
2026-07-02 09:08:45
2026-07-02 20:59:00
侃故事的阿庆
侃故事的阿庆
几分钟看完一部影视剧,诙谐幽默的娓娓道来
857文章数 8871关注度
往期回顾 全部

科技要闻

马斯克不承认,但SpaceX就该造AI手机

头条要闻

售价超30万小鹏新车仅200公里爆胎 4S店给的说法反复

头条要闻

售价超30万小鹏新车仅200公里爆胎 4S店给的说法反复

体育要闻

韩国人,为什么恨透了洪明甫?

娱乐要闻

众星祝福祖国,曾沛慈原形毕露?

财经要闻

千亿茶市场无赢家:澜沧巨亏 八马停"蹄"

汽车要闻

小鹏MONA L03 智能化水平拉满 还有玩法多样的巧思大空间

态度原创

亲子
本地
艺术
房产
公开课

亲子要闻

分年龄段选购儿童被子指南:不同成长阶段核心需求与选型方向梳理

本地新闻

这场穿越酉阳的光影之旅,张张都是壁纸!

艺术要闻

冉茂芹人物写生 17幅

房产要闻

稀缺预警!海岸线200米+限墅令下,海南「绝版硬通货」来了!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版