硅谷再次失眠！DeepSeek之后，中国大模型扔出又一枚“开源核弹”|编程|新系统|deepseek

硅谷再次失眠！DeepSeek之后，中国大模型扔出又一枚“开源核弹”

分享至

当闭源巨头被迫关门，一个中国开源模型正在改写全球AI编程的权力版图。

一年前，DeepSeek R1让硅谷第一次感受到中国AI的冲击波。一年后的今天，历史正在重演。

2026年6月17日，智谱正式发布并开源新一代旗舰模型GLM-5.2。消息传出后，硅谷的线上讨论圈瞬间沸腾。面向开发者的云平台Vercel CEO吉列尔莫·劳奇在X上写道：“对于智谱GLM-5.2在编程方面的出色表现，我感到由衷的赞叹，几乎震惊。这将改变格局。”曾担任Meta、谷歌DeepMind和微软副总裁的马特·韦洛索更是直言：“这是第一款能当日常主力用的开源模型，行业格局要变了。”

这一次，不是因为“便宜”而刷屏——是因为真的强。

一、什么是“长程任务”？AI从“聊天”到“干活”的质变

GLM-5.2最核心的突破，不是一个参数数字，而是一个全新的能力维度——长程任务。

过去的AI模型再强，本质上还是“即时问答”——你问一句，它答一句。但GLM-5.2被设计成能像人一样连续工作数小时、自主跑完一个完整的大型工程。

什么意思？用一句话描述需求，它就能自主完成从开发、联调、测试到打包上线的完整软件交付流程，几小时内交付一个网页、手机、小程序都能用的完整应用。过去，这样的工程往往需要一支团队干上数周。

智谱方面说得更直白：“当一个模型不知疲倦地在写软件工程代码，本质上是在学习一名顶级软件工程师的思维方式，然后以机器的耐力将其放大。这是对一个又一个职业的重新定义。”

支撑这一能力的是100万Token无损上下文。模型可稳定处理数百万字长文本、数百页复杂PDF或中大型软件项目完整代码库。在实际测试中，GLM-5.2在一轮连续任务中处理了88万以上token——几乎用满了百万级的上下文窗口。

这不再是“记忆力好”的问题——这是工程级可用的问题。

二、榜单“屠杀”：全球可用模型第一，逼近Opus 4.8

光说概念不够，数字不会骗人。

在大模型盲测平台竞技场（Arena.ai）的编程评估系统Code Arena上，GLM-5.2拿下1595分的高分，排名总榜第二，全球可用模型中排名第一。

在专门评测模型“品味”的Design Arena上，GLM-5.2更是取得全球第一的表现。IT之家报道，GLM-5.2在Design Arena单轮HTML网页设计评测中，超过Claude Fable 5等模型，首次登顶总分第一。在91%的会话中使用TailwindCSS，能高效调用chart.js、three.js等第三方库。

在测评“超长程、开放式、高难度软件工程任务”的FrontierSWE基准中，GLM-5.2得分74.4，仅比Anthropic顶级模型Claude Opus 4.8的75.1低约1个百分点，同时超越GPT-5.5的72.6。在Terminal-Bench 2.1中得分81.0，较前代GLM-5.1的63.5大幅提升17.5个百分点。

在Artificial Analysis综合榜单上，GLM-5.2取得51分，位列开源模型SOTA。

一连串数字背后只有一个结论：开源模型第一次真正站到了闭源巨头的同一梯队。

三、MIT开源+国产算力：技术平权不是口号

GLM-5.2的另一重震撼在于它的“开放姿态”。

模型以最宽松的MIT协议开源，允许自由下载、部署与商用。已上线Hugging Face与ModelScope。智谱在声明中写道：“前沿智能不应只属于少数人，也不应被少数规则随时收回。它应该开放、可用、可构建，并服务于每一位开发者。”

这句话的背景极具针对性——GLM-5.2发布的时间点，恰好紧邻Anthropic因美国出口管制暂停Claude Fable 5与Mythos 5全球服务之后。一边是闭源巨头被迫“关门”，一边是开源模型主动“开门”——这个对照本身就构成了一部AI行业当下的寓言。

更值得关注的是，GLM-5.2的训练与线上推理均未依赖海外算力。Day 0即完成与华为昇腾、平头哥、摩尔线程、寒武纪、昆仑芯、沐曦、海光、壁仞等全部主流国产算力平台的推理适配。据透露，下半年昇腾950超节点上市后，也将成为GLM-5.2强劲的算力底座。

在海外最强模型转向封闭、开源替代需求上升的背景下，这一 “开源国模+国产算力”的组合正受到全行业关注。

四、“新御三家”格局：谷歌被挤出去了

这场发布最标志性的意义在于——全球AI编程的权力格局正在被重写。

在AI编程模型领域，此前公认的全球头部玩家长期只有Anthropic（Claude系列）和OpenAI（GPT系列）。此次，GLM-5.2通过全球可用编程模型第一的榜单成绩和开发者“Opus平替”的真实口碑，正在跻身这一顶级俱乐部。

一个由Anthropic、OpenAI、智谱构成的“Coding御三家”格局正在成形。

要知道，此前提到AI界的“御三家”，大概率指向的是Claude、OpenAI和谷歌。但这一次，谷歌的Gemini实实在在地被GLM淘汰掉了。

有开发者直言：“这是国内第一款在我工作流上达到Opus级的模型。”海外用户也反馈，GLM-5.2的表现超出预期，与Fable 5的差距比预期中要小得多。如今Fable 5已无法正常使用，海外网友原本以为它的封禁会拉开差距，没想到GLM已经快追上来了。

知乎上，有用户打趣道：以后通过中转站用Opus的用户得面对一个新问题——如果Opus是GLM-5.2冒充的，那用户可能真的分辨不出来。

Zero君深度见解

在梳理完GLM-5.2的全部信息之后，有三个超越榜单分数的判断，值得每一位关注AI产业的人深思。

第一，长程任务是一个比“代码能力”更可怕的赛道切换。

当所有人还在比“谁能写出更漂亮的代码”时，智谱已经把战场迁移到了“谁能独立跑完一个完整工程”。这就像从比“谁会打字”到比“谁能写出一本书”——维度完全不同。GLM-5.2主攻的“长程任务”，本质上是让AI从“工具”变成“协作者”甚至“执行者”。智谱下一步的目标更值得关注——完全自治的智能体系统（Autonomous Agent System），让AI能够7×24小时运转，实现“自动驾驶”级别的数字生产力。从“回答问题”到“完成任务”再到“自主决策”——这条进化链一旦走通，被重构的将不只是编程这个工种。

第二，MIT开源+国产算力，是一套完整的“地缘政治防御工事”。

GLM-5.2最聪明的地方，不是技术本身，而是它构建了一套几乎无法被“卡脖子”的完整闭环：模型开源（不怕被封）、训练未依赖海外算力（不怕被断）、推理适配全部国产平台（不怕被锁）。在Fable 5因出口管制被迫关停的同一周发布这样一款模型，时机和意图都极其精准。这不是巧合，这是战略。

第三，最值得关注的不是“追上Opus”，而是“定价比Opus低80%”。

GLM-5.2每百万tokens的推理价格为1.40/4.40美元，远低于Fable 5的10/50美元。比Opus 4.8低约72%至82%。当一个开源模型在性能上逼近闭源顶级模型、在价格上却只有对方的五分之一时，商业模式的冲击是结构性的。国内开源模型的性能追赶，正在削弱海外闭源模型的定价权和可替代性优势。换句话说——闭源巨头的高溢价时代，可能比所有人预想的都要短。

回到那个让硅谷失眠的问题：中国AI什么时候能追上美国？

特斯拉CEO埃隆·马斯克上周在X上被问及此事时，给出的预测是“可能在2027年一季度”。智谱创始人唐杰很快回应：“不需要那么久。”

GLM-5.2的出现，或许就是那个让“不需要那么久”变得可信的证据。

从DeepSeek到GLM-5.2，中国开源模型正在走出一条与闭源巨头截然不同的路径——不拼算力堆砌、不拼参数军备，而是拼工程化落地、拼开放生态、拼性价比。这条路能不能走到AGI的终点？没有人知道答案。

但至少，硅谷已经无法假装看不见了。

One more thing：

Zero君想问各位读者——你认为GLM-5.2能否真正撼动Claude和GPT在编程领域的统治地位？开源模型 vs 闭源模型，你更看好哪条路线？欢迎在评论区互动讨论。如果你想持续关注AI大模型的最新动态与深度解读，欢迎关注Zero君，一起洞察未来。

本文信息来源：

1. 智谱AI官方发布GLM-5.2上线公告（2026年6月17日）
2. Code Arena、Design Arena、FrontierSWE、Terminal-Bench等第三方基准测试公开数据
3. Artificial Analysis综合榜单及开源模型SOTA排名
4. 36氪《一手实测智谱最强模型，AI编程“御三家”要成型了？》（2026年6月17日）
5. 科技日报《智谱GLM-5.2上线并开源》（2026年6月17日）
6. 央广网《智谱上线并开源新一代旗舰大模型GLM-5.2》（2026年6月17日）
7. IT之家《超越Claude Fable 5：智谱GLM 5.2登顶Design Arena》（2026年6月20日）
8. 量子位《刚刚，Fable-5之下，智谱开源的GLM-5.2拿下AI编程第一！》（2026年6月17日）
9. 中国日报《智谱开源新一代大模型GLM-5.2 跻身全球模型前三》（2026年6月17日）
10. 凤凰网科技《DeepSeek之后，中国又一开源AI模型引发硅谷热议》（2026年6月22日）
11. 华尔街见闻《当Fable 5全球下架，GLM 5.2逼近Opus 4.8“意义重大”》（2026年6月17日）
12. 北京商报《万亿智谱领衔国产大模型集体跨坎》（2026年6月23日）

本文由Zero君基于公开资料整理分析，个人见解部分仅供参考。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.