当闭源巨头被迫关门,一个中国开源模型正在改写全球AI编程的权力版图。
一年前,DeepSeek R1让硅谷第一次感受到中国AI的冲击波。一年后的今天,历史正在重演。
2026年6月17日,智谱正式发布并开源新一代旗舰模型GLM-5.2。消息传出后,硅谷的线上讨论圈瞬间沸腾。面向开发者的云平台Vercel CEO吉列尔莫·劳奇在X上写道:“对于智谱GLM-5.2在编程方面的出色表现,我感到由衷的赞叹,几乎震惊。这将改变格局。”曾担任Meta、谷歌DeepMind和微软副总裁的马特·韦洛索更是直言:“这是第一款能当日常主力用的开源模型,行业格局要变了。”
这一次,不是因为“便宜”而刷屏——是因为真的强。
一、什么是“长程任务”?AI从“聊天”到“干活”的质变
GLM-5.2最核心的突破,不是一个参数数字,而是一个全新的能力维度——长程任务。
过去的AI模型再强,本质上还是“即时问答”——你问一句,它答一句。但GLM-5.2被设计成能像人一样连续工作数小时、自主跑完一个完整的大型工程。
什么意思?用一句话描述需求,它就能自主完成从开发、联调、测试到打包上线的完整软件交付流程,几小时内交付一个网页、手机、小程序都能用的完整应用。过去,这样的工程往往需要一支团队干上数周。
智谱方面说得更直白:“当一个模型不知疲倦地在写软件工程代码,本质上是在学习一名顶级软件工程师的思维方式,然后以机器的耐力将其放大。这是对一个又一个职业的重新定义。”
支撑这一能力的是100万Token无损上下文。模型可稳定处理数百万字长文本、数百页复杂PDF或中大型软件项目完整代码库。在实际测试中,GLM-5.2在一轮连续任务中处理了88万以上token——几乎用满了百万级的上下文窗口。
这不再是“记忆力好”的问题——这是工程级可用的问题。
二、榜单“屠杀”:全球可用模型第一,逼近Opus 4.8
光说概念不够,数字不会骗人。
在大模型盲测平台竞技场(Arena.ai)的编程评估系统Code Arena上,GLM-5.2拿下1595分的高分,排名总榜第二,全球可用模型中排名第一。
在专门评测模型“品味”的Design Arena上,GLM-5.2更是取得全球第一的表现。IT之家报道,GLM-5.2在Design Arena单轮HTML网页设计评测中,超过Claude Fable 5等模型,首次登顶总分第一。在91%的会话中使用TailwindCSS,能高效调用chart.js、three.js等第三方库。
在测评“超长程、开放式、高难度软件工程任务”的FrontierSWE基准中,GLM-5.2得分74.4,仅比Anthropic顶级模型Claude Opus 4.8的75.1低约1个百分点,同时超越GPT-5.5的72.6。在Terminal-Bench 2.1中得分81.0,较前代GLM-5.1的63.5大幅提升17.5个百分点。
在Artificial Analysis综合榜单上,GLM-5.2取得51分,位列开源模型SOTA。
一连串数字背后只有一个结论:开源模型第一次真正站到了闭源巨头的同一梯队。
三、MIT开源+国产算力:技术平权不是口号
GLM-5.2的另一重震撼在于它的“开放姿态”。
模型以最宽松的MIT协议开源,允许自由下载、部署与商用。已上线Hugging Face与ModelScope。智谱在声明中写道:“前沿智能不应只属于少数人,也不应被少数规则随时收回。它应该开放、可用、可构建,并服务于每一位开发者。”
这句话的背景极具针对性——GLM-5.2发布的时间点,恰好紧邻Anthropic因美国出口管制暂停Claude Fable 5与Mythos 5全球服务之后。一边是闭源巨头被迫“关门”,一边是开源模型主动“开门”——这个对照本身就构成了一部AI行业当下的寓言。
更值得关注的是,GLM-5.2的训练与线上推理均未依赖海外算力。Day 0即完成与华为昇腾、平头哥、摩尔线程、寒武纪、昆仑芯、沐曦、海光、壁仞等全部主流国产算力平台的推理适配。据透露,下半年昇腾950超节点上市后,也将成为GLM-5.2强劲的算力底座。
在海外最强模型转向封闭、开源替代需求上升的背景下,这一 “开源国模+国产算力”的组合正受到全行业关注。
四、“新御三家”格局:谷歌被挤出去了
这场发布最标志性的意义在于——全球AI编程的权力格局正在被重写。
在AI编程模型领域,此前公认的全球头部玩家长期只有Anthropic(Claude系列)和OpenAI(GPT系列)。此次,GLM-5.2通过全球可用编程模型第一的榜单成绩和开发者“Opus平替”的真实口碑,正在跻身这一顶级俱乐部。
一个由Anthropic、OpenAI、智谱构成的“Coding御三家”格局正在成形。
要知道,此前提到AI界的“御三家”,大概率指向的是Claude、OpenAI和谷歌。但这一次,谷歌的Gemini实实在在地被GLM淘汰掉了。
有开发者直言:“这是国内第一款在我工作流上达到Opus级的模型。”海外用户也反馈,GLM-5.2的表现超出预期,与Fable 5的差距比预期中要小得多。如今Fable 5已无法正常使用,海外网友原本以为它的封禁会拉开差距,没想到GLM已经快追上来了。
知乎上,有用户打趣道:以后通过中转站用Opus的用户得面对一个新问题——如果Opus是GLM-5.2冒充的,那用户可能真的分辨不出来。
Zero君深度见解
在梳理完GLM-5.2的全部信息之后,有三个超越榜单分数的判断,值得每一位关注AI产业的人深思。
第一,长程任务是一个比“代码能力”更可怕的赛道切换。
当所有人还在比“谁能写出更漂亮的代码”时,智谱已经把战场迁移到了“谁能独立跑完一个完整工程”。这就像从比“谁会打字”到比“谁能写出一本书”——维度完全不同。GLM-5.2主攻的“长程任务”,本质上是让AI从“工具”变成“协作者”甚至“执行者”。智谱下一步的目标更值得关注——完全自治的智能体系统(Autonomous Agent System),让AI能够7×24小时运转,实现“自动驾驶”级别的数字生产力。从“回答问题”到“完成任务”再到“自主决策”——这条进化链一旦走通,被重构的将不只是编程这个工种。
第二,MIT开源+国产算力,是一套完整的“地缘政治防御工事”。
GLM-5.2最聪明的地方,不是技术本身,而是它构建了一套几乎无法被“卡脖子”的完整闭环:模型开源(不怕被封)、训练未依赖海外算力(不怕被断)、推理适配全部国产平台(不怕被锁)。在Fable 5因出口管制被迫关停的同一周发布这样一款模型,时机和意图都极其精准。这不是巧合,这是战略。
第三,最值得关注的不是“追上Opus”,而是“定价比Opus低80%”。
GLM-5.2每百万tokens的推理价格为1.40/4.40美元,远低于Fable 5的10/50美元。比Opus 4.8低约72%至82%。当一个开源模型在性能上逼近闭源顶级模型、在价格上却只有对方的五分之一时,商业模式的冲击是结构性的。国内开源模型的性能追赶,正在削弱海外闭源模型的定价权和可替代性优势。换句话说——闭源巨头的高溢价时代,可能比所有人预想的都要短。
回到那个让硅谷失眠的问题:中国AI什么时候能追上美国?
特斯拉CEO埃隆·马斯克上周在X上被问及此事时,给出的预测是“可能在2027年一季度”。智谱创始人唐杰很快回应:“不需要那么久。”
GLM-5.2的出现,或许就是那个让“不需要那么久”变得可信的证据。
从DeepSeek到GLM-5.2,中国开源模型正在走出一条与闭源巨头截然不同的路径——不拼算力堆砌、不拼参数军备,而是拼工程化落地、拼开放生态、拼性价比。这条路能不能走到AGI的终点?没有人知道答案。
但至少,硅谷已经无法假装看不见了。
One more thing:
Zero君想问各位读者——你认为GLM-5.2能否真正撼动Claude和GPT在编程领域的统治地位?开源模型 vs 闭源模型,你更看好哪条路线?欢迎在评论区互动讨论。如果你想持续关注AI大模型的最新动态与深度解读,欢迎关注Zero君,一起洞察未来。
本文信息来源:
- 1. 智谱AI官方发布GLM-5.2上线公告(2026年6月17日)
- 2. Code Arena、Design Arena、FrontierSWE、Terminal-Bench等第三方基准测试公开数据
- 3. Artificial Analysis综合榜单及开源模型SOTA排名
- 4. 36氪《一手实测智谱最强模型,AI编程“御三家”要成型了?》(2026年6月17日)
- 5. 科技日报《智谱GLM-5.2上线并开源》(2026年6月17日)
- 6. 央广网《智谱上线并开源新一代旗舰大模型GLM-5.2》(2026年6月17日)
- 7. IT之家《超越Claude Fable 5:智谱GLM 5.2登顶Design Arena》(2026年6月20日)
- 8. 量子位《刚刚,Fable-5之下,智谱开源的GLM-5.2拿下AI编程第一!》(2026年6月17日)
- 9. 中国日报《智谱开源新一代大模型GLM-5.2 跻身全球模型前三》(2026年6月17日)
- 10. 凤凰网科技《DeepSeek之后,中国又一开源AI模型引发硅谷热议》(2026年6月22日)
- 11. 华尔街见闻《当Fable 5全球下架,GLM 5.2逼近Opus 4.8“意义重大”》(2026年6月17日)
- 12. 北京商报《万亿智谱领衔 国产大模型集体跨坎》(2026年6月23日)
本文由Zero君基于公开资料整理分析,个人见解部分仅供参考。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.