网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

GLM-5.2 技术解读：智谱百万上下文的新一代旗舰模型

2026-06-17 20:18:38　来源: wisemodel开源社区

北京举报

0

分享至

始智AI wisemodel将打造一个“All for Agent”的原生技术平台，始终坚持“中立、开放、共建、共创、合作”五项基本原则，欢迎加入共同成长。

GLM-5.2 是智谱AI（Zhipu AI）推出的最新旗舰大模型，专为长程任务（long-horizon tasks）设计。相较于上一代 GLM-5.1，GLM-5.2 在长程任务能力上有显著提升，并首次在100万 token（1M context）的超长上下文上实现了稳定可靠的表现。

四大核心能力升级：

能力

稳定百万上下文

真正可用的 1M token 上下文，稳定支撑长程工程任务

灵活编码能力

多档"推理投入度"（effort level），按需平衡性能与延迟

架构级优化

提出 IndexShare + MTP 改进，推理性价比更高

完全开源

MIT 协议，无区域限制，开放获取无壁垒

1. 稳定的百万级上下文

长上下文的真正挑战不在于"能接受多少 token"，而在于在超长、混乱的 Agent 轨迹中保持质量稳定。1M context 容易声称，但真正在工程压力下稳定可靠才是难题。

为此，GLM-5.2 大幅扩展了面向Agent 场景的百万 token 训练数据，覆盖：

大规模代码实现
自动化研究
性能优化
复杂调试

使得模型不仅"窗口宽"，而且"执行稳"，成为可持续工程工作的实用基础。

三项长程任务基准测试表现：

基准测试

GLM-5.2 表现

排名

FrontierSWE

（数小时规模的开放技术项目：系统优化、大规模代码构建、应用ML研究）

距 Opus 4.8 仅差 1%，领先 GPT-5.5 约 1%，领先 Opus 4.7 约 11%

开源第一

PostTrainBench

（给 Agent H100 GPU，通过后训练提升小模型能力）

超越 Opus 4.7 和 GPT-5.5，仅次于 Opus 4.8

排名第二

SWE-Marathon

（超长程软件工程：构建编译器、优化内核、开发生产级服务）

距 Opus 4.8 差 13%，但稳居开源第一，仅次于 Opus 系列

开源第一

在三项长程基准测试中，GLM-5.2 均为开源模型第一名，验证了其 1M 上下文已转化为真正的长程任务交付能力。

2. 标准编程基准测试

基准测试

GLM-5.2

GLM-5.1

Claude Opus 4.8

Gemini 3.1 Pro

Terminal-Bench 2.1

81.0

63.5

85.0

SWE-bench Pro

62.1

58.4

GLM-5.2 在标准编程基准上为最强开源模型，相比 GLM-5.1 大幅提升
Terminal-Bench 2.1 仅落后 Claude Opus 4.8 数个百分点，超越 Gemini 3.1 Pro

3. 灵活推理投入度（Effort Level）控制

GLM-5.2 引入多档推理投入度控制，让用户可以在模型能力与任务执行速度/计算成本之间自由选择：

在相同 token 消耗下，GLM-5.2 的 Agent 编程性能远强于 GLM-5.1，能力定位约在 Claude Opus 4.7 与 Opus 4.8 之间
Max 档位：在极具挑战的任务上，可分配更多计算资源，进一步提升编程能力
设计哲学：给予用户更大灵活性，让不同场景都能找到最适合的推理模式

4. 百万上下文架构：IndexShare4.1 为什么需要 IndexShare？

在 1M 上下文长度下，DSA（动态稀疏注意力）的 indexer 计算成本显著增加。为了解决这个问题，GLM-5.2 应用了 IndexShare 技术：

核心做法：每 4 个 Transformer 层共享一个轻量级 indexer。

- 该 indexer 放置在 4 层中的第一层

- 其 top-K 索引在后续 3 层中被复用

- 3/4 层的 indexer 点积和 top-K 操作被完全省去

效果：在 1M 上下文长度下，每个 token 的 FLOPs降低 2.9 倍。GLM-5.2 从 128K 序列长度开始基于 IndexShare 训练，在更少计算量下超越了 GLM-5.1 的长上下文表现。

4.2 MTP 层与 KV 优化

GLM-5.2 对 MTP（Multi-Token Prediction）层做了两项改进，以服务于投机解码（speculative decoding）：

目标一：最小化 MTP 作为 Draft 模型的开销 → 同样应用 IndexShare

目标二：最大化投机解码接受率 → 消除 GLM-5.1 MTP 层中的训练-推理不一致性

以两步 MTP 推理为例：

第一步：与训练一致，所有隐状态来自目标模型
第二步：h₁:₄来自目标模型，h₅来自 MTP 层 → KV 缓存是混合状态，造成不一致

IndexShare 解决了这个问题：通过在 MTP 各步复用 top-K 索引，保持推理时 KV 缓存的一致性，MTP 接受长度提升最高达 20%。

5. 完全开源

GLM-5.2 采用MIT 开源协议：

✅ 无区域限制
✅ 技术获取无国界壁垒
✅ 可自由商用、修改和分发

总结

GLM-5.2 是智谱在长程 Agent 能力上的一次重大突破：

百万上下文
真正从"能接受"变成"用得住"，大幅扩展了编程 Agent 的任务边界
IndexShare 架构
将 1M 上下文的计算成本降低近 3 倍，实用性大幅提升
多档 Effort Level
让用户按需平衡性能与成本，适配从快速验证到深度研究的多样场景
MIT 开源
让全球开发者无障碍获取和使用

GLM-5.2 目前是开源编程模型的新标杆，在长程任务上与闭源顶级模型（Opus 4.8、GPT-5.5）的差距已大幅缩小。

----- END -----

wisemodel相关：

系列模型：

Wisemodel Agentverse

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

13人团队叫板Anthropic：我们造了一个更快更便宜的大模型

DeepTech深科技 2026-06-20 17:13:28
44 跟贴 44
GLM-5.2全球免费6小时，马斯克点赞，HuggingFace掏钱

机器之心Pro 2026-06-21 20:17:58
8 跟贴 8

哈？改个URL就行！alphaXiv甩出论文复现神器，单卡也能跑

机器之心Pro 2026-06-21 17:10:57
0 跟贴 0

快手开源GoLongRL：23K样本、9大任务类型，长上下文RL荒时代结束

机器之心Pro 2026-06-21 19:52:29
0 跟贴 0
给世界模型加上因果，她要让机器人真正理解“为什么”

DeepTech深科技 2026-06-20 11:32:15
3 跟贴 3

Agent-World：扩展真实世界环境，让智能体与环境协同进化！

机器之心Pro 2026-05-06 12:40:24
0 跟贴 0

奥特曼预言与现实相差几何？12个顶级模型“创业”一年，仅3个存活

钛媒体APP 2026-04-03 17:11:08
1 跟贴 1
马斯克说明年Q1，唐杰说用不了那么久，谁在闷头做中国的Mythos？

机器之心Pro 2026-06-20 18:03:45
3 跟贴 3

为了让你烧token，英伟达已经卷到机器人身上了

量子位 2026-06-20 20:08:22
1 跟贴 1
让两个大模型在线吵架，跑通全网95%科研代码｜深势Deploy-Master

机器之心Pro 2026-01-09 14:22:47
0 跟贴 0
半年20余倍增长，一个中国Token工厂的生意飞轮

虎嗅APP 2026-06-20 15:30:07
6 跟贴 6
南洋理工推出支持物理仿真三维模型！生成资产可部署于机器人训练

DeepTech深科技 2026-06-21 21:17:07
2 跟贴 2
大批歌手即将失业？实测AI作曲仅需5分钟，传统音乐被逼死胡同？

雷科技 2026-06-21 21:37:09
21 跟贴 21
大神程序员蒸馏自己，用16个skill给AI注入软件工程之魂

量子位 2026-05-12 03:08:58
0 跟贴 0
25亿美金估值，零收入、这家公司试图用大脑算法破解AI能耗危机

DeepTech深科技 2026-06-21 21:13:02
1 跟贴 1
从眼控到脑控，蔡磊化身“赛博躯体”称将把意识传送到具身机器人

第一财经资讯 2026-06-21 15:40:24
213 跟贴 213
AI隐私训练时，那个最难控制的「阀门」能自动调节吗？

机器之心Pro 2026-06-21 21:19:41
0 跟贴 0
死磕完几十个一线案例，我们对AI怎么落地营销服有了这些判断

虎嗅APP 2026-06-21 22:14:07
0 跟贴 0
LLM数据量大管饱，机器人数据却连1%的起跑线都没够到？

量子位 2026-04-13 20:54:19
0 跟贴 0
王晓野：Working Agent将是下一个爆发点

量子位 2026-05-21 08:05:51
0 跟贴 0
这个时代必须以Agent为中心：三个趋势回顾

量子位 2026-04-05 02:14:15
0 跟贴 0
AI Agent是科技革命中的一次真正的范式转移

量子位 2026-04-03 22:52:35
0 跟贴 0
Agent输出到底该用谁？卡帕西转发：试试让AI输出HTML

量子位 2026-05-13 07:19:50
0 跟贴 0
刘伟：分层构建人机协同架构，重塑公募基金AI生产系统新形态

财联社 2026-06-20 04:42:08
0 跟贴 0
ICLR 2026 Oral | Revela：用语言建模重新定义稠密检索器训练

机器之心Pro 2026-03-27 10:33:36
0 跟贴 0
不用向量数据库，Agent也能会搜索：给它一个grep就够了？

机器之心Pro 2026-06-11 17:06:46
0 跟贴 0
一张无意间拍下的照片，揭示了狼群的组织架构 #科普 #狼群

小白聊科普 2026-06-19 08:49:41
31 跟贴 31
OpenRouter推出复合方案，用一半价格实现性能碾压

DeepTech深科技 2026-06-21 21:20:46
3 跟贴 3
外国知名学者：当今世界只有四个大国

参考消息 2026-06-21 12:27:22
13211 跟贴 13211
性能真的不重要了吗？Jeff Dean给出反常答案

新智元 2025-12-28 17:20:51
0 跟贴 0
不出意外！广东队未来5年5大主力架构如下

一只会跳舞的熊 2026-06-20 01:56:35
0 跟贴 0
媒体：两大核武国家“水仗”升级巴基斯坦陷入恐慌

中国新闻周刊 2026-06-21 19:23:56
2162 跟贴 2162
交警执勤时全身叮满蚊虫，让人心疼！

中国日报网 2026-06-21 09:46:06
99 跟贴 99
首个三模式大语言模型：4倍token吞吐量，长文本秒级时代要来了？

机器之心Pro 2026-05-22 14:21:21
0 跟贴 0
华为Claw-Anything：跨设备、跨时间、跨服务Claw评测与数据引擎

机器之心Pro 2026-06-21 19:38:32
5 跟贴 5
【数智周报】DeepSeek敲定首轮超510亿元外部融资；SpaceX换股收购AI编程独角兽Cursor；美国叫停Anthropic最强模型Fable

钛媒体APP 2026-06-21 18:20:11
1 跟贴 1
GRPO过时了吗？

机器之心Pro 2026-06-21 17:26:45
2 跟贴 2
后端JD没写AI，面试却考Agent和RAG？

摸鱼算法 2026-06-22 04:06:28
0 跟贴 0
大学生实习日薪180元弄丢客户6.5万元劳力士表

极目新闻 2026-06-21 14:57:13
4051 跟贴 4051
没人想要700亿参数的大模型了？

固件更新中 2026-06-22 02:53:00
0 跟贴 0

大家要做好心理准备了，从明天6.22开始，股市或将再次历史重演？

大家要做好心理准备了，从明天6.22开始，股市或将再次历史重演？

云鹏叙事

2026-06-21 12:27:51

现在的俄罗斯大概率只剩下两条路了：要么低头，要么正式宣战

现在的俄罗斯大概率只剩下两条路了：要么低头，要么正式宣战

扶苏聊历史

2026-06-21 18:39:08

表哥表嫂用我名义定88桌酒席，酒店来电催款，我回谁定谁结

表哥表嫂用我名义定88桌酒席，酒店来电催款，我回谁定谁结

晓艾故事汇

2026-06-18 17:53:36

值得珍藏：MLCC+英伟达+玻璃基板+工业气体+机器人+半导体+电池等

值得珍藏：MLCC+英伟达+玻璃基板+工业气体+机器人+半导体+电池等

林子说事

2026-06-22 01:21:18

75岁黄维平父亲节潸然泪下！曝儿子酒精中毒去世，大女儿忙前忙后

75岁黄维平父亲节潸然泪下！曝儿子酒精中毒去世，大女儿忙前忙后

裕丰娱间说

2026-06-21 10:20:02

朱雨玲3-4日本名将，丢冠，连续两站WTT挑战赛决赛都输给日本选手

朱雨玲3-4日本名将，丢冠，连续两站WTT挑战赛决赛都输给日本选手

侧身凌空斩

2026-06-22 00:26:13

印不生莫迪，万古如长夜？莫迪执政12年，给印度带来了哪些蜕变？

印不生莫迪，万古如长夜？莫迪执政12年，给印度带来了哪些蜕变？

静夜史君

2026-06-22 00:10:07

孙艺珍一家在冲绳度假，她搂着玄彬，玄彬很壮，两人体型差明显

孙艺珍一家在冲绳度假，她搂着玄彬，玄彬很壮，两人体型差明显

沧海一书客

2026-06-21 14:58:31

降维打击！日本4-0横扫突尼斯，名嘴黄健翔赛后点评一针见血！

降维打击！日本4-0横扫突尼斯，名嘴黄健翔赛后点评一针见血！

田先生篮球

2026-06-21 15:01:38

C罗女友乔治娜前后反差太大，从前清纯灵动如今臃肿像复刻卡戴珊

C罗女友乔治娜前后反差太大，从前清纯灵动如今臃肿像复刻卡戴珊

述家娱记

2026-06-20 20:27:52

中央巡视再出“组合重拳”：提级办理，深挖“伞中伞”一查到底！

中央巡视再出“组合重拳”：提级办理，深挖“伞中伞”一查到底！

细说职场

2026-06-21 23:39:56

正式复出，张继科官宣重返赛场，首秀曝光，迎战德国名将

正式复出，张继科官宣重返赛场，首秀曝光，迎战德国名将

泥说体育

2026-06-21 16:40:38

104岁澳洲科学家没病也要安乐死，嫌活太久、摔地两天没人知，临终吐槽这过程太长了

104岁澳洲科学家没病也要安乐死，嫌活太久、摔地两天没人知，临终吐槽这过程太长了

童童聊娱乐啊

2026-06-20 01:41:02

狂轰47分15板22助！男篮20岁天才后卫杀疯了：这2战让他媲美徐杰

狂轰47分15板22助！男篮20岁天才后卫杀疯了：这2战让他媲美徐杰

篮球快餐车

2026-06-22 02:25:17

A股：今晚2.5亿股民，要兴奋到睡不着觉了，两大核心利好已浮现？

A股：今晚2.5亿股民，要兴奋到睡不着觉了，两大核心利好已浮现？

云鹏叙事

2026-06-22 00:00:11

一场5-1，日本渔翁得利！世界杯F组乱了：榜首易主，瑞典出线反转

一场5-1，日本渔翁得利！世界杯F组乱了：榜首易主，瑞典出线反转

侃球熊弟

2026-06-21 02:57:42

随着雨果3-2险胜，WTT卢布尔雅那站男单决赛对阵出炉，无国乒球员

随着雨果3-2险胜，WTT卢布尔雅那站男单决赛对阵出炉，无国乒球员

侧身凌空斩

2026-06-21 20:03:29

战局突变，特朗普按不住内塔，以色列又开打了，中方站出来发话

战局突变，特朗普按不住内塔，以色列又开打了，中方站出来发话

小嵩

2026-06-22 02:23:34

王树国回应“福耀科技大学各院系要自负盈亏”：绝非要求院系以盈利为目标，而是鼓励科研攻关提升自我造血能力，学校资金保障充足

王树国回应“福耀科技大学各院系要自负盈亏”：绝非要求院系以盈利为目标，而是鼓励科研攻关提升自我造血能力，学校资金保障充足

每日经济新闻

2026-06-21 13:29:04

吃播良子被曝“大结局”倒计时：血糖破7牙齿烂光，网友却祝他“早点猝死”

吃播良子被曝“大结局”倒计时：血糖破7牙齿烂光，网友却祝他“早点猝死”

热搜摘要官

2026-06-20 00:49:00

wisemodel开源社区

始智AI wisemodel.cn开源社区，打造中国版“huggingface”

487文章数 16关注度

往期回顾全部

科技要闻

马斯克拿下7800亿元天价薪酬 2028年可兑现

头条要闻

西班牙4-0大胜沙特亚马尔首次世界杯首发+首球

头条要闻

西班牙4-0大胜沙特亚马尔首次世界杯首发+首球

体育要闻

德国的超级替补，10年前还在工厂上班

娱乐要闻

原来她就是张颂文老婆

财经要闻

“床垫界的特斯拉”破产了

汽车要闻

惊出冷汗！重庆实测奥迪A5L，华为智驾这波操作绝了…

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

手机

旅游

家居

公开课

军事航空

手机要闻

消息称供应链公司已向苹果首款折叠屏iPhone小批量供货

旅游要闻

云南十八怪湖泊称作海，滇池滇海叫法流传千年，根源不只是水面大

家居要闻

绿意盎然自然之境

公开课

李玫瑾：为什么性格比能力更重要？

军事要闻

时隔44年试射洲际导弹现场照片传递三个重磅信息

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版