![]()
始智AI wisemodel将打造一个“All for Agent”的原生技术平台,始终坚持“中立、开放、共建、共创、合作”五项基本原则,欢迎加入共同成长。
![]()
GLM-5.2 是智谱AI(Zhipu AI)推出的最新旗舰大模型,专为长程任务(long-horizon tasks)设计。相较于上一代 GLM-5.1,GLM-5.2 在长程任务能力上有显著提升,并首次在100万 token(1M context)的超长上下文上实现了稳定可靠的表现。![]()
四大核心能力升级:
能力
稳定百万上下文
真正可用的 1M token 上下文,稳定支撑长程工程任务
灵活编码能力
多档"推理投入度"(effort level),按需平衡性能与延迟
架构级优化
提出 IndexShare + MTP 改进,推理性价比更高
完全开源
MIT 协议,无区域限制,开放获取无壁垒
![]()
1. 稳定的百万级上下文
长上下文的真正挑战不在于"能接受多少 token",而在于在超长、混乱的 Agent 轨迹中保持质量稳定。1M context 容易声称,但真正在工程压力下稳定可靠才是难题。
为此,GLM-5.2 大幅扩展了面向Agent 场景的百万 token 训练数据,覆盖:
大规模代码实现
自动化研究
性能优化
复杂调试
![]()
使得模型不仅"窗口宽",而且"执行稳",成为可持续工程工作的实用基础。
三项长程任务基准测试表现:
基准测试
GLM-5.2 表现
排名
FrontierSWE
(数小时规模的开放技术项目:系统优化、大规模代码构建、应用ML研究)
距 Opus 4.8 仅差 1%,领先 GPT-5.5 约 1%,领先 Opus 4.7 约 11%
开源第一
PostTrainBench
(给 Agent H100 GPU,通过后训练提升小模型能力)
超越 Opus 4.7 和 GPT-5.5,仅次于 Opus 4.8
排名第二
SWE-Marathon
(超长程软件工程:构建编译器、优化内核、开发生产级服务)
距 Opus 4.8 差 13%,但稳居开源第一,仅次于 Opus 系列
开源第一
在三项长程基准测试中,GLM-5.2 均为开源模型第一名,验证了其 1M 上下文已转化为真正的长程任务交付能力。2. 标准编程基准测试
基准测试
GLM-5.2
GLM-5.1
Claude Opus 4.8
Gemini 3.1 Pro
Terminal-Bench 2.1
81.0
63.5
85.0
SWE-bench Pro
62.1
58.4
GLM-5.2 在标准编程基准上为最强开源模型,相比 GLM-5.1 大幅提升
Terminal-Bench 2.1 仅落后 Claude Opus 4.8 数个百分点,超越 Gemini 3.1 Pro
![]()
3. 灵活推理投入度(Effort Level)控制
GLM-5.2 引入多档推理投入度控制,让用户可以在模型能力与任务执行速度/计算成本之间自由选择:
在相同 token 消耗下,GLM-5.2 的 Agent 编程性能远强于 GLM-5.1,能力定位约在 Claude Opus 4.7 与 Opus 4.8 之间
- Max 档位:在极具挑战的任务上,可分配更多计算资源,进一步提升编程能力
设计哲学:给予用户更大灵活性,让不同场景都能找到最适合的推理模式
在 1M 上下文长度下,DSA(动态稀疏注意力)的 indexer 计算成本显著增加。为了解决这个问题,GLM-5.2 应用了 IndexShare 技术:
核心做法: 每 4 个 Transformer 层共享一个轻量级 indexer。
- 该 indexer 放置在 4 层中的第一层
- 其 top-K 索引在后续 3 层中被复用
- 3/4 层的 indexer 点积和 top-K 操作被完全省去
![]()
效果:在 1M 上下文长度下,每个 token 的 FLOPs降低 2.9 倍。GLM-5.2 从 128K 序列长度开始基于 IndexShare 训练,在更少计算量下超越了 GLM-5.1 的长上下文表现。
4.2 MTP 层与 KV 优化
GLM-5.2 对 MTP(Multi-Token Prediction)层做了两项改进,以服务于投机解码(speculative decoding):
目标一:最小化 MTP 作为 Draft 模型的开销 → 同样应用 IndexShare
目标二:最大化投机解码接受率 → 消除 GLM-5.1 MTP 层中的训练-推理不一致性
以两步 MTP 推理为例:
第一步:与训练一致,所有隐状态来自目标模型
第二步:
h₁:₄来自目标模型,h₅来自 MTP 层 → KV 缓存是混合状态,造成不一致
IndexShare 解决了这个问题:通过在 MTP 各步复用 top-K 索引,保持推理时 KV 缓存的一致性,MTP 接受长度提升最高达 20%。
![]()
5. 完全开源
GLM-5.2 采用MIT 开源协议:
✅ 无区域限制
✅ 技术获取无国界壁垒
✅ 可自由商用、修改和分发
GLM-5.2 是智谱在长程 Agent 能力上的一次重大突破:
- 百万上下文
真正从"能接受"变成"用得住",大幅扩展了编程 Agent 的任务边界
- IndexShare 架构
将 1M 上下文的计算成本降低近 3 倍,实用性大幅提升
- 多档 Effort Level
让用户按需平衡性能与成本,适配从快速验证到深度研究的多样场景
- MIT 开源
让全球开发者无障碍获取和使用
GLM-5.2 目前是开源编程模型的新标杆,在长程任务上与闭源顶级模型(Opus 4.8、GPT-5.5)的差距已大幅缩小。
----- END -----
wisemodel相关:
系列模型:
Wisemodel Agentverse
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.