网易首页 > 网易号 > 正文 申请入驻

GLM-5.2 技术解读:智谱百万上下文的新一代旗舰模型

0
分享至


始智AI wisemodel将打造一个“All for Agent”的原生技术平台,始终坚持“中立、开放、共建、共创、合作”五项基本原则,欢迎加入共同成长。


GLM-5.2 是智谱AI(Zhipu AI)推出的最新旗舰大模型,专为长程任务(long-horizon tasks)设计。相较于上一代 GLM-5.1,GLM-5.2 在长程任务能力上有显著提升,并首次在100万 token(1M context)的超长上下文上实现了稳定可靠的表现。

四大核心能力升级:

能力

稳定百万上下文

真正可用的 1M token 上下文,稳定支撑长程工程任务

灵活编码能力

多档"推理投入度"(effort level),按需平衡性能与延迟

架构级优化

提出 IndexShare + MTP 改进,推理性价比更高

完全开源

MIT 协议,无区域限制,开放获取无壁垒


1. 稳定的百万级上下文

长上下文的真正挑战不在于"能接受多少 token",而在于在超长、混乱的 Agent 轨迹中保持质量稳定。1M context 容易声称,但真正在工程压力下稳定可靠才是难题。

为此,GLM-5.2 大幅扩展了面向Agent 场景的百万 token 训练数据,覆盖:

  • 大规模代码实现

  • 自动化研究

  • 性能优化

  • 复杂调试


使得模型不仅"窗口宽",而且"执行稳",成为可持续工程工作的实用基础。

三项长程任务基准测试表现:

基准测试

GLM-5.2 表现

排名

FrontierSWE

(数小时规模的开放技术项目:系统优化、大规模代码构建、应用ML研究)

距 Opus 4.8 仅差 1%,领先 GPT-5.5 约 1%,领先 Opus 4.7 约 11%

开源第一

PostTrainBench

(给 Agent H100 GPU,通过后训练提升小模型能力)

超越 Opus 4.7 和 GPT-5.5,仅次于 Opus 4.8

排名第二

SWE-Marathon

(超长程软件工程:构建编译器、优化内核、开发生产级服务)

距 Opus 4.8 差 13%,但稳居开源第一,仅次于 Opus 系列

开源第一

在三项长程基准测试中,GLM-5.2 均为开源模型第一名,验证了其 1M 上下文已转化为真正的长程任务交付能力。
2. 标准编程基准测试

基准测试

GLM-5.2

GLM-5.1

Claude Opus 4.8

Gemini 3.1 Pro

Terminal-Bench 2.1

81.0

63.5

85.0

SWE-bench Pro

62.1

58.4

  • GLM-5.2 在标准编程基准上为最强开源模型,相比 GLM-5.1 大幅提升

  • Terminal-Bench 2.1 仅落后 Claude Opus 4.8 数个百分点,超越 Gemini 3.1 Pro


3. 灵活推理投入度(Effort Level)控制

GLM-5.2 引入多档推理投入度控制,让用户可以在模型能力与任务执行速度/计算成本之间自由选择:

  • 在相同 token 消耗下,GLM-5.2 的 Agent 编程性能远强于 GLM-5.1,能力定位约在 Claude Opus 4.7 与 Opus 4.8 之间

  • Max 档位:在极具挑战的任务上,可分配更多计算资源,进一步提升编程能力
  • 设计哲学:给予用户更大灵活性,让不同场景都能找到最适合的推理模式

4. 百万上下文架构:IndexShare4.1 为什么需要 IndexShare?

在 1M 上下文长度下,DSA(动态稀疏注意力)的 indexer 计算成本显著增加。为了解决这个问题,GLM-5.2 应用了 IndexShare 技术:

核心做法: 每 4 个 Transformer 层共享一个轻量级 indexer。
- 该 indexer 放置在 4 层中的第一层
- 其 top-K 索引在后续 3 层中被复用
- 3/4 层的 indexer 点积和 top-K 操作被完全省去


效果:在 1M 上下文长度下,每个 token 的 FLOPs降低 2.9 倍。GLM-5.2 从 128K 序列长度开始基于 IndexShare 训练,在更少计算量下超越了 GLM-5.1 的长上下文表现。

4.2 MTP 层与 KV 优化

GLM-5.2 对 MTP(Multi-Token Prediction)层做了两项改进,以服务于投机解码(speculative decoding):

目标一:最小化 MTP 作为 Draft 模型的开销 → 同样应用 IndexShare

目标二:最大化投机解码接受率 → 消除 GLM-5.1 MTP 层中的训练-推理不一致性

以两步 MTP 推理为例:

  • 第一步:与训练一致,所有隐状态来自目标模型

  • 第二步:h₁:₄来自目标模型,h₅来自 MTP 层 → KV 缓存是混合状态,造成不一致

IndexShare 解决了这个问题:通过在 MTP 各步复用 top-K 索引,保持推理时 KV 缓存的一致性,MTP 接受长度提升最高达 20%


5. 完全开源

GLM-5.2 采用MIT 开源协议

  • ✅ 无区域限制

  • ✅ 技术获取无国界壁垒

  • ✅ 可自由商用、修改和分发

总结

GLM-5.2 是智谱在长程 Agent 能力上的一次重大突破:

  • 百万上下文

    真正从"能接受"变成"用得住",大幅扩展了编程 Agent 的任务边界

  • IndexShare 架构

    将 1M 上下文的计算成本降低近 3 倍,实用性大幅提升

  • 多档 Effort Level

    让用户按需平衡性能与成本,适配从快速验证到深度研究的多样场景

  • MIT 开源

    让全球开发者无障碍获取和使用

GLM-5.2 目前是开源编程模型的新标杆,在长程任务上与闭源顶级模型(Opus 4.8、GPT-5.5)的差距已大幅缩小。

----- END -----

wisemodel相关:

系列模型:

  • Wisemodel Agentverse

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大家要做好心理准备了,从明天6.22开始,股市或将再次历史重演?

大家要做好心理准备了,从明天6.22开始,股市或将再次历史重演?

云鹏叙事
2026-06-21 12:27:51
现在的俄罗斯大概率只剩下两条路了:要么低头,要么正式宣战

现在的俄罗斯大概率只剩下两条路了:要么低头,要么正式宣战

扶苏聊历史
2026-06-21 18:39:08
表哥表嫂用我名义定88桌酒席,酒店来电催款,我回谁定谁结

表哥表嫂用我名义定88桌酒席,酒店来电催款,我回谁定谁结

晓艾故事汇
2026-06-18 17:53:36
值得珍藏:MLCC+英伟达+玻璃基板+工业气体+机器人+半导体+电池等

值得珍藏:MLCC+英伟达+玻璃基板+工业气体+机器人+半导体+电池等

林子说事
2026-06-22 01:21:18
75岁黄维平父亲节潸然泪下!曝儿子酒精中毒去世,大女儿忙前忙后

75岁黄维平父亲节潸然泪下!曝儿子酒精中毒去世,大女儿忙前忙后

裕丰娱间说
2026-06-21 10:20:02
朱雨玲3-4日本名将,丢冠,连续两站WTT挑战赛决赛都输给日本选手

朱雨玲3-4日本名将,丢冠,连续两站WTT挑战赛决赛都输给日本选手

侧身凌空斩
2026-06-22 00:26:13
印不生莫迪,万古如长夜?莫迪执政12年,给印度带来了哪些蜕变?

印不生莫迪,万古如长夜?莫迪执政12年,给印度带来了哪些蜕变?

静夜史君
2026-06-22 00:10:07
孙艺珍一家在冲绳度假,她搂着玄彬,玄彬很壮,两人体型差明显

孙艺珍一家在冲绳度假,她搂着玄彬,玄彬很壮,两人体型差明显

沧海一书客
2026-06-21 14:58:31
降维打击!日本4-0横扫突尼斯,名嘴黄健翔赛后点评一针见血!

降维打击!日本4-0横扫突尼斯,名嘴黄健翔赛后点评一针见血!

田先生篮球
2026-06-21 15:01:38
C罗女友乔治娜前后反差太大,从前清纯灵动如今臃肿像复刻卡戴珊

C罗女友乔治娜前后反差太大,从前清纯灵动如今臃肿像复刻卡戴珊

述家娱记
2026-06-20 20:27:52
中央巡视再出“组合重拳”:提级办理,深挖“伞中伞”一查到底!

中央巡视再出“组合重拳”:提级办理,深挖“伞中伞”一查到底!

细说职场
2026-06-21 23:39:56
正式复出,张继科官宣重返赛场,首秀曝光,迎战德国名将

正式复出,张继科官宣重返赛场,首秀曝光,迎战德国名将

泥说体育
2026-06-21 16:40:38
104岁澳洲科学家没病也要安乐死,嫌活太久、摔地两天没人知,临终吐槽这过程太长了

104岁澳洲科学家没病也要安乐死,嫌活太久、摔地两天没人知,临终吐槽这过程太长了

童童聊娱乐啊
2026-06-20 01:41:02
狂轰47分15板22助!男篮20岁天才后卫杀疯了:这2战让他媲美徐杰

狂轰47分15板22助!男篮20岁天才后卫杀疯了:这2战让他媲美徐杰

篮球快餐车
2026-06-22 02:25:17
A股:今晚2.5亿股民,要兴奋到睡不着觉了,两大核心利好已浮现?

A股:今晚2.5亿股民,要兴奋到睡不着觉了,两大核心利好已浮现?

云鹏叙事
2026-06-22 00:00:11
一场5-1,日本渔翁得利!世界杯F组乱了:榜首易主,瑞典出线反转

一场5-1,日本渔翁得利!世界杯F组乱了:榜首易主,瑞典出线反转

侃球熊弟
2026-06-21 02:57:42
随着雨果3-2险胜,WTT卢布尔雅那站男单决赛对阵出炉,无国乒球员

随着雨果3-2险胜,WTT卢布尔雅那站男单决赛对阵出炉,无国乒球员

侧身凌空斩
2026-06-21 20:03:29
战局突变,特朗普按不住内塔,以色列又开打了,中方站出来发话

战局突变,特朗普按不住内塔,以色列又开打了,中方站出来发话

小嵩
2026-06-22 02:23:34
王树国回应“福耀科技大学各院系要自负盈亏”:绝非要求院系以盈利为目标,而是鼓励科研攻关提升自我造血能力,学校资金保障充足

王树国回应“福耀科技大学各院系要自负盈亏”:绝非要求院系以盈利为目标,而是鼓励科研攻关提升自我造血能力,学校资金保障充足

每日经济新闻
2026-06-21 13:29:04
吃播良子被曝“大结局”倒计时:血糖破7牙齿烂光,网友却祝他“早点猝死”

吃播良子被曝“大结局”倒计时:血糖破7牙齿烂光,网友却祝他“早点猝死”

热搜摘要官
2026-06-20 00:49:00
2026-06-22 05:03:00
wisemodel开源社区 incentive-icons
wisemodel开源社区
始智AI wisemodel.cn开源社区,打造中国版“huggingface”
487文章数 16关注度
往期回顾 全部

科技要闻

马斯克拿下7800亿元天价薪酬 2028年可兑现

头条要闻

西班牙4-0大胜沙特 亚马尔首次世界杯首发+首球

头条要闻

西班牙4-0大胜沙特 亚马尔首次世界杯首发+首球

体育要闻

德国的超级替补,10年前还在工厂上班

娱乐要闻

原来她就是张颂文老婆

财经要闻

“床垫界的特斯拉”破产了

汽车要闻

惊出冷汗!重庆实测奥迪A5L,华为智驾这波操作绝了…

态度原创

手机
旅游
家居
公开课
军事航空

手机要闻

消息称供应链公司已向苹果首款折叠屏iPhone小批量供货

旅游要闻

云南十八怪湖泊称作海,滇池滇海叫法流传千年,根源不只是水面大

家居要闻

绿意盎然 自然之境

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

时隔44年试射洲际导弹 现场照片传递三个重磅信息

无障碍浏览 进入关怀版