网易首页 > 网易号 > 正文 申请入驻

智谱公开GLM-5技术细节:四大创新推动编程范式转变

0
分享至


GLM-5推动编程范式从“Vibe Coding”转向了“Agentic Engineering”。

本文为IPO早知道原创

作者|Stone Jin

据IPO早知道消息,从Pony Alpha神秘模型引发全球开发者热议起,智谱在过去两三周的时间内无疑是全球最受关注的大模型企业。

硅谷顶级风投机构a16z近日又发布了一组数据:开源大模型和顶级闭源模型之间的能力差距,正在以肉眼可见的速度快速收窄。这次被正面对标的正是智谱的开源模型 GLM-5以及闭源天花板之一的Claude Opus 4.6。


从模型本身来看,GLM-5的发布某种程度上可被视为正推动编程范式从“Vibe Coding”(氛围编程)转向了“Agentic Engineering”(智能体工程)

2月22日,智谱发布《GLM-5技术报告:技术细节全公开》并阐述称,GLM-5 在前代模型 GLM-4.5 的智能体、推理与编程(Agentic, Reasoning and Coding, ARC)能力基础上,采用稀疏注意力(DeepSeek Sparse Attention,DSA)以大幅降低推理成本,同时保持长上下文能力无损。同时,为了让模型更好地与各类任务对齐,智谱构建了一套新型异步强化学习(RL)基础设施,通过将生成过程与训练过程解耦,从而大幅提升了后训练的迭代效率。此外,智谱还提出了全新的异步 Agent 强化学习算法,进一步提升强化学习的效果,使模型能够更有效地从复杂、长程交互中学习。基于上述创新,GLM-5 在主流的开放基准测试中实现了 SOTA 性能。最关键的是,GLM-5 在真实世界编程任务中展现出前所未有的能力,在处理端到端软件工程挑战方面超越了此前所有开源基线。

总体而言,GLM-5 能够实现性能的大幅跃升,主要得益于以下四大技术创新:

1、引入 DSA 稀疏注意力机制(DeepSeek Sparse Attention, DSA)。这一全新架构极大降低了训练与推理成本。此前的 GLM-4.5 依赖标准 MoE 架构提升效率,而 DSA 机制则使 GLM-5 能够根据 Token 的重要性动态分配注意力资源。在不折损长上下文理解和推理深度的前提下,算力开销得以大幅削减。得益于此,智谱将模型参数规模成功扩展至 744B(7440 亿),同时将训练 Token 规模提升至 28.5T(28.5 万亿)。

2、构建全新的异步 RL 基础设施。基于 GLM-4.5 时期 slime 框架“训练与推理解耦”的设计,智谱的新基建进一步实现了“生成与训练”的深度解耦,将 GPU 利用率推向极致。该系统支持模型开展大规模的智能体(Agent)轨迹探索,大幅减缓了以往拖慢迭代速度的同步瓶颈,让 RL 后训练流程的效率实现了质的飞跃。

3、提出全新的异步 Agent RL 算法。该算法旨在全面提升模型的自主决策质量。GLM-4.5 曾依靠迭代自蒸馏和结果监督来训练 Agent;而在 GLM-5 中,智谱研发的异步算法使模型能够从多样化的长周期交互中持续学习。这一算法针对动态环境下的规划与自我纠错能力进行了深度优化,这也正是 GLM-5 能够在真实编程场景中表现卓越的底层逻辑。

4、全面拥抱国产算力生态。从模型发布伊始,GLM-5 就原生适配了中国 GPU 生态。智谱已完成从底层内核到上层推理框架的深度优化,全面兼容七大主流国产芯片平台:华为昇腾、摩尔线程、海光、寒武纪、昆仑芯、天数智芯与燧原。

另外同样需要注意的是,智谱继续使用 slime 作为 GLM-5 统一的后训练训练框架,实现大规模端到端 RL。GLM-5 充分利用了 slime 的能力:一方面通过灵活的 rollout 定制化接口和服务化(server-based)的推理方案扩大训练任务的覆盖面;另一方面通过混合精度训练 / rollout 以及多 token 预测(MTP)和预填充-解码(PD)分离大幅降低延迟,特别是在多轮 RL 工作负载下的端到端延迟;并使用基于心跳的容灾和生命周期管理提升稳定性。

此外,GLM-5 在 slime 中进行了延迟导向的性能优化和调度:采用多节点推理部署(如跨 8 节点的 EP64 配合 DP64)以提供充足的 KV 缓存;使用 FP8 精度进行推理以降低每个 token 的解码延迟;利用 MTP 来在 RL 中典型的小批次解码场景下获得显著性能收益;通过 PD 分离确保在多轮交互的训练任务中解码速度的稳定,从而显著改善长程 Agent RL 训练中的长尾问题,提升训练效率

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
权志龙再三挑衅中国春节,女星邓家佳跟风,被网友骂后删博了事

权志龙再三挑衅中国春节,女星邓家佳跟风,被网友骂后删博了事

钱小刀娱乐
2026-02-22 21:54:09
突发!伊朗开始主动出击!

突发!伊朗开始主动出击!

达文西看世界
2026-02-23 15:27:59
尼格买提8个家宴菜曝光!满桌不见一片绿叶菜,背后身世藏不住了

尼格买提8个家宴菜曝光!满桌不见一片绿叶菜,背后身世藏不住了

师维
2026-02-23 12:31:35
果然,中国拒绝后,土耳其立马变脸,比亚迪宣布:中国不再吃亏

果然,中国拒绝后,土耳其立马变脸,比亚迪宣布:中国不再吃亏

说故事的阿袭
2026-02-22 23:04:59
俄对乌发动饱和式袭击,17枚导弹击中目标,乌展开雷霆反击

俄对乌发动饱和式袭击,17枚导弹击中目标,乌展开雷霆反击

史政先锋
2026-02-23 14:56:12
瑞典为何结束210年中立,加入北约并援乌近百亿美元?

瑞典为何结束210年中立,加入北约并援乌近百亿美元?

高博新视野
2026-02-22 20:16:40
美军很纳闷:十几架F16起飞连韩国都没打招呼,解放军咋就知道?

美军很纳闷:十几架F16起飞连韩国都没打招呼,解放军咋就知道?

东极妙严
2026-02-23 09:07:14
返程注意!气温“跳水”,夜间局部中到大雨 | 天气早知道

返程注意!气温“跳水”,夜间局部中到大雨 | 天气早知道

上海杨浦
2026-02-23 07:50:13
2028年的AI世界:AI在各方面都超出预期,但经济面目全非

2028年的AI世界:AI在各方面都超出预期,但经济面目全非

知识圈
2026-02-23 13:14:49
乌克兰无人机侵袭莫斯科空域致航班大面积延误,多位中国游客滞留莫斯科机场10小时,有乘客称赶着回国上班,延误航班正陆续起飞

乌克兰无人机侵袭莫斯科空域致航班大面积延误,多位中国游客滞留莫斯科机场10小时,有乘客称赶着回国上班,延误航班正陆续起飞

极目新闻
2026-02-23 12:06:50
机枪封锁高速,火烧汽车飞机!墨西哥击毙最大毒枭引发多地混乱,贩毒集团恐“内战”

机枪封锁高速,火烧汽车飞机!墨西哥击毙最大毒枭引发多地混乱,贩毒集团恐“内战”

红星新闻
2026-02-23 13:56:15
战斗民族至暗时刻:撒钱求人带飞机来飞,奈何全球航司无人敢应!

战斗民族至暗时刻:撒钱求人带飞机来飞,奈何全球航司无人敢应!

民航观点汇
2026-02-22 10:00:13
问界通报广东惠州车辆起火事件:非车辆自身原因导致

问界通报广东惠州车辆起火事件:非车辆自身原因导致

界面新闻
2026-02-23 14:05:36
华为确实是出现了严重的问题,只是至今官方还没有公开承认

华为确实是出现了严重的问题,只是至今官方还没有公开承认

雪中风车
2026-02-22 20:18:26
宇树去年卖了5500台机器人,深挖后发现:买主根本不是普通人

宇树去年卖了5500台机器人,深挖后发现:买主根本不是普通人

离离言几许
2026-02-22 20:45:23
“我就是她取精生子的工具”清华学霸哭诉,撕开了女富豪的遮羞布

“我就是她取精生子的工具”清华学霸哭诉,撕开了女富豪的遮羞布

北纬的咖啡豆
2026-02-20 19:12:17
央视披露一起现实版《惊蛰无声》:外籍男子多次请吃烧烤增进感情,一航天科研人员留学时被策反,大量搜集我国航天核心情报,被判刑7年

央视披露一起现实版《惊蛰无声》:外籍男子多次请吃烧烤增进感情,一航天科研人员留学时被策反,大量搜集我国航天核心情报,被判刑7年

扬子晚报
2026-02-23 14:44:43
江苏一老板凌晨付15000,承诺35000五月结清!网友问还能跟他干吗

江苏一老板凌晨付15000,承诺35000五月结清!网友问还能跟他干吗

火山詩话
2026-02-23 13:10:40
济宁套圈中汽车后续:花5600元赢大奖被赖账,民警来了老板才认怂

济宁套圈中汽车后续:花5600元赢大奖被赖账,民警来了老板才认怂

奇思妙想草叶君
2026-02-23 15:49:12
德媒称美即将打击伊朗,伊朗外长呼吁和平解决问题

德媒称美即将打击伊朗,伊朗外长呼吁和平解决问题

参考消息
2026-02-23 15:04:55
2026-02-23 18:51:00
IPO早知道 incentive-icons
IPO早知道
IPO情报专家。
6632文章数 2408关注度
往期回顾 全部

科技要闻

智谱、MiniMax合计蒸发近千亿市值,为何?

头条要闻

郑丽文:一旦台海爆发冲突 台湾将成最大输家

头条要闻

郑丽文:一旦台海爆发冲突 台湾将成最大输家

体育要闻

哈登版骑士首败:雷霆的冠军课

娱乐要闻

谷爱凌奶奶去世,谷爱凌泪奔

财经要闻

美国海关将停止征收被裁定违法的关税

汽车要闻

续航1810km!smart精灵#6 EHD超级电混2026年上市

态度原创

教育
时尚
本地
数码
手机

教育要闻

我把一个差生送进美国名校,如何帮他逆袭的?我兑现了当初的承诺

今年春天一定要拥有的针织,这样穿减龄又好看!

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

数码要闻

1986年的苹果巨无霸Mac电脑亮相:女孩打字演示 这键盘太狂了

手机要闻

荣耀MWC 2026全球发布会定档3月1日

无障碍浏览 进入关怀版