网易首页 > 网易号 > 正文 申请入驻

智谱发布GLM-5技术细节:工程级智能,适配国产算力

0
分享至

2月12日,智谱发布GLM-5,技惊四座。10天后技术报告出炉,让人们一窥GLM-5模型的内在基因。

有意思的不是又刷了什么榜,而是整个思路变了:不再比参数大小,开始比系统工程能力。

GLM-5做的三件事都挺实在:1、模型真的能完成复杂任务了,不只是写几行代码;2、训练效率上了一个台阶,超大模型不再是纯烧钱游戏;3、从底层到推理框架全面适配国产芯片——这个最关键。

如果说之前是“中国在追赶”,现在则已经开始搭自己的技术体系了。

从"给代码"到"做系统"

报告提了个概念转变:从 Vibe Coding 到 Agentic Engineering。前者是你说一句我给段代码,后者是你给目标、我自己规划拆解、写代码调工具、调试迭代,直到把整个系统搞定。

GLM-5的重点已经不是单题得分,而是:

200K上下文(几百页文档的量)
跨文件软件工程任务
长周期任务中持续规划修正
多轮交互保持思考一致性

比如 Vending-Bench 2 要求"模拟经营自动售货机一年",最后看账户余额。GLM-5在开源模型里第一,接近 Claude Opus 4.5。这测的是长期决策能力,不是问答题。

模型开始有"工程级智能"了。

稀疏注意力:不再无脑烧算力

GLM-5有744B参数(激活40B),训练了28.5万亿token。按传统架构,算力消耗会爆炸。

核心创新是DSA(DeepSeek稀疏注意力)。传统注意力机制"看所有内容",计算复杂度平方级增长;DSA动态判断"哪些token真正重要",只算关键部分。

200K长上下文下,DSA把注意力计算量降低1.5–2倍。

而且——无损。

其他高效注意力方法通常牺牲精度,DSA通过继续预训练平滑过渡,性能不退化。

结果是:

  • 同样算力 → 更长上下文
  • 同样成本 → 更高推理能力
  • 同样硬件 → 更大模型

对中国来说,效率创新比堆算力重要得多。

强化学习架构重构

GLM-5的RL体系做了彻底改造。

生成与训练解耦。模型生成轨迹,训练在另一套系统异步进行。过去要等最慢任务完成才继续训练,现在谁先完成谁先训练,吞吐大幅提升。对长程Agent任务至关重要。

异步Agent RL算法解决了真实软件工程中任务持续数小时的问题。引入:

  • Token-in-Token-out(避免重新分词误差)
  • 双侧重要性采样
  • DP-aware路由优化KV cache

模型能在复杂环境中稳定学习,不会因策略偏移崩溃。

说白了,解决的是"如何让大模型在真实任务中持续自我改进"。

真正关键的一步:适配国产算力

报告对中国AI最重要的部分在这。

GLM-5原生适配国产GPU生态,已兼容华为昇腾、摩尔线程、海光、寒武纪、昆仑芯、天数智芯、燧原。

不是"能跑"那种适配,而是:

  • KV cache调度优化
  • 通信机制适配
  • 混合精度训练匹配
  • INT4量化感知训练对齐
  • 分布式并行策略重构

很多国产芯片生态的难点不是算力,是软件栈。

GLM-5的意义在于:不是围绕单一海外硬件架构设计,而是面向多种国产算力平台做系统级适配。

这是个质变——中国大模型开始围绕本土硬件生态做工程优化,不再被动迁移。

报告称,得益于上述软硬协同的极致优化,GLM-5 在单台国产算力节点上的性能表现,已足可媲美由两台国际主流 GPU 组成的计算集群;不仅如此,在长序列处理场景下,其部署成本更是大幅降低了 50%。

软硬件闭环正在形成

把GLM-5的技术路径拆开看,是个完整闭环:

模型架构创新(DSA)→ 训练效率优化(异步RL)→ 内存与通信压缩(ZeRO、激活卸载)→ 低精度对齐(INT4 QAT)→ 国产芯片深度适配

这是一条完整的国产AI工程链路。

过去中国AI的优势在应用层,现在开始进入架构创新、算法工程、训练系统、芯片适配、推理框架的全栈优化。

这份技术报告的真正意义,不在某个基准测试分数,在于中国AI第一次以"体系能力"展示竞争力。

从炫技到成熟

GLM-5的报告没过度强调"我们比谁强多少",详细披露训练流程、算法选择、工程权衡、消融实验。这本身就是成熟的表现。

当一个模型开始谈GPU利用率、长尾延迟、KV cache复用、量化kernel对齐、灾难性遗忘控制——它已经不是在秀能力,而是在做工业级系统。

对中国来说,GLM-5更像是一次宣告:我们不仅能做大模型,也能做自己的算力适配,还能把两者打通。

这才是真正的跨越。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
国内或将逐渐停止肠镜检查?做检查对身体有影响?医生告诉您真相

国内或将逐渐停止肠镜检查?做检查对身体有影响?医生告诉您真相

健康科普365
2026-04-17 20:05:08
19.99万起!又一中大型新能源SUV正式上市,100度大电池+空气悬架

19.99万起!又一中大型新能源SUV正式上市,100度大电池+空气悬架

DeepAuto车探
2026-04-20 13:29:53
还不赶紧过来学习演奏?

还不赶紧过来学习演奏?

贵圈真乱
2026-04-19 09:36:08
中科院院长正式宣布!已完成这项技术突破,反超3倍碾压美国

中科院院长正式宣布!已完成这项技术突破,反超3倍碾压美国

触摸史迹
2026-04-18 17:30:00
郑丽文判断准确,解放军通牒在即,赖清德将登机离台

郑丽文判断准确,解放军通牒在即,赖清德将登机离台

风雨与阳光
2026-04-21 03:13:01
首场下克上!魔术灭活塞总分1-0 坎宁安39+5+4班凯罗23+9

首场下克上!魔术灭活塞总分1-0 坎宁安39+5+4班凯罗23+9

醉卧浮生
2026-04-20 09:08:16
比披丝巾更可怕的是“瑜伽裤外穿”,廉价又卡裆,三角区更尴尬

比披丝巾更可怕的是“瑜伽裤外穿”,廉价又卡裆,三角区更尴尬

生命之泉的奥秘
2026-03-20 03:56:49
广东接连输福建山西给朱芳雨敲响警钟,夺冠靠引援真不如自己挖潜

广东接连输福建山西给朱芳雨敲响警钟,夺冠靠引援真不如自己挖潜

光辉记
2026-04-21 00:42:42
扎心拷问!最终都是灵活就业,从小鸡娃当学霸,到底图啥?

扎心拷问!最终都是灵活就业,从小鸡娃当学霸,到底图啥?

狐狸先森讲升学规划
2026-04-20 08:40:03
独家:某运营商原省公司总经理出事细节曝光  被送往原任职地接受调查! 与另一个集团二级正职没交集

独家:某运营商原省公司总经理出事细节曝光 被送往原任职地接受调查! 与另一个集团二级正职没交集

新浪财经
2026-04-20 21:43:43
广东省最厉害的八个医院科室

广东省最厉害的八个医院科室

白宸侃片
2026-04-20 11:30:58
胡杏儿一家五口出游度假,画面温馨有爱,三个儿子一个比一个帅气

胡杏儿一家五口出游度假,画面温馨有爱,三个儿子一个比一个帅气

手工制作阿歼
2026-04-21 00:59:47
巴黎FC主帅:我们队里的意大利人都比尤文和米兰的意大利人多

巴黎FC主帅:我们队里的意大利人都比尤文和米兰的意大利人多

懂球帝
2026-04-20 09:47:26
立讯精密: 预计2027年Q3~Q4批量交付CPC

立讯精密: 预计2027年Q3~Q4批量交付CPC

每日经济新闻
2026-04-20 21:40:20
哥斯达黎加称对中方不满意,未能达到谈判预期,要求中国扩大进口

哥斯达黎加称对中方不满意,未能达到谈判预期,要求中国扩大进口

小嵩
2026-04-20 03:12:38
原来我们随时都可能去世

原来我们随时都可能去世

言立方
2026-04-20 18:24:52
全面狙击AMD,intel违背祖训搞一插槽传4代了

全面狙击AMD,intel违背祖训搞一插槽传4代了

小兔子发现大事情
2026-04-19 21:49:26
鲁尼:枪手能赢下剩余所有比赛,但曼城可能在埃弗顿身上失分

鲁尼:枪手能赢下剩余所有比赛,但曼城可能在埃弗顿身上失分

懂球帝
2026-04-20 11:23:07
东风导弹泄密案!间谍郭万钧一家三口,全部被处以死刑

东风导弹泄密案!间谍郭万钧一家三口,全部被处以死刑

番外行
2026-03-31 08:28:28
巴勒斯坦最大错误,就是过去向以色列人出售土地,没有底线酿祸根

巴勒斯坦最大错误,就是过去向以色列人出售土地,没有底线酿祸根

抽象派大师
2026-04-21 01:14:08
2026-04-21 05:55:00
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
144858文章数 2653325关注度
往期回顾 全部

科技要闻

HUAWEI Pura X Max发布 售价10999元起

头条要闻

19岁女孩挪用自家1700万当"榜一大姐" 亲爹带女儿自首

头条要闻

19岁女孩挪用自家1700万当"榜一大姐" 亲爹带女儿自首

体育要闻

阿森纳已拼尽全力,但你早干嘛去了...

娱乐要闻

《八千里路云和月》田家泰暗杀

财经要闻

利润暴跌7成,字节到底在做什么

汽车要闻

把天门山搬进厂?开仰望U8冲上45度坡的那刻 我腿软了

态度原创

教育
时尚
旅游
手机
亲子

教育要闻

“真大方,还拍给外人看”,女儿蹭枕头,家长放网上,网友却毛了

春天衣服不用准备太多!这几大单品提前备好,百搭实用又不过时

旅游要闻

以“Fun”为名,深圳布吉将发布全域旅游品牌IP

手机要闻

OPPO影像旗舰高端发力 Find X9 Ultra走出国门

亲子要闻

居家防夹刻不容缓,多名儿童在家玩闹时手指被夹断

无障碍浏览 进入关怀版