网易首页 > 网易号 > 正文 申请入驻

智谱发布GLM-5技术细节:工程级智能,适配国产算力

0
分享至

2月12日,智谱发布GLM-5,技惊四座。10天后技术报告出炉,让人们一窥GLM-5模型的内在基因。

有意思的不是又刷了什么榜,而是整个思路变了:不再比参数大小,开始比系统工程能力。

GLM-5做的三件事都挺实在:1、模型真的能完成复杂任务了,不只是写几行代码;2、训练效率上了一个台阶,超大模型不再是纯烧钱游戏;3、从底层到推理框架全面适配国产芯片——这个最关键。

如果说之前是“中国在追赶”,现在则已经开始搭自己的技术体系了。

从"给代码"到"做系统"

报告提了个概念转变:从 Vibe Coding 到 Agentic Engineering。前者是你说一句我给段代码,后者是你给目标、我自己规划拆解、写代码调工具、调试迭代,直到把整个系统搞定。

GLM-5的重点已经不是单题得分,而是:

200K上下文(几百页文档的量)
跨文件软件工程任务
长周期任务中持续规划修正
多轮交互保持思考一致性

比如 Vending-Bench 2 要求"模拟经营自动售货机一年",最后看账户余额。GLM-5在开源模型里第一,接近 Claude Opus 4.5。这测的是长期决策能力,不是问答题。

模型开始有"工程级智能"了。

稀疏注意力:不再无脑烧算力

GLM-5有744B参数(激活40B),训练了28.5万亿token。按传统架构,算力消耗会爆炸。

核心创新是DSA(DeepSeek稀疏注意力)。传统注意力机制"看所有内容",计算复杂度平方级增长;DSA动态判断"哪些token真正重要",只算关键部分。

200K长上下文下,DSA把注意力计算量降低1.5–2倍。

而且——无损。

其他高效注意力方法通常牺牲精度,DSA通过继续预训练平滑过渡,性能不退化。

结果是:

  • 同样算力 → 更长上下文
  • 同样成本 → 更高推理能力
  • 同样硬件 → 更大模型

对中国来说,效率创新比堆算力重要得多。

强化学习架构重构

GLM-5的RL体系做了彻底改造。

生成与训练解耦。模型生成轨迹,训练在另一套系统异步进行。过去要等最慢任务完成才继续训练,现在谁先完成谁先训练,吞吐大幅提升。对长程Agent任务至关重要。

异步Agent RL算法解决了真实软件工程中任务持续数小时的问题。引入:

  • Token-in-Token-out(避免重新分词误差)
  • 双侧重要性采样
  • DP-aware路由优化KV cache

模型能在复杂环境中稳定学习,不会因策略偏移崩溃。

说白了,解决的是"如何让大模型在真实任务中持续自我改进"。

真正关键的一步:适配国产算力

报告对中国AI最重要的部分在这。

GLM-5原生适配国产GPU生态,已兼容华为昇腾、摩尔线程、海光、寒武纪、昆仑芯、天数智芯、燧原。

不是"能跑"那种适配,而是:

  • KV cache调度优化
  • 通信机制适配
  • 混合精度训练匹配
  • INT4量化感知训练对齐
  • 分布式并行策略重构

很多国产芯片生态的难点不是算力,是软件栈。

GLM-5的意义在于:不是围绕单一海外硬件架构设计,而是面向多种国产算力平台做系统级适配。

这是个质变——中国大模型开始围绕本土硬件生态做工程优化,不再被动迁移。

报告称,得益于上述软硬协同的极致优化,GLM-5 在单台国产算力节点上的性能表现,已足可媲美由两台国际主流 GPU 组成的计算集群;不仅如此,在长序列处理场景下,其部署成本更是大幅降低了 50%。

软硬件闭环正在形成

把GLM-5的技术路径拆开看,是个完整闭环:

模型架构创新(DSA)→ 训练效率优化(异步RL)→ 内存与通信压缩(ZeRO、激活卸载)→ 低精度对齐(INT4 QAT)→ 国产芯片深度适配

这是一条完整的国产AI工程链路。

过去中国AI的优势在应用层,现在开始进入架构创新、算法工程、训练系统、芯片适配、推理框架的全栈优化。

这份技术报告的真正意义,不在某个基准测试分数,在于中国AI第一次以"体系能力"展示竞争力。

从炫技到成熟

GLM-5的报告没过度强调"我们比谁强多少",详细披露训练流程、算法选择、工程权衡、消融实验。这本身就是成熟的表现。

当一个模型开始谈GPU利用率、长尾延迟、KV cache复用、量化kernel对齐、灾难性遗忘控制——它已经不是在秀能力,而是在做工业级系统。

对中国来说,GLM-5更像是一次宣告:我们不仅能做大模型,也能做自己的算力适配,还能把两者打通。

这才是真正的跨越。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
152万只能卖55万,19000一平跌到2900,房产信仰的破碎!

152万只能卖55万,19000一平跌到2900,房产信仰的破碎!

A活着
2026-02-21 18:38:13
闹大了!相亲没看上,河南一女生把男方照片挂网上,还被本人刷到

闹大了!相亲没看上,河南一女生把男方照片挂网上,还被本人刷到

火山詩话
2026-02-22 14:25:44
贝加尔湖7名遇难中国游客身份全部确认:一家四口中仅一名男性生还,另有4人约团司机同行;接私单司机身份曝光,属非法载客

贝加尔湖7名遇难中国游客身份全部确认:一家四口中仅一名男性生还,另有4人约团司机同行;接私单司机身份曝光,属非法载客

扬子晚报
2026-02-21 22:44:48
冬奥会收官日,中国第5金诞生!谷爱凌大翻盘:失误后从第8升第1

冬奥会收官日,中国第5金诞生!谷爱凌大翻盘:失误后从第8升第1

侃球熊弟
2026-02-22 19:16:16
贝加尔湖遇难中国游客身份全部确认:七条生命,一个破碎的春节

贝加尔湖遇难中国游客身份全部确认:七条生命,一个破碎的春节

青木说
2026-02-22 09:02:50
当利润跌破4%,一场比新车更惨烈的战争开始了

当利润跌破4%,一场比新车更惨烈的战争开始了

大佬灼见
2026-02-20 09:03:49
双膝跪地!谷爱凌眼眶红了:身披五星红旗+高唱中国国歌 回击质疑

双膝跪地!谷爱凌眼眶红了:身披五星红旗+高唱中国国歌 回击质疑

念洲
2026-02-22 19:46:50
平顶山打人夫妻结婚照曝光:男的酷似昆山龙哥,女的刻薄像燕冬萍

平顶山打人夫妻结婚照曝光:男的酷似昆山龙哥,女的刻薄像燕冬萍

江山挥笔
2026-02-22 09:48:58
事发上海和平饭店门口!一声闷响,民警狂奔呐喊,救援争分夺秒

事发上海和平饭店门口!一声闷响,民警狂奔呐喊,救援争分夺秒

环球网资讯
2026-02-22 07:25:07
后续!摔倒被扶反索赔22万大妈认怂撤诉 女孩母亲再发声 事恐没完

后续!摔倒被扶反索赔22万大妈认怂撤诉 女孩母亲再发声 事恐没完

离离言几许
2026-02-22 11:08:04
无名指超食指长之人,这4样东西别去碰,恐会泄漏你的福气!

无名指超食指长之人,这4样东西别去碰,恐会泄漏你的福气!

一根香烟的少女
2025-09-22 16:52:27
马未都:香港宁愿要20万菲佣,也不接受内地保姆,原因很简单

马未都:香港宁愿要20万菲佣,也不接受内地保姆,原因很简单

谈史论天地
2026-02-19 12:44:34
王濛社媒:谷爱凌实至名归!轻盈舒展,优雅大方

王濛社媒:谷爱凌实至名归!轻盈舒展,优雅大方

懂球帝
2026-02-22 19:59:04
美方扶持的4位中国富豪开始露头了:在华疯狂捞金,扭头捐给美国

美方扶持的4位中国富豪开始露头了:在华疯狂捞金,扭头捐给美国

来科点谱
2026-02-22 07:06:28
见到交警强行开车门坐自己旁边,陈赓忽然开口:我的车你也敢坐?

见到交警强行开车门坐自己旁边,陈赓忽然开口:我的车你也敢坐?

芊芊子吟
2026-02-22 16:45:08
大理一游客大年初四订酒店订到医院:最贵149元/晚,有食堂还可随时就诊

大理一游客大年初四订酒店订到医院:最贵149元/晚,有食堂还可随时就诊

上游新闻
2026-02-22 12:55:54
湖南女子输液去世后续:丈夫发声,原因令人愤怒,医院愿赔11万

湖南女子输液去世后续:丈夫发声,原因令人愤怒,医院愿赔11万

离离言几许
2026-02-21 23:21:43
雷军晒春节滑雪照引热议!网友:摄影师是高手中的高手

雷军晒春节滑雪照引热议!网友:摄影师是高手中的高手

快科技
2026-02-22 14:08:12
重大错误,印制错误的韩国国旗被升起4次,国际奥委会已致歉

重大错误,印制错误的韩国国旗被升起4次,国际奥委会已致歉

懂球帝
2026-02-22 17:22:25
美国总统特使:特朗普感到“好奇”,“伊朗为何还没有屈服”

美国总统特使:特朗普感到“好奇”,“伊朗为何还没有屈服”

环球网资讯
2026-02-22 17:32:07
2026-02-22 21:12:49
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
141957文章数 2652604关注度
往期回顾 全部

科技要闻

马斯克:星舰每年将发射超过10000颗卫星

头条要闻

中国第五金 谷爱凌U型场地技巧决赛夺金李方慧摘银

头条要闻

中国第五金 谷爱凌U型场地技巧决赛夺金李方慧摘银

体育要闻

自由式滑雪U型池 谷爱凌成功卫冕

娱乐要闻

裴世矩养侄为刃 看懂两次放行裴行俨!

财经要闻

特朗普新加征关税税率从10%提升至15%

汽车要闻

续航1810km!smart精灵#6 EHD超级电混2026年上市

态度原创

房产
亲子
教育
游戏
公开课

房产要闻

窗前即地标!独占三亚湾C位 自贸港总裁行宫亮相

亲子要闻

萌娃怀疑妈妈吃了个宝宝,问的妈妈哭笑不得

教育要闻

本科生,就业去哪了?

2026年迎财神大赛,冠军是爆出茅台的传奇玩家!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版