网易首页 > 网易号 > 正文 申请入驻

“全球大模型第一股”,公开技术细节

0
分享至

来源:上海证券报

  2月22日,智谱发布技术报告,全面解读GLM-5的技术细节。


  从技术导向而言,此前AI编程范式属于“Vibe Coding”(氛围编程),即程序员手动提示AI生成代码,较为依赖人力,效率有瓶颈。

  GLM-5瞄准的是Agentic Engineering(智能体工程),要求AI不再只是辅助工具,而是一个可以自主规划、执行、迭代的“虚拟工程师”。

  为了实现这一目标,GLM-5在技术上实现了四大突破:

  第一,更高效的模型“大脑”。GLM-5引入DSA稀疏注意力机制(DeepSeek Sparse Attention,DSA),可以理解为,模型在处理长文本时,不再对每个词都投入同等注意力,而是智能地聚焦在关键信息上。这大幅降低了计算成本,使得模型能用更少的资源处理更长的上下文。

  得益于此,智谱将模型参数规模扩展至744B(7440亿),同时将训练token规模提升至28.5T(28.5万亿)。

  第二,更快的“学习”方式。GLM-5构建并完善了一套名为“slime”的异步强化学习基础设施,这是其训练效率取得突破的核心。传统的强化学习训练效率相对较低,slime将“生成任务轨迹”和“模型参数更新”解耦,即将这两个过程分开后同时进行。这就像一边让AI在实践中不断尝试,一边后台同步总结经验教训,极大提升了训练效率。

  第三,更聪明的“决策”算法。GLM-5提出了全新的异步Agent RL算法。这一算法针对动态环境下的规划与自我纠错能力进行了深度优化,这使得模型能够从海量的、多步骤的交互中持续学习,优化其在动态环境中的规划、执行和自我纠错能力。

  第四,全面拥抱国产算力生态。从模型发布伊始,GLM-5就全面兼容七大主流国产芯片平台:华为昇腾、摩尔线程、海光、寒武纪、昆仑芯、沐曦与燧原,完成从底层内核到上层推理框架的深度优化。

  GLM-5发布后,获得了开发者社区的用脚投票。发布之初,智谱以代号“Pony Alpha”在顶级模型平台OpenRouter上进行了匿名盲测,在社区引发了轰动。初步统计显示,25%的用户推测它是Anthropic的Claude Sonnet5,20%认为是Grok的新版本,10%猜是DeepSeek-V4,而其余用户则成功猜中了GLM-5。

  “最终确认Pony Alpha真身即是GLM-5,这对我们团队是一次巨大的鼓舞,也有力回击了长期以来外界对中国本土模型技术水准的质疑。”智谱团队表示。

  GLM-5折射出的另一趋势,是开源与闭源模型的差距正在被填平。硅谷顶级的风投机构a16z近期发布了一组数据,称开源大模型与顶级闭源模型之间的能力差距,正在以肉眼可见的速度快速收窄。而报告中被选为开源阵营的代表、并与闭源天花板ClaudeOpus4.6进行正面对标的,正是GLM-5。

  智谱团队称,开源追赶闭源的战役仍在继续,将坚定不移地探索技术前沿,构建更高效、更智能的底层系统。

  作者:孙小程

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
拉住跳楼女友5分钟至力竭,仍被判10%责赔8万:司法自由裁量+无限责任令人不寒而栗

拉住跳楼女友5分钟至力竭,仍被判10%责赔8万:司法自由裁量+无限责任令人不寒而栗

少爷写春秋
2026-04-18 22:47:55
陕西张扣扣除夕灭门案:终南山通灵师对话亡魂,原来王家只是棋子

陕西张扣扣除夕灭门案:终南山通灵师对话亡魂,原来王家只是棋子

诡谲怪谈
2025-02-19 20:35:19
曾高喊打败美帝:如今却全家跑去美国,84岁活成这样,引人热议!

曾高喊打败美帝:如今却全家跑去美国,84岁活成这样,引人热议!

无处不风景love
2026-04-16 13:36:36
杨立昆开喷 Anthropic CEO:别信那个卖AI的人

杨立昆开喷 Anthropic CEO:别信那个卖AI的人

象先志
2026-04-19 21:04:50
美军袭击一艘伊朗商船 迫使其返航

美军袭击一艘伊朗商船 迫使其返航

财联社
2026-04-20 01:22:09
阿森纳1-2,赛后阿尔特塔信心满满的表态引热议,球迷:其实慌了

阿森纳1-2,赛后阿尔特塔信心满满的表态引热议,球迷:其实慌了

侧身凌空斩
2026-04-20 02:32:20
马斯克发布新芯片,性能狂飙4000%

马斯克发布新芯片,性能狂飙4000%

林子说事
2026-04-19 18:00:38
随着41岁C罗破门+利雅得胜利4-0,亚冠二级4强已诞生3席

随着41岁C罗破门+利雅得胜利4-0,亚冠二级4强已诞生3席

侧身凌空斩
2026-04-20 00:01:29
争议!阿森纳7500万中卫锁喉+撕烂哈兰德球衣 故意顶牛挑衅逃红牌

争议!阿森纳7500万中卫锁喉+撕烂哈兰德球衣 故意顶牛挑衅逃红牌

我爱英超
2026-04-20 02:51:23
别再尬演“万人迷”!满脸褶子疙瘩、鼻孔朝天,这皮囊能迷倒谁?

别再尬演“万人迷”!满脸褶子疙瘩、鼻孔朝天,这皮囊能迷倒谁?

雨月海星
2026-04-18 05:25:40
林徽因落选的国徽方案,网友看后感叹:审美确实厉害,但真不合适

林徽因落选的国徽方案,网友看后感叹:审美确实厉害,但真不合适

浩渺青史
2026-04-17 13:55:15
刚刚!集体下跌

刚刚!集体下跌

中国基金报
2026-04-19 19:32:16
外交部:如美方执意以所谓“军品出口”为借口对华加征关税,中方必将坚决反制

外交部:如美方执意以所谓“军品出口”为借口对华加征关税,中方必将坚决反制

全国党媒信息公共平台
2026-04-15 10:18:13
缺德到这种程度,已经没有半点“人性”了

缺德到这种程度,已经没有半点“人性”了

胖胖说他不胖
2026-04-17 09:25:19
为何川藏上的司机,总要点根烟扔出窗外?藏民:扔烟的都是聪明人

为何川藏上的司机,总要点根烟扔出窗外?藏民:扔烟的都是聪明人

网络易不易
2026-04-15 10:53:59
特朗普1个月骂4次纸老虎 北约秘书长:他不会退群

特朗普1个月骂4次纸老虎 北约秘书长:他不会退群

看看新闻Knews
2026-04-19 19:16:02
北京连下六道指令,陕西硬抗整整四年,最高指示:让749局来

北京连下六道指令,陕西硬抗整整四年,最高指示:让749局来

小哥很OK
2025-12-12 14:33:01
1939年,一名波兰女孩赤身露体被迫和德军合影,低着头一脸羞愧

1939年,一名波兰女孩赤身露体被迫和德军合影,低着头一脸羞愧

浩舞默画
2026-04-07 09:05:56
为什么国家越来越强,我们还是感觉到没钱?真相扎心了

为什么国家越来越强,我们还是感觉到没钱?真相扎心了

谈史论天地
2026-04-17 11:25:18
“谷雨不排毒,夏天身体堵”,明日谷雨,多吃4样排毒菜,正当季

“谷雨不排毒,夏天身体堵”,明日谷雨,多吃4样排毒菜,正当季

小茉莉美食记
2026-04-19 09:41:12
2026-04-20 04:00:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2919462文章数 6774关注度
往期回顾 全部

科技要闻

50分26秒破人类纪录!300台机器人狂飙半马

头条要闻

半年下沉22厘米 女子家中坐拥价值上亿别墅却没法住人

头条要闻

半年下沉22厘米 女子家中坐拥价值上亿别墅却没法住人

体育要闻

湖人1比0火箭:老詹比乌度卡像教练

娱乐要闻

何润东涨粉百万!内娱隔空掀桌第一人

财经要闻

华谊兄弟,8年亏光85亿

汽车要闻

29分钟大定破万 极氪8X为什么这么多人买?

态度原创

本地
教育
时尚
数码
军事航空

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

教育要闻

655家单位、1.29万个岗位,湖南用心帮大学生找工作

装修“精神角落”,就是这么上瘾

数码要闻

华为新机发布前瞻:阔折叠X Max+影像旗舰Pura 90,都没悬念了

军事要闻

伊朗逼退美扫雷艇:美方求给15分钟撤退

无障碍浏览 进入关怀版