网易首页 > 网易号 > 正文 申请入驻

智谱GLM-5强调的Agentic Engineering能力是什么?|甲子光年

0
分享至



智谱GLM-5验证了Agentic Engineering的可行性,但成本正在变得更显性。

作者|周悦

编辑|王博

今天,智谱上线并开源GLM-5,其在Coding与Agent能力上,取得开源SOTA表现,在真实编程场景的使用体感逼近 Claude Opus 4.5,擅长复杂系统工程与长程Agent任务。


在全球权威的Artificial Analysis榜单中,GLM-5位居全球第四、开源第一,图片来源:智谱

这一发布直接刺激了资本市场,智谱股价一度涨超41%。截至收盘,智谱股价报402港元/股,涨幅为28.68%,市值为1792.3亿港元。

值得注意的是,智谱称GLM-5为“Agentic Engineering时代最好的开源模型”。

什么是Agentic Engineering?为什么智谱要强调这个概念呢?

1.从“氛围”到“工程”

如果说AI行业需要寻找一位能精准捕捉技术风向的观测者,特斯拉前AI总监、OpenAI创始成员Andrej Karpathy无疑是最佳人选。

2025年2月,他提出Vibe Coding(氛围编码)概念。开发者不再逐行写代码,而是用自然语言描述意图,让模型在一种更像即兴创作的状态里生成实现。这种体验带来了一段明显的“编程蜜月期”:生成更快、试错更便宜、上手更轻松。

但一年后,Karpathy抛出了一个更现实的概念:Agentic Engineering(代理工程)。他的关注点不再是单纯地追求生成代码,而是试图让AI交付完整的工程闭环。

从“氛围”到“工程”的转变,折射出一个更直观的行业变化:写代码的门槛在降低,但让模型跑完工程的门槛并没有同步下降。

在「甲子光年」看来,要让Agentic Engineering真的跑起来,需要满足两个条件:模型能力强,成本可接受。

我们把它粗略概括为一个便于理解的表达:Agentic Engineering的扩散性 ≈ 能力阈值 × 成本阈值。

前者决定可行性,后者决定普及率。没有足够的智能,循环会放大错误;能力足够时,成本会变成新的瓶颈。这种范式往往会更早落在预算更充足、对收敛速度更敏感的团队里。

今天,智谱GLM-5的发布与GLM Coding Plan价格体系调整,让这两个变量在同一个时间点上显得更清晰。


Andrej Karpathy发布博文,图片来源:X平台

理解这次转变,需要还原开发者的真实工作流。

在Vibe Coding时代,一个后端开发者使用Cursor等编程工具时,典型循环往往是:人类输入—模型输出—人类验证—模型修改——人类确认。它提高了生成效率,但没有消除人工介入的难题。

Karpathy对此的总结很精准:“很好、很有趣,而且几乎能行得通。(It was good and fun and it almost worked)”

关键就在“几乎”。

当任务开始变长、上下文变复杂、回归测试变多时,人类介入的频率并不会下降,开发者依然需要反复确认。瓶颈逐渐从代码生成速度转向开发者的验证速度。

Agentic Engineering试图打破的,正是这种线性依赖,让模型把“找—改—测—再改—再测”的闭环尽量跑完,人类更多在关键节点介入,最终对结果负责。开发者的角色也随之变化,从写代码的人变成更像“监督者”。

在这样的语境下,GLM-5之所以值得被讨论,是因为它为开源模型能否更接近代码代理工作流,提供了一个可观察样本也就是把公式左侧的变量(能力阈值)推到了一个更高的位置。

根据智谱披露的结果,在衡量AI解决真实GitHub问题能力的权威榜单SWE-bench Verified上,GLM-5取得了77.8的成绩,这一数据逼近了闭源模型的第一梯队。与此同时,在部分第三方公开榜单下,GLM-5也处于开源模型的前列。

这些分数当然不是全部意义,但它们至少指向一个变化:在给定代码仓库、给定验证条件的任务设定下,开源模型完成更长程的规划、反思与自我修正,正在变得更可行。


大模型评估结果,图片来源:智谱

从智谱披露的技术路径来看,GLM-5在几个关键维度上做了面向长流程任务的强化:

  • 参数规模扩展:参数规模扩展至744B(激活40B),预训练数据量提升,增强了通用智能;

  • 异步强化学习:引入“Slime”框架和异步智能体强化学习算法,使模型能够从长程交互中持续学习;

  • 稀疏注意力机制:集成DeepSeek Sparse Attention,保证了在处理长上下文时的效果无损,提升token效率。

更值得注意的是,智谱表示,GLM-5已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等多家国产算力平台的深度推理适配与优化。这说明,在部署路径上,它正在探索一种更可落地的工程组合方式。

这共同指向了一个结论:开源模型在“更接近工程闭环”这一维度上,正在跨过更高的能力门槛。

2.现实的成本问题

当能力门槛被抬上去之后,公式右侧的变量“成本阈值”会更快变成现实问题。

Agentic Engineering的核心逻辑是“循环”。一次真实的修复任务往往并不是一问一答,而是多轮定位、修改、测试与复盘。在这种模式下,Token消耗与推理时长通常会显著高于普通对话。

换句话说,它不是“更省钱地写代码”,而是用更密集的算力去置换人类的时间。

2月12日,智谱发布价格调整说明,宣布 GLM Coding Plan取消首购优惠,整体价格上调,涨幅自30%起,将原因归于需求增长与高负载下的稳定性与服务质量保障。

这些信息共同指向一个更明确的现实:当模型开始被更频繁地当作生产力工具使用,成本会更早变成账单。

因此,“涨价”本身不必被简化为单一结论。更准确的说法是:能力阈值在上升,成本阈值也更显性。

GLM-5的案例一定程度说明,未来的软件工程可能会呈现出一种分层态势

  • Vibe Coding层,对于日常、短程的辅助开发,低成本、快响应的模型依然是主流;

  • Agentic Engineering层,面向关键任务、复杂架构调整或必须快速收敛的问题,更强的代理工程能力,更像一种需要付费的“加速券”——用更高的推理预算,换取更快的工程收敛。

对大公司和追求极致效率的团队来说,这是一笔算得过来的投入;而对于更广泛的个人开发者,这或许意味着需要更精细地计算 ROI(投资回报率)。

我们或许已经看到了一个更接近现实的结论:模型能力决定Agentic Engineering正在走向现实;成本,决定它能扩散到多远。

(封面图来源:AI生成)

声明:包含AI生成内容

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
这是真有钱!沙特撤销前利物浦9号联赛资格,2000+万薪资几乎白给

这是真有钱!沙特撤销前利物浦9号联赛资格,2000+万薪资几乎白给

里芃芃体育
2026-02-14 10:30:12
伊能静现身春晚彩排,打扮超级年轻,就是脸部有点浮肿不太自然

伊能静现身春晚彩排,打扮超级年轻,就是脸部有点浮肿不太自然

君笙的拂兮
2026-02-15 02:13:14
在七千多的养老院住了一年才明白:再贵的养老院,也买不来这3样

在七千多的养老院住了一年才明白:再贵的养老院,也买不来这3样

小马达情感故事
2026-02-10 11:50:09
波切蒂诺:梅西从不积极逼抢,在巴萨他也不这么做,输球只怪教练

波切蒂诺:梅西从不积极逼抢,在巴萨他也不这么做,输球只怪教练

夏侯看英超
2026-02-15 01:08:49
只剩11天,俄罗斯撤侨准时开始,中方按兵不动,美国偷偷断供石油

只剩11天,俄罗斯撤侨准时开始,中方按兵不动,美国偷偷断供石油

介知
2026-02-15 12:36:09
亚伯拉罕:这个结果确实让人难以接受,但我为队友们感到自豪

亚伯拉罕:这个结果确实让人难以接受,但我为队友们感到自豪

懂球帝
2026-02-15 05:11:11
在日华人直言:如今中国要是再和日本发生冲突,根本撑不过14年!

在日华人直言:如今中国要是再和日本发生冲突,根本撑不过14年!

南权先生
2026-02-12 15:39:07
著名杀猪盘——韩国浦项钢铁,被印度折磨了十二年,没炼一斤铁

著名杀猪盘——韩国浦项钢铁,被印度折磨了十二年,没炼一斤铁

斜烟风起雨未
2026-01-21 13:39:33
雷佳音:大学时陈赫瞧不起我,见面都躲着走,我农村人,就这样

雷佳音:大学时陈赫瞧不起我,见面都躲着走,我农村人,就这样

白面书誏
2025-11-20 17:29:35
在学校发生的八卦能有多炸裂?网友:怀孕率比升学率高,不夸张

在学校发生的八卦能有多炸裂?网友:怀孕率比升学率高,不夸张

带你感受人间冷暖
2026-02-05 00:30:08
著名艺术家达式常坐轮椅现身,虽已86岁,眉宇间仍是昔日男神模样

著名艺术家达式常坐轮椅现身,虽已86岁,眉宇间仍是昔日男神模样

章眽八卦
2026-02-08 21:31:17
正式官宣!又1国足希望之星留洋,加盟欧洲豪门,接过前辈接力棒

正式官宣!又1国足希望之星留洋,加盟欧洲豪门,接过前辈接力棒

体坛鉴春秋
2026-02-15 12:49:14
中美外长达成共识,鲁比奥或得到“豁免”,全球方向正在发生变化

中美外长达成共识,鲁比奥或得到“豁免”,全球方向正在发生变化

东极妙严
2026-02-14 18:03:06
印度国产氮化镓雷达成功“突围”,中国贡献了多少隐形力量?

印度国产氮化镓雷达成功“突围”,中国贡献了多少隐形力量?

瞩望云霄
2026-02-13 23:27:08
26岁世界冠军晒工资单:月薪15万 本人解释原因 网友评论两极分化

26岁世界冠军晒工资单:月薪15万 本人解释原因 网友评论两极分化

念洲
2026-02-14 16:28:02
全球唯一一只不属于中国的熊猫,叫欣欣,吃不到竹子吃的是仙人掌

全球唯一一只不属于中国的熊猫,叫欣欣,吃不到竹子吃的是仙人掌

西楼知趣杂谈
2026-01-31 13:18:43
意甲最新积分战报:科莫爆冷,拉齐奥倒下,国米绝杀尤文

意甲最新积分战报:科莫爆冷,拉齐奥倒下,国米绝杀尤文

足球狗说
2026-02-15 07:07:01
博主吐槽遇到保姆刺客!要求给2000块红包,不给就说她不懂感恩!

博主吐槽遇到保姆刺客!要求给2000块红包,不给就说她不懂感恩!

另子维爱读史
2026-02-14 20:31:24
北京美女王博谷:嫁小7岁演员巴图,婚后生两子,风光背后有辛酸

北京美女王博谷:嫁小7岁演员巴图,婚后生两子,风光背后有辛酸

夏末moent
2026-02-02 17:42:14
社保局提醒:身份证一换,马上做两件事,别等钱停了才后悔

社保局提醒:身份证一换,马上做两件事,别等钱停了才后悔

小陆搞笑日常
2026-02-15 12:56:42
2026-02-15 14:59:00
甲子光年
甲子光年
中国科技产业化前沿智库
3346文章数 9256关注度
往期回顾 全部

科技要闻

发春节红包的大厂都被约谈了

头条要闻

女子在上海机场崩溃后奇迹突现 超10万人点赞感谢信

头条要闻

女子在上海机场崩溃后奇迹突现 超10万人点赞感谢信

体育要闻

最戏剧性的花滑男单,冠军为什么是他?

娱乐要闻

河南春晚被骂上热搜!大量广告满屏AI

财经要闻

谁在掌控你的胃?起底百亿"飘香剂"江湖

汽车要闻

奔驰中国换帅:段建军离任,李德思接棒

态度原创

时尚
数码
旅游
游戏
亲子

推广中奖名单-更新至2026年2月3日推广

数码要闻

三星Galaxy Watch8 Classic更新上线独立微信手表版App

旅游要闻

临沂新春赏灯地图,来了!

大荒归潮!手机搬砖躺赚旭旭宝宝都来入局

亲子要闻

一位优秀保姆的下户

无障碍浏览 进入关怀版