网易首页 > 网易号 > 正文 申请入驻

智谱GLM-5横空出世:开源模型追平闭源天花板的技术逆袭

0
分享至



2月11日深夜,智谱AI发布新一代旗舰模型GLM-5,这个消息像一颗重磅炸弹在AI圈炸开了锅。更劲爆的是,此前在全球模型服务平台OpenRouter登顶热度榜首、引发无数猜测的神秘模型"Pony Alpha",真实身份就是GLM-5。

发布后的市场反应几乎可以用疯狂来形容。智谱股价连续两个交易日暴涨超20%,市值突破2000亿港元大关,一日就厚增了400亿港元。这个成绩单背后,是GLM-5在技术层面实现的多项实质性突破,让业界看到了国产开源模型追平甚至超越闭源天花板的可能性。




从代码生成到工程构建的质变

GLM-5最令人兴奋的,不是简单的参数堆砌,而是它带来的能力跃迁。模型参数规模从上一代的355B扩展至744B,激活参数从32B提升至40B,预训练数据量也从23T攀升到28.5T。但这些数字背后真正重要的是,GLM-5重新定义了AI编程的能力边界。

智谱官方的说法很直白:GLM-5在真实编程环境中的使用体感已逼近Claude Opus 4.5水平。这意味着什么?意味着开源终于追上了闭源。在SWE-bench Verified这个权威基准测试中,GLM-5取得了77.8%的得分,在前端、后端、长程任务等场景中,平均性能较上代提升超过20%。



用户实测的反馈更直观。有人发现GLM-5在Agent模式下可以生成可运行的手机应用环境,完成那些需要多步骤、深度思考的复杂系统工程任务。以前的AI助手只能帮你"写代码",而GLM-5已经能"做工程"了,这是一个质的飞跃。按照智谱的说法,AI开发正从"Vibe Coding"变革为"Agentic Engineering",也就是更大规模的AI自动化编程。

智谱团队在训练范式上也做了创新。他们构建了名为"slime"的异步强化学习基础设施,大幅提升训练吞吐量。这让后训练从过去的粗颗粒修补,变成了高频、细颗粒度迭代,说白了就是模型可以更精细地不断优化自己。

Agent能力开源封神

如果说编程是GLM-5的一只翅膀,那Agent智能体能力就是另一只。GLM-5在Agent能力上实现了开源SOTA,在多个评测基准中拿下开源第一,这可不是吹牛。

具体来看,在BrowseComp(联网检索与信息理解)基准测试中,GLM-5表现最优。在MCP-Atlas(大规模端到端工具调用)这个考验模型工具使用能力的测试里,GLM-5同样登顶。最关键的是τ²-Bench测试,这个专门考核复杂场景下自动代理的工具规划和执行能力的基准,GLM-5取得89.7%的高分,远超其他开源模型。



内部评估显示,GLM-5能够以极少人工干预,自主完成Agentic长程规划与执行、后端重构、深度调试等任务。这些在以前都是需要高级工程师手把手操作的活儿,现在AI可以独立搞定大部分了。有测试者反映,GLM-5在前端表现"丝滑"、细节丰富,让人用起来特别顺手。

这种能力的突破,对软件开发行业的影响可能是革命性的。未来的程序员可能不再是一行行敲代码,而是变成AI工程的"指挥官",让AI去完成具体的编程任务,人类负责更高层面的架构设计和创意工作。

性价比优势与商业化野心

有了技术实力,智谱也开始展现商业化的野心。GLM-5发布的同时,智谱宣布GLM Coding Plan价格进行结构性调整,取消首购优惠,套餐价格整体涨幅从30%起。这在外界看来有点"趁热打铁"的意思,毕竟市场需求摆在那儿。

涨价后,GLM-5输入单价最高6元/百万tokens,输出单价最高22元/百万tokens。对比一下,两个月前Anthropic的Claude Opus 4.5降价后是每百万tokens 5美元/25美元。换算下来,智谱GLM-5的价格依旧只有Claude的1/5左右。在性能基本持平的背景下,这个性价比优势相当明显。

更深层的逻辑在于,智谱希望通过GLM-5推动业务结构转型。根据2025年上半年财报,智谱的本地化部署业务占比高达85%,虽然毛利率接近60%,但这类To B业务天花板低、回款难、需要大量项目人员投入。相比之下,API业务虽然当前占比只有15%,但想象空间更大。

智谱已经明确表示,希望将API业务收入占比提升至50%。而GLM-5在编程与智能体能力上的突破,正是推动API业务放量的最佳武器。随着越来越多开发者和企业接入GLM-5的API,智谱有望从项目制公司转型为真正的MaaS(模型即服务)平台。

独立厂商的算力经济学

GLM-5的成功,也让人重新思考一个问题:在大厂动辄千亿投入的AI军备竞赛中,独立大模型厂商还有活路吗?

智谱给出的答案是:有,而且可能活得不错。关键在于算力成本的可控性。根据智谱招股书,截至2025年6月30日,智谱算力服务费用支出11.45亿元,占研发开支的71.8%。10多亿听起来不少,但跟阿里、腾讯、字节这些大厂比起来,真的是"小巫见大巫"。

独立厂商的玩法不同。他们通常采用租算力的模式,比如智谱跟并行科技深度绑定,后者为智谱提供了超1.2万P的超算架构算力,双方签订了总额13.9亿元的长期协议。这种轻资产模式避免了巨额的前期投入,让创业公司也能玩得起大模型。

当然,这种模式也有风险。推理侧依赖第三方云服务可能带来额外成本。有分析指出,OpenAI在微软Azure上2025年第三季度的推理成本达36.5亿美元,而同期收入只有20.6亿美元,处于严重亏损状态。全栈大厂可以通过"内化"成本来容忍推理侧亏损,但独立厂商必须在商业化上更谨慎。

这也是为什么GLM-5选择涨价的原因之一。优秀的模型必须带来真金白银的货币化,否则再牛的技术也难以持续。智谱后续的财报表现,特别是MaaS业务的增长情况,将成为观察独立大模型厂商生存状况的重要窗口。

GLM-5的横空出世,或许标志着国产大模型进入了一个新阶段。从单纯追赶到局部超越,从闭门造车到开源共赢,这条路走得并不容易。但至少现在我们看到,中国的AI创业公司也能做出世界级的产品,这本身就是一种突破。接下来就看智谱能否把技术优势转化为商业成功,能否在巨头环伺的市场中杀出一条血路了。

作品声明:仅在头条发布,观点不代表平台立场

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
星链用户突破1000万!

星链用户突破1000万!

太空那些事儿
2026-02-14 08:28:34
只剩10天!俄罗斯撤侨准时开始,中方按兵不动,美国偷偷断供石油

只剩10天!俄罗斯撤侨准时开始,中方按兵不动,美国偷偷断供石油

小小科普员
2026-02-14 15:07:25
2026香港富豪榜出炉:霍家排不上号,刘銮雄仅第7,李嘉诚不意外

2026香港富豪榜出炉:霍家排不上号,刘銮雄仅第7,李嘉诚不意外

离离言几许
2026-02-14 11:02:11
春节需求激增!杭州95后女生9天接了100多单,能赚8500元

春节需求激增!杭州95后女生9天接了100多单,能赚8500元

都市快报橙柿互动
2026-02-13 22:49:50
汪小菲台北豪宅内景曝光,桌上一排全家福,马筱梅让狗陪小玥儿睡

汪小菲台北豪宅内景曝光,桌上一排全家福,马筱梅让狗陪小玥儿睡

古希腊掌管月桂的神
2026-02-14 10:52:09
自家产品被用于绑架马杜罗,这家美国AI公司很不满

自家产品被用于绑架马杜罗,这家美国AI公司很不满

观察者网
2026-02-14 17:44:07
还没有开始流行,就逐渐被“淘汰”的5个电器,建议别跟风买!

还没有开始流行,就逐渐被“淘汰”的5个电器,建议别跟风买!

家居设计师苏哥
2026-02-13 10:57:27
巴拿马两港口已不可控,长和将采取法律行动,李嘉诚损失有多大?

巴拿马两港口已不可控,长和将采取法律行动,李嘉诚损失有多大?

财话连篇
2026-02-13 18:50:44
咖啡店结缘,泰总理与恋爱4年的女友登记结婚:上午领证,下午继续开会

咖啡店结缘,泰总理与恋爱4年的女友登记结婚:上午领证,下午继续开会

红星新闻
2026-02-14 13:52:23
待宰大鹅流泪引网友喊话求放过,市民只好把鹅送人,鹅真会被“吓哭”吗?专家解答来了

待宰大鹅流泪引网友喊话求放过,市民只好把鹅送人,鹅真会被“吓哭”吗?专家解答来了

大风新闻
2026-02-13 22:20:04
中央批准,湖北省副省长跨省履新!多个省级党委领导班子调整

中央批准,湖北省副省长跨省履新!多个省级党委领导班子调整

上观新闻
2026-02-14 10:49:06
4 大新升级!新 iPhone 官宣:2月19日,即将发布

4 大新升级!新 iPhone 官宣:2月19日,即将发布

科技堡垒
2026-02-14 10:29:51
郭言:恩格尔系数创新高凸显日本民生窘境

郭言:恩格尔系数创新高凸显日本民生窘境

经济日报
2026-02-14 07:00:32
最新报告曝美国只剩7个紧密盟友

最新报告曝美国只剩7个紧密盟友

财联社
2026-02-14 15:59:47
中国团队攻克难题,每公斤氢气成本不到0.7美元!

中国团队攻克难题,每公斤氢气成本不到0.7美元!

中国先进制造技术论坛
2026-02-12 14:11:09
不可错过!2月14日晚19:00比赛!中央5套CCTV5、CCTV5+直播节目表

不可错过!2月14日晚19:00比赛!中央5套CCTV5、CCTV5+直播节目表

皮皮观天下
2026-02-14 12:52:14
樊振东一人输两分,竟是队友莫雷加德故意要求他输球

樊振东一人输两分,竟是队友莫雷加德故意要求他输球

凤幻洋
2026-02-14 15:00:29
8岁男童放“二踢脚”炸伤4岁邻居致十级伤残,受害人家长被判担责20%,法院:未及时预见风险并规避,存在疏忽

8岁男童放“二踢脚”炸伤4岁邻居致十级伤残,受害人家长被判担责20%,法院:未及时预见风险并规避,存在疏忽

极目新闻
2026-02-14 15:58:10
游客在三亚支付19晚房费8499元,被民宿单方面取消,三亚通报

游客在三亚支付19晚房费8499元,被民宿单方面取消,三亚通报

爱看头条
2026-02-14 13:24:46
34岁东北姑娘拿下81岁全球首富,长的很漂亮,一年抱俩娃身价上亿

34岁东北姑娘拿下81岁全球首富,长的很漂亮,一年抱俩娃身价上亿

云舟史策
2025-09-13 07:37:04
2026-02-14 18:28:49
娱乐督察中
娱乐督察中
独乐乐不如众乐乐
391文章数 20628关注度
往期回顾 全部

科技要闻

字节跳动官宣豆包大模型今日进入2.0阶段

头条要闻

委石油收入超10亿美元 资金将存入美财政部新开设账户

头条要闻

委石油收入超10亿美元 资金将存入美财政部新开设账户

体育要闻

金博洋:天才少年的奥运终章

娱乐要闻

吴克群变“吴克穷”助农,国台办点赞

财经要闻

春节抢黄金,谁赚到钱了?

汽车要闻

星光730新春促销开启 80天销量破2.6万台

态度原创

游戏
房产
家居
公开课
军事航空

2月14日上架?堡垒之夜联动漫威争锋新皮肤泄露

房产要闻

三亚新机场,又传出新消息!

家居要闻

中古雅韵 乐韵伴日常

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

外媒:特朗普一旦下令攻击伊朗 行动或持续数周

无障碍浏览 进入关怀版