网易首页 > 网易科技 > 网易科技 > 正文

10倍速的一夜:智谱GLM-5官宣,MiniMax与DeepSeek的暗战

0
分享至


出品 |《态度》栏目

    作者 | 袁宁

    编辑 | 丁广胜

2月11日深夜到12日清晨,短短几个小时内,中国三家知名的大模型公司几乎同时完成了一轮关键更新:

智谱正式发布 GLM-5,MiniMax M2.5在产品中悄然上线体验,DeepSeek 也启动新一轮能力升级。

智谱 GLM-5:从“写代码”到“搞工程”

2月12日,智谱正式官宣上线并开源新模型 GLM-5。同时确认:此前在 OpenRouter 上爆火的匿名模型 Pony Alpha,正是 GLM-5。

在匿名测试阶段,这个模型已经被全球开发者当作真实生产工具使用。有人用它做横版解谜游戏,有人搭建 Agent 交互世界,也有人直接基于它开发出论文版“抖音”等完整应用形态。模型在没有品牌背书的情况下完成真实市场验证,本身已经说明了能力层级的变化。

智谱对 GLM-5的定位非常明确:它不是一个聊天模型,而是一个 Agentic Engineering 基座模型

过去两年,大模型的主流叙事是“写代码”“写前端”;而现在,行业共识正在转向:模型需要完成完整工程与复杂任务,即从「Vibe Coding」走向「Agentic Engineering」。GLM-5正是这一阶段的代表产物。

与上一代相比,GLM-5不再满足于生成一个漂亮 demo 或一段 Python 脚本,而是为稳定交付生产级结果而生。在真实编程场景的使用体感上,GLM-5已经被认为逼近当前行业天花板 Claude Opus 4.5。

在底层能力上,GLM-5进行了全面扩展:

● 参数规模: 从上一代的355B(激活32B)扩展至744B(激活40B)。

● 数据量级: 预训练数据从23T 提升至28.5T。

● 架构创新: 首次集成了 DeepSeek Sparse Attention 机制。这一技术在维持长文本效果无损的同时,大幅降低了模型部署成本,提升了 Token 的生成效率。

● 异步强化学习: 构建了全新的“Slime”框架,让模型能够在长程交互中持续学习,不再是“聊几句就忘”。

在全球权威的 Artificial Analysis 榜单中,GLM-5位居全球第四、开源第一。

GLM-5在编程能力上实现了对 Claude Opus 4.5的对齐,在工程师最看重的 SWE-bench-Verified(软件工程基准测试)中,GLM-5拿下了77.8的高分;在 Terminal Bench 2.0(终端操作能力)中达到了56.2。这两个分数不仅是开源模型的 SOTA(State Of The Art),更直接超越了 Google 的 Gemini 3 Pro。

在智谱内部的 Claude Code 评估集合中,GLM-5在后端重构和深度调试等“硬骨头”任务上,比 GLM-4.7平均提升了超过20%。

GLM-5在 Agent 能力上实现开源 SOTA,在多个评测基准中取得开源第一。

更有意思的是 Vending Bench 2的测试结果。这个测试要求模型在一年期内经营一个模拟的自动售货机业务。GLM-5最终的账户余额达到了4432美元。这意味着它不仅会写代码,还懂得资源管理和长期规划,这种“经营能力”是迈向 AGI 的关键一步。

同一夜:MiniMax 与 DeepSeek

就在智谱官宣的同时,另外两家巨头的布局也在进行。

昨晚,细心的用户发现,在 MiniMax Agent 产品中,底层模型选项里悄然出现了一个新名字——MiniMax M2.5

虽然公司尚未正式官宣,但这显然是一次在产品端的“实弹演习”。据早期测试用户反馈,“M2.5 Agent能力炸裂”,“编程和工具调用又强又便宜”。

据我们了解,MiniMax M2.5定位为全球首个为Agent场景原生设计的生产级模型。其编程与智能体性能 (Coding & Agentic)比肩国际顶尖模型,直接对标 Claude Opus 4.6,支持PC、App、跨端应用的全栈编程开发,尤其在 Excel高阶处理、深度调研、PPT等Office核心生产力场景中处于SOTA地位。

同时,M2.5模型激活参数量仅 10B,在显存占用和推理能效比上优势明显,支持 100 TPS 超高吞吐量。

此外,就在众人还在猜测DeepSeek V4何时到来时,DeepSeek也在悄然更新。

我们在昨晚尝试询问 DeepSeek 的最新状态,在关闭“深度思考”和“联网搜索”后查询模型信息时发现,其上下文长度已提升至1M Token(此前为128K),知识库截止日期更新至2025年5月。

2026年,注定不会平静。

智谱用 GLM-5证明了中国模型在复杂工程能力上已能与世界最强掰手腕;MiniMax 在产品端极速狂奔,抢占用户心智;而所有人依旧在等待 DeepSeek 出招。

对于此时此刻的身处浪潮中的我们来说,唯一的选择就是——跟上速度。毕竟,在这个10倍速的夜晚过后,掉队可能只是一瞬间的事。

延伸阅读
相关推荐
热点推荐
王鹤棣的“虚伪”,让我看到了真人秀有多假

王鹤棣的“虚伪”,让我看到了真人秀有多假

杰哥娱天下
2026-04-03 22:47:03
曾国藩:真正拉开人与人差距的,从来不是能力,而是做好这三件事

曾国藩:真正拉开人与人差距的,从来不是能力,而是做好这三件事

千秋文化
2026-03-31 20:52:57
24岁科隆中场克劳斯与33岁女友官宣恋情,后者为健身网红

24岁科隆中场克劳斯与33岁女友官宣恋情,后者为健身网红

科学发掘
2026-04-03 18:38:33
《危险关系》口碑爆棚,本是冲着孙俪来的,却意外被女配惊艳!

《危险关系》口碑爆棚,本是冲着孙俪来的,却意外被女配惊艳!

小樾说历史
2026-04-02 11:59:36
心理学上说:下等的自愈,是买醉;中等的自愈,是旅行;顶级的自愈,是在琐碎的日子里,学会与自己握手言和

心理学上说:下等的自愈,是买醉;中等的自愈,是旅行;顶级的自愈,是在琐碎的日子里,学会与自己握手言和

四行书
2026-03-17 12:32:38
张瑜现状:68岁无儿无女,一人独居,与74岁前夫张建亚处境差别大

张瑜现状:68岁无儿无女,一人独居,与74岁前夫张建亚处境差别大

白面书誏
2026-04-03 14:15:58
暴跌至1%!!他MVP基本被判死刑了....

暴跌至1%!!他MVP基本被判死刑了....

柚子说球
2026-04-03 19:19:26
张柏芝上热搜!这次彻底无关谢霆锋,15岁二儿子正面照杀疯了

张柏芝上热搜!这次彻底无关谢霆锋,15岁二儿子正面照杀疯了

科学发掘
2026-04-03 16:18:37
机构闭门会:光模块+国产算力,2026核心赛道曝光

机构闭门会:光模块+国产算力,2026核心赛道曝光

Thurman在昆明
2026-04-03 19:00:02
脂肪“最害怕”的6个动作,每天一遍,想胖都难!

脂肪“最害怕”的6个动作,每天一遍,想胖都难!

增肌减脂
2026-04-03 11:47:45
郑丽文访问大陆名单公布:她很聪明,带来一个重要人物的后代

郑丽文访问大陆名单公布:她很聪明,带来一个重要人物的后代

梁讯
2026-04-03 00:22:26
伯纳乌内讧?姆巴佩发言惹众怒,皇马队友集体不满

伯纳乌内讧?姆巴佩发言惹众怒,皇马队友集体不满

澜归序
2026-04-04 04:22:13
拉里贾尼之弟:霍尔木兹海峡不会回到战前状态

拉里贾尼之弟:霍尔木兹海峡不会回到战前状态

新京报
2026-04-03 07:16:58
再见!麻豆传媒突然官宣,永久关停

再见!麻豆传媒突然官宣,永久关停

我不叫阿哏
2026-04-03 15:25:28
火箭一口气获4大喜讯!提前锁前6直通季后赛 杜兰特获月最佳提名

火箭一口气获4大喜讯!提前锁前6直通季后赛 杜兰特获月最佳提名

锅子篮球
2026-04-03 12:08:01
尼古拉-佩佩宣布和成人女星女友分手:我从来没有提过结婚

尼古拉-佩佩宣布和成人女星女友分手:我从来没有提过结婚

懂球帝
2026-04-04 03:13:38
日本真在准备打仗了!一旦动武,日本数万登陆部队或将沉入东海

日本真在准备打仗了!一旦动武,日本数万登陆部队或将沉入东海

照亮你的前行之路
2026-04-04 06:01:33
看6集《钢铁森林》,我想说:中国刑侦片的大门要被蔡文静踹烂了

看6集《钢铁森林》,我想说:中国刑侦片的大门要被蔡文静踹烂了

洲洲影视娱评
2026-04-03 23:04:22
娱圈“采花高手”们的瓜!

娱圈“采花高手”们的瓜!

文刀万
2026-04-02 18:00:09
末节临危受命投中关键三分,北京这个05后小将是何方神圣?

末节临危受命投中关键三分,北京这个05后小将是何方神圣?

狼叔评论
2026-04-03 22:14:08
2026-04-04 07:36:49

科技要闻

5万辆库存车,给了特斯拉一记重拳

头条要闻

美国宣布:F-15E被击落 1名飞行员被救还有1人下落不明

头条要闻

美国宣布:F-15E被击落 1名飞行员被救还有1人下落不明

体育要闻

被NBA选中20年后,他重新回到篮球场

娱乐要闻

夏克立官宣再婚当爸?否认婚内出轨

财经要闻

刘纪鹏:只盼长慢牛,巩固4000点是关键

汽车要闻

你介意和远房亲戚长得很像吗?

态度原创

亲子
房产
教育
游戏
公开课

亲子要闻

医生说这娃一场感冒就可能没命!一针250万美元的药打完,娃能跑能跳了...

房产要闻

小阳春全面启动!现房,才是这波行情里最稳的上车票

教育要闻

以“锻造”代“保护”:重塑青少年心理健康教育的底层逻辑

三十年铁律崩塌!主机涨价疯魔 IGN警告行业"将死"

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×