网易首页 > 网易科技 > 网易科技 > 正文

10倍速的一夜:智谱GLM-5官宣,MiniMax与DeepSeek的暗战

0
分享至

10倍速的一夜:智谱GLM-5官宣,MiniMax与DeepSeek的暗战

出品 |《态度》栏目

    作者 | 袁宁

    编辑 | 丁广胜

2月11日深夜到12日清晨,短短几个小时内,中国三家知名的大模型公司几乎同时完成了一轮关键更新:

智谱正式发布 GLM-5,MiniMax M2.5在产品中悄然上线体验,DeepSeek 也启动新一轮能力升级。

智谱 GLM-5:从“写代码”到“搞工程”

2月12日,智谱正式官宣上线并开源新模型 GLM-5。同时确认:此前在 OpenRouter 上爆火的匿名模型 Pony Alpha,正是 GLM-5。

在匿名测试阶段,这个模型已经被全球开发者当作真实生产工具使用。有人用它做横版解谜游戏,有人搭建 Agent 交互世界,也有人直接基于它开发出论文版“抖音”等完整应用形态。模型在没有品牌背书的情况下完成真实市场验证,本身已经说明了能力层级的变化。

10倍速的一夜:智谱GLM-5官宣,MiniMax与DeepSeek的暗战

智谱对 GLM-5的定位非常明确:它不是一个聊天模型,而是一个 Agentic Engineering 基座模型

过去两年,大模型的主流叙事是“写代码”“写前端”;而现在,行业共识正在转向:模型需要完成完整工程与复杂任务,即从「Vibe Coding」走向「Agentic Engineering」。GLM-5正是这一阶段的代表产物。

10倍速的一夜:智谱GLM-5官宣,MiniMax与DeepSeek的暗战

与上一代相比,GLM-5不再满足于生成一个漂亮 demo 或一段 Python 脚本,而是为稳定交付生产级结果而生。在真实编程场景的使用体感上,GLM-5已经被认为逼近当前行业天花板 Claude Opus 4.5。

在底层能力上,GLM-5进行了全面扩展:

● 参数规模: 从上一代的355B(激活32B)扩展至744B(激活40B)。

● 数据量级: 预训练数据从23T 提升至28.5T。

● 架构创新: 首次集成了 DeepSeek Sparse Attention 机制。这一技术在维持长文本效果无损的同时,大幅降低了模型部署成本,提升了 Token 的生成效率。

● 异步强化学习: 构建了全新的“Slime”框架,让模型能够在长程交互中持续学习,不再是“聊几句就忘”。

10倍速的一夜:智谱GLM-5官宣,MiniMax与DeepSeek的暗战

在全球权威的 Artificial Analysis 榜单中,GLM-5位居全球第四、开源第一。

10倍速的一夜:智谱GLM-5官宣,MiniMax与DeepSeek的暗战

GLM-5在编程能力上实现了对 Claude Opus 4.5的对齐,在工程师最看重的 SWE-bench-Verified(软件工程基准测试)中,GLM-5拿下了77.8的高分;在 Terminal Bench 2.0(终端操作能力)中达到了56.2。这两个分数不仅是开源模型的 SOTA(State Of The Art),更直接超越了 Google 的 Gemini 3 Pro。

在智谱内部的 Claude Code 评估集合中,GLM-5在后端重构和深度调试等“硬骨头”任务上,比 GLM-4.7平均提升了超过20%。

10倍速的一夜:智谱GLM-5官宣,MiniMax与DeepSeek的暗战

GLM-5在 Agent 能力上实现开源 SOTA,在多个评测基准中取得开源第一。

10倍速的一夜:智谱GLM-5官宣,MiniMax与DeepSeek的暗战

更有意思的是 Vending Bench 2的测试结果。这个测试要求模型在一年期内经营一个模拟的自动售货机业务。GLM-5最终的账户余额达到了4432美元。这意味着它不仅会写代码,还懂得资源管理和长期规划,这种“经营能力”是迈向 AGI 的关键一步。

10倍速的一夜:智谱GLM-5官宣,MiniMax与DeepSeek的暗战

同一夜:MiniMax 与 DeepSeek

就在智谱官宣的同时,另外两家巨头的布局也在进行。

昨晚,细心的用户发现,在 MiniMax Agent 产品中,底层模型选项里悄然出现了一个新名字——MiniMax M2.5

10倍速的一夜:智谱GLM-5官宣,MiniMax与DeepSeek的暗战

虽然公司尚未正式官宣,但这显然是一次在产品端的“实弹演习”。据早期测试用户反馈,“M2.5 Agent能力炸裂”,“编程和工具调用又强又便宜”。

10倍速的一夜:智谱GLM-5官宣,MiniMax与DeepSeek的暗战

据我们了解,MiniMax M2.5定位为全球首个为Agent场景原生设计的生产级模型。其编程与智能体性能 (Coding & Agentic)比肩国际顶尖模型,直接对标 Claude Opus 4.6,支持PC、App、跨端应用的全栈编程开发,尤其在 Excel高阶处理、深度调研、PPT等Office核心生产力场景中处于SOTA地位。

同时,M2.5模型激活参数量仅 10B,在显存占用和推理能效比上优势明显,支持 100 TPS 超高吞吐量。

此外,就在众人还在猜测DeepSeek V4何时到来时,DeepSeek也在悄然更新。

我们在昨晚尝试询问 DeepSeek 的最新状态,在关闭“深度思考”和“联网搜索”后查询模型信息时发现,其上下文长度已提升至1M Token(此前为128K),知识库截止日期更新至2025年5月。

10倍速的一夜:智谱GLM-5官宣,MiniMax与DeepSeek的暗战

2026年,注定不会平静。

智谱用 GLM-5证明了中国模型在复杂工程能力上已能与世界最强掰手腕;MiniMax 在产品端极速狂奔,抢占用户心智;而所有人依旧在等待 DeepSeek 出招。

对于此时此刻的身处浪潮中的我们来说,唯一的选择就是——跟上速度。毕竟,在这个10倍速的夜晚过后,掉队可能只是一瞬间的事。

延伸阅读
相关推荐
热点推荐
中国有源相控阵雷达真实水平:并非世界第一,和美差距有多大

中国有源相控阵雷达真实水平:并非世界第一,和美差距有多大

黑翼天使
2026-01-10 03:28:16
下课仅 1 个月!曼联弃帅竟要接手欧洲豪门,穆里尼奥成最大推手

下课仅 1 个月!曼联弃帅竟要接手欧洲豪门,穆里尼奥成最大推手

澜归序
2026-02-12 03:14:56
老牌军事网文平台宣布关停,产生过《夜色》《兵王》等大热作品,连载小说改编的电视剧《雪豹》曾引发热潮

老牌军事网文平台宣布关停,产生过《夜色》《兵王》等大热作品,连载小说改编的电视剧《雪豹》曾引发热潮

大风新闻
2026-02-12 20:17:04
1月车市销量同比下降3.2% 新能源汽车仅增长0.1%

1月车市销量同比下降3.2% 新能源汽车仅增长0.1%

经济观察报
2026-02-11 21:43:17
宋威龙赵今麦官宣,热搜爆了

宋威龙赵今麦官宣,热搜爆了

背包旅行
2026-02-12 15:04:29
2026年的春运,长途大巴结结实实给了“智能时代”一记耳光

2026年的春运,长途大巴结结实实给了“智能时代”一记耳光

老特有话说
2026-02-09 23:34:10
1925年,孙中山先生去世后,国民党内最具实权的五位人物分别是谁?

1925年,孙中山先生去世后,国民党内最具实权的五位人物分别是谁?

文史明鉴
2026-02-11 17:36:06
除夕夜都别睡了!“春节红包大战”总额飙至近100亿

除夕夜都别睡了!“春节红包大战”总额飙至近100亿

极目新闻
2026-02-11 19:26:54
33.2万!丰田官宣:新车正式亮相

33.2万!丰田官宣:新车正式亮相

高科技爱好者
2026-02-12 04:50:09
中国十大奢侈菜,我赌你没吃过

中国十大奢侈菜,我赌你没吃过

风烟食录
2026-02-12 06:21:27
成都首次连续25天不限行,为什么“敢”?需求在,算过账,管得细

成都首次连续25天不限行,为什么“敢”?需求在,算过账,管得细

红星新闻
2026-02-12 12:15:26
李嘉诚旗下长和最新发布:遭巴拿马政府步步进迫,意图强制接管港口,港口能否继续营运不在公司控制范围内

李嘉诚旗下长和最新发布:遭巴拿马政府步步进迫,意图强制接管港口,港口能否继续营运不在公司控制范围内

每日经济新闻
2026-02-12 19:42:07
在日华人直言:如今中国要是再和日本发生冲突,根本撑不过14年!

在日华人直言:如今中国要是再和日本发生冲突,根本撑不过14年!

南权先生
2026-02-12 15:39:07
白崇禧为何不像傅作义那样弃暗投明,非要跟四野大军决战?

白崇禧为何不像傅作义那样弃暗投明,非要跟四野大军决战?

真猫爷的渔场
2026-02-08 10:58:06
满屏荷尔蒙!Netflix这一脱,又火了

满屏荷尔蒙!Netflix这一脱,又火了

来看美剧
2026-02-12 23:14:52
宁忠岩1枚铜牌令3个夺金点落空,但别担心,中国队能拿3-6金

宁忠岩1枚铜牌令3个夺金点落空,但别担心,中国队能拿3-6金

真理是我亲戚
2026-02-12 10:39:43
名人堂公布!4人入选,含金量越来越低了?

名人堂公布!4人入选,含金量越来越低了?

篮球实录
2026-02-12 13:52:56
郭碧婷一家新加坡过年,5岁女儿穿汉服正面像洋娃娃,向佐玩手机

郭碧婷一家新加坡过年,5岁女儿穿汉服正面像洋娃娃,向佐玩手机

古希腊掌管月桂的神
2026-02-12 22:57:11
国家最大的敌人,是愚昧和僵化

国家最大的敌人,是愚昧和僵化

深度报
2026-02-06 22:28:05
3球11助攻!前教练为20岁居莱尔鸣不平:他在皇马遭受了队友霸凌

3球11助攻!前教练为20岁居莱尔鸣不平:他在皇马遭受了队友霸凌

夏侯看英超
2026-02-13 00:04:04
2026-02-13 00:20:49

科技要闻

10倍速的一夜:三大模型春节前的暗战

头条要闻

美称中国已购买美国出售的委内瑞拉石油 中方回应

头条要闻

美称中国已购买美国出售的委内瑞拉石油 中方回应

体育要闻

31岁首次参加冬奥,10年前她是个水管工

娱乐要闻

《惊蛰无声》违规抢占排片遭影院控诉

财经要闻

“影子万科”如何掘金万科?

汽车要闻

开212 T01柴油版去穿越 连牧马人都跟不上

态度原创

亲子
本地
房产
公开课
军事航空

亲子要闻

孩子最渴望听到父母说的五句话

本地新闻

下一站是嘉禾望岗,请各位乘客做好哭泣准备

房产要闻

999元开线上免税店?海南爆出免税大骗局,多人已被抓!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美国新交付F35隐身战机没雷达

无障碍浏览 进入关怀版
×