网易首页 > 网易号 > 正文 申请入驻

模型大战红包之后:DeepSeek上新,AI小龙们座次已变

0
分享至



2026 年的马年春节,AI 的火药味甚至盖过了红包味。

字节、阿里、腾讯几乎同时把 AI 大规模推向台前:红包、免单、春晚互动、本地生活接入……都在争入口。与此同时,BAT 三家也在基础模型上连续出牌,视频生成(Seedance 2.0)、图像(Qwen-IMAGE-2.0)、多模态、语音模型密集更新,几乎没有空档。

不过,基础模型的对抗也从字节、阿里、腾讯等巨头迅速蔓延到了 DeepSeek 和「AI 小龙」们。

2 月 11 日晚,DeepSeek 新模型版本全面上线,继续把长上下文与复杂任务能力往前推;几乎同一时间,智谱推出新一代旗舰 GLM-5,强调 Agent 与编程能力;MiniMax 也带来了 MiniMax M2.5,延续多模态与应用导向路线。

三家几乎在同一时间点出手,让这场春节 AI 大战的「模型交锋」又升级了一个档位。

巨头双线推进,既抢入口也抢模型;创业公司聚焦底层能力,把筹码压在基础模型上。真正决定 2026 年甚至未来几年的竞争,正在这里展开。

春节 AI 大战:前线发红包,后端拼模型

2 月 12 日,阿里千问宣布「春节 30 亿大免单」上线 6 天完成 1.2 亿笔 AI 下单,用户说了 41 亿次。稍早前,腾讯元宝则宣布春节活动启动 5 天,元宝 AI 生图功能日均调用增长 30 倍,时长增长超 80%。



图片来源:千问、元宝

如果说今年春节 AI 大战前半段是纯粹的入口之争,后半段则是更为复杂,从巨头到初创大模型公司,都在集中发力基础模型的迭代。

这一点其实雷科技在之前的报道《一切为了Agent:千问、阶跃、Gemini打响「3.5模型大战」,春节将成关键节点?》就有提到,包括:

- 海外的 GPT-5.3-Codex 和 Claude Opus 4.6;
- 国内已经发布的 Kimi 2.5、Step 3.5 Flash、SeedDance 2.0、Seedream 5.0;
- 刚刚发布的 GLM-5、MiniMax M2.5、DeepSeek V3 系列更新;
- 还有箭在弦上的 Doubao 2.0、Qwen 3.5、Gemin 3.5。
DeepSeek V4大招还没发,把「长上下文」做深是亮点

考虑到 DeepSeek 并没有发布官方博文,这一次更新的 DeepSeek 新模型大概率不是 V4,而是 V3.2 系列的更新(或为 V3.5)。

不过这也可以看作 V4 发布前的「灰度版」,因为按照 The Information 的最新爆料,DeepSeek V4 内部初步测试显示,其在模型的编程能力了已经超越了 Claude(没有指出具体模型)。

而从网友们统一收到的 DeepSeek 回复来看,DeepSeek 新模型的变化集中在两点:百万级长上下文和知识库更新。



首先是上下文窗口从之前的 128K 直接拉升到了 1M(100 万 Token),你可以一次性把《三体》全集或者一整个项目的代码仓库塞给它。测试显示,它处理这类长文档的响应速度非常快,不再需要手动拆分文件。

另外,DeepSeek 新模型的知识库也更新到了 2025 年 5 月,但依然不支持多模态——无法理解图片(文字内容除外)和视频,也符合 DeepSeek 一直坚持的「语言模型」路线:

不追求炫目的多模态,而是把文本推理、工程任务这些高频刚需做到极致。

而上下文长度的大幅提升,不仅长文档处理与多轮推理能力更稳定,理论上也会改善长代码理解、多步骤分析等复杂场景执行表现。

时隔 1 个多月迭代,智谱 GLM-5 把 Agent 推到台前



相比之下,GLM-5 作为原生 Agent 基座模型的升级更具「代际感」。虽然距离去年底发布 GLM-4.7 仅仅过去 1 个多月,但智谱年初上市时候预告的新一代模型,确实升级不小。

这一代模型的核心关键词不再是对话,而是 Agent 与编程能力,也规格已经明显向「Agent 基础模型」靠拢:上下文达到 200K 级别,最大输出可达 128K,模型规模进一步扩大,训练体系也做了重构。

但真正的变化还是发生在能力结构上。

GLM-5.0 被直接设计为可执行任务的 Agent 模型,强调编程能力、工具调用与长流程执行。在编程测试中,它已经能处理项目级代码与调试问题,模型可以拆解需求、调用接口、持续执行任务,并在多阶段过程中保持目标一致。

继续押注多模态,MiniMax M2.5依然坚持生产至上



MiniMax 从模型到应用的垂直路线,依旧与前两者拉开距离。

MiniMax M2.5 的升级重点仍然放在多模态与内容生成能力,但强调的一整套多模态能力的推进,包括语音生成、音乐生成与文本能力同步提升,强调可直接进入创作与产品流程。

模型继续采用 MoE 架构,在保持规模的同时控制推理成本,更适合部署在应用侧。语音克隆、情绪表达、音乐生成质量的提升,使它更接近「生产工具」,而不是推理模型。

MiniMax 的定位因此也很清晰——不是去比谁最聪明,而是更偏向让模型在内容生产环节真正可用,生成内容、参与创作、进入产品流程。

这条路径也决定了 MiniMax 的目标不是 benchmark,而是可落地的生产能力。

三家模型的路径差异由此变得非常具体:DeepSeek 把长推理能力做到极致,智谱把模型推向 Agent 工程形态,MiniMax 则把多模态生产能力做成基础设施。它们不再围绕同一套指标竞争,而是在不同能力方向上构建各自的模型形态。

但共性同样明显。参数规模不再是核心卖点,聊天体验也不再是主要目标,所有升级都在指向一件事——模型要能参与真实任务,而不仅是给出答案。

DeepSeek 炸场一年后,「AI 小龙」位次已剧变

把时间拨回到去年春节,DeepSeek-V3 和 R1 的开源发布,冲击了全球 AI 格局,也成为「AI 小龙」阵营的分水岭。

关键不只是「模型很强」,更在于成本被重新定义。低成本、高性能的推理模型开始出现后,行业对基础模型的预期突然变了——不只是要求严格训练出一个模型,而是要求更低成本的更强模型。



剧烈的模型竞争加速,再加之训练算力的匮乏,直接引发了「AI 小龙」阵营的明显分化。百川和零一几乎已经退出「前沿基础模型」的主战场:前者转向医疗等垂直方向,后者更多走企业与行业场景路线,更新节奏明显放缓。

当基础模型进入高投入、高密度迭代阶段,只有极少数团队还能长期承受算力与研发压力。

不过今年的情况又有些不一样,最直接的一点就是 DeepSeek V4 至今没有发布。从外部看,可能有两种解释。

一种是技术层面的现实:推理能力、长上下文、工程稳定性这些方向本身难度更高,模型要跨出一整代的差距,需要更长周期,而且之前也传出过 DeepSeek 在训练过程遇到难题。另一种则是更偏策略性,不只是跟着友商一起发布,而是作为压轴登场,形成宣发上的优势。

还有一个更容易被忽略的变化是:今年春节,DeepSeek 要面对字节、阿里、腾讯在模型上的高强度投入,以及全球模型的快速迭代,最直观的例子就是最近引爆全球的字节 Seedance 5.0 视频模型。



Seedance 5.0 生成,图片来源:bilibili

当然,还在活跃的「AI 小龙」也在第一线持续推进基础模型的迭代,智谱 GLM 和阶跃星辰 Step 更多还是集中在模型,面向行业提供更创新、更实用的基础模型。

MiniMax 和月之暗面 Kimi 则更多主打「模型即应用」,不只打造模型,也在发力自己的原生 AI 应用,MiniMax 更是形成了一定的产品矩阵,但二者都在从基础模型到应用进行垂直整合。

这不是简单的「谁强谁弱」,而是一种更现实的分化。

写在最后

2026 年的春节还没正式开始,但大模型下半场的发令枪已经响得震耳欲聋。

从巨头们的「撒币」入口战,到 DeepSeek、智谱、MiniMax 在初四晚上的模型突袭,这场仗的打法变了。大家不再执着于在 Benchmark 上刷分,而是开始比谁能更深地嵌入真实生产力:是吞下百万行代码的胃口,是自主跑通工程的双手,还是理解人类情绪的耳朵。

DeepSeek 这次虽然没祭出传说中的 V4,但这记「1M 上下文」的长拳,依然也让不少空谈 Agent 却解决不了长程记忆的对手感到脊背发凉。而智谱和 MiniMax 的如期对垒,则证明了「AI 小龙」们已经从去年的防守反击,转向了更有底气的差异化进攻。

悬念依然存在。DeepSeek 憋了许久的 V4 究竟是在等一个「一力降十会」的压轴时刻,还是在攻克某种未知的技术天花板?在大厂与小龙的混战中,谁能率先把「模型能力」真正转化为「商业护城河」?

但有一点是肯定的:2026 年,单纯靠「会聊天」已经拿不到门票了。烟花散去,留在牌桌上的,只能是那些能真正卷入工作流的狠角色。



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
比恒大还惨!中国第二大民企轰然倒塌,负债7500亿,创始人被带走

比恒大还惨!中国第二大民企轰然倒塌,负债7500亿,创始人被带走

古事寻踪记
2025-12-27 07:16:35
都是十四亿人口,印度每1000人仅34人有车,中国1000人中有多少?

都是十四亿人口,印度每1000人仅34人有车,中国1000人中有多少?

流史岁月
2026-02-12 15:00:04
长期服用降压药不能吃西柚?提醒:不止是西柚,这5物最好也远离

长期服用降压药不能吃西柚?提醒:不止是西柚,这5物最好也远离

读懂世界历史
2026-02-12 21:49:16
日本议员:与中国发生战争,东京只要接一发导弹日本就会完蛋!

日本议员:与中国发生战争,东京只要接一发导弹日本就会完蛋!

我心纵横天地间
2025-12-03 12:48:02
“正常男生不会这样”,家长晒大学儿子,网友:把儿子养成姑娘了

“正常男生不会这样”,家长晒大学儿子,网友:把儿子养成姑娘了

妍妍教育日记
2026-02-10 21:02:10
2026年,辽宁启动独生子女父母奖励:发放标准、所需材料?看看

2026年,辽宁启动独生子女父母奖励:发放标准、所需材料?看看

虎哥闲聊
2026-02-12 08:28:17
冬奥双金得主竟是盗窃犯!法国选手夺冠后爆发:请你们不要再说了

冬奥双金得主竟是盗窃犯!法国选手夺冠后爆发:请你们不要再说了

全景体育V
2026-02-12 08:07:59
6.4英寸!新机曝光:搭载第六代骁龙8 Elite+双2亿像素!

6.4英寸!新机曝光:搭载第六代骁龙8 Elite+双2亿像素!

科技堡垒
2026-02-13 00:16:07
周薪43万欧!努涅斯被新月联赛除名,C罗罢赛能成功,为啥他不行

周薪43万欧!努涅斯被新月联赛除名,C罗罢赛能成功,为啥他不行

夏侯看英超
2026-02-13 00:34:58
60岁手握41亿现金,于东来突然宣布退休!他到底怕什么?

60岁手握41亿现金,于东来突然宣布退休!他到底怕什么?

三农老历
2026-02-12 19:53:08
高市久久等不到中国贺信!48小时已过!外交部对日发出警告!

高市久久等不到中国贺信!48小时已过!外交部对日发出警告!

潘冹旅行浪子
2026-02-11 22:56:04
中兴通讯前总经理:中国用无选择的穷举法跟美国打科技战,把所有技术一起发展,整个产业链全干了

中兴通讯前总经理:中国用无选择的穷举法跟美国打科技战,把所有技术一起发展,整个产业链全干了

芯火相承
2026-02-12 20:54:30
“开门黑”!1月乘用车仅售154.4万辆

“开门黑”!1月乘用车仅售154.4万辆

汽车通讯社
2026-02-12 16:38:25
法国打响第一枪,27国考虑对华加税30%,美财长三字定义中美关系

法国打响第一枪,27国考虑对华加税30%,美财长三字定义中美关系

井普椿的独白
2026-02-12 22:11:56
现货白银直线跳水跌超6%

现货白银直线跳水跌超6%

财联社
2026-02-13 00:18:21
解放军绕台军机不见了?歼20大批量服役,让台军雷达成了睁眼瞎

解放军绕台军机不见了?歼20大批量服役,让台军雷达成了睁眼瞎

明天后天大后天
2026-02-12 03:00:27
你见过最奇怪的规定是什么?网友:我们学校禁止男女生一起吃饭

你见过最奇怪的规定是什么?网友:我们学校禁止男女生一起吃饭

带你感受人间冷暖
2026-02-05 03:19:07
湖北一木匠,两年时间骗取宁夏自治区政府高层近十亿,无人敢吱声

湖北一木匠,两年时间骗取宁夏自治区政府高层近十亿,无人敢吱声

神奇的锤子
2025-02-14 20:48:49
一山东女子手持离婚证,打包行囊回老家过年,网友:这是炫耀吗?

一山东女子手持离婚证,打包行囊回老家过年,网友:这是炫耀吗?

火山詩话
2026-02-11 10:49:01
美媒预测东西部最终排名!骑士拿下哈登升第2 一数据致火箭被看衰

美媒预测东西部最终排名!骑士拿下哈登升第2 一数据致火箭被看衰

锅子篮球
2026-02-12 20:47:12
2026-02-13 04:03:00
雷科技 incentive-icons
雷科技
专注AI硬科技
36110文章数 811835关注度
往期回顾 全部

科技要闻

10倍速的一夜:三大模型春节前的暗战

头条要闻

钟南山:会用证据让全世界服气

头条要闻

钟南山:会用证据让全世界服气

体育要闻

31岁首次参加冬奥,10年前她是个水管工

娱乐要闻

《惊蛰无声》违规抢占排片遭影院控诉

财经要闻

“影子万科”如何掘金万科?

汽车要闻

开212 T01柴油版去穿越 连牧马人都跟不上

态度原创

艺术
本地
数码
亲子
公开课

艺术要闻

震惊!罗布泊的模特竟然如此美艳动人!

本地新闻

下一站是嘉禾望岗,请各位乘客做好哭泣准备

数码要闻

英伟达App更新,搞定Optimus MUX显卡切换难题

亲子要闻

孩子最渴望听到父母说的五句话

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版