模型大战红包之后：DeepSeek上新，AI小龙们座次已变|调用|模态|编程|上下文|新论文|agent|deepseek

模型大战红包之后：DeepSeek上新，AI小龙们座次已变

2026-02-12 22:15:24　来源: 雷科技

广东举报

分享至

2026 年的马年春节，AI 的火药味甚至盖过了红包味。

字节、阿里、腾讯几乎同时把 AI 大规模推向台前：红包、免单、春晚互动、本地生活接入……都在争入口。与此同时，BAT 三家也在基础模型上连续出牌，视频生成(Seedance 2.0)、图像（Qwen-IMAGE-2.0)、多模态、语音模型密集更新，几乎没有空档。

不过，基础模型的对抗也从字节、阿里、腾讯等巨头迅速蔓延到了 DeepSeek 和「AI 小龙」们。

2 月 11 日晚，DeepSeek 新模型版本全面上线，继续把长上下文与复杂任务能力往前推；几乎同一时间，智谱推出新一代旗舰 GLM-5，强调 Agent 与编程能力；MiniMax 也带来了 MiniMax M2.5，延续多模态与应用导向路线。

三家几乎在同一时间点出手，让这场春节 AI 大战的「模型交锋」又升级了一个档位。

巨头双线推进，既抢入口也抢模型；创业公司聚焦底层能力，把筹码压在基础模型上。真正决定 2026 年甚至未来几年的竞争，正在这里展开。

春节 AI 大战：前线发红包，后端拼模型

2 月 12 日，阿里千问宣布「春节 30 亿大免单」上线 6 天完成 1.2 亿笔 AI 下单，用户说了 41 亿次。稍早前，腾讯元宝则宣布春节活动启动 5 天，元宝 AI 生图功能日均调用增长 30 倍，时长增长超 80%。

图片来源：千问、元宝

如果说今年春节 AI 大战前半段是纯粹的入口之争，后半段则是更为复杂，从巨头到初创大模型公司，都在集中发力基础模型的迭代。

这一点其实雷科技在之前的报道《一切为了Agent：千问、阶跃、Gemini打响「3.5模型大战」，春节将成关键节点？》就有提到，包括：

- 海外的 GPT-5.3-Codex 和 Claude Opus 4.6；
- 国内已经发布的 Kimi 2.5、Step 3.5 Flash、SeedDance 2.0、Seedream 5.0；
- 刚刚发布的 GLM-5、MiniMax M2.5、DeepSeek V3 系列更新；
- 还有箭在弦上的 Doubao 2.0、Qwen 3.5、Gemin 3.5。

DeepSeek V4大招还没发，把「长上下文」做深是亮点

考虑到 DeepSeek 并没有发布官方博文，这一次更新的 DeepSeek 新模型大概率不是 V4，而是 V3.2 系列的更新（或为 V3.5）。

不过这也可以看作 V4 发布前的「灰度版」，因为按照 The Information 的最新爆料，DeepSeek V4 内部初步测试显示，其在模型的编程能力了已经超越了 Claude（没有指出具体模型）。

而从网友们统一收到的 DeepSeek 回复来看，DeepSeek 新模型的变化集中在两点：百万级长上下文和知识库更新。

首先是上下文窗口从之前的 128K 直接拉升到了 1M（100 万 Token），你可以一次性把《三体》全集或者一整个项目的代码仓库塞给它。测试显示，它处理这类长文档的响应速度非常快，不再需要手动拆分文件。

另外，DeepSeek 新模型的知识库也更新到了 2025 年 5 月，但依然不支持多模态——无法理解图片（文字内容除外）和视频，也符合 DeepSeek 一直坚持的「语言模型」路线：

不追求炫目的多模态，而是把文本推理、工程任务这些高频刚需做到极致。

而上下文长度的大幅提升，不仅长文档处理与多轮推理能力更稳定，理论上也会改善长代码理解、多步骤分析等复杂场景执行表现。

时隔 1 个多月迭代，智谱 GLM-5 把 Agent 推到台前

相比之下，GLM-5 作为原生 Agent 基座模型的升级更具「代际感」。虽然距离去年底发布 GLM-4.7 仅仅过去 1 个多月，但智谱年初上市时候预告的新一代模型，确实升级不小。

这一代模型的核心关键词不再是对话，而是 Agent 与编程能力，也规格已经明显向「Agent 基础模型」靠拢：上下文达到 200K 级别，最大输出可达 128K，模型规模进一步扩大，训练体系也做了重构。

但真正的变化还是发生在能力结构上。

GLM-5.0 被直接设计为可执行任务的 Agent 模型，强调编程能力、工具调用与长流程执行。在编程测试中，它已经能处理项目级代码与调试问题，模型可以拆解需求、调用接口、持续执行任务，并在多阶段过程中保持目标一致。

继续押注多模态，MiniMax M2.5依然坚持生产至上

MiniMax 从模型到应用的垂直路线，依旧与前两者拉开距离。

MiniMax M2.5 的升级重点仍然放在多模态与内容生成能力，但强调的一整套多模态能力的推进，包括语音生成、音乐生成与文本能力同步提升，强调可直接进入创作与产品流程。

模型继续采用 MoE 架构，在保持规模的同时控制推理成本，更适合部署在应用侧。语音克隆、情绪表达、音乐生成质量的提升，使它更接近「生产工具」，而不是推理模型。

MiniMax 的定位因此也很清晰——不是去比谁最聪明，而是更偏向让模型在内容生产环节真正可用，生成内容、参与创作、进入产品流程。

这条路径也决定了 MiniMax 的目标不是 benchmark，而是可落地的生产能力。

三家模型的路径差异由此变得非常具体：DeepSeek 把长推理能力做到极致，智谱把模型推向 Agent 工程形态，MiniMax 则把多模态生产能力做成基础设施。它们不再围绕同一套指标竞争，而是在不同能力方向上构建各自的模型形态。

但共性同样明显。参数规模不再是核心卖点，聊天体验也不再是主要目标，所有升级都在指向一件事——模型要能参与真实任务，而不仅是给出答案。

DeepSeek 炸场一年后，「AI 小龙」位次已剧变

把时间拨回到去年春节，DeepSeek-V3 和 R1 的开源发布，冲击了全球 AI 格局，也成为「AI 小龙」阵营的分水岭。

关键不只是「模型很强」，更在于成本被重新定义。低成本、高性能的推理模型开始出现后，行业对基础模型的预期突然变了——不只是要求严格训练出一个模型，而是要求更低成本的更强模型。

剧烈的模型竞争加速，再加之训练算力的匮乏，直接引发了「AI 小龙」阵营的明显分化。百川和零一几乎已经退出「前沿基础模型」的主战场：前者转向医疗等垂直方向，后者更多走企业与行业场景路线，更新节奏明显放缓。

当基础模型进入高投入、高密度迭代阶段，只有极少数团队还能长期承受算力与研发压力。

不过今年的情况又有些不一样，最直接的一点就是 DeepSeek V4 至今没有发布。从外部看，可能有两种解释。

一种是技术层面的现实：推理能力、长上下文、工程稳定性这些方向本身难度更高，模型要跨出一整代的差距，需要更长周期，而且之前也传出过 DeepSeek 在训练过程遇到难题。另一种则是更偏策略性，不只是跟着友商一起发布，而是作为压轴登场，形成宣发上的优势。

还有一个更容易被忽略的变化是：今年春节，DeepSeek 要面对字节、阿里、腾讯在模型上的高强度投入，以及全球模型的快速迭代，最直观的例子就是最近引爆全球的字节 Seedance 5.0 视频模型。

Seedance 5.0 生成，图片来源：bilibili

当然，还在活跃的「AI 小龙」也在第一线持续推进基础模型的迭代，智谱 GLM 和阶跃星辰 Step 更多还是集中在模型，面向行业提供更创新、更实用的基础模型。

MiniMax 和月之暗面 Kimi 则更多主打「模型即应用」，不只打造模型，也在发力自己的原生 AI 应用，MiniMax 更是形成了一定的产品矩阵，但二者都在从基础模型到应用进行垂直整合。

这不是简单的「谁强谁弱」，而是一种更现实的分化。

写在最后

2026 年的春节还没正式开始，但大模型下半场的发令枪已经响得震耳欲聋。

从巨头们的「撒币」入口战，到 DeepSeek、智谱、MiniMax 在初四晚上的模型突袭，这场仗的打法变了。大家不再执着于在 Benchmark 上刷分，而是开始比谁能更深地嵌入真实生产力：是吞下百万行代码的胃口，是自主跑通工程的双手，还是理解人类情绪的耳朵。

DeepSeek 这次虽然没祭出传说中的 V4，但这记「1M 上下文」的长拳，依然也让不少空谈 Agent 却解决不了长程记忆的对手感到脊背发凉。而智谱和 MiniMax 的如期对垒，则证明了「AI 小龙」们已经从去年的防守反击，转向了更有底气的差异化进攻。

悬念依然存在。DeepSeek 憋了许久的 V4 究竟是在等一个「一力降十会」的压轴时刻，还是在攻克某种未知的技术天花板？在大厂与小龙的混战中，谁能率先把「模型能力」真正转化为「商业护城河」？

但有一点是肯定的：2026 年，单纯靠「会聊天」已经拿不到门票了。烟花散去，留在牌桌上的，只能是那些能真正卷入工作流的狠角色。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.