网易首页 > 网易号 > 正文 申请入驻

模型大战红包之后:DeepSeek上新,AI小龙们座次已变

0
分享至



2026 年的马年春节,AI 的火药味甚至盖过了红包味。

字节、阿里、腾讯几乎同时把 AI 大规模推向台前:红包、免单、春晚互动、本地生活接入……都在争入口。与此同时,BAT 三家也在基础模型上连续出牌,视频生成(Seedance 2.0)、图像(Qwen-IMAGE-2.0)、多模态、语音模型密集更新,几乎没有空档。

不过,基础模型的对抗也从字节、阿里、腾讯等巨头迅速蔓延到了 DeepSeek 和「AI 小龙」们。

2 月 11 日晚,DeepSeek 新模型版本全面上线,继续把长上下文与复杂任务能力往前推;几乎同一时间,智谱推出新一代旗舰 GLM-5,强调 Agent 与编程能力;MiniMax 也带来了 MiniMax M2.5,延续多模态与应用导向路线。

三家几乎在同一时间点出手,让这场春节 AI 大战的「模型交锋」又升级了一个档位。

巨头双线推进,既抢入口也抢模型;创业公司聚焦底层能力,把筹码压在基础模型上。真正决定 2026 年甚至未来几年的竞争,正在这里展开。

春节 AI 大战:前线发红包,后端拼模型

2 月 12 日,阿里千问宣布「春节 30 亿大免单」上线 6 天完成 1.2 亿笔 AI 下单,用户说了 41 亿次。稍早前,腾讯元宝则宣布春节活动启动 5 天,元宝 AI 生图功能日均调用增长 30 倍,时长增长超 80%。



图片来源:千问、元宝

如果说今年春节 AI 大战前半段是纯粹的入口之争,后半段则是更为复杂,从巨头到初创大模型公司,都在集中发力基础模型的迭代。

这一点其实雷科技在之前的报道《一切为了Agent:千问、阶跃、Gemini打响「3.5模型大战」,春节将成关键节点?》就有提到,包括:

- 海外的 GPT-5.3-Codex 和 Claude Opus 4.6;
- 国内已经发布的 Kimi 2.5、Step 3.5 Flash、SeedDance 2.0、Seedream 5.0;
- 刚刚发布的 GLM-5、MiniMax M2.5、DeepSeek V3 系列更新;
- 还有箭在弦上的 Doubao 2.0、Qwen 3.5、Gemin 3.5。
DeepSeek V4大招还没发,把「长上下文」做深是亮点

考虑到 DeepSeek 并没有发布官方博文,这一次更新的 DeepSeek 新模型大概率不是 V4,而是 V3.2 系列的更新(或为 V3.5)。

不过这也可以看作 V4 发布前的「灰度版」,因为按照 The Information 的最新爆料,DeepSeek V4 内部初步测试显示,其在模型的编程能力了已经超越了 Claude(没有指出具体模型)。

而从网友们统一收到的 DeepSeek 回复来看,DeepSeek 新模型的变化集中在两点:百万级长上下文和知识库更新。



首先是上下文窗口从之前的 128K 直接拉升到了 1M(100 万 Token),你可以一次性把《三体》全集或者一整个项目的代码仓库塞给它。测试显示,它处理这类长文档的响应速度非常快,不再需要手动拆分文件。

另外,DeepSeek 新模型的知识库也更新到了 2025 年 5 月,但依然不支持多模态——无法理解图片(文字内容除外)和视频,也符合 DeepSeek 一直坚持的「语言模型」路线:

不追求炫目的多模态,而是把文本推理、工程任务这些高频刚需做到极致。

而上下文长度的大幅提升,不仅长文档处理与多轮推理能力更稳定,理论上也会改善长代码理解、多步骤分析等复杂场景执行表现。

时隔 1 个多月迭代,智谱 GLM-5 把 Agent 推到台前



相比之下,GLM-5 作为原生 Agent 基座模型的升级更具「代际感」。虽然距离去年底发布 GLM-4.7 仅仅过去 1 个多月,但智谱年初上市时候预告的新一代模型,确实升级不小。

这一代模型的核心关键词不再是对话,而是 Agent 与编程能力,也规格已经明显向「Agent 基础模型」靠拢:上下文达到 200K 级别,最大输出可达 128K,模型规模进一步扩大,训练体系也做了重构。

但真正的变化还是发生在能力结构上。

GLM-5.0 被直接设计为可执行任务的 Agent 模型,强调编程能力、工具调用与长流程执行。在编程测试中,它已经能处理项目级代码与调试问题,模型可以拆解需求、调用接口、持续执行任务,并在多阶段过程中保持目标一致。

继续押注多模态,MiniMax M2.5依然坚持生产至上



MiniMax 从模型到应用的垂直路线,依旧与前两者拉开距离。

MiniMax M2.5 的升级重点仍然放在多模态与内容生成能力,但强调的一整套多模态能力的推进,包括语音生成、音乐生成与文本能力同步提升,强调可直接进入创作与产品流程。

模型继续采用 MoE 架构,在保持规模的同时控制推理成本,更适合部署在应用侧。语音克隆、情绪表达、音乐生成质量的提升,使它更接近「生产工具」,而不是推理模型。

MiniMax 的定位因此也很清晰——不是去比谁最聪明,而是更偏向让模型在内容生产环节真正可用,生成内容、参与创作、进入产品流程。

这条路径也决定了 MiniMax 的目标不是 benchmark,而是可落地的生产能力。

三家模型的路径差异由此变得非常具体:DeepSeek 把长推理能力做到极致,智谱把模型推向 Agent 工程形态,MiniMax 则把多模态生产能力做成基础设施。它们不再围绕同一套指标竞争,而是在不同能力方向上构建各自的模型形态。

但共性同样明显。参数规模不再是核心卖点,聊天体验也不再是主要目标,所有升级都在指向一件事——模型要能参与真实任务,而不仅是给出答案。

DeepSeek 炸场一年后,「AI 小龙」位次已剧变

把时间拨回到去年春节,DeepSeek-V3 和 R1 的开源发布,冲击了全球 AI 格局,也成为「AI 小龙」阵营的分水岭。

关键不只是「模型很强」,更在于成本被重新定义。低成本、高性能的推理模型开始出现后,行业对基础模型的预期突然变了——不只是要求严格训练出一个模型,而是要求更低成本的更强模型。



剧烈的模型竞争加速,再加之训练算力的匮乏,直接引发了「AI 小龙」阵营的明显分化。百川和零一几乎已经退出「前沿基础模型」的主战场:前者转向医疗等垂直方向,后者更多走企业与行业场景路线,更新节奏明显放缓。

当基础模型进入高投入、高密度迭代阶段,只有极少数团队还能长期承受算力与研发压力。

不过今年的情况又有些不一样,最直接的一点就是 DeepSeek V4 至今没有发布。从外部看,可能有两种解释。

一种是技术层面的现实:推理能力、长上下文、工程稳定性这些方向本身难度更高,模型要跨出一整代的差距,需要更长周期,而且之前也传出过 DeepSeek 在训练过程遇到难题。另一种则是更偏策略性,不只是跟着友商一起发布,而是作为压轴登场,形成宣发上的优势。

还有一个更容易被忽略的变化是:今年春节,DeepSeek 要面对字节、阿里、腾讯在模型上的高强度投入,以及全球模型的快速迭代,最直观的例子就是最近引爆全球的字节 Seedance 5.0 视频模型。



Seedance 5.0 生成,图片来源:bilibili

当然,还在活跃的「AI 小龙」也在第一线持续推进基础模型的迭代,智谱 GLM 和阶跃星辰 Step 更多还是集中在模型,面向行业提供更创新、更实用的基础模型。

MiniMax 和月之暗面 Kimi 则更多主打「模型即应用」,不只打造模型,也在发力自己的原生 AI 应用,MiniMax 更是形成了一定的产品矩阵,但二者都在从基础模型到应用进行垂直整合。

这不是简单的「谁强谁弱」,而是一种更现实的分化。

写在最后

2026 年的春节还没正式开始,但大模型下半场的发令枪已经响得震耳欲聋。

从巨头们的「撒币」入口战,到 DeepSeek、智谱、MiniMax 在初四晚上的模型突袭,这场仗的打法变了。大家不再执着于在 Benchmark 上刷分,而是开始比谁能更深地嵌入真实生产力:是吞下百万行代码的胃口,是自主跑通工程的双手,还是理解人类情绪的耳朵。

DeepSeek 这次虽然没祭出传说中的 V4,但这记「1M 上下文」的长拳,依然也让不少空谈 Agent 却解决不了长程记忆的对手感到脊背发凉。而智谱和 MiniMax 的如期对垒,则证明了「AI 小龙」们已经从去年的防守反击,转向了更有底气的差异化进攻。

悬念依然存在。DeepSeek 憋了许久的 V4 究竟是在等一个「一力降十会」的压轴时刻,还是在攻克某种未知的技术天花板?在大厂与小龙的混战中,谁能率先把「模型能力」真正转化为「商业护城河」?

但有一点是肯定的:2026 年,单纯靠「会聊天」已经拿不到门票了。烟花散去,留在牌桌上的,只能是那些能真正卷入工作流的狠角色。



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
不法之徒村田晃大,正面照曝光

不法之徒村田晃大,正面照曝光

新京报
2026-03-26 11:18:17
谁还敢充长期会员?男子视频VIP充到2028年,被一纸新规一夜返贫

谁还敢充长期会员?男子视频VIP充到2028年,被一纸新规一夜返贫

温读史
2026-03-26 10:41:06
S家发威了!大S律师已报警,官方出手,张兰律师怒斥,牵连马筱梅

S家发威了!大S律师已报警,官方出手,张兰律师怒斥,牵连马筱梅

小舟谈历史
2026-03-26 15:44:38
二百多名军官被枪毙、撤职、处分,长津湖战役中失职的志愿军88师

二百多名军官被枪毙、撤职、处分,长津湖战役中失职的志愿军88师

云霄纪史观
2026-03-25 12:16:14
马上评|双双被罚,友谊赛不是“友尽赛”

马上评|双双被罚,友谊赛不是“友尽赛”

澎湃新闻
2026-03-25 16:16:26
这4种鱼,可能含有甲醛和重金属,建议:还是少吃比较好!

这4种鱼,可能含有甲醛和重金属,建议:还是少吃比较好!

阿龙美食记
2026-03-24 21:52:23
昊铂的“新叙事”,一场久违的新豪华“破局”

昊铂的“新叙事”,一场久违的新豪华“破局”

功夫AUTO
2026-03-19 14:25:02
怼得漂亮!伊朗外长:既然我们连领导层都没有了,还有什么好谈的

怼得漂亮!伊朗外长:既然我们连领导层都没有了,还有什么好谈的

南风不及你温柔
2026-03-26 14:07:38
欧盟威胁越南:若中方参与了…

欧盟威胁越南:若中方参与了…

观察者网
2026-03-25 15:19:16
国际油价涨幅扩大 布伦特原油期货站上105美元/桶

国际油价涨幅扩大 布伦特原油期货站上105美元/桶

每日经济新闻
2026-03-26 15:11:37
杨振宁猝然离世5个月后,翁帆突传新消息,怀孕传闻早就真相大白

杨振宁猝然离世5个月后,翁帆突传新消息,怀孕传闻早就真相大白

李橑在北漂
2026-03-25 23:30:59
收评:沪指跌1.09% 全市场成交额不足2万亿元

收评:沪指跌1.09% 全市场成交额不足2万亿元

证券时报
2026-03-26 15:22:10
一代香港美人,感觉不是很开心的样子,大家还记得她的名字吗?

一代香港美人,感觉不是很开心的样子,大家还记得她的名字吗?

动物奇奇怪怪
2026-03-26 08:35:16
初代丑男何润东的突然爆火,狠狠抽了内娱一巴掌

初代丑男何润东的突然爆火,狠狠抽了内娱一巴掌

娱乐圈笔娱君
2026-03-24 16:08:36
中方是否了解美伊磋商情况?外交部:支持一切有利缓局降温的努力

中方是否了解美伊磋商情况?外交部:支持一切有利缓局降温的努力

澎湃新闻
2026-03-26 15:32:26
带娃出国的中产后悔了:想回来,但回国失败

带娃出国的中产后悔了:想回来,但回国失败

视觉志
2026-03-24 10:36:13
血管狭窄超90%,重油重腻且生活不规律,假如第一时间被抢救,张雪峰能活吗?

血管狭窄超90%,重油重腻且生活不规律,假如第一时间被抢救,张雪峰能活吗?

消化石医生
2026-03-26 12:52:28
强闯中国驻日使馆不法之徒照片曝光,3月15日刚晋升三等陆尉

强闯中国驻日使馆不法之徒照片曝光,3月15日刚晋升三等陆尉

澎湃新闻
2026-03-26 14:34:04
白宫不装了,承认伊朗拒绝谈判,特朗普准备“释放地狱”

白宫不装了,承认伊朗拒绝谈判,特朗普准备“释放地狱”

书纪文谭
2026-03-26 16:28:13
释永信“开光”真相大白,过程不堪入目,易中天也有牵扯

释永信“开光”真相大白,过程不堪入目,易中天也有牵扯

秋姐居
2026-03-25 10:22:58
2026-03-26 18:15:00
雷科技 incentive-icons
雷科技
专注AI硬科技
36595文章数 811953关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

男子从四家公司贷出共计356万元 实际到手却仅8万多元

头条要闻

男子从四家公司贷出共计356万元 实际到手却仅8万多元

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

长护险谁能享受?享受多少?解答来了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

教育
家居
亲子
房产
军事航空

教育要闻

中小学家长必看数据,看与不看都会后悔

家居要闻

傍海而居 静观蝴蝶海

亲子要闻

售卖“增高神药”让孩子“猛长20厘米”?多家店铺被立案调查!

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版