小米跟了DeepSeek价格战！直降99%，全面对标|雷军|卢伟冰|小米集团|deepseek

小米跟了DeepSeek价格战！直降99%，全面对标

2026-05-27 11:18:12　来源: 智东西

北京举报

分享至

智东西
作者｜江宇
编辑｜李水青

DeepSeek刚宣布API永久降价，小米也跟了。

智东西5月27日，今日，小米正式宣布MiMo-V2.5系列API价格永久下调，并同步升级新版Token Plan计费体系。相比原始定价，新价格最高降幅达到99%，且不再区分上下文窗口长度。

▲MiMo-V2.5系列API价格永久下调（图源：小米）

▲小米MiMo新版Token Plan计费体系：定价不变/Credits大幅提升（图源：小米）

就在几天前，DeepSeek刚刚宣布：从6月1日起，DeepSeek-V4-Pro当前促销价将直接转为正式价格，不再恢复原价。此前，DeepSeek已将V4-Pro API价格降至2.5折，并把输入缓存命中价格进一步压到原价1/10。

短短一周内，两家国产大模型厂商先后选择“永久降价”，国内API价格战再次升温。

而这一次，小米MiMo几乎直接对标了DeepSeek当前API的价格。更新后的价格表显示，更新后的价格显示，MiMo-V2.5输入缓存命中价格已经降至0.02元/百万tokens，未命中输入为1元/百万tokens，输出价格为2元/百万tokens；MiMo-V2.5-Pro则分别为0.025元、3元和6元。

▲DeepSeek与小米MiMo API价格对比表（智东西制表）

值得注意的是，MiMo此次还取消了此前按上下文长度区分价格的策略。无论是256K还是1M上下文窗口，均统一采用同一价格。

昨日，我们深度梳理并对比过国内外数十家主流大模型厂商的订阅制套餐与API调用计费。

其中，DeepSeek选择“永久降价”，阿里则暂停了Coding Plan中的Lite低价套餐，字节下架低价Coding Plan，智谱2026年一季度API调用定价提升83%。不完全统计，近半年至少已有小米、字节、阿里、智谱和腾讯等5家国产大模型厂商，对自家套餐体系进行过明显调整。部分厂商开始缩减低价套餐、减少额度，整体价格有所上涨。

有意思的是，就在不久前，小米MiMo大模型负责人罗福莉还曾公开“开怼”行业价格战。但另一边，小米MiMo又靠着“100万亿Token免费计划”，一度冲上Hermes全球调用量第一。

▲罗福莉在X上的发文部分截图（图源：X）

如今，小米MiMo也正式加入了这场长期价格战。

一、Token Plan大改版：套餐容量提升5-8倍

除了API永久降价，这次变化最大的，其实是Token Plan套餐体系。

小米称，新版计费规则进行了重新梳理，在价格不变的情况下，套餐Credits大幅提升，用量普遍达到原来的5-8倍。

从我们梳理的国内主流大模型订阅制套餐来看，小米此次调整后，入门档方面，小米Lite套餐与Kimi、字节、阶跃星辰等厂商的最低档位接近，但并不是市场最低，腾讯混元Hy目前仍有28元/月的Lite档。

而高阶档方面，小米Max套餐也并非最高。目前阿里尊享版达到1398元/月，字节Agent Plan Max档位为950元/月，MiniMax Ultra极速版则接近750元/月。

▲国内大模型订阅制套餐价格对比（智东西制表，统计截止时间为：2026/05/27）

与此同时，小米还公布了新版Credits与Token换算关系，并公开给出了高缓存命中场景下，不同套餐大致对应的实际Token规模。

▲小米MiMo Credits与Token换算关系

按照小米给出的95%以上缓存命中场景测算，如果使用MiMo-V2.5，39元Lite套餐理论上已经可以跑到5亿Token以上，99元Standard档位超过13亿Token，329元Pro档位达到47亿Token以上，659元Max档位则突破100亿Token。

即便是更贵的MiMo-V2.5-Pro，在高缓存命中场景下，39元Lite档位也能达到1.9亿Token以上，99元套餐超过5亿Token，329元档位约18亿Token，659元Max档位则接近40亿Token。

小米特别强调，在Agent与Code类场景下，由于缓存命中率通常更高，实际可使用Token数量会明显增加。

小米“百万亿Token创造者激励计划”也一度引发开发者圈关注。小米披露，截至5月26日下午4点08分，100T Tokens已经全部提前发放完毕，活动提前收官。所有当前仍在有效期内的Token Plan用户，无论此前套餐已经使用到什么程度，其Credits额度都将在5月27日0点全部重置，并自动切换至新计费规则。

针对已经过期的历史付费用户，小米后续也将提供额外福利。

二、小米为什么敢降价？推理系统上的持续优化

这次小米也专门解释了背后的推理优化方案。

小米团队基于SGLang HiCache完整支持SWA（Sliding Window Attention），将KV Cache在GPU显存、CPU内存、SSD等多级存储间的数据搬运量降低至优化前的约1/7，可缓存Token数量提升至约5倍。与此同时，小米还优化了专家并行方案、输入长度分桶策略等机制，进一步提升集群输入吞吐能力，从而降低单位Token成本。

简单来说，小米这次的核心逻辑其实和DeepSeek类似：一边是更激进的缓存命中策略，一边是更高的推理吞吐效率。

价格战背后，本质仍然是推理系统与基础设施能力的竞争。

三、模型能力进入前排后，小米MiMo补上价格牌

今年4月23日，小米正式开启Xiaomi MiMo-V2.5系列大模型公测，推出MiMo-V2.5、V2.5-Pro、V2.5-TTS Series以及V2.5-ASR等多个版本。其中，MiMo-V2.5-Pro重点面向Agent、复杂软件工程以及长程任务等场景。

目前，MiMo-V2.5-Pro在Artificial Analysis综合智能榜中位列全球开源模型并列第一，同时进入全球大模型总榜前五；其Agent指数同样位列全球开源模型并列第一。

4月28日，小米进一步将MiMo-V2.5系列以MIT协议正式开源，支持商用部署与二次训练，无需额外授权。

而真正让MiMo在开发者圈快速出圈的，还是此前那轮“100万亿Token免费计划”。

5月9日，Hermes Agent（“爱马仕”）首次超越OpenClaw（“龙虾”），登顶OpenRouter全球应用调用量榜首。当时，Hermes月调用量排名前五的模型中，MiMo-V2-Pro排在第一，后面依次是MiniMax M2.7、英伟达Nemotron 3 Super、阶跃星辰Step 3.5 Flash以及腾讯Hy3 preview。

不过，榜单变化也非常快。

截至5月27日上午9点，OpenRouter本周调用榜中，MiMo-V2.5-Pro位列第十四；

▲OpenRouter本周调用榜（截至5月27日上午9点）

在Hermes Agent模型月调用榜里，MiMo-V2-Pro也已从此前榜首掉到第16名。

▲（图源：OpenRouter）

目前排名前三的分别是DeepSeek-V4-Flash、匿名模型Owl Alpha以及DeepSeek-V4-Pro。

▲（图源：OpenRouter）

某种程度上，这也能看出当前国内大模型竞争的激烈程度：一边是榜单和调用量变化越来越快，另一边，则是价格战开始直接靠拢DeepSeek的“地板价”。

结语：营收利润双降后，小米还是下场打起了价格战

价格战之外，小米昨日的财报，也让这轮降价多了一层“大放血”的意味。一季度，小米营收991亿元，同比下降10.9%；经调整净利润61亿元，同比下降43.1%。

另一边，小米对AI的投入并没有放缓。财报显示，其当季研发开支达到90亿元，同比增长33.4%；截至2026年3月31日，小米研发人员数量达到26048人，创下历史新高。

小米管理层也在财报会上频繁提到AI。当被问到雷军此前提出的160亿元AI投资计划时，小米集团CFO林世伟认为未来对于AI的投资计划会根据AI业务的发展状况进行调整，预期会有所上涨。

卢伟冰则专门提到，在当前内存上涨周期里，“抓住AI非常重要”。

从MiMo开源、100万亿Token免费计划，到冲击OpenRouter Agent榜单，再到如今直接跟进DeepSeek永久降价，小米过去一个多月在AI上的动作明显频繁。而随着国内模型价格继续下探，这场竞争也已经不只是模型能力本身的比拼，背后更是一场围绕推理系统、算力效率以及长期资金投入的持续消耗战。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.