网易首页 > 网易号 > 正文 申请入驻

小米跟了DeepSeek价格战!直降99%,全面对标

0
分享至


智东西
作者|江宇
编辑|李水青

DeepSeek刚宣布API永久降价,小米也跟了。

智东西5月27日,今日,小米正式宣布MiMo-V2.5系列API价格永久下调,并同步升级新版Token Plan计费体系。相比原始定价,新价格最高降幅达到99%,且不再区分上下文窗口长度。


▲MiMo-V2.5系列API价格永久下调(图源:小米)


▲小米MiMo新版Token Plan计费体系:定价不变/Credits大幅提升(图源:小米)

就在几天前,DeepSeek刚刚宣布:从6月1日起,DeepSeek-V4-Pro当前促销价将直接转为正式价格,不再恢复原价。此前,DeepSeek已将V4-Pro API价格降至2.5折,并把输入缓存命中价格进一步压到原价1/10。

短短一周内,两家国产大模型厂商先后选择“永久降价”,国内API价格战再次升温。

而这一次,小米MiMo几乎直接对标了DeepSeek当前API的价格。更新后的价格表显示,更新后的价格显示,MiMo-V2.5输入缓存命中价格已经降至0.02元/百万tokens,未命中输入为1元/百万tokens,输出价格为2元/百万tokens;MiMo-V2.5-Pro则分别为0.025元、3元和6元。


▲DeepSeek与小米MiMo API价格对比表(智东西制表)

值得注意的是,MiMo此次还取消了此前按上下文长度区分价格的策略。无论是256K还是1M上下文窗口,均统一采用同一价格

昨日,我们深度梳理并对比过国内外数十家主流大模型厂商的订阅制套餐与API调用计费。

其中,DeepSeek选择“永久降价”,阿里则暂停了Coding Plan中的Lite低价套餐,字节下架低价Coding Plan,智谱2026年一季度API调用定价提升83%。不完全统计,近半年至少已有小米、字节、阿里、智谱和腾讯5家国产大模型厂商,对自家套餐体系进行过明显调整。部分厂商开始缩减低价套餐、减少额度,整体价格有所上涨

有意思的是,就在不久前,小米MiMo大模型负责人罗福莉还曾公开“开怼”行业价格战。但另一边,小米MiMo又靠着“100万亿Token免费计划”,一度冲上Hermes全球调用量第一。


▲罗福莉在X上的发文部分截图(图源:X)

如今,小米MiMo也正式加入了这场长期价格战

一、Token Plan大改版:套餐容量提升5-8倍

除了API永久降价,这次变化最大的,其实是Token Plan套餐体系。

小米称,新版计费规则进行了重新梳理,在价格不变的情况下,套餐Credits大幅提升,用量普遍达到原来的5-8倍

从我们梳理的国内主流大模型订阅制套餐来看,小米此次调整后,入门档方面,小米Lite套餐与Kimi、字节、阶跃星辰等厂商的最低档位接近,但并不是市场最低,腾讯混元Hy目前仍有28元/月的Lite档

而高阶档方面,小米Max套餐也并非最高。目前阿里尊享版达到1398元/月,字节Agent Plan Max档位为950元/月,MiniMax Ultra极速版则接近750元/月。


▲国内大模型订阅制套餐价格对比(智东西制表,统计截止时间为:2026/05/27)

与此同时,小米还公布了新版Credits与Token换算关系,并公开给出了高缓存命中场景下,不同套餐大致对应的实际Token规模



▲小米MiMo Credits与Token换算关系

按照小米给出的95%以上缓存命中场景测算,如果使用MiMo-V2.5,39元Lite套餐理论上已经可以跑到5亿Token以上,99元Standard档位超过13亿Token,329元Pro档位达到47亿Token以上,659元Max档位则突破100亿Token

即便是更贵的MiMo-V2.5-Pro,在高缓存命中场景下,39元Lite档位也能达到1.9亿Token以上,99元套餐超过5亿Token,329元档位约18亿Token,659元Max档位则接近40亿Token

小米特别强调,在Agent与Code类场景下,由于缓存命中率通常更高,实际可使用Token数量会明显增加。

小米“百万亿Token创造者激励计划”也一度引发开发者圈关注。小米披露,截至5月26日下午4点08分,100T Tokens已经全部提前发放完毕,活动提前收官。所有当前仍在有效期内的Token Plan用户,无论此前套餐已经使用到什么程度,其Credits额度都将在5月27日0点全部重置,并自动切换至新计费规则。

针对已经过期的历史付费用户,小米后续也将提供额外福利。

二、小米为什么敢降价?推理系统上的持续优化

这次小米也专门解释了背后的推理优化方案。

小米团队基于SGLang HiCache完整支持SWA(Sliding Window Attention),将KV Cache在GPU显存、CPU内存、SSD等多级存储间的数据搬运量降低至优化前的约1/7,可缓存Token数量提升至约5倍。与此同时,小米还优化了专家并行方案、输入长度分桶策略等机制,进一步提升集群输入吞吐能力,从而降低单位Token成本。

简单来说,小米这次的核心逻辑其实和DeepSeek类似:一边是更激进的缓存命中策略,一边是更高的推理吞吐效率。

价格战背后,本质仍然是推理系统与基础设施能力的竞争。

三、模型能力进入前排后,小米MiMo补上价格牌

今年4月23日,小米正式开启Xiaomi MiMo-V2.5系列大模型公测,推出MiMo-V2.5、V2.5-Pro、V2.5-TTS Series以及V2.5-ASR等多个版本。其中,MiMo-V2.5-Pro重点面向Agent、复杂软件工程以及长程任务等场景。

目前,MiMo-V2.5-Pro在Artificial Analysis综合智能榜中位列全球开源模型并列第一,同时进入全球大模型总榜前五;其Agent指数同样位列全球开源模型并列第一

4月28日,小米进一步将MiMo-V2.5系列以MIT协议正式开源,支持商用部署与二次训练,无需额外授权。

而真正让MiMo在开发者圈快速出圈的,还是此前那轮“100万亿Token免费计划”。

5月9日,Hermes Agent(“爱马仕”)首次超越OpenClaw(“龙虾”),登顶OpenRouter全球应用调用量榜首。当时,Hermes月调用量排名前五的模型中,MiMo-V2-Pro排在第一,后面依次是MiniMax M2.7、英伟达Nemotron 3 Super、阶跃星辰Step 3.5 Flash以及腾讯Hy3 preview。

不过,榜单变化也非常快。

截至5月27日上午9点,OpenRouter本周调用榜中,MiMo-V2.5-Pro位列第十四


▲OpenRouter本周调用榜(截至5月27日上午9点)

在Hermes Agent模型月调用榜里,MiMo-V2-Pro也已从此前榜首掉到第16名


▲(图源:OpenRouter)

目前排名前三的分别是DeepSeek-V4-Flash、匿名模型Owl Alpha以及DeepSeek-V4-Pro。


▲(图源:OpenRouter)

某种程度上,这也能看出当前国内大模型竞争的激烈程度:一边是榜单和调用量变化越来越快,另一边,则是价格战开始直接靠拢DeepSeek的“地板价”。

结语:营收利润双降后,小米还是下场打起了价格战

价格战之外,小米昨日的财报,也让这轮降价多了一层“大放血”的意味。一季度,小米营收991亿元,同比下降10.9%;经调整净利润61亿元,同比下降43.1%。

另一边,小米对AI的投入并没有放缓。财报显示,其当季研发开支达到90亿元,同比增长33.4%;截至2026年3月31日,小米研发人员数量达到26048人,创下历史新高。

小米管理层也在财报会上频繁提到AI。当被问到雷军此前提出的160亿元AI投资计划时,小米集团CFO林世伟认为未来对于AI的投资计划会根据AI业务的发展状况进行调整,预期会有所上涨。

卢伟冰则专门提到,在当前内存上涨周期里,“抓住AI非常重要”。

从MiMo开源、100万亿Token免费计划,到冲击OpenRouter Agent榜单,再到如今直接跟进DeepSeek永久降价,小米过去一个多月在AI上的动作明显频繁。而随着国内模型价格继续下探,这场竞争也已经不只是模型能力本身的比拼,背后更是一场围绕推理系统、算力效率以及长期资金投入的持续消耗战。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
霍尔木兹大消息,伊朗向试图通过的船只开火!特朗普:秘密帮200多艘商船、1亿桶石油通过!美军向油轮开火致多人失踪,国际海事组织谴责

霍尔木兹大消息,伊朗向试图通过的船只开火!特朗普:秘密帮200多艘商船、1亿桶石油通过!美军向油轮开火致多人失踪,国际海事组织谴责

每日经济新闻
2026-06-11 07:58:08
7死17伤!广西兴安突发爆炸事故,知情人发声官方通报信息量很大

7死17伤!广西兴安突发爆炸事故,知情人发声官方通报信息量很大

Mr王的饭后茶
2026-06-11 09:55:23
大猩猩被同伴轰出门,托腮凝视远方陷入沉思,网友:兄弟,我懂你!

大猩猩被同伴轰出门,托腮凝视远方陷入沉思,网友:兄弟,我懂你!

都市快报橙柿互动
2026-06-10 11:01:41
北海银滩强逼消费后续!多位受害者实锤,恶霸身份曝光,文旅沦陷

北海银滩强逼消费后续!多位受害者实锤,恶霸身份曝光,文旅沦陷

奇思妙想草叶君
2026-06-10 18:31:26
苏联最强的时候有多猛?1939年,硬是把三个已经独立的国家吞并

苏联最强的时候有多猛?1939年,硬是把三个已经独立的国家吞并

北海史记
2026-06-10 04:44:15
特斯拉高管抨击双层夹胶玻璃,雷军回应:小米和特斯拉一样

特斯拉高管抨击双层夹胶玻璃,雷军回应:小米和特斯拉一样

明镜pro
2026-06-08 15:35:33
暨南大学六篇硕士论文研究副词“赶快”“赶紧”“迟早”,AI一口气可以写60篇

暨南大学六篇硕士论文研究副词“赶快”“赶紧”“迟早”,AI一口气可以写60篇

老郭在学习
2026-06-11 10:53:59
NBA总决赛战报:29分大逆转!尼克斯绝杀马刺,福克斯4失误16中6

NBA总决赛战报:29分大逆转!尼克斯绝杀马刺,福克斯4失误16中6

球场没跑道
2026-06-11 11:44:53
孟羽童又火了!自曝自媒体收入不稳定,转头当场向平安高管求职

孟羽童又火了!自曝自媒体收入不稳定,转头当场向平安高管求职

观鱼听雨
2026-06-10 23:32:59
社评:比利时首相不是“怕中国”,而是怕承担责任

社评:比利时首相不是“怕中国”,而是怕承担责任

环球网资讯
2026-06-11 00:16:10
巴萨8000万新援传射,英格兰3-0哥斯达黎加,世界杯首战克罗地亚

巴萨8000万新援传射,英格兰3-0哥斯达黎加,世界杯首战克罗地亚

钉钉陌上花开
2026-06-11 07:05:05
领先1分选择上篮被帽,巴克利痛批福克斯:真是个愚蠢的举动

领先1分选择上篮被帽,巴克利痛批福克斯:真是个愚蠢的举动

懂球帝
2026-06-11 12:09:38
AI时代最大的浪费,是让聪明人做重复事

AI时代最大的浪费,是让聪明人做重复事

刀姐doris
2026-06-10 10:54:09
菲律宾7.8级强震过去了36小时,国际上的慰问铺天盖地

菲律宾7.8级强震过去了36小时,国际上的慰问铺天盖地

小马姨
2026-06-10 13:43:21
非法获取多个在售商品房小区业主信息并出售,17名犯罪嫌疑人落网,公安网安部门查获2.9万余条公民个人信息

非法获取多个在售商品房小区业主信息并出售,17名犯罪嫌疑人落网,公安网安部门查获2.9万余条公民个人信息

扬子晚报
2026-06-11 11:24:51
封神新历史!29分史诗级逆天翻盘!尼克斯绝境涅槃,手握冠军点

封神新历史!29分史诗级逆天翻盘!尼克斯绝境涅槃,手握冠军点

体坛老球迷
2026-06-11 12:12:31
下课1天后再就业 43岁皇马弃帅接掌英超劲旅 穆帅引发3队互换主帅

下课1天后再就业 43岁皇马弃帅接掌英超劲旅 穆帅引发3队互换主帅

我爱英超
2026-06-11 07:23:37
“鹅腿阿姨”一年至少挣60万,比很多北大清华的上班精英厉害多啦

“鹅腿阿姨”一年至少挣60万,比很多北大清华的上班精英厉害多啦

基本常识
2026-06-11 11:56:20
2-5!董路怒斥:巴西人故意使坏 永远不要相信欧洲南美+韩国人

2-5!董路怒斥:巴西人故意使坏 永远不要相信欧洲南美+韩国人

念洲
2026-06-11 09:56:39
“有人撒野我们抓!” 外媒称日本和菲律宾没想到中国大陆出手这么快

“有人撒野我们抓!” 外媒称日本和菲律宾没想到中国大陆出手这么快

极目新闻
2026-06-11 09:42:03
2026-06-11 12:27:00
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
12018文章数 117100关注度
往期回顾 全部

数码要闻

一文看懂苹果WWDC26:库克谢幕深情告别,Siri AI史诗级加强

头条要闻

外媒:日本和菲律宾没想到 中国大陆出手这么快

头条要闻

外媒:日本和菲律宾没想到 中国大陆出手这么快

体育要闻

2026世界杯,我们看什么?

娱乐要闻

闹大了?《奔跑吧》被曝停播,承认收费

财经要闻

干细胞生意:17万一针的希望

科技要闻

钉钉CEO换帅:陈航卸任,90后陈宇森接棒

汽车要闻

埃安i60 530宁德时代版上市限时焕新价10.36万起

态度原创

教育
手机
家居
游戏
时尚

教育要闻

快说烂了!这4个地道英语习语,才是“遗传梗”的正确打开方式

手机要闻

打破15年肌肉记忆:苹果iOS 27通知下滑手势让位Siri AI

家居要闻

空间微调 移形换境

《艾尔登法环》Switch2版预购开启 8月28日发售

毕业季,为林徽因正名的年轻女孩们

无障碍浏览 进入关怀版