网易首页 > 网易号 > 正文 申请入驻

“价格屠夫”来了:小米MiMo大模型API永久降价最高达99%

0
分享至

5月27日,小米宣布MiMo-V2.5系列大模型API价格体系进行永久性调价,最高降幅度达99%,且不再区分上下文长度。

具体来看MiMo-V2.5-Pro:

百万tokens输入(缓存命中)只需要0.025元。

百万tokens输入(缓存未命中)3元。

百万tokens输出6元。

不仅如此,Token Plan方面,小米采取“加量不加价”策略,用户在Agent或Code场景下的可用 Token 数量将提升至原来的5-8倍,并把规则调整为“所见即所得”,简化了因换算导致的复杂计价逻辑。

这是继DeepSeek上周宣布V4-Pro永久降价至原价25%之后,国内头部大模型在短短一周内的又一次重磅价格调整。

国际比较看,DeepSeek与小米的最新定价已显著低于主流海外厂商。

国际主流模型方面,OpenAI GPT-4o的标准输入价格为每百万Tokens 2.5美元,输出价格为10美元;Claude Sonnet 4.6的输入为每百万Tokens 3美元,输出为15美元。

与简单的“烧钱”不同,小米此次降价的逻辑指向工程层面的成本结构优化。

据小米解释,基于 SGLang HiCache 完整支持 SWA(Sliding Window Attention),将 KV Cache 在 GPU 显存、CPU 内存、SSD 等多级存储之间的数据搬运量降低至优化前的近 1/7,并将可缓存 token 数量提升至优化前的近 5 倍,显著提升了缓存命中率和推理效率。此外,小米还通过优化专家方案、输入长度分桶策略等手段,进一步提升集群输入吞吐能力。

这与DeepSeek的降价逻辑一脉相承,都是通过架构创新以及推理系统的工程化优化,结构性地压低单位Token服务成本,再将红利让渡给开发者。

从行业情况来看,本轮国产大模型降价潮亦是伴随着应用方需求的变化,随着大模型正在从“聊天”进入“干活”的阶段,真正让开发者和企业用户焦虑的也不再只是一次问答金额,而是Agent在多轮推理、调用和自动化成本工作流等过程中持续燃烧的Token。

当百万Tokens价格被不断压低,国内大模型的竞争也会继续向下游传导。对于开发者来说,成本下降意味着更多Agent等应用供给会迎来井喷;对于厂商来说,低价背后则是更高的推理效率、更强的算力调度能力,以及更长周期的生态投入。

价格战未必能直接决定谁的模型最强,但可以推动其更快地被开发者调用,小米MiMo此时大幅降价正是国内大模型走向“规模化使用”的又一个注脚。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“他们都该死”,老汉怒杀儿子一家四口,安徽凤台灭门惨案始末

“他们都该死”,老汉怒杀儿子一家四口,安徽凤台灭门惨案始末

易玄
2026-05-27 10:06:45
无名指长于食指为龙长虎短,这类手相之人晚年有三种不同运势

无名指长于食指为龙长虎短,这类手相之人晚年有三种不同运势

唠叨说历史
2026-05-27 14:59:27
今日最惨股:主力跑了,散户踩踏式封跌停,17万股民套在山顶!

今日最惨股:主力跑了,散户踩踏式封跌停,17万股民套在山顶!

丁丁鲤史纪
2026-05-27 11:10:33
突然,全线跳水!近9万人爆仓

突然,全线跳水!近9万人爆仓

每日经济新闻
2026-05-28 00:14:21
俄罗斯最大的弊病就是舍不得放下远东!一旦放下,甚至能满血复活

俄罗斯最大的弊病就是舍不得放下远东!一旦放下,甚至能满血复活

抽象派大师
2026-05-25 16:41:16
深夜利空!16家公司集体暴雷,2家退市警报拉满,1家立案

深夜利空!16家公司集体暴雷,2家退市警报拉满,1家立案

慧眼看世界哈哈
2026-05-27 12:05:24
户籍制度改革,可能真的要来了

户籍制度改革,可能真的要来了

黑噪音
2026-05-27 22:26:33
做人的最高境界,请你牢记这4句话

做人的最高境界,请你牢记这4句话

金沛的国学笔记
2026-05-21 20:52:48
官方:39岁的丹麦门将小舒梅切尔宣布退役

官方:39岁的丹麦门将小舒梅切尔宣布退役

懂球帝
2026-05-27 15:55:09
不用3nm照样封神!麒麟9050性能超越A18:3D堆叠绕开制程封锁

不用3nm照样封神!麒麟9050性能超越A18:3D堆叠绕开制程封锁

快科技
2026-05-26 11:37:30
男子早餐买4个包子付款21365元,老板守店20天等失主未果后报警寻人!乌龙竟是熊孩子拨弄收款机所致

男子早餐买4个包子付款21365元,老板守店20天等失主未果后报警寻人!乌龙竟是熊孩子拨弄收款机所致

环球网资讯
2026-05-27 07:15:19
跨省履新江西省委常委、统战部部长8个月后,李伟被查

跨省履新江西省委常委、统战部部长8个月后,李伟被查

澎湃新闻
2026-05-27 18:16:26
西媒:马竞为阿尔瓦雷斯标价1.5亿欧

西媒:马竞为阿尔瓦雷斯标价1.5亿欧

懂球帝
2026-05-27 19:25:34
8枪秒杀七人,一人反杀120名黑社会成员,行凶者是职业杀手所为!

8枪秒杀七人,一人反杀120名黑社会成员,行凶者是职业杀手所为!

易玄
2026-05-26 11:23:01
弗爷宣布竞选连任皇马主席:掌舵世界最佳,要再带来世界最佳球星

弗爷宣布竞选连任皇马主席:掌舵世界最佳,要再带来世界最佳球星

仰卧撑FTUer
2026-05-27 10:02:15
发现一个残忍真相:真正毁掉孩子学习动力的,不是手机,而是父母过强的“外驱力”!想要重建内动力,父母一定要戒掉“反复提醒”的习惯

发现一个残忍真相:真正毁掉孩子学习动力的,不是手机,而是父母过强的“外驱力”!想要重建内动力,父母一定要戒掉“反复提醒”的习惯

青春期父母成长学堂
2026-05-27 06:41:39
“割四赔五”升级版!又有师傅称3000元梯子被盗,哭诉麦收季寒心

“割四赔五”升级版!又有师傅称3000元梯子被盗,哭诉麦收季寒心

火山詩话
2026-05-27 06:50:51
高志凯:目前人民币全球交易结算占比只有2.5%-3% 建议提高至30%

高志凯:目前人民币全球交易结算占比只有2.5%-3% 建议提高至30%

凤凰网财经
2026-05-27 19:54:21
夏窗首签?曝巴萨与25岁英格兰国脚达成全面协议!已报价7000万欧

夏窗首签?曝巴萨与25岁英格兰国脚达成全面协议!已报价7000万欧

我爱英超
2026-05-27 22:52:16
铁公鸡拔毛?俄罗斯松口转让中国卡-226T整条生产线,算盘打得精

铁公鸡拔毛?俄罗斯松口转让中国卡-226T整条生产线,算盘打得精

步论天下事
2026-05-27 09:40:08
2026-05-28 01:27:00
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
146720文章数 2653714关注度
往期回顾 全部

数码要闻

罗技K98M PLUS机械键盘新增“冰淇淋小熊”版本,569元

头条要闻

女子称车祸住院遭男医生侵犯 送检的纸巾检出医生精斑

头条要闻

女子称车祸住院遭男医生侵犯 送检的纸巾检出医生精斑

体育要闻

这群老阿姨,是最硬核的马刺球迷

娱乐要闻

王鹤棣风波连累父亲炸串店遭差评?

财经要闻

中国半导体的阳谋

科技要闻

韬定律:全球在卷纳米数 华为换了一把尺子

汽车要闻

限时补贴价9.28-10.98万 MG 4X正式上市

态度原创

旅游
数码
本地
手机
艺术

旅游要闻

5月27日最佳情报|晨韵如诗超治愈,蜀葵绽放花枝温婉雅致

数码要闻

雷鸟GT系列AR眼镜发布 267英寸巨幕+杜比视界 1899起

本地新闻

用剪纸的方式,打开江苏扬州

手机要闻

鸿蒙系统大推送:6.1.0.125已来袭,API 24也转正了!

艺术要闻

蚂蚁新总部封顶了!大圆环到底有啥魔力,科技公司都抢着用?

无障碍浏览 进入关怀版