![]()
![]()
夏至未至,大模型行业的价格战已经打到了白热化的程度。
过去一年,企业级大模型的Token调用成本暴跌了67%,开源模型拿下了企业Token调用量38%的份额。
就在一周前,DeepSeek扔下一颗深水炸弹——V4-Pro模型的API从临时打折变成永久降价,百万Token的输入缓存命中价格压到0.025元,网友戏称“收了个电费”。
当行业还没缓过神的时候,5月27日凌晨,小米突然宣布MiMo-V2.5系列API永久降价,最高降幅高达99%,且不再区分上下文窗口长度。
短短几天时间,两条重磅消息把大模型赛道的价格锚点彻底打穿了。
![]()
MiMo亮剑,深夜降价
先说这次降价本身。
小米技术官方公告显示,MiMo-V2.5-Pro的输入缓存命中价格调整后仅为0.025元/百万tokens,相比原来256k规格的1.40元降了98%,对比长窗口的2.80元达到了99%的降幅。
标准版MiMo-V2.5也不含糊,输入缓存命中价格降到0.020元,较原价最高降了98%。
![]()
●图源:小米技术
也就是说,过去调用一次大模型的成本,现在能调用几十次甚至上百次。对此小米技术官方表示,这是一次对整个模型价格体系进行永久性翻新。
与此同时,TokenPlan计费体系也得到了优化。
此前不少开发者吐槽套餐价格偏贵、Token不够用,这次小米给出了“加量不加价”的方案:
同等付费价格下,可用Token数量提升到原来的5-8倍,计费规则简化为:不再区分上下文窗口长度,所见即所得。
此外,所有当前有效的TokenPlan用户额度在5月27日零点全部重置,按新规则执行,已经过期的历史付费用户据说也有惊喜。
![]()
●图源:小米技术
小米此次降价并非单纯的低价竞争,背后是技术底座的持续迭代。
小米技术团队基于SGLangHiCache完整支持了SWA,将KVCache在多级存储之间的数据搬运量降到优化前的近1/7,可缓存Token数量提升近5倍,同时通过专家并行方案、输入长度分桶策略等优化,持续降低了单位Token服务成本。
目前MiMo-V2.5系列,已经覆盖商用普惠市场的主要场景。
可能很多人对Xiaomi MiMo的印象,还停留在“小米也做了个模型”上。
但实际上,XiaomiMiMo-V2.5-Pro在ArtificialAnalysis榜单上综合智能指数和Agent指数均位列全球开源模型并列第一,跻身全球所有大模型总榜前五,与ClaudeOpus4.6、GPT-5.4等闭源旗舰比肩。
![]()
![]()
同一时期,MiMo-V2-Pro以超过30%的市占率登顶OpenRouter平台周榜第一,周调用量达到4.82万亿Token。
从追赶者到领跑者,小米AI只用了一年多的时间。
![]()
六百亿豪赌,雷军下注了
就在降价消息炸开的前一晚,5月26日,小米发布了2026年第一季度财报。
核心数据显示:总营收991亿元,经调整净利润61亿元,研发投入90亿元同比增长33.4%,研发人员总数突破2.6万人,硬核科技投入力度可见一斑。
财报明确提到,Xiaomi MiMo-V2.5-Pro已跻身全球开源模型双料第一,MiMo大模型助力HermesAgent登顶全球调用量榜首,成为第一贡献模型。
雷军明确对外表态:未来三年,小米在AI领域的投入将超过600亿元,今年至少160亿元。
![]()
●图源:小米
据悉,小米2025年全年总收入4573亿元,净利润不到300亿。这意味着小米未来三年要在AI上烧掉两年多的利润。
即便当年all in造车时,雷军也才说十年投入100亿美元,而AI的三年投入,年均超过200亿,力度之大前所未有。
小米AI业务的快速崛起,离不开核心人才的加持。
此前95后顶尖AI技术人才罗福莉加盟小米,曾在业内引发不小震动,传闻雷军以千万年薪力邀其加入。
在她的统筹下,MiMo从V2系列一路迭代到V2.5系列,4月23日更是一口气官宣了四款新模型,时隔上一代发布仅36天。
![]()
●图源:小米
如今,小米MiMo研发团队平均年龄仅25岁,清北毕业生占比超六成,年轻且顶尖的人才阵容为模型快速迭代提供了核心动力。
而罗福莉本人曾在多个公开场合表达过对AI前景的大胆判断,她认为大模型完全可能“自己左脚踩右脚提升”,甚至预言AGI将在两年内到来。这样的技术野心,显然需要真金白银来支撑。
预计小米全年研发投入将超过400亿元,而其中相当大的一部分会花在AI上。
![]()
●图源:小米
在AI加速重构“人车家全生态”的战略下,小米正把大模型能力注入手机、汽车、IoT全场景,从跨端AI Agent到车载语音助手,从智能家居到工业质检,每一块都在铺AI的底座。
![]()
汽车盈转亏,雷军慌不
如果说大模型降价是小米在进攻,那么Q1财报的另一面则揭露了这家公司正在承受的压力。
财报显示,小米集团总营收同比下滑10.9%至991.42亿元,经调整净利润60.72亿元,同比大跌43.1%,毛利同比下降14.2%,经营利润更是从去年同期的131.3亿元骤降至53.1亿元。
![]()
●图源:小米集团
可以看到,各条业务线的冷热分化非常明显。
手机×AIoT分部收入792.8亿元,同比下滑14.5%;智能手机出货量3380万台,同比下降19.2%。
但手机的平均售价却逆势涨到了1310元,创下历史新高,中国大陆高端智能手机销量占比也达到了23.5%。
这说明小米在主动收缩中低端机型、向高端要利润。
![]()
●图源:小米
IoT业务相对稳健,毛利率达到了25.2%的历史高位,境外IoT收入创下新高。但外界最关心的还是汽车。
一季度智能电动汽车及AI等创新业务收入198.6亿元,营收占比飙升至20%,已正式成为小米的第二大业务支柱。
当季交付80,856辆新车,在行业淡季和产品切换的双重压力下实现了同比增长6.6%。
然而,由于巨大的工厂折旧、产能爬坡和前瞻研发投入,汽车业务一季度净经营亏损达到了31.3亿元,在连续两个季度盈利之后,再度转亏。
怎么理解这个数字?
放眼同级新势力,一季度零跑以11.02万辆登顶销冠,理想以9.51万辆稳居第二,蔚来交付8.35万辆,小米以7.86万辆排名第四。
![]()
●图源:中汽数研
但零跑背后是五个以上的产品线在同时跑量,理想也是L系列加纯电五六个系列打天下,蔚来更是主品牌叠加乐道、萤火虫超过六个系列。
而小米就SU7和YU7两个系列。论每款车型的平均贡献效率,小米甩开所有对手不止一个身位;论产品线单一带来的结构性风险,小米同样甩开了所有对手不止一个身位。
一季度小米汽车的处境很微妙。老SU7已经停产,交付全靠YU7系列扛着;新一代SU7虽然在3月下旬开启交付后,4月单月卖了26826辆、占当月总销量的73%,但YU7在4月的零售量已从年初巅峰的3.7万辆回落至9876辆。
两款车的此消彼长,像极了青黄不接的过渡期。
![]()
●图注:YU7与Model Y销量对比,八败两胜
但从财报电话会上释放的信号来看,雷军并不慌张。
小米CFO林世伟在会上透露,董事会已启动总额不超过200亿港元的股份回购计划,截至披露时小米2026年累计回购已超过80亿港元,回购力度位居港股第二。
真金白银回购股票,确实比任何口头表态都更有说服力。更何况小米汽车的毛利率一季度达到了20.1%,放在整车行业已经是一个相当拿得出手的工业化起点,单车均价23.5万元也在行业中处于第一梯队。
管理层在电话会上坦言,亏损主要来自跨年订单的购置税补贴、SU7 Ultra高端车型交付占比下降、以及核心零部件价格上涨的三重叠加,属于阶段性因素而非结构性问题。
![]()
价格战打到头,然后呢
随着DeepSeek和小米前后降价,一个清晰的信号浮出了水面:大模型API正在从高毛利的收费入口,变成基础设施级别的水电煤。
梁文锋此前说过一句话,公司的定价哲学很简单:核算成本后定价,不贴钱,也不赚暴利,AI应该是普惠的、人人用得起的。
此次小米的降价幅度比DeepSeek更猛,背后是同样的逻辑:技术的价值,最终要体现在被使用的广度上。
降价不意味着不赚钱。当调用成本降到足够低,下游的应用生态才会真正爆发。
Agent开发、代码辅助、智能客服、语音交互......这些场景的商业化,靠的不是高价卖Token,而是海量调用带来的规模效应。
小米的算盘很清楚:用降价把开发者拉进自己的生态,用生态的繁荣反哺模型迭代,再用模型能力的领先守住定价的话语权。
而相比于雷军的豪赌最终能否让小米在AI时代站稳脚跟,开发者们可能更关心下一个降价的会是谁。
*编排 | 黄家俊 审核 | 黄家俊
行业资讯、案例资料、运营干货,精彩不停
![]()
2000万品牌经理人内参!
聚焦头部与标杆,助力品牌高端化。
品牌专访微信:jiangnan254(备注:专访)
百万品牌经理人都在看
![]()
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.