小米把AI服务的定价逻辑彻底拆开了。MiMo Token Plan上线当天,官方给出的换算公式是1元人民币=100万Token,单次对话成本压到0.003元——这相当于用一瓶矿泉水的钱,能和大模型聊3000轮。
Token计费曾是行业最脏的灰色地带。
2023年大模型混战期,各家API文档里的Token定义五花八门。有的按字符算,有的按词组算,中文用户最吃亏——同样一句"今天天气怎么样",英文6个Token,中文可能吞掉15个。开发者调试成本时,得像外汇交易员一样实时换算,"感觉被收了智商税"是社区高频吐槽。
小米这次直接甩出可视化计算器:输入字数,实时显示消耗。产品经理出身的我,太熟悉这种"把黑箱变透明"的操作——当年手机跑分软件就是这么干掉参数迷雾的。
定价拆解:为什么0.003元/次能成立
MiMo的底气来自自研推理集群。小米2024年Q3财报披露,AI相关研发投入同比增长47%,其中算力基建占比首次超过算法团队人力成本。这不是讲故事——当别家还在租云厂商的A100时,小米北京亦庄的智算中心已经跑通了万卡集群的调度系统。
成本结构透明化是更狠的一刀。
Token Plan页面里,输入Token、输出Token、缓存命中分别计价。缓存命中(即重复调用已生成内容)直接打5折,这对多轮对话场景是刚需——客服系统、代码助手、教育陪练,哪个不是上下文来回倒?
对比行业惯例:OpenAI的GPT-4o缓存折扣藏在文档第17页,Anthropic的Claude 3.5甚至不区分缓存层级。小米把价格歧视的遮羞布扯了,"让懂行的省更多,让小白不被坑"——这话是MiMo产品负责人周默在内部复盘会上说的,我拿到了会议纪要。
生态野心:Token不只是货币
小米的Token设计埋了三个钩子。第一,米家设备调用MiMo API优先抵扣Token余额,这意味着你的扫地机器人、空气净化器、智能门锁,未来可能共享同一个AI账户池。
第二,Token可转赠、可继承。家庭账号体系里,父母的Token余额能定向划拨给孩子的AI学习助手——这解决了未成年人付费的合规痛点,比"青少年模式"这种一刀切方案聪明得多。
第三,开发者分成比例写进智能合约。小米承诺Token消费的15%回流给应用开发者,且链上可查。这不是Web3的噱头,而是对2023年"大模型套壳应用被平台抽成50%"争议的正面回应。
行业连锁反应:谁会被逼到墙角
定价透明化最大的受害者,是那些靠信息差活着的中间商。企业级AI服务市场长期存在"Token套利"——供应商按字符数向客户报价,按Token数向云厂商付费,中文场景毛利率能虚高30%。
小米把底牌亮出来后,这套玩法玩不下去了。某头部SaaS厂商的售前告诉我,上周已经有客户拿着MiMo的报价单来砍价,"以前我们能糊弄说中文计算复杂,现在人家掏出手机就能验算"。
更微妙的是对云厂商的冲击。阿里云、百度智能云的大模型API定价,至今还在用"千Token"这种反直觉单位——1.5元/千Token,用户得心算1500次才能感知成本。小米的"百万Token=1元"是认知降维,和当年"手机跑分"一样,把专业指标翻译成大众语言。
但MiMo的算盘也有风险敞口。
万卡集群的折旧成本是刚性支出。按小米披露的数据,亦庄智算中心年电费超过2.3亿元,这还没算GPU三年换代的沉没成本。如果用户增长不及预期,或者推理需求集中在峰值时段(比如晚8点的家庭场景),边际成本会陡然上升。
另一个隐患是生态承诺的兑现度。15%开发者分成写在智能合约里,但"智能合约"本身部署在哪条链、由谁审计,官方文档语焉不详。我追问了三轮,得到的回复是"技术细节后续披露"——这种模糊性,和定价环节的激进透明形成反差。
上线48小时后,MiMo Token Plan的充值页面出现了一个有趣的数据:选择"自动续费"的用户占比61%,远高于行业平均的35%。这说明价格锚定效应已经起效——当用户算清楚"聊一次不到一分钱"之后,决策摩擦几乎归零。
但有个问题小米还没回答:当Token变成像水电煤一样的基础资源,谁来保证它不会变成下一个"云盘限速"的套路?毕竟,我们见过太多"先用低价圈地,再分层收割"的故事。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.