开发者用Grok 4.20 Multi-Agent时,如果走OpenRouter中转,输入token费用是直接对接xAI的1.6倍,输出token更是贵出2.4倍。这不是小数目——百万token级别的调用,差价直接吃掉项目预算。
上下文窗口超过20万token后,溢价更夸张。输入成本跳到3倍以上,输出成本飙到4倍。原文给出的价目表很直白:xAI直供输入$1.25/百万token、输出$2.50;OpenRouter同样模型输入$2.00(≤20万上下文)或$4.00(>20万),输出$6.00或$12.00。
![]()
中间商的商业模式不难理解——聚合多源模型、统一API格式、降低接入门槛。但便利是有价格的。对于已经锁定单一模型、调用量稳定的团队,这笔"手续费"值得重新算账。
![]()
关键变量是上下文长度。短文本场景差价可控,长文档分析、代码库理解这类吃token的任务,成本曲线陡然变陡。20万token的门槛,恰好卡在复杂企业应用的常见水位线上。
![]()
选型建议很务实: prototyping阶段用中间商快速验证,生产环境高并发调用时切直连。省下的预算,够多跑几轮微调实验。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.