2024年4月,Google把Gemma 4的权重文件往Apache 2.0协议下一丢,六家实验室的开放模型正式凑齐一桌麻将。一年前选开源模型还得认栽——隐私有了、控制权有了,但质量明显比GPT-4差一截。现在?Epoch AI的追踪数据显示,开放模型平均只落后最强闭源模型三个月。
三个月和三年的区别,相当于外卖迟到和快递丢件。
62倍价差,70%场景打平
今年2月的一份定价分析算过笔账:最便宜的GPT-5 Nano每百万token 0.4美元,最贵的Claude Opus 4.6要25美元,价差62倍。但典型API流量里,约70%的请求——邮件摘要、短语翻译、工单分类——两者输出几乎没区别。
你付的溢价,买的是你用不上的能力。
剩下30%才是闭源模型的护城河:复杂多步推理、陌生领域的代码生成、 nuanced 的法律或财务分析。如果你的 workload 扎在这块,Claude或GPT-5的钱花得值。如果不是,你在为 Ferrari 的引擎买单,却只用来买菜。
Linux基金会和Meta的联合报告里有个数字:89%的组织已经在某种程度上使用开源AI,这些组织的ROI比纯闭源用户高25%。世界经济论坛2026年1月的企业AI调研也确认,63%的组织已采用开源工具,核心理由就是成本。
许可证才是隐形战场
六家开放模型里,五家用的是Apache 2.0或MIT协议。这意味着没有商业限制、没有"可接受使用条款"在你上线后突然变脸、没有月活门槛触发法务约谈。
Meta的Llama 4、阿里Qwen 3.5、Mistral、OpenAI的gpt-oss、智谱GLM-5,加上Google的Gemma 4,阵容已经齐整。OpenAI进场尤其值得玩味——这家公司靠API订阅起家,现在却把开放权重当成一张牌打。
许可证的选择从来不是技术问题,是权力问题。Apache 2.0让你可以修改、可以集成、可以闭源衍生,不用每隔半年重新谈判条款。对于需要把模型塞进边缘设备、或者担心数据出境合规的团队,这种确定性值多少钱?
评估成本 vs 不评估的成本
开源模型的隐藏成本不是部署,是评估。你得测它在你的数据上表现如何,得调参,得建评估流水线。但闭源模型的隐藏成本是锁定——价格变动、功能下线、服务条款单方面更新。
Google发布Gemma 4的同一天,内部团队放出了一组微调后的医疗问答数据。没上新闻稿,藏在技术文档里:在特定垂直场景,27B参数的Gemma 4微调版打平了半年前70B闭源模型的表现。参数效率的提升,让单卡推理从奢望变成常态。
这对预算结构的冲击是直接的。以前"开源=省钱但凑合"的等式,现在变成"开源=够用且可控"。财务模型里那行"AI API支出"的增速,终于可以往下调了。
但别急着把OpenAI的API key 注销。三个月的代差在快速收窄,却还没抹平。关键问题是:你的 use case 到底落在70%还是30%?多数团队其实没仔细测过。
Google DeepMind的Gemma团队负责人Tomás Berrueta在发布后的技术 AMA 里被问到:「你们不怕开放权重影响Gemini的订阅收入吗?」他的回复是:「企业客户最终会为支持、为安全审查、为合规工具链付费,不是为权重文件本身。」
这话的潜台词是:模型层正在commoditize(商品化),价值往上迁移。谁能在你的基础设施里扎根更深,谁才能收到持续的钱。
你的AI预算里,有多少比例花在"以防万一"的能力冗余上?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.