网易首页 > 网易号 > 正文 申请入驻

微软把GPT-4踢出生产线,小模型省下97%成本还更快

0
分享至

2024年,全球企业调用大模型API的总支出预计突破120亿美元。但一个反直觉的数据正在硅谷流传:超过60%的生产任务,其实根本不需要参数过千亿的巨型模型。

微软Azure AI团队最近放出一组内部数据。他们帮客户做架构优化时,把一批原本跑在GPT-4上的任务迁移到Phi-3-mini——一个只有38亿参数的小模型。结果延迟从800毫秒压到23毫秒,成本砍掉97%。客户原话:「我们之前像在拿屠龙刀切葱花。」

小模型是怎么突然能打的

参数规模曾经是AI能力的唯一标尺。GPT-4据传超过1.8万亿参数,GPT-3.5也有1750亿。这种「越大越强」的信仰,让所有人默认生产环境必须堆最大号模型。

但2023年下半年,情况变了。

Meta开源Llama 2,证明700亿参数模型经过充分训练,能在多数任务上逼近GPT-3.5。微软接着推出Phi系列,用教科书级高质量数据训练小模型,38亿参数的Phi-3-mini在代码和推理测试里追平GPT-3.5。Google的Gemma、Mistral的7B模型陆续跟进。小模型阵营开始形成规模效应。

技术社区有个被忽视的细节:Phi-3的训练数据里,大量使用了「合成数据」——由大模型生成的、经过严格过滤的教科书式样本。这相当于让GPT-4当老师,把知识蒸馏给更小的学生。微软研究员Ronen Eldan在论文里写得很直接:「数据质量对小型模型的影响,比增大参数量更显著。」

生产环境的真实成本账

调用API的企业很少算清一笔账:延迟成本。

GPT-4处理一个中等复杂度的客服查询,平均响应800毫秒。用户体感是「明显卡顿」,转化率因此流失。换成Phi-3-mini,23毫秒的响应接近即时反馈。电商客户的数据显示,页面加载每快100毫秒,转化率提升约1%。

更隐蔽的是能耗。斯坦福AI指数报告测算,一次GPT-4调用耗电约0.002千瓦时,是小模型的50-100倍。当调用量达到日均十亿级别,电费差就是真金白银。

微软Azure的架构师有个内部判断:「最好的模型是能完成任务的最小模型。」这句话被写进了他们的官方文档,但很少被行业讨论。原因很现实——卖大模型API的利润远高于小模型。

谁在偷偷换模型

实际案例比论文更有说服力。

摩根士丹利的财富管理部门,2023年用GPT-4做内部知识库问答。半年后迁移到自研的微调小模型,准确率从87%提升到94%,成本降到原来的4%。他们的技术负责人解释:「金融领域的问答范围相对封闭,不需要模型知道怎么写十四行诗。」

Shopify的客服场景更典型。他们把80%的常规咨询交给70亿参数模型,只有涉及复杂退货政策时才上调到更大模型。分层架构让年度AI支出减少62%,用户满意度反而上升——因为响应快了。

GitHub Copilot也在调整策略。早期版本统一调用Codex(GPT-3.5级别),现在会根据代码复杂度动态选择模型。简单补全用轻量模型,复杂架构设计才上大模型。用户无感知,但微软的服务器成本显著下降。

小模型的边界在哪里

不是所有任务都能降级。

需要多步推理的复杂分析、跨领域知识整合、创意写作——这些场景小模型确实吃力。医疗诊断辅助、法律合同审查这类高风险场景,企业仍倾向用大模型保底。

但边界正在移动。Phi-3-small(70亿参数)已经在部分数学推理测试里超过早期GPT-4。Google DeepMind的研究显示,用「测试时计算扩展」——让模型在回答前多思考几步——小模型的推理能力可以临时放大。

一个行业共识正在形成:未来不是「一个大模型做所有事」,而是「成百上千个专用小模型各司其职」。每个模型针对特定任务优化,通过路由机制调度。这类似于从「万能瑞士军刀」转向「专业工具箱」。

OpenAI自己也意识到了。2024年发布的GPT-4o mini,明确主打性价比路线。Sam Altman在开发者日上的原话:「我们认为智能应该越来越便宜,而不是越来越贵。」这句话的潜台词是:他们也知道高端市场快触顶了。

对技术团队的建议变得务实。先拿小模型试跑任务,设定准确率阈值,达不到再逐级上调。这个策略被微软内部称为「模型节食」(Model Dieting)。多数情况下,团队会发现他们高估了任务难度。

一位在三家独角兽做过AI架构的工程师告诉我,他现在面试候选人必问:「如果预算砍掉90%,你怎么设计系统?」答不上来的,说明没在生产环境真刀真枪干过。

你的团队现在有多少比例的任务,其实可以用小模型解决,却还在付GPT-4的钱?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
5月7日起,广州白云机场T1航站楼航司全部转至T3运营

5月7日起,广州白云机场T1航站楼航司全部转至T3运营

南方都市报
2026-04-30 22:54:12
上海地铁互殴最新后续!处罚结果公示于众,拘留仅仅只是开始

上海地铁互殴最新后续!处罚结果公示于众,拘留仅仅只是开始

阅微札记
2026-04-30 19:36:10
儿童绘本居然有床戏!尺度大胆细节露骨,儿童读物底线何在?

儿童绘本居然有床戏!尺度大胆细节露骨,儿童读物底线何在?

今朝牛马
2026-04-28 22:43:44
知名男星朴东彬骤逝!在餐厅断气被发现「留下一女儿」 享年56岁

知名男星朴东彬骤逝!在餐厅断气被发现「留下一女儿」 享年56岁

ETtoday星光云
2026-04-30 12:04:05
海南夫妻英勇救人,荣誉不止官媒点赞,医院认定更暖心

海南夫妻英勇救人,荣誉不止官媒点赞,医院认定更暖心

奇思妙想草叶君
2026-04-30 20:08:05
中国零关税“点燃”尼日利亚农产品加工梦

中国零关税“点燃”尼日利亚农产品加工梦

北青网-北京青年报
2026-05-01 07:49:02
尤伯杯4强出炉,汤姆斯杯1/4决赛国羽男团换二双,大马变阵

尤伯杯4强出炉,汤姆斯杯1/4决赛国羽男团换二双,大马变阵

佑铭羽球
2026-05-01 07:13:06
楼市“最大禁忌”,被打破了!

楼市“最大禁忌”,被打破了!

刘晓博说楼市
2026-04-30 18:08:43
中纪委2026严查新方向,这6类岗位首当其冲

中纪委2026严查新方向,这6类岗位首当其冲

细说职场
2026-05-01 08:18:54
朝鲜展示在俄乌战场缴获的西方武器,包括“豹”-2、M1A1“艾布拉姆斯”坦克!普京:铭记俄朝士兵并肩作战的英勇事迹

朝鲜展示在俄乌战场缴获的西方武器,包括“豹”-2、M1A1“艾布拉姆斯”坦克!普京:铭记俄朝士兵并肩作战的英勇事迹

每日经济新闻
2026-04-30 21:50:12
美伊最新局势一文速览:特朗普称已“摧毁”伊朗核能力,美正推动建立新联盟以重开霍尔木兹;伊朗:持续海上封锁不可容忍

美伊最新局势一文速览:特朗普称已“摧毁”伊朗核能力,美正推动建立新联盟以重开霍尔木兹;伊朗:持续海上封锁不可容忍

极目新闻
2026-05-01 07:46:05
四川泸州47岁公益博主“罗二哥”突发疾病去世:生前参与创立数百人公益团队,帮学助困

四川泸州47岁公益博主“罗二哥”突发疾病去世:生前参与创立数百人公益团队,帮学助困

红星新闻
2026-05-01 09:31:19
蒋中正日记手稿被揭露,字迹竟被称作书法界的奇迹!

蒋中正日记手稿被揭露,字迹竟被称作书法界的奇迹!

书画相约
2026-04-30 11:14:19
今年的季后赛,极有可能是小个子球员市场全面崩塌的分水岭

今年的季后赛,极有可能是小个子球员市场全面崩塌的分水岭

篮球小烟花
2026-05-01 08:00:03
马斯克,撕破脸了

马斯克,撕破脸了

蓝钻故事
2026-04-30 22:41:52
张本智和父亲怒了:我儿子比99%的中国人优秀,他在日本备受尊敬

张本智和父亲怒了:我儿子比99%的中国人优秀,他在日本备受尊敬

拳击时空
2026-05-01 06:29:10
云南元阳发生车祸 造成7死12伤

云南元阳发生车祸 造成7死12伤

环球网资讯
2026-04-30 20:15:07
实力说话!泽连斯基态度突变非常强势

实力说话!泽连斯基态度突变非常强势

名人苟或
2026-04-30 22:35:43
1-2!德甲劲旅欧联杯遭绝杀失先机 2000万门神扑点后补时脱手送礼

1-2!德甲劲旅欧联杯遭绝杀失先机 2000万门神扑点后补时脱手送礼

我爱英超
2026-05-01 07:17:19
《乘风2026》三公路透,“李小冉毫无运动痕迹”登上热搜

《乘风2026》三公路透,“李小冉毫无运动痕迹”登上热搜

落雪听梅a
2026-05-01 04:58:46
2026-05-01 10:03:00
赛博兰博
赛博兰博
专注捣鼓AI效率工具,试图在这个时代留下数字分身的探索者。
2037文章数 25关注度
往期回顾 全部

科技要闻

苹果上季在华收入继续大增 iPhone收入新高

头条要闻

牛弹琴:特朗普还是没抵住诱惑 诱惑中果然有陷阱

头条要闻

牛弹琴:特朗普还是没抵住诱惑 诱惑中果然有陷阱

体育要闻

季后赛场均5.4分,他凭啥在骑士打首发?

娱乐要闻

孙杨博士学历有问题?官方含糊其辞

财经要闻

GPU神话松动,AI真正的战场变了

汽车要闻

专访捷途汪如生:捷途双线作战 全球化全面落地

态度原创

数码
旅游
亲子
游戏
公开课

数码要闻

华硕准备“ROG新NUC”,预计升级CPU与GPU

旅游要闻

“跟着演出去旅行” 解锁文旅新体验

亲子要闻

南山公立幼儿园的天花板!你们心目中的好幼儿园是什么样的?

曝《GTA6》定价即将揭晓!悬念终于要落地了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版