网易首页 > 网易号 > 正文 申请入驻

OpenAI深夜甩出"极速模式":GPT-4o推理成本骤降90%,开发者连夜重写代码

0
分享至

OpenAI CEO Sam Altman 在凌晨突然发布 GPT-4o 的「/fast」模式,推理成本最高下降 90%,延迟降低 80%——这意味着 AI 应用的经济账将被彻底重算。

「极速模式」突袭:价格屠夫再出手


Altman 的推文简短得近乎随意:「忘了提 /fast!」(Forgot to mention /fast!),配图只有一句「我觉得大家会喜欢这个。」(I think people will like this.)

但开发者社区的反应证明这绝非小事。/fast 模式针对 GPT-4o 的推理层进行了深度优化,将非推理模型的 token 生成速度推向极限。根据 OpenAI 官方技术文档,该模式在保持模型核心能力不变的前提下,实现了两项关键突破:推理成本最高削减 90%,端到端延迟降低 80%。

这一幅度远超行业常规优化水平。作为参照,OpenAI 去年推出的 GPT-4 Turbo 降价幅度为 50%,已引发竞品连锁反应。此次 /fast 模式的技术路线并非简单压缩模型,而是通过动态批处理、投机解码(speculative decoding)和定制推理内核的组合,在硬件利用率上榨取极限效率。

更值得关注的是定价策略的激进转向。/fast 模式采用独立于标准 API 的计费体系,输入 token 价格降至 0.5 美元/百万,输出 token 1.5 美元/百万——对比 GPT-4o 标准版的 2.5 美元/百万输入、10 美元/百万输出,成本曲线呈现断崖式下跌。对于高频调用场景,这意味着年度 AI 基础设施支出可能从百万美元级骤降至十万级。

延迟战争:80% 提速背后的技术博弈

延迟优化是 /fast 模式的另一张王牌。80% 的延迟削减并非均匀分布,而是在高并发场景下尤为显著。OpenAI 工程团队透露,该模式通过预测性缓存和并行 token 生成技术,将首 token 时间(Time to First Token)从数百毫秒压缩至 50 毫秒以内,后续 token 生成速率突破每秒 200 个。

这一数据直接挑战了此前由 Groq 等专用推理芯片公司保持的性能标杆。Groq 的 LPU 架构曾以确定性低延迟著称,但其硬件成本高昂且供应受限。/fast 模式的出现表明,软件层面的优化仍能在通用 GPU 集群上释放巨大潜力——这对英伟达等芯片供应商的定价权构成隐性压力。

开发者实测反馈呈现两极分化。部分用户报告在代码生成、实时对话等场景体验「质变」,但也有声音指出 /fast 模式在复杂数学推理和长上下文(128k 以上)任务中出现质量衰减。OpenAI 官方承认该模式「针对速度优化,部分用例可能更适合标准模式」,暗示技术路线存在明确的 trade-off 设计。

生态重构:从模型竞争到推理效率竞争

/fast 模式的发布时机耐人寻味。就在 48 小时前,Anthropic 刚刚公布 Claude 3.5 Sonnet 的 API 更新,Google 也在 I/O 大会预热 Gemini 1.5 Pro 的降价计划。Altman 的「突袭式」推文,实质是将行业竞争焦点从模型能力评分强行拉向推理经济性维度。

这一策略对中小开发者的冲击尤为剧烈。此前,成本敏感型应用往往被迫在模型质量与运营可持续性之间妥协,选择 GPT-3.5 Turbo 或开源模型。/fast 模式以接近 GPT-3.5 的价格提供 GPT-4o 的能力,直接抹平了这道选择题的存在价值。据第三方监测平台数据,消息发布后 6 小时内,GPT-4o API 调用量激增 340%,而 GPT-3.5 Turbo 流量出现 15% 的即时下滑。

更深层的行业影响在于推理层的战略地位升级。OpenAI 同时宣布将在未来两周内开放 /fast 模式的自定义微调接口,允许企业针对特定任务进一步优化延迟-成本曲线。这与微软 Azure 的专用 AI 加速器、AWS 的 Trainium/Inferentia 芯片形成正面交锋——云厂商的 AI 基础设施叙事,正从「算力规模」向「推理效率」急速迁移。

未竟之局:速度红利能持续多久

/fast 模式的技术护城河并非不可逾越。投机解码、动态批处理等优化手段在学术圈已公开讨论多年,Google、Meta 的工程团队具备快速跟进的工程能力。真正的壁垒在于 OpenAI 对用户调用模式的深度洞察——其全球 API 流量形成的实时数据飞轮,使其能持续校准缓存策略和预测模型。

Altman 在后续推文中暗示「这只是开始」,并提及「2024 年推理成本还将有数量级下降」。若这一预言兑现,当前基于订阅制的 AI 产品商业模式将面临根本性挑战:当边际成本趋近于零,按 token 计费的 API 经济本身或许都需要重构。

对于开发者而言,/fast 模式释放了一个明确信号:AI 应用的创新瓶颈已从「模型能力」转向「成本架构设计」。那些能在极速推理与业务场景之间找到精准匹配的团队,将在下一轮洗牌中占据先机——而仍在为标准 API 高价买单的玩家,账期可能已所剩无几。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
威廉凯特光脚躺草地,却给了大洋彼岸的梅根,最响亮的一记耳光!

威廉凯特光脚躺草地,却给了大洋彼岸的梅根,最响亮的一记耳光!

白露文娱志
2026-04-30 11:01:36
外媒:捷克今年前三个月从台湾购买近亿美元无人机

外媒:捷克今年前三个月从台湾购买近亿美元无人机

俄罗斯卫星通讯社
2026-04-28 15:10:00
今夜,涨爆了!特朗普,突然宣布!

今夜,涨爆了!特朗普,突然宣布!

中国基金报
2026-04-30 00:15:46
吉林加快组建省农机集团,省长:确保今年9月挂牌成立

吉林加快组建省农机集团,省长:确保今年9月挂牌成立

界面新闻
2026-04-30 20:49:17
南宁飞广州一航班延误超1小时,疑因旅客开玩笑称“没有充电宝有炸弹”,南航客服:系公共安全事件,机场警方称有旅客被带走调查

南宁飞广州一航班延误超1小时,疑因旅客开玩笑称“没有充电宝有炸弹”,南航客服:系公共安全事件,机场警方称有旅客被带走调查

大风新闻
2026-04-30 20:46:04
什么都不长的盐碱地,撒进去28万只螃蟹,捞出来的东西让人眼红

什么都不长的盐碱地,撒进去28万只螃蟹,捞出来的东西让人眼红

爱下厨的阿椅
2026-04-30 17:37:21
让以色列心惊胆战的对手,终于猛龙过江了:既非土耳其,也非伊朗

让以色列心惊胆战的对手,终于猛龙过江了:既非土耳其,也非伊朗

遁走的两轮
2026-04-19 19:10:28
阿里发布数字员工QoderWake:真实工作中承担软件工程师、运营等

阿里发布数字员工QoderWake:真实工作中承担软件工程师、运营等

IT之家
2026-04-30 14:53:19
斯诺克世锦赛:希金斯拒绝连输2局!65-27赢乱战,1-1追平墨菲!

斯诺克世锦赛:希金斯拒绝连输2局!65-27赢乱战,1-1追平墨菲!

刘姚尧的文字城堡
2026-04-30 20:52:08
赚外快不能停!广州主场打广东郭艾伦仍不去现场,继续解说捞钱

赚外快不能停!广州主场打广东郭艾伦仍不去现场,继续解说捞钱

弄月公子
2026-04-30 20:38:06
单依纯郑州公开挑衅李荣浩,穿的像马桶刷,现场氛围诡异,太疯狂

单依纯郑州公开挑衅李荣浩,穿的像马桶刷,现场氛围诡异,太疯狂

嫹笔牂牂
2026-04-30 07:30:10
老板娘吴迪:50岁风情万种,纹身很个性,曾为易建联砸2亿留队魂

老板娘吴迪:50岁风情万种,纹身很个性,曾为易建联砸2亿留队魂

做一个合格的吃瓜群众
2026-03-27 10:48:37
神舟二十三号备战发射,2名国外航天员穿上中国宇航服:照片来了

神舟二十三号备战发射,2名国外航天员穿上中国宇航服:照片来了

环球科学猫
2026-04-30 11:03:50
半年打一针,4000万慢性鼻窦炎有新药了

半年打一针,4000万慢性鼻窦炎有新药了

医学界
2026-04-29 19:56:22
Codex、Claude、Gemini 发力争抢桌面端

Codex、Claude、Gemini 发力争抢桌面端

Ai学习的老章
2026-04-30 18:30:54
96岁奶奶摆摊10年还清2077万,但凡稍微“体面”一点,都说不口

96岁奶奶摆摊10年还清2077万,但凡稍微“体面”一点,都说不口

走读新生
2026-04-29 10:48:15
官方:伯恩利主帅斯科特-帕克下课,球队34轮仅积20分已降级

官方:伯恩利主帅斯科特-帕克下课,球队34轮仅积20分已降级

懂球帝
2026-04-30 17:15:08
以防长称或“很快”对伊朗“再次采取行动”

以防长称或“很快”对伊朗“再次采取行动”

澎湃新闻
2026-04-30 23:29:04
太恶心!放射线技师借拍X光骗女高中生脱衣,背后更吓人

太恶心!放射线技师借拍X光骗女高中生脱衣,背后更吓人

戗词夺理
2026-04-30 21:06:21
G5结束后,NBA夺冠概率更新!火箭0.7%骑士2.4%两队超20%断档领跑

G5结束后,NBA夺冠概率更新!火箭0.7%骑士2.4%两队超20%断档领跑

锅子篮球
2026-04-30 19:43:18
2026-05-01 01:03:00
硅屿手记
硅屿手记
有态度网友ytd
3332文章数 15关注度
往期回顾 全部

科技要闻

9000亿美元估值,Anthropic即将反超OpenAI

头条要闻

英国国王给特朗普送了口钟 还贴脸开大"有需要尽管敲"

头条要闻

英国国王给特朗普送了口钟 还贴脸开大"有需要尽管敲"

体育要闻

季后赛场均5.4分,他凭啥在骑士打首发?

娱乐要闻

孙杨博士学历有问题?官方含糊其辞

财经要闻

易会满被“双开”!

汽车要闻

专访捷途汪如生:捷途双线作战 全球化全面落地

态度原创

健康
本地
教育
公开课
军事航空

干细胞治烧烫伤面临这些“瓶颈”

本地新闻

用青花瓷的方式,打开西溪湿地

教育要闻

高考地理中的数字文旅

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

意大利议会批准:捐赠航母给印度尼西亚

无障碍浏览 进入关怀版