网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

OpenAI大溃败！GPT-5「换皮」GPT-4o，两年半预训练0突破

2025-12-01 15:14:01　来源: 新智元

北京举报

0

分享至

新智元报道

编辑：KingHZ 桃子

【新智元导读】OpenAI，亟需一场翻身仗！今天，全网最大的爆料：GPT-5基石实为GPT-4o。自4o发布之后，内部预训练屡屡受挫，几乎沦为「弃子」。

OpenAI核心预训练，接连翻车？

传言称，GPT-5的基石仍是GPT-4o，且GPT-4.5之后的预训练版本，都被OpenAI放弃了！

这么说并非空穴来风，核心爆料恰恰来自权威SemiAnalysis的最新一文——

OpenAI顶尖团队自GPT-4o发布之后，迄今尚未完成一次完整的，为下一代前沿模型设计的大规模预训练。

文章中，高级分析师强调：谷歌正手持TPUv7这把利剑，向英伟达王座发起冲锋，或将终结CUDA护城河。

众所周知，OpenAI全栈模型是在纯英伟达GPU上炼出的。

然而，圈内人的焦点，大都放在了大模型「推理」和「后训练」的硬件之上。

殊不知，没有前沿模型的预训练，一切皆是「无米之炊」。恰恰这一环节，成为了AI硬件里最难、最耗资源的一关。

如今，一个不为人知的内幕爆出了：

事实证明，谷歌TPU彻底经受住了这一考验；

相较之下，自2024年5月GPT-4o诞生之后，OpenAI的预训练却毫无进展.....

过去，两年半的时间，OpenAI没有真正Scaling预训练的规模。

GPT的预训练，或许在GPT-4o之后触及了天花板，由此也解释了GPT-5性能未达业界预期的关键原因。

有网友表示，那不正是Ilya离开的时候吗.....

恰在昨天，Ilya最新发文称，Scaling不会停，但某个重要的东西仍然会缺失。

OpenAI预训练，大溃败

还记得去年底，那场铺天盖地的「Orion」传闻吗？

这一秘密项目，原定以GPT-5面世，但因训练未达预期，最终被降级为GPT-4.5发布。

在前沿模型预训练上，OpenAI的研发似乎陷入了僵局——

如今第五代旗舰模型GPT-5，包括最新GPT-5.1，其「技术根基」本质或仍未突破GPT-4o的范畴。

SemiAnalysis去年底一篇文章，曾对外公开了Orion训练的困境。

当前，算法的进步使得模型每年所需的物理计算量减少约三分之一，因此，训练运行时间很少超过3个月。

甚至，行业中大多数预训练通常仅需要1-2个月。

然而，OpenAI的Orion大规模预训练，却打破了这一常规，其训练时间超过了3个月。

另据Information同一时间爆出，Orion不会像前代实现巨大的飞跃，相较于从GPT-3到GPT-4的迭代，改进幅度要小得多。

不仅如此，Orion性能提升也基本局限在——语言能力上，其代码能力甚至不如旧模型，且成本更高。

如今再回看2月，GPT-4.5的诞生，基于代号Orion的模型，OpenAI追求的是：

更强的语言能力+更稳的对话体验+更大知识库

情商，成为了GPT-4.5的关键词。代码虽有提升，但并非主菜。

这一切的一切，从侧面印证了，此前外媒关于「Orion遇挫」爆料的准确性——

LLM有提升，但不大。

GPT-4o，成Scaling主线？

今年8月，GPT-5的那场发布，奥特曼将其定调为「博士级AI，是通往AGI又一里程碑」。

实则，业界对于GPT-5的反响，唏嘘一片。

大家原本以为，GPT-5会是全面超越前代的一次飞跃，但实际发布后，更像是GPT-4.5的进一步优化版，不是「颠覆版」。

但至于GPT-5真正基于哪一款GPT打造，还有待证实。

正如之前传闻的猜测，有可能是GPT-4o，还有Reddit网友称是GPT-4.1....

但不论是哪一款，都证明了GPT-5，没有在全新前沿模型的大规模预训练上淬炼。

搞笑的，那个曾将OpenAI三颗「焊在」名字中的大佬，如今改成了三个。

他表示，这已经不是什么秘密了——

GPT-4.5将预训练推向极致之后，OpenAI加倍投入了推理范式，主打o系列+RL。

不同的是，谷歌和Anthropic仍在Scaling预训练，并增强了强化学习。

OpenAI主动放弃了这一范式，为劲敌让出了一条速通道。

奥特曼：这事儿瞒不住了！

Gemini 3发布后，谷歌和OpenAI攻守之势易形——

Gemini 3来势汹汹，而OpenAI这次终于坐不住了！

据泄露的内部备忘录，奥特曼坦言：「近期，从各方面来看，谷歌在大语言模型表现出色」，特别是预训练。

这番表态标志OpenAI的重大转变——它终于承认，一个重新崛起的竞争对手与逐渐降温的企业需求，已彻底打破了其「天下无敌」的光环。

所谓预训练，是训练生成式AI模型（无论是文本还是图像）过程中的第一阶段。在这一阶段，研究人员会用网页等大量数据「投喂」模型，让它掌握数据之间的各种关联。

大语言模型（LLM）开发与训练流程概述：预训练和后训练是关键

在预训练领域，谷歌取得了新突破，给Gemini 3带来了空前的推理深度。

这让不少AI研究者颇感意外——

毕竟，OpenAI去年曾屡屡碰壁，而谷歌自己过去也曾陷入瓶颈。

正因如此，在一段时间内，OpenAI选择将更多精力转向另一种新型AI架构——「推理模型」，这种模型虽然计算量更大，但有望输出更优质的回答。

在推出GPT-5之前，OpenAI团队曾尝试对预训练阶段做出一系列调整，这些方法在小模型上有效，一旦模型变大就失效了。

GPT-5发布第二天，西班牙与波兰Talan公司AI应用负责人Javier Alba de Alba表示：

(GPT-5）整体观感颇为失望：

这是个优秀的模型——响应迅捷、价格亲民、能力全面，但远非人们基于OpenAI过往发布会所预期的代际飞跃。

GPT-5带来了不少提升——

编程能力显著提升、推理能力进阶、幻觉现象减少、医疗领域表现优化，甚至免费用户也享有更长的默认使用时长。此外命名体系全面简化：GPT-4o/4.1/turbo/mini等繁杂名称悉数消失，统一更名为GPT-5。

不过，Javier Alba de Alba提醒：「千万不要被名称迷惑：GPT-5并非新一代产品。」他解释道：

技术层面而言，它更像是GPT-4o的功能增强版，即便命名为GPT-4.2也毫不违和。

OpenAI此举虽完成了必要的名称统一，但整场发布会未能达到预期，让技术社区颇感失落。

GPT-5发布后，Epoch AI也发现了其中的异常：

相比前代GPT-4.5，GPT-5很可能消耗了更少的训练算力。

虽然具体数值尚未公开，但GPT-4.5使用的训练算力极有可能超过GPT-5。

预训练并未消亡，它依然是胜负关键。

在内部会议中，奥特曼鼓舞士气，称在未来几个月，OpenAI将重新夺回优势。其中关键举措之一，就是打造一款代号为「Shallotpeat」的新一代大语言模型。

据知情人士透露，该模型的设计目标之一，就是专门修复OpenAI在预训练过程中遇到的种种「疑难杂症」。

OpenAI：内部的风向变了

GPT-5发布的实质是什么？

对现有ChatGPT用户而言，GPT-5是个好消息，但这并未开启新时代。

它只是进化历程中的一小步，而非革命性飞跃。

既然更多算力通常意味着更强性能，为何OpenAI会反其道而行？这对未来模型发展意味着什么？

在与a16z合伙人Martin Casado对话中，OpenAI平台工程负责人Sherwin Wu，深度拆解了OpenAI当前平台架构、定价逻辑与未来方向。

在这次访谈中，他们深入探讨了为何开发者往往会长期依赖某个「值得信赖」的模型系列，信任感是如何建立的，以及为什么行业已经逐步放弃了「一个模型通吃所有任务」的幻想。

Sherwin还讲解了从提示词工程到上下文设计的演变过程，以及企业如何借助OpenAI的微调（fine-tuning）和RFT API，利用自有数据定制模型行为。

共识已变

几年前，OpenAI内部认为：未来会有一个「统治一切」的超级模型。但现在行业共识已经转变为「模型的专业化和多样化」。

虽然会有强大的通用模型，但也需要针对特定任务（如编程Codex、视频Sora）的专用模型。

文本、图像、视频背后的技术堆栈各不同。目前，在后台。这些模型往往是分开优化的独立系统，很难简单地「一锅炖」。

顺便提一句，正是DALL-E 2的出现让Sherwin决定加入OpenAI，因为那是他第一次感受到AI的魔力。

而微调（Fine-tuning）也悄然进化——

早期的微调，主要用于调整「语气」或「指令遵循」。现在的重头戏，是强化学习微调（Reinforcement Fine-Tuning）。

这允许企业利用其庞大的专有数据（Data Treasure Troves），将较小的模型在特定领域训练至SOTA水平。这是解锁企业数据的关键。

也就是说，企业拥有大量内部数据，但与ChatGPT「毫无关系」，对企业专属AI而言却是黄金。

他们多次提到AI代码编辑器Cursor作为建立在 OpenAI API 之上的成功产品案例，证明了：

即使OpenAI自己有竞品，开发者依然可以建立伟大的垂直应用。

Agent开发模式

从第一天起，奥特曼和Greg Brockman就确立了「App+ API」的双轨战略。

这样做是为了尽可能广泛地分发AGI的利益——

如果只做 API，你就无法触达普通消费者；如果只做应用，你就无法赋能各行各业的开发者。

在这次对话中，他们重点谈论了智能体开发工具「Agent Builder」。

Sherwin认为，智能体（Agent）并非一种全新的模态，而是AI的一种新使用方式。

本质上，智能体是一个能够代表用户、在较长的时间跨度（Long Time Horizons）内执行一系列操作并完成任务的AI系统。

OpenAI曾推出了可视化的「Agent Builder」（节点式构建），但发现对于开发者而言，这种方式可能过于受限。

访谈中，Sherwin和Martin将智能体清晰地划分为两类，这解释了为什么目前市面上的Agent产品形态各异——

探索型/非定向工作 (Undirected/Exploratory Work)
流程型/SOP导向工作 (Procedural/SOP-oriented Work)

在对话中，第二类Agent开发可能更像传统的软件工程或游戏开发中的NPC（非玩家角色）逻辑。

与其让模型完全自由发挥，不如通过代码给予它明确的逻辑框架和标准操作程序（SOP），特别是在受监管的行业（如客户支持、金融）。

也就是说，逻辑必须写死在代码里，而不是提示词里。

这就是Agent Builder想要解决的问题：为那些必须控制智能体行为的行业和场景，提供一个简单、清晰、可验证的解决方案。

One More Thing

2025年度压轴大戏，谷歌Gemini 3 Pro无疑打了一场胜仗，但OpenAI不会袖手旁观。

内部已确认，圣诞节前夕，一连串发布连番轰炸。

据传，一系列新模型，在路上了——

Image Gen v2

IMO和IOI金牌多模态模型

GPT-5.2 Codex

12月，AI圈一定非常热闹。

参考资料：

https://www.newsbreak.com/winbuzzer-com-302470011/4359574113974-leaked-memo-sam-altman-sees-rough-vibes-and-economic-headwinds-at-openai

https://the-decoder.com/as-google-pulls-ahead-openais-comeback-plan-is-codenamed-shallotpeat/

https://x.com/jasondeanlee/status/1994616079751286855?s=20

https://x.com/koltregaskes/status/1994836507694436628?s=20

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标，锁定新智元极速推送！

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

钉钉的问题，不在钉钉

钛媒体APP 2026-06-25 16:39:19
14 跟贴 14
离谱！阿里惊现「小马云」工牌，实习生玩梗光速离职惹热议

雷科技 2026-06-24 21:53:02
13 跟贴 13

Gemini多位核心人员叛逃

新智元 2026-06-25 15:33:16
0 跟贴 0

OpenAI挖走AWS十年老将，AI巨头将目光放在“卖货”上

智东西 2026-06-25 16:18:35
0 跟贴 0
开源！阿里甩出首个语言世界模型，能造智能体环境

智东西 2026-06-24 13:37:59
0 跟贴 0

活久见，时代少年团给大模型上了一课

机器之心Pro 2026-05-09 12:48:20
1 跟贴 1

估值68亿！前Anthropic员工拿下融资，英伟达投了

智东西 2026-06-25 19:40:18
0 跟贴 0
韩乔生已就位，当算法数据与脑洞大开同步登场，谁会是最后的赢家？

咪咕体育 2026-06-25 06:03:16
0 跟贴 0

孙继海已就位，当算法数据与硬核实力同步登场，谁会是最后的赢家

咪咕体育 2026-06-24 21:01:09
31 跟贴 31
2.8万Star爆款作者竟被谷歌裁了！硅谷大佬火速抢人

新智元 2026-06-25 23:32:51
0 跟贴 0
LeCun、谢赛宁转发世界模型方案：中关村学院ECCV2026—VLA-JEPA

机器之心Pro 2026-06-23 19:06:55
0 跟贴 0
投资600万元的加油站，建成即被“责令限期拆除”？河南淮滨县发布情况通报

环球网资讯 2026-06-25 14:21:30
7614 跟贴 7614
FlashAR：仅用0.05%数据，让预训练好的自回归图像模型飞起来

机器之心Pro 2026-05-24 17:52:21
0 跟贴 0
元护士助理机器人进驻杭州市第一医院GCP科室：护理大模型赋能，智能体驱动，打造“人机协同”新生态

新浪财经 2026-06-25 10:51:19
0 跟贴 0
800万人围观！虾爹给Agent套上循环，让它自己跑起来！

机器之心Pro 2026-06-17 12:13:35
0 跟贴 0
血糖高到多少会出并发症？记住这4个关键数值

普外耿医生 2026-06-22 09:39:58
0 跟贴 0
100多万人围观！没头没腿，神似充电宝的机器人全网走红？

机器之心Pro 2026-06-17 18:52:08
2 跟贴 2
同济出手！国产AI，第一次进攻土木工程

新智元 2026-06-25 23:33:02
0 跟贴 0
OpenAI首款芯片问世：用AI设计，9个月流片

机器之心Pro 2026-06-25 20:45:28
0 跟贴 0
GTA6开启预购，Anthropic称又遭中国模型蒸馏攻击，张雪机车首次批量出口欧洲，谷歌前CEO批中国 AI 开源，这就是今天的其他大新闻！

差评XPIN 2026-06-26 01:57:14
0 跟贴 0
黄仁勋：Prompt正在过时，Loop才是新范式

量子位 2026-06-25 16:05:47
40 跟贴 40
中国AI智能体爆火FIFA世界杯：48支球队全在用，每场比赛问上百个问题！

智东西 2026-06-25 18:05:25
0 跟贴 0
数值超标了

白班看影视 2026-06-24 17:30:05
1 跟贴 1
马斯克预测GLM明年Q1追平Fable，智谱唐杰：没那么久

量子位 2026-06-25 12:41:00
3 跟贴 3
「找视频」到「产视频」：快手RaG推动推荐系统迈向完全生成时代

机器之心Pro 2026-06-25 18:18:29
0 跟贴 0
智能体从「单兵作战」到「精锐团队」 -1

机器之心Pro 2026-04-28 16:55:35
0 跟贴 0
机器之心逛谷歌，分享最热的Self-Improving

机器之心Pro 2026-06-16 12:45:36
0 跟贴 0
插混vs增程，聊透逻辑，选购干货，帮你少亏20万！

X基地 2026-06-24 14:05:51
0 跟贴 0
全球最大银行掌门接班赛突变！摩根大通“双太子”上位股价再创新高

财联社 2026-06-26 00:20:29
0 跟贴 0
Claude design限速，谷歌开源轻松做动态网页，实力打脸？

机器之心Pro 2026-04-29 17:20:04
0 跟贴 0
郭春林 2026教育大变局！人才选拔逻辑已经发生了改变

安安折纸 2026-06-24 02:57:06
1 跟贴 1
张维为：中国哲学从不信奉所谓的“绝对真理”

看看新闻Knews 2026-06-24 23:22:23
3925 跟贴 3925
读博最后一年转方向，拿到OpenAI offer：我的面试之路充满意外

机器之心Pro 2026-06-25 18:29:44
0 跟贴 0
ACL2026圣地亚哥现场,上海AI实验室北极星X星启交流会(报名开启)

机器之心Pro 2026-06-25 20:49:08
0 跟贴 0
算力数值误导揭秘：揭秘笼统宣传背后的真相_2

智慧教育空间站 2026-06-24 18:35:56
4 跟贴 4
男生查分看到屏幕显示不敢信，妈妈也蒙了，爸爸直呼“怎么可能”

星视频 2026-06-25 11:45:00
118 跟贴 118
起底 GPT Image 2 团队后，我扒出了一张华人师徒网

爱范儿 2026-04-23 16:44:45
0 跟贴 0
平民三巨头平替Fable 5！性能追平，成本砍半

量子位 2026-06-21 09:58:58
0 跟贴 0
多模态大模型视觉定位难题怎么解？

机器之心Pro 2026-06-10 11:31:45
0 跟贴 0
不想私了咱就按正规程序走

梦游爱追剧 2026-06-22 17:12:00
0 跟贴 0

一再发难，欧盟对华的底层逻辑是什么？

一再发难，欧盟对华的底层逻辑是什么？

观察者网

2026-06-23 16:54:10

彻查！信号强烈！中央升级反腐“天网”！

彻查！信号强烈！中央升级反腐“天网”！

细说职场

2026-06-24 12:54:49

Lisa这头发掉光了，看来富豪的圈子也不好混

Lisa这头发掉光了，看来富豪的圈子也不好混

西楼知趣杂谈

2026-05-11 21:50:42

为什么说，俄罗斯这回真顶不住了

为什么说，俄罗斯这回真顶不住了

老男孩儿

2026-06-24 10:45:20

开屏广告，没了

放毒

2026-06-24 18:03:22

1951年海南剿匪,横行11年女匪首被捕,老政委看了一眼耳环当场吓跪

1951年海南剿匪,横行11年女匪首被捕,老政委看了一眼耳环当场吓跪

睡前讲故事

2026-06-18 19:33:01

几十万只蚊子“以命代言”，这广告直接拿下戛纳大奖！

几十万只蚊子“以命代言”，这广告直接拿下戛纳大奖！

最黑科技

2026-06-25 01:11:37

“都把儿子养雌化了！”初中男孩出现雌化现象，家长却执迷不悟

“都把儿子养雌化了！”初中男孩出现雌化现象，家长却执迷不悟

妍妍教育日记

2026-05-29 07:55:13

6月25日47股成交额超过百亿，包括中际旭创、新易盛、兆易创新、京东方Ａ、天孚通信等

6月25日47股成交额超过百亿，包括中际旭创、新易盛、兆易创新、京东方Ａ、天孚通信等

金融界

2026-06-25 15:57:48

穆尼奥斯：加盟利物浦一切发生得很快，我和家人都没任何犹豫

穆尼奥斯：加盟利物浦一切发生得很快，我和家人都没任何犹豫

懂球帝

2026-06-26 02:21:08

四川成都2.3亿“天价”别墅被强制拍卖，因无人报名、无人出价流拍；原房主利用资金操纵市场、涉证券犯罪被判刑

四川成都2.3亿“天价”别墅被强制拍卖，因无人报名、无人出价流拍；原房主利用资金操纵市场、涉证券犯罪被判刑

大风新闻

2026-06-23 11:23:28

玩“田忌赛马”！前曼联球星朴智星批韩国主帅：真是为赢球而踢吗

玩“田忌赛马”！前曼联球星朴智星批韩国主帅：真是为赢球而踢吗

足球大腕

2026-06-25 13:17:38

3年7400万美元！科比·怀特续约黄蜂三球离队后他成首发控卫

3年7400万美元！科比·怀特续约黄蜂三球离队后他成首发控卫

醉卧浮生

2026-06-25 23:51:08

北京这一天，洗把脸就来的王凯，秒了内娱一堆涂脂抹粉的小鲜肉

北京这一天，洗把脸就来的王凯，秒了内娱一堆涂脂抹粉的小鲜肉

星宿影视鸭

2026-06-25 17:05:27

洪森即将访华，柬埔寨媒体人在华参访时表示“柬中关系处于最高水平”

洪森即将访华，柬埔寨媒体人在华参访时表示“柬中关系处于最高水平”

澎湃新闻

2026-06-24 22:06:29

浙江高考第一名，连续三年花落镇海中学！

浙江高考第一名，连续三年花落镇海中学！

新浪财经

2026-06-25 18:29:35

全新宝马X5要来了，或6月30日首发，国产依旧加长

全新宝马X5要来了，或6月30日首发，国产依旧加长

汽车公告板

2026-06-23 17:47:34

俄罗斯预演“乌克兰摧毁克里米亚大桥”，这转变太快了

俄罗斯预演“乌克兰摧毁克里米亚大桥”，这转变太快了

山河路口

2026-06-23 20:13:36

补充后卫吗？记者：黄蜂正在兜售迈尔斯-布里奇斯

补充后卫吗？记者：黄蜂正在兜售迈尔斯-布里奇斯

懂球帝

2026-06-25 22:30:08

7月10日起，演员表要写真名了！成龙刘德华六小龄童全得括号备注

7月10日起，演员表要写真名了！成龙刘德华六小龄童全得括号备注

美美赚钱

2026-06-24 17:24:05

AI产业主平台领航智能+时代

15531文章数 66936关注度

往期回顾全部

科技要闻

存储成本压力山大！苹果罕见全球提价

头条要闻

女孩在网红景点拍照时坠湖身亡前一天刚参加中考

头条要闻

女孩在网红景点拍照时坠湖身亡前一天刚参加中考

体育要闻

世界杯最动人一吻：我若离世你就改嫁吧

娱乐要闻

这国产剧太装了，居然还热播第一？

财经要闻

又有纸尿裤送检后被检测出甲酰胺！

汽车要闻

老板们的新座驾！65万元起，尊界V800/V680开启预订

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

旅游

数码

手机

艺术

军事航空

旅游要闻

人生第一次去巴黎，最难忘的竟然是扫墓

数码要闻

IDC报告：2026Q1全球手持智能相机市场出货量同比增长33%

手机要闻

安卓首个液态玻璃！荣耀MagicOS 11上手实拍：效果可自由调节

艺术要闻

税务局大楼能是这样？5个立方体扭40度，高171米！

军事要闻

特朗普：现在到了关注朝鲜问题的时候了

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版