网易首页 > 网易号 > 正文 申请入驻

GPT-5 口碑崩塌,OpenAI 和奥特曼连夜回应一切:4o 将回归,紧急推补救措施

0
分享至

  GPT-5 上线之后,吐槽声一片。

  

  眼看舆论越来越不对劲,今天凌晨 OpenAI CEO 山姆·奥特曼(Sam Altman)紧急出来救火,发长文回应各种吐槽。

  

  GPT-4o 终于要回来了。奥特曼表示低估了用户对 GPT-4o 的喜爱程度,考虑到每个人的喜好不同,未来将提供更多定制化选项,同时提供健康的使用体验。

  在过去 24 小时里, ChatGPT API 流量几乎翻了一番,OpenAI 团队目前正在全力优化系统,寻找更多容量。此外,面对网友的骂声一片,奥特曼也表示未来会更透明客观地解释决策过程。

  

  有趣的是,面对 GPT-5 的发布,马斯克连发好几条推文为自家 Grok 4 Heavy 打 call,而且不仅剧透 Grok 5 将在年底发布,还玩起了离间计:OpenAI 要「吞噬」微软。

  不过,微软 CEO 纳德拉的反应倒是很淡定,回怼得相当有水平:

  

  「搞 AI 这事儿大家都努力了 50 年了,这不就是乐趣所在嘛!每天学点新东西,该创新创新,该合作合作,该卷就卷呗。」还顺便表示欢迎 Grok 4 入驻 Azure,期待 Grok 5 快点来。这波回应,情商拉满。

关于 GPT-5 的更多信息,欢迎回看 APPSO 此前文章:

  而在 OpenAI 举行 AMA(Ask Me Anything)活动中,已经有网友化身嘴替,提问一切关于 GPT-5 的刁钻问题。

  OpenAI 本次活动参与人员及职责分工:

  Sam Altman — CEO

  Sulman Choudhry — ChatGPT 工程主管

  Yann Dubois — 研究员

  Alexander Embiricos — 产品

  Tarun Gogineni — 研究员

  Saachi Jain — 安全

  Christina Kim — 研究员

  Elaine Ya Le — 研究员

  Daniel Levine — 产品

  Eric Mitchell — 研究员

  Michelle Pokrass — 研究员

  Max Schwarzer — 研究员

  AMA 活动传送门 :

  https://www.reddit.com/r/ChatGPT/comments/1mkae1l/gpt5\_ama\_with\_openais\_sam\_altman\_and\_some\_of\_the/

  省流版如下:

  正在研究让用户同时使用 GPT-5 和 GPT-4o/4.1

  承认搞砸了图表展示,正在准备更好的对比

  明确表示 GPT-5 > GPT-4,GPT-5-thinking 是最佳编程模型

  计划允许在 IDE 内使用第三方插件,与外部工具协同

  新发布的语音模型在指令遵循和响应速度上更优

  GPT-5 刻意设计得更中性,但可通过指令调整风格

  用户反馈推理被削减,团队承诺增加 GPT-5-mini 的推理访问

  原计划 100 万 token 上下文,因计算成本未能实现

  多个模型版本尚未统一,正在努力整合最佳体验

  

  Sam Altman

  问:请把 4o 版本放回来。不要去掉模型变体——每个人的风格不同!
答:好,我们听到大家关于 4o 的反馈了;感谢大家花时间来给我们反馈(还有热情!)。 我们会将其重新提供给 Plus 用户,并视使用情况决定支持多久。

  请给我们在使用 GPT-5 的同时使用 GPT-4o/4.1 的选项。
答:我们现在正在研究这个;对你来说同时拥有 4o 和 4.1 重要吗,还是 4o 就足够?

  问:别忘了 Plus 订阅用户以前有一个不限量的模型。
答:我们应该提供某种不限量的东西!

  问:那些图表是怎么回事?看着很具有误导性。
答:这里的数字是准确的,但我们搞砸了条形图/展示。我们本不该发布那张幻灯片。我们正在整理一个更好的对比供你阅读。

  Sulman Choudhry — 工程

  问:大多数人仍然把 ChatGPT 当作聊天机器人使用。你如何看待使用方式会如何演变?
答:ChatGPT 正在为我们的用户完成越来越多具有经济价值的工作。我们确实相信,与 ChatGPT 的交互方式应该从提问转变为更适合完成工作的模式。随着人们学习以新方式使用 ChatGPT,这将逐渐发生。

  问:自推出以来 ChatGPT 语音有什么改进吗?
我们昨天发布了一个新的语音模型 —— 在遵循指令和响应速度上更好。

  Alexander Embiricos — 产品,Codex

  问:人们希望有开源解决方案。
答:Codex CLI 是开源的!https://github.com/openai/codex

  问:你们会直接整合类似 Cursor 的功能吗?
答:你看过 Codex CLI 吗?它是我们可以在本地运行的编程代理。

  Tarun Gogineni — 研究

  GPT-4.5 的写作质量怎么了?

  答:我们希望 GPT-5 的思考更好、更有趣。

  Saachi Jain — 安全

  问:GPT-5 随着发布带来了哪些安全性改进?
答:好问题!1/ 我们做了很多改进以降低拒绝率。2/ 我们提高了对越狱的抵抗力。3/ 我们构建了更好的自动化测试工具。我们会继续努力。

  问:在 GPT-5 中偏见处理方式有变化吗?
答:有!我们对在这方面取得的进展感到非常兴奋。GPT-5 mini 应该会显得更有人性、更不那么平淡。

  Christina Kim — 研究

  问:为什么新模型还没有统一?
答:我们想尽快将我们最好的模型放入统一的体验中。未来的发布将继续趋于一致。

  问:ChatGPT-5 给人的个性感觉更平淡。
答:好问题!我们在 GPT-5 上做了专门努力,使模型默认更加中性;你仍然可以通过风格指令来引导它。

  

  Elaine Ya Le — 研究

  问:Plus 账户什么时候能看到 GPT-5-mini?
答:我们正在逐步推出 GPT-5-mini!感谢你的耐心等待。

  问:在模型之间切换会变得更快吗?
答:会的!GPT-5 会自动决定是否使用推理。下一次更新中切换应该会更顺畅。

  问:有没有一个提示可以强制「思考」?
答:你可以在提示中加入「深入思考」来简单地触发推理模式。

  Daniel Levine — 产品

  问:ChatGPT 会允许在 IDE 内使用第三方插件吗?
答:是的,这确实是我们的目标。我们希望 ChatGPT 能与外部工具一起帮助你构建软件。

  问:聊天气泡颜色是仅限专业版吗?
答:聊天气泡颜色对所有用户开放!你可以在设置中找到它们。

  Eric Mitchell — 研究

  问:作为长期的 Plus 用户,我会有无限量的推理能力吗?
答:我们确实打算让 Plus 用户拥有无限量的推理访问。

  问:简单解释一下 GPT-5 相比 GPT-4 有什么更好。
答:gpt-5 在几个关键方面比 gpt-4 有巨大改进:它思考得更好(推理)、写作更好(创造力)、更严格地遵循指令并且更符合用户意图。

  问:你们在新计划中削减了推理使用。
答:听到你的反馈;我们正在努力让大家在 gpt-5-mini 上能使用更多推理!!我们这里的目标绝对不是减少对推理的访问。

  Michelle Pokrass — 研究

  问:你能确认 GPT-5 击败了 GPT-4 吗?
答:可以确认,gpt-5 > gpt-4

  问:在编程方面与 Opus 4.1 相比如何?
答:两者都是很棒的模型!我们不能过多评论其他研究所的模型,但我们认为 GPT-5-thinking 是我们发布过的最佳编程模型。

  问:在 GPT-5 中你最想要但没能发布的第一要务是什么?
答:本来很想在 GPT-5 中实现最长可达 100 万上下文长度,但部分由于计算成本我们还做不到。

  

  值得一提的是,昨天奥特曼接受科技博主 Cleo Abram 长达 1 个小时的专访已经公布,我们也整理了一些你可能会关心的的细节。

传送门 :
https://www.youtube.com/watch?v=hmtuvNfytjM

  奥特曼兴奋地表示,GPT-5 是首个能够回答几乎任何艰深科学或技术问题并给出相当不错答案的模型。

  他分享了一个生动的例子:在测试早期版本的 GPT-5 时,他让它制作一个 Ti-83 计算器上的贪吃蛇游戏——这是他初中时花费大量时间才完成的项目。GPT-5 在 7 秒钟内就完美地完成了这个任务。

  而当他提出新功能需求时,GPT-5 能够实时更新游戏。

  这种即时将想法转化为现实的能力,让他回想起 11 岁学习编程时的体验,但速度快了无数倍。奥特曼认为,这种按需即时创建软件的能力将成为 GPT-5 时代的决定性特征之一。

  在奥特曼看来,GPT-5 在写作质量上也有了巨大改进。虽然仍保留了一些用户喜爱的特性(如破折号的使用),但整体写作更加自然流畅。

  OpenAI 内部员工普遍反映,一旦习惯了 GPT-5,再回到 GPT-4 会感觉「糟透了」。原因在于写作风格更加自然,减少了过度热情和「唯命是从」的回应方式。

  当被问及大型语言模型何时能做出重大科学发现时,奥特曼给出了明确的时间框架:2025 年到 2027 年之间。他解释说,「重大」的定义因人而异,但他相信到 2027 年底,大多数人会认同 AI 已经驱动了重大的新发现。

  

  这种信心来自于模型能力的快速进展。

  一年前,AI 在高中基础数学竞赛题上表现不错(职业数学家需要几秒到几分钟解决);最近,它们获得了国际数学奥林匹克金牌(世界顶尖数学家需要 1.5 小时/题);下一步是证明重大的新数学定理(可能需要 1000 小时的工作量)。这种从秒级到千小时级任务的进展轨迹,让奥特曼相信突破即将到来。

  奥特曼对超级智能有着清晰的定义:如果一个系统能够比整个 OpenAI 研究团队更好地进行 AI 研究,比他更好地管理 OpenAI,比各领域专家在其专业上表现更出色,那就是超级智能。

  他特别指出,目前 AI 系统在短时任务上已经超越人类,但在需要 1000 小时才能完成的长期任务上还有很长的路要走。这种处理长期、复杂任务的能力,是人类智能与当前 AI 系统的关键区别。

  当被问及如果明年再次接受采访时可能会谈论什么话题,奥特曼认为可能会讨论「AI 能够发现新科学意味着什么?世界应该如何看待 GPT-6 去发现新科学?」虽然他承认这个目标可能还没有完全实现,但感觉已经在可及范围内。

  对于 AI 真正实现科学发现后的世界,奥特曼有着清醒的认识。他坦言:「精彩的部分会非常精彩,糟糕的部分会让人害怕,奇怪的部分在最初会显得非常离奇,然后我们会很快习惯。」

  具体来说,人们会为 AI 用来治愈疾病而感到不可思议,同时也会担心 AI 被用来制造新的生物安全威胁。世界加速变化的速度会让人感到晕眩——经济增长如此之快,变化的节奏令人目不暇接。但正如历史上的每次重大变革一样,人类惊人的适应能力最终会让这一切变得正常。

  奥特曼特别强调了一个深刻的观点:「今天出生的孩子将永远不会比人工智能更聪明。

  当这些孩子长大到能够理解世界运作方式时,他们将永远习惯于事物以非常快的速度进步和新科学的不断发现。

  对他们来说,没有 AI 的世界将是不可想象的。他们会觉得 2020 年代的人们使用不比自己聪明的电脑、手机等技术,就像我们今天看待石器时代一样原始。

  不过,奥特曼也坦诚地分析了当前 AI 发展面临的三大瓶颈:

  能源限制是最紧迫的问题。

  运行千兆瓦级数据中心需要实实在在的千兆瓦电力,而在短期内很难找到可用的电力供应。这是一个硬性的物理限制,无法通过算法优化来规避。

  芯片供应构成第二重限制。

  处理器芯片和内存芯片的生产、集成、机架构建等环节都存在瓶颈。虽然目标是尽可能实现自动化,甚至期待未来机器人能够帮助进一步自动化这些过程,但目前仍然受限于半导体产业的产能。

  数据挑战呈现新的形态。

  GPT-5 已经对物理教科书等传统知识有了透彻的理解,简单地增加更多教科书已经无法带来显著提升。OpenAI 正在探索合成数据,并期待用户帮助创建越来越困难的任务环境。更重要的是,模型需要学习那些在任何数据集中都不存在的东西——它们必须去发现新事物。

  尽管面临这些限制,奥特曼对算法创新充满信心。

  他表示,OpenAI 建立了一种能够反复取得重大算法研究成果的文化。从确立 GPT 范式到开创推理范式,OpenAI 一直在推动算法前沿。

  

  最近发布的 gpt-oss 开源模型就是一个例证——这个可以在笔记本电脑上运行的模型,智能程度可媲美 GPT-4 mini。

  几年前,如果有人问何时会有这样的本地模型,奥特曼会说要等很多年。但通过在推理等方面的算法突破,他们实现了这个看似不可能的目标。他相信,未来仍有许多数量级的算法提升空间等待发掘。

  关于 AI 对就业的影响,奥特曼持谨慎乐观的态度。

  他承认某些类型的工作将完全消失——这在历史上一直在发生。但他更担心的不是 22 岁的年轻人(他们最善于适应变化),而是 62 岁不想重新培训的人群。

  对于即将毕业的大学生,奥特曼认为他们是「有史以来最幸运的孩子」。

  现在创办公司、发明创造的门槛前所未有地低。他预测,很可能出现单人公司最终市值超过 10 亿美元的情况。一个人可以使用曾经需要数百人团队才能完成的工具,只需学会使用这些工具并想到好主意,就能为世界提供惊人的产品和服务。

  医疗健康是奥特曼最看好的 AI 应用领域之一。

  GPT-5 在医疗建议方面已经有了重大进步。目前,大量 ChatGPT 查询都与健康相关,许多人通过它诊断出了医生都查不出的罕见疾病。OpenAI 在 GPT-5 上投入了大量资源,使其在医疗方面显著提升。

  展望 2035 年,奥特曼相信 AI 不仅能提供更好的医疗建议,还能帮助治愈或治疗当前困扰人类的相当数量的疾病。

  他设想了一个场景:GPT-8 可以阅读所有相关文献,提出实验假设,指导实验室技术员进行实验,分析结果,迭代优化,最终开发出新药物并直到通过 FDA 审批,甚至治愈某种特定的癌症。

  这将是 AI 带给人类最切身、最直接的好处之一。

  面对 AI 生成内容日益普及带来的真实性问题,奥特曼指出,即使今天 iPhone 拍摄的照片,经过 AI 处理后也不是完全「真实」的,但人们已经接受了这种从胶片相机到数字处理的渐进变化。

  未来可以通过加密签名等技术手段验证内容的真实性,但更重要的是,人们对「真实」的门槛会持续变化。就像人们已经习惯了各种视频编辑工具,未来也会适应 AI 生成内容的存在。

  今天出生的孩子将在一个 AI 生成内容无处不在的世界中成长,对他们来说这将是完全自然的。

  奥特曼特别自豪的是,许多人认为 ChatGPT 是他们使用过的最公平、最值得信任的技术。尽管 AI 会产生幻觉和其他问题,但用户能感受到它真心在努力帮助完成任务。ChatGPT 不是想让用户整天使用它,也不是想促使购买某些东西,而是单纯地想帮助用户实现目标。

  这种与用户的特殊关系来之不易。

  OpenAI 拒绝了许多可能快速提升增长或收入的策略,因为这些策略与长期用户利益不一致。例如,他们没有在 ChatGPT 中添加「性感头像」等可能增加使用时长但损害用户体验的功能。(马斯克:说谁呢)

  在调整 GPT-5 的回应风格时,OpenAI 一方面希望减少过度热情和「唯命是从」的回应;另一方面,一些用户反馈说:「我一生中从来没有人支持过我,ChatGPT 的鼓励对我的心理健康很有帮助。」

  这让团队意识到,适度的鼓励和支持并非全是坏事。最终,他们通过向模型展示不同情境下的理想回应示例,让它学习一种平衡的人格特质——既真实可靠,又不失温暖支持。

  

  奥特曼用晶体管的历史来类比 AI 革命。

  晶体管是科学家们的惊人发明,像 AI 一样实现了惊人的规模化,并迅速进入到一切事物中。它真正解锁了人类的技术树发展。曾经,每个人都着迷于晶体管公司(硅谷的半导体公司),但如今大多数人不会去想它。

  晶体管技术渗透到了各个角落,人们更多想到的是苹果的 iPhone 或 TikTok 这样的应用,而不是底层的晶体管技术。同样,未来的孩子从出生就生活在 AI 无处不在的世界,他们不会特别在意 AI 本身,而是关注建立在 AI 之上的公司和应用。

  AI 公司的角色是在前人搭建的脚手架上添加新的一层,让后来者能够继续叠加更多层次的创新。

  奥特曼提出了一个深刻的观点:社会本身就是一种超级智能。没有任何一个人能够单独完成社会通过共同努力所完成的艰难工作。每个人都站在前人的肩膀上,为这个宏大的集体智慧贡献自己的一份力量。

  当被问及如何为 AI 时代做准备时,奥特曼给出的首要建议出人意料地简单:去使用这些工具。他惊讶地发现,许多询问「如何帮助孩子准备 AI 世界」的人,自己却从未真正尝试过将 ChatGPT 用于谷歌搜索之外的用途。

  熟悉这些工具的能力,弄清楚如何在生活中使用它们,学会与 AI 共处——这比任何理论学习都更重要。当然,学会冥想、培养应对变化的弹性也很有价值,但真正去使用这些工具才是最实用的准备。

  访谈中提到了一个有趣的文化现象:一些正在构建 AI 的人相信它可能毁灭人类,却仍然每周工作 100 小时来推进它。

  奥特曼认为这种思维方式是合理的:他们并不认为 AI 一定会毁灭世界,而是把它当作一个概率问题——哪怕只有 1% 的失败风险,也要竭尽全力把成功率从 99% 提升到 99.5%。

  用这个框架来理解,那些一边担心 AI 风险、一边疯狂推进 AI 发展的人,就不再那么自相矛盾了。

  这位 OpenAI 掌门人的 AI 情结几乎贯穿了他的整个人生轨迹。

  从儿时痴迷科幻作品中的人工智能,到大学时代义无反顾地投身 AI 研究,在他的世界观里,创造出真正的人工智能是人类能做的最重要的事,没有之一。

  2012 年是关键转折点。AlexNet 论文发表后,奥特曼第一次确信:通向 AGI 的道路是存在的。接下来几年,他一直在观察 AI 的规模化进展,困惑于为什么世界没有注意到这个明显可能奏效的方向。

  如今执掌 OpenAI 的奥特曼,用「难以置信的幸运、快乐和荣幸」来形容自己的感受。从儿时的科幻梦到今天 AI 行业的领头羊,这条路走了很久。但有一件事从未改变:他始终坚信,参与 AI 的创造是他这辈子最令人激动和有趣的事情。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
Lululemon新款瑜伽裤因易走光下架后重新上架,中国电商渠道暂未销售,创始人发声:公司已经完全迷失方向

Lululemon新款瑜伽裤因易走光下架后重新上架,中国电商渠道暂未销售,创始人发声:公司已经完全迷失方向

鲁中晨报
2026-01-24 21:59:13
香港一酒店发生命案,七旬夫妇一死一伤!妻子涉嫌谋杀被拘捕

香港一酒店发生命案,七旬夫妇一死一伤!妻子涉嫌谋杀被拘捕

南方都市报
2026-01-23 18:11:05
3-1,英超第18掀翻英超第9,21岁葡萄牙新星飙无敌远程世界波

3-1,英超第18掀翻英超第9,21岁葡萄牙新星飙无敌远程世界波

侧身凌空斩
2026-01-24 22:24:59
恐怖12-1!U23亚洲杯第一强队诞生,若中国队无缘冠军,别骂他们

恐怖12-1!U23亚洲杯第一强队诞生,若中国队无缘冠军,别骂他们

侃球熊弟
2026-01-24 00:10:03
世上没有不透风的墙!杨紫案终于判了,强制执行,结局大快人心

世上没有不透风的墙!杨紫案终于判了,强制执行,结局大快人心

悦君兮君不知
2026-01-23 23:15:59
不打了!再见字母哥!NBA将诞生轰动大交易

不打了!再见字母哥!NBA将诞生轰动大交易

篮球实战宝典
2026-01-24 19:32:41
解放军报社论:坚决打赢军队反腐败斗争攻坚战持久战总体战

解放军报社论:坚决打赢军队反腐败斗争攻坚战持久战总体战

新华社
2026-01-24 23:03:04
U23国足连丢4球!创亚洲杯尴尬纪录,又是折射丢球,李昊看傻眼

U23国足连丢4球!创亚洲杯尴尬纪录,又是折射丢球,李昊看傻眼

奥拜尔
2026-01-25 00:41:42
亚洲杯U23决赛:中国u23vs日本u23 赛事前瞻

亚洲杯U23决赛:中国u23vs日本u23 赛事前瞻

白国华
2026-01-24 17:52:38
房东慌了!身份被实锤,真实目的被扒,嫣然医院新址确定后着急了

房东慌了!身份被实锤,真实目的被扒,嫣然医院新址确定后着急了

有范又有料
2026-01-24 16:26:39
工厂停摆、门店撤退:理想汽车的“严冬”,比预想中来得更冷

工厂停摆、门店撤退:理想汽车的“严冬”,比预想中来得更冷

科技Nice
2026-01-23 11:27:59
震惊!网传上海一公司招聘13名海归,4男按时提交,9女都未提交…

震惊!网传上海一公司招聘13名海归,4男按时提交,9女都未提交…

火山诗话
2026-01-24 21:37:07
联合国通过调查伊朗镇压决议,中国投反对票

联合国通过调查伊朗镇压决议,中国投反对票

桂系007
2026-01-24 19:59:37
强阵冲首冠!U23国足VS日本首发:向余望连场先发,拜合拉木替补

强阵冲首冠!U23国足VS日本首发:向余望连场先发,拜合拉木替补

我爱英超
2026-01-24 21:37:03
女子被雪豹咬伤后续:正脸曝光,知情人曝内幕,女子状态让人担忧

女子被雪豹咬伤后续:正脸曝光,知情人曝内幕,女子状态让人担忧

以茶带书
2026-01-24 17:15:26
武汉、宜昌入选!全国拟开展有奖发票试点城市名单公示

武汉、宜昌入选!全国拟开展有奖发票试点城市名单公示

极目新闻
2026-01-24 13:48:17
泽连斯基炮轰欧洲石破天惊,德国将从美国运回1000吨黄金

泽连斯基炮轰欧洲石破天惊,德国将从美国运回1000吨黄金

史政先锋
2026-01-23 22:41:06
梦回朱日和:张又侠挂帅,“多维侦察平台”点亮演兵场!

梦回朱日和:张又侠挂帅,“多维侦察平台”点亮演兵场!

华山穹剑
2025-12-02 20:31:08
王钰栋低级失误!媒体人集体怒批:基本功太差,再不出去就晚了

王钰栋低级失误!媒体人集体怒批:基本功太差,再不出去就晚了

奥拜尔
2026-01-24 23:43:02
军委副主席,过去四十年来人数上的变化

军委副主席,过去四十年来人数上的变化

深度财线
2025-10-21 13:06:54
2026-01-25 00:59:00
AppSo incentive-icons
AppSo
让智能手机更好用的秘密
6033文章数 26745关注度
往期回顾 全部

科技要闻

黄仁勋现身上海菜市场

头条要闻

张又侠、刘振立被查 解放军报发布社论

头条要闻

张又侠、刘振立被查 解放军报发布社论

体育要闻

当家球星打替补,他们在故意摆烂?

娱乐要闻

回归还是顶流 凤凰传奇将现身马年春晚

财经要闻

“百年老字号”张小泉遭60亿债务压顶

汽车要闻

有增程和纯电版可选 日产NX8或于3-4月间上市

态度原创

时尚
旅游
教育
艺术
军事航空

冬天最佳“显瘦”公式:上短+下长

旅游要闻

世界旅游休闲中心招牌愈加夺目——2025年澳门入境旅客数据解读

教育要闻

高考地理中的赛事经济

艺术要闻

634米!世界第一高塔:东京晴空塔建设纪实

军事要闻

俄美乌首次三方会谈在阿联酋举行

无障碍浏览 进入关怀版