网易首页 > 网易号 > 正文 申请入驻

GPT-5波折超乎想象!奥特曼连夜回应一切:4o重新上阵,团队紧急补救

0
分享至


新智元报道

编辑:定慧 好困

【新智元导读】奥特曼和OpenAI团队回应关于GPT-5的所有问题。

GPT-5发布会,大家都看了吧~

感觉现在整个世界,都在讨论GPT-5。

网友们都吵翻了天,直播的时候跑分图都能画错,这也算AGI?更有网友哭着喊着:还我GPT-4o!

但另一边呢?画风完全不一样,很多网友实测后表示「GPT-5强无敌」

这种又爱又恨的奇妙感觉,恰恰说明了一件事:我们对AGI,太期待了!

这种让整个AI圈子都「炸锅」的盛况,上一次或许还是ChatGPT横空出世那会儿。

2022年11月30日,ChatGPT上线,才短短不到3年,我们对于GPT-5的期待已经是AGI了!

这世界,因为AI,真的变得太快了。

面对GPT-5发布后的所有的疑问和口诛笔伐,奥特曼,终于回应了这一切。


奥特曼「回应」所有问题

首先是,面对沸腾的舆论,GPT-5刚刚发布后的第一时间,奥特曼就表示要进行一波全面更新。

我们会继续努力保障系统稳定,并持续听取大家的反馈。

一次性上线这么多新东西,我们预料到过程会有些磕磕绊绊。

但实际的波折比我们预想的还要多一些!


  • 在完成全面部署后,我们会将ChatGPT Plus用户的GPT-5使用限额翻倍

  • Plus用户将可以选择继续使用4o。我们会持续关注其使用情况,并依此来决定旧版模型会保留多久。

  • 从今天起,GPT-5会感觉更智能。(昨天,模型的自动切换器出了故障,宕机了大半天,导致GPT-5表现得笨了很多。)

  • 我们将让你更清楚地看到,回答每一个问题的究竟是哪个模型。

  • 我们会调整用户界面,让用户可以更方便地手动触发模型的「思考」过程。

  • 向所有用户完全开放的过程比我们预想的要长一些。这毕竟是一次规模庞大的系统性变更。

  • 举个例子,在过去24小时里,我们的API流量就几乎翻了一倍…(虽然大家嘴上骂着,但是都管不住手啊)

  • 我们确实低估了用户会如此看重GPT-4o的某些特性,即便GPT-5在绝大多数方面都表现得更好。

  • 关于GPT-4o和GPT-5(Chat版本)的相对优劣,用户们的看法大相径庭。

  • 这件事让我们明白,不存在一个能满足所有人的模型,我们需要为不同用户提供好的个性化定制方案。

  • 我们正在集中精力完成GPT-5的全面推送并确保系统稳定。


OpenAI GPT-5团队「回应一切」

与此同时,每次发布会后的「例行公事」AMA问答环节也已完成,奥特曼和众多高管在线答疑。


太长不看版:

  • GPT-4o回归:Plus用户将重新获得4o的使用权限,支持时长取决于使用情况;

  • 是否同时提供4o/4.1与GPT-5正在研究中。

  • 考虑推出不限量模式。(以前的Plus用4.1是无限的

  • GPT-5将自动启用推理能力,下次更新会让切换更顺滑,可用「think hard」强制进入推理模式。

  • 新语音模型:更快、更好地遵循指令。

  • 将支持IDE中使用第三方插件。

  • 偏见处理更好,GPT-5 mini更有人情味。

  • 计划让Plus用户无限次使用推理模型,并提升GPT-5 mini推理的使用额度。

  • 遗憾的是,由于算力成本限制,没能实现100万Token的上下文

AMA问答参与成员:

·奥特曼(CEO)

·Sulman Choudhry(工程)

·Yann Dubois(研究)

·Alexander Embiricos(产品)

·Tarun Gogineni(研究)

·Saachi Jain(安全)

·Christina Kim(研究)

·Elaine YaLe(研究)

·Daniel Levine(产品)

·Eric Mitchell(研究)

·Michelle Pokrass(研究)

·Max Schwarzer(研究)

问:请让4o回归吧。别移除不同的模型版本,大家各有所好。

奥特曼:好的,我们都听到了大家对4o的呼声;我们会为Plus用户重新上线4o,并会根据使用情况来决定支持它多久。

问:请给我们一个选项,可以同时使用GPT-4o/4.1和GPT-5。

奥特曼:我们正在研究这个问题。是必须同时拥有4o和4.1,还是只有4o就够了?


问:别忘了Plus订阅用户曾经有过不限量的模型。

奥特曼:我们是该搞一个不限量的东西

问:之前那几张图表是怎么回事?看起来很有误导性。

奥特曼:图里的数据是准确的,但柱状图和演示文稿搞砸了。当初压根就不该放出那张幻灯片。我们正在整理一份更好的对比数据供大家参考。


问:现在大多数人还是把ChatGPT当聊天机器人用。它的用途将会如何演变?

Sulman Choudhry:ChatGPT正在为用户完成越来越多具有经济价值的工作。人与ChatGPT的互动方式,应该从「提问」逐渐转变为更适合「做事」的模式。随着大家学会用新的方式来使用ChatGPT,这一转变会逐步发生。

问:ChatGPT语音功能自发布以来有什么改进吗?

Sulman Choudhry:我们昨天上线了一个新的语音模型,它在指令遵循和响应速度上都更加出色

问:你们会直接集成类似Cursor的功能吗?

Alexander Embiricos:你试过Codex CLI吗?这是我们的开源编码智能体,可以在本地运行。

问:GPT-4.5的写作质量怎么了?

Tarun Gogineni:我们希望GPT-5的思考模式(thinking)能写得更好、也更有趣。


问:GPT-5在处理偏见问题上有什么不同吗?

Saachi Jain:当然!实际上我们对这方面取得的进展感到非常兴奋。GPT-5mini会让人感觉更有人情味,而不是那么平淡乏味。

问:为什么这些新模型还没有整合到一起?

Christina Kim:我们希望尽快把最强的模型通过统一的体验提供给大家。未来的版本会继续将它们融合起来。

问:感觉ChatGPT-5的个性更平淡了。

Christina Kim:我们是特意训练GPT-5这么做的,让它在默认情况下表现得更中立;你仍然可以通过风格指令来引导它的表达方式。

问:模型之间的切换会变快吗?

Elaine YaLe:会的!GPT-5会自动判断是否需要启用推理能力。在下个版本更新中,切换过程应该会更顺滑

问:有没有什么提示词可以强制开启「思考」模式?

Elaine YaLe:你可以在提示词里加上「think hard」(认真思考),就能直接触发推理模式。

问:ChatGPT会允许在IDE里使用第三方插件吗?

Daniel Levine:会的,这正是我们的目标。我们希望ChatGPT能借助外部工具帮你构建软件。

问:作为一名长期的Plus用户,我能无限使用推理功能吗?

Eric Mitchell:我们正在推进让Plus用户可以无限次使用推理功能的计划。

问:你们在新套餐里削减了推理功能的使用量。

Eric Mitchell:我们正在努力让大家能用gpt-5-mini进行更多推理!我们的目标绝不是限制大家使用推理功能。

问:它的编码能力和Opus4.1比怎么样?

Michelle Pokrass:两个都是非常棒的模型!我们不便过多评论其他实验室的模型,但我们认为GPT-5的思考模式(thinking)是我们发布过的最强编码模型。

问:你们最想在GPT-5中实现、但最终没能做到的功能是什么?

Michelle Pokrass:我们曾非常希望在GPT-5中实现高达100万Token的更长上下文,但部分由于算力成本的限制,目前还无法实现











9.11和9.9哪个数字更大

为了测试GPT-5的幻觉问题,我们问了3次GPT-5「9.11和9.9哪个数字更大」这个问题。

3次问答,3种模式下,GPT-5都完全回答正确,没有幻觉出现!

并且GPT-5、GPT-5Thinking和GPT-5Pro模式下的回答都体现了不同模型的特点,Pro模式甚至思考了接近1分钟。




参考资料:

https://www.reddit.com/r/ChatGPT/comments/1mkae1l/gpt5_ama_with_openais_sam_altman_and_some_of_the/

https://x.com/OpenAI/status/1953548075760595186


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
逮到马杜罗后,特朗普安抚中国,中方反将一军,对美提出明确要求

逮到马杜罗后,特朗普安抚中国,中方反将一军,对美提出明确要求

朗威游戏说
2026-01-04 17:08:27
2026门诊开药大调整!这6条规矩没搞懂的人,钱包估计要遭殃了?

2026门诊开药大调整!这6条规矩没搞懂的人,钱包估计要遭殃了?

今朝牛马
2026-01-03 15:24:08
中奖31500缴税6300元?彩民吐槽彩票个税规则引争议

中奖31500缴税6300元?彩民吐槽彩票个税规则引争议

中闻世界
2026-01-04 13:26:50
医院回应“最快女护士”宣布辞职:系其个人提出申请,已批准

医院回应“最快女护士”宣布辞职:系其个人提出申请,已批准

南方都市报
2026-01-04 11:54:10
雷军直播,冲上热搜!网友:是真敢啊

雷军直播,冲上热搜!网友:是真敢啊

中国基金报
2026-01-04 00:01:01
具俊晔元旦守着大S,俯身擦拭墓碑很憔悴,忙得连折叠椅都没打开

具俊晔元旦守着大S,俯身擦拭墓碑很憔悴,忙得连折叠椅都没打开

娱圈小愚
2026-01-04 14:25:24
突发!曾志伟任期已满将卸任TVB总经理一职,颁奖典礼设大奖致谢

突发!曾志伟任期已满将卸任TVB总经理一职,颁奖典礼设大奖致谢

青史楼兰
2026-01-04 09:39:59
29岁渐冻症女孩“重生”,吃了蔡磊团队研发药物2年,“这个药用在我身上有用,病情没再发展”

29岁渐冻症女孩“重生”,吃了蔡磊团队研发药物2年,“这个药用在我身上有用,病情没再发展”

观威海
2026-01-02 10:14:04
美媒公布中美个人开支消费对比,结果一出,媒体安静了

美媒公布中美个人开支消费对比,结果一出,媒体安静了

扶苏聊历史
2026-01-03 18:22:46
网恋两年的理想“女友”竟是男儿身,嫌疑人到案后辩称是“真爱”

网恋两年的理想“女友”竟是男儿身,嫌疑人到案后辩称是“真爱”

上观新闻
2026-01-04 16:40:09
中国最败家的儿子:为追求女明星与文强约架,在天上人间激起动荡

中国最败家的儿子:为追求女明星与文强约架,在天上人间激起动荡

凯裕说故事
2024-12-19 10:12:44
辣眼睛!长沙一20年同学会,15秒现场疯狂亲吻视频流出,登上热搜

辣眼睛!长沙一20年同学会,15秒现场疯狂亲吻视频流出,登上热搜

火山詩话
2026-01-04 06:41:49
网红郭有才,泡沫散去之后,曾经飘的有多高,如今摔得就有多惨

网红郭有才,泡沫散去之后,曾经飘的有多高,如今摔得就有多惨

小熊侃史
2025-12-20 10:55:18
赵薇深夜现身机场接女儿,推箱子拿行李很朴素,四月染黄发显叛逆

赵薇深夜现身机场接女儿,推箱子拿行李很朴素,四月染黄发显叛逆

娱乐圈圈圆
2026-01-04 15:48:01
世界首次3.5万吨群组列车试验成功

世界首次3.5万吨群组列车试验成功

财联社
2026-01-04 07:30:34
不敢相信!中国游客的日本住宿预订量,在春节期间同比增加六成!

不敢相信!中国游客的日本住宿预订量,在春节期间同比增加六成!

扶苏聊历史
2026-01-03 13:39:11
马杜罗被抓真相

马杜罗被抓真相

蓝钻故事
2026-01-04 04:34:25
疑点太多!南博陈超当年被立刻枪决,更像是为了掩盖什么

疑点太多!南博陈超当年被立刻枪决,更像是为了掩盖什么

天气观察站
2025-12-30 19:10:01
香港取消免费医疗?每人最高负担1万港币,多项民生收费同步上涨

香港取消免费医疗?每人最高负担1万港币,多项民生收费同步上涨

诗意世界
2026-01-04 09:00:03
TOP14位身高170以上的女神,有颜有灯有演技

TOP14位身高170以上的女神,有颜有灯有演技

素然追光
2026-01-02 02:45:02
2026-01-04 18:19:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14252文章数 66428关注度
往期回顾 全部

科技要闻

独家|宇树科技上市绿色通道被叫停

头条要闻

2026年新年首个工作日 中纪委连打4“虎”

头条要闻

2026年新年首个工作日 中纪委连打4“虎”

体育要闻

球队陷入危难,一名44岁教练选择复出打球

娱乐要闻

《小城大事》上星央八 热血筑梦正当时

财经要闻

委内瑞拉变局对原油美元黄金的连锁冲击

汽车要闻

最高续航310km 岚图泰山8或将上半年发布

态度原创

健康
艺术
房产
本地
军事航空

这些新疗法,让化疗不再那么痛苦

艺术要闻

故宫一级文物:和珅送给乾隆的80大寿贺礼

房产要闻

单盘最高狂卖64亿!海南楼市2025年最全榜单发布!

本地新闻

即将过去的2025年,对重庆的影响竟然如此深远

军事要闻

美军突袭抓获马杜罗 三个细节值得关注

无障碍浏览 进入关怀版