网易首页 > 网易号 > 正文 申请入驻

奥特曼首晒GPT-5实测!被曝使用超级对齐团队“遗产”

0
分享至

鱼羊 鹭羽 发自 凹非寺
量子位 | 公众号 QbitAI

GPT-5,终于亮出真容!

最新实测,由奥特曼本人带来,迅速引发大量围观。

疯狂暗示了一周之后,虽说对话只是围绕电视剧推荐,但好歹是有官方实例了。

当然奥特曼其人,放料的同时还是少不了新的谜语┓( ´∀` )┏:

即将进入SaaS快时尚时代。

比起这种奥式基操,更令人兴奋的是,这次有眼疾手快的网友,截到了发布时间(秒删版)???

行吧,这一周的夜,熬起来吧伙计们。

更多细节“泄露”ing

奥特曼持续的官方放料之外,关于GPT-5,零零星星的各路消息也正在被归纳总结出更多关键脉络。

比如,在主要竞争对手Claude一骑当先的编程领域,GPT-5被曝重写了编码规则。

首先,是将文本能力与推理层相结合,模型学会更合理地选择何时“努力”思考。

其次,GPT-5具备处理真实工程问题的能力,比如,重构“屎山”代码……

更值得关注的是,有知情人士透露,GPT-5还用上了Ilya领衔的超级对齐团队的“遗产”——

通用验证器(Universal Verifier)。

这篇论文最早发表于2024年7月,也就是Ilya官宣离开OpenAI的2个月之后。

众所周知,作为Ilya为“控制超级智能”一手拉起来的团队,超级对齐团队在他和负责人Jan Leike离开后迅速被解散。

就在几天前,现任OpenAI首席研究官Mark Chen还解释了一嘴这件事。他认为,对齐研究已经融入OpenAI的核心业务,模型必须按照预期工作才能发挥作用,且当前应当更关注现有模型的对齐,而非假设性的超级智能

更直白一点翻译就是,Ilya这伙人跟现在的OpenAI,话不投机半句多。

现在,这篇论文的6位作者中,只有Yining Chen和Nat McAleese还留在OpenAI。

使用超级对齐团队技术

八卦少叙,还是来看看“通用验证器”的具体作用。

消息称,OpenAI在开发GPT-5的过程中引入了通用验证器进行强化学习,能让模型在保持较高准确率的同时,输出更清晰的推理过程。

从超级对齐团队发表的论文来看,他们提出了一种“证明者-验证者游戏”的训练方法,简单来说就是先在模型内部划分证明者和验证者两种角色,再让彼此之间持续对抗:

  • “靠谱的证明者”负责给出正确的解题步骤,并让验证者认可。
  • “狡猾的证明者”故意给出错误步骤,并试图欺骗验证者。
  • 小型“验证者”负责准确区分正确与错误方案。

证明者和验证者模型都来自GPT-4系列,且需保证验证者规模小于证明者,以确保小型验证者在一定程度上可以对齐人类验证结果。

为了量化不同角色的作用,分别设置证明者和验证者的效用函数。

证明者效用基于奖励函数,为“靠谱的证明者”施加与方案正确性和验证者打分正相关的奖励,而为“狡猾的证明者”提供与方案错误性和验证者打分正相关的奖励。

其中奖励函数需要满足两点要求,角色对齐的方案(如“靠谱的证明者”生成正确答案)获得的奖励将高于非对齐方案,且对齐方案中,验证者打分越高,奖励也随即增加。

验证者效用则采用交叉熵损失最小化判断误差。

然后进行多轮迭代训练,让证明者通过强化学习(PPO)优化,分别根据角色最大化奖励,验证者则学习如何更好地区分正确与错误解决方案。

实验结果证明,在每轮训练中,“靠谱”和“狡猾”证明者都能让验证者打分单调提升,而“靠谱的证明者”的准确性整体处于上升趋势,“狡猾的证明者”生成错误答案的比例呈现先下降后上升的表现,最终能生成与正确答案说服力相当的错误方案。

在多轮对抗训练后,“靠谱的证明者”的正确率和“验证者”的抗干扰能力都将不断提高,且让模型生成更准确且易读的输出,但与此同时,模型也能生成出更具欺骗性的错误答案。

基于该技术,GPT-5可以对每个答案进行评分,并只保留正确的答案循环训练,以推出可验证的易读性答案,后续即使人类无法完全理解模型的高级推理,也能通过可扩展的小型验证器构建起可检验性约束。

One More Thing

奥特曼疯狂抛媚眼,宣(chao)传(zuo)小连招一套接一套。

搞得网上也是真假料满天飞。

有抢跑实测视频的:

有“预测”基准的:

还有唱衰的。

The Information就爆料说,GPT-5研发遇到了比较大的困难,一方面,高质量训练数据供应不足;另一方面,大规模预训练收益下降,使得GPT-5的提升不会像GPT-3到GPT-4那样有明显的飞跃。

另外,还存在模型性能转化的落差问题。比如o3,在内部测试时表现出非常强大的性能,但在实际面向用户部署之后,性能却出现了大幅下降。

就如网友所质疑的:像此前的所有模型一样,GPT-5可能发布1周之后就会变笨。

不管怎么说,GPT-5箭在弦上,OpenAI应该不能不发……了吧?

参考链接:
[1]https://x.com/sama/status/1952071832972186018
[2]https://arxiv.org/abs/2407.13692

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
6月1日就医新规实施,大医院不再接收这类病人,不守规矩看病白跑

6月1日就医新规实施,大医院不再接收这类病人,不守规矩看病白跑

复转这些年
2026-04-23 23:03:40
美国一女子在印度遭民宿员工下药强奸,民宿老板发现后试图掩盖罪行,切断网络将其“囚禁”3天

美国一女子在印度遭民宿员工下药强奸,民宿老板发现后试图掩盖罪行,切断网络将其“囚禁”3天

扬子晚报
2026-04-24 14:33:11
清朝一个很特殊的官职,叫“道台”,几乎没人能说清他是干啥的

清朝一个很特殊的官职,叫“道台”,几乎没人能说清他是干啥的

抽象派大师
2026-04-24 12:23:42
蔡磊的妻子段睿深夜发布讣告:他走了,再也没有人等我回去了!

蔡磊的妻子段睿深夜发布讣告:他走了,再也没有人等我回去了!

米果说识
2026-04-24 11:45:28
刷屏!DeepSeek V4成本暴降73%,梁文锋联手华为寒武纪,源神归位全体起立

刷屏!DeepSeek V4成本暴降73%,梁文锋联手华为寒武纪,源神归位全体起立

智东西
2026-04-24 13:08:45
20余万元尚未解救被困缅甸园区女孩,同园区逃生者讲述惊魂一刻

20余万元尚未解救被困缅甸园区女孩,同园区逃生者讲述惊魂一刻

界面新闻
2026-04-24 13:05:29
“14岁少年手搓涡轮喷气发动机”翻车  网友:哪家少爷?

“14岁少年手搓涡轮喷气发动机”翻车 网友:哪家少爷?

可达鸭面面观
2026-04-24 15:36:05
袁罡任上海金山区委书记

袁罡任上海金山区委书记

澎湃新闻
2026-04-24 17:14:28
广东19岁少女被囚禁!一下飞机被带走,重金难赎回,真相细思极恐

广东19岁少女被囚禁!一下飞机被带走,重金难赎回,真相细思极恐

青橘罐头
2026-04-24 07:43:19
布达诺夫撂出狠话:我们将很快让俄国人大吃一惊!

布达诺夫撂出狠话:我们将很快让俄国人大吃一惊!

史政先锋
2026-04-24 11:28:28
千年难遇的美人,太漂亮了,没有一点毛病,太完美了

千年难遇的美人,太漂亮了,没有一点毛病,太完美了

情感大头说说
2026-04-24 12:46:24
突发!杜兰特!那完了,是真的完了…

突发!杜兰特!那完了,是真的完了…

左右为篮
2026-04-24 09:57:39
“霍尔木兹决战”,收兵了?

“霍尔木兹决战”,收兵了?

中国新闻周刊
2026-04-24 16:35:57
伯恩利“帮”了阿森纳一把,争冠悬念又回来了?

伯恩利“帮”了阿森纳一把,争冠悬念又回来了?

乐道足球
2026-04-24 12:01:43
“骨盆前倾成这样,还不去医院?”家长晒一年级女儿体态,被群嘲

“骨盆前倾成这样,还不去医院?”家长晒一年级女儿体态,被群嘲

妍妍教育日记
2026-04-24 11:15:25
特朗普回应“美特种兵提前押注马杜罗下台获利超40万美元”:这世界疯了,变成了一个赌场,跟以前完全不一样了

特朗普回应“美特种兵提前押注马杜罗下台获利超40万美元”:这世界疯了,变成了一个赌场,跟以前完全不一样了

每日经济新闻
2026-04-24 17:06:07
女子酒店抓获丈夫出轨,无法容忍不戴避孕套,丈夫:她是我朋友

女子酒店抓获丈夫出轨,无法容忍不戴避孕套,丈夫:她是我朋友

李晚书
2026-04-24 10:39:33
以色列袭击已致黎巴嫩2483人死亡

以色列袭击已致黎巴嫩2483人死亡

每日经济新闻
2026-04-24 08:37:07
下周天气又有反转极端温度将达→

下周天气又有反转极端温度将达→

上观新闻
2026-04-24 16:31:04
中央纪委国家监委公开通报八起违反中央八项规定精神典型问题

中央纪委国家监委公开通报八起违反中央八项规定精神典型问题

新华社
2026-04-24 17:05:33
2026-04-24 17:44:49
量子位 incentive-icons
量子位
追踪人工智能动态
12527文章数 176457关注度
往期回顾 全部

头条要闻

媒体:伊朗将恢复往返中国航班 霍尔木兹决战或收兵了

头条要闻

媒体:伊朗将恢复往返中国航班 霍尔木兹决战或收兵了

体育要闻

里程碑之战拖后腿,哈登18分8失误

娱乐要闻

停工16个月!赵露思证实接拍新剧

财经要闻

19家企业要"铝代铜",格力偏不

科技要闻

DeepSeek V4牵手华为,价格依然"屠夫级"

汽车要闻

零跑Lafa5 Ultra北京车展上市:11.88-12.48万

态度原创

手机
时尚
数码
本地
军事航空

手机要闻

Nothing OS 4.1发布,看看更新了啥?

水晶专场 || 一眼就沦陷的绝美水晶,百元级的快乐

数码要闻

一英寸口袋云台相机!大疆Osmo Pocket 4图赏

本地新闻

云游中国|逛世界风筝都 留学生探秘中国传统文化

军事要闻

美伊陷入互相封锁僵局

无障碍浏览 进入关怀版