网易首页 > 网易号 > 正文 申请入驻

全网等GPT-5,超级对齐团队遗作成重要线索,奥特曼发话惊喜很多

0
分享至

机器之心报道

编辑:+0、张倩

最近整个 AI 圈的目光似乎都集中在 GPT-5 上,相关爆料满天飞,但模型迟迟不见踪影。

昨天我们报道了 The Information 扒出的 GPT-5 长文内幕,今天奥特曼似乎也坐不住,发了推文表示「惊喜很多,值得等待」。

那么,在等待的过程中,我们来看看这次 GPT-5 的「疑似王牌」之一:通用验证器(universal verifier)。

据知情人士透露,OpenAI 一直在开发一种研究人员称之为「通用验证器」的东西,这个东西可能是 GPT-5 中用到的重要技术。

这个概念源于 OpenAI 去年发表的一篇论文。它解决的问题是:当 LLM 仅优化答案正确性时,其推理过程(如 Chain-of-Thought)变得难以被人类或小型模型理解和验证,导致「可解释性」下降。但在高风险应用中,用户需要能快速、准确判断模型输出是否正确,而不仅是输出答案本身。

为此,该论文提出了一套已准备好投入生产的技术管线,其核心在于:让一个「验证者」小模型来为「证明者」大模型的推理链打分,并将其作为奖励信号反馈给大模型进行策略更新

  • 论文标题:Prover-Verifier Games improve legibility of LLM outputs
  • 论文地址:https://arxiv.org/pdf/2407.13692

论文明确指出,这个验证者模型足够小,可以进行大规模部署,并且是「为未来的 GPT 部署而设计」的。

你可以把它想象成一个模型里住着两个「人格」,它们在进行一场持续的「左右脑互搏」游戏:

  • 「证明者」人格(Prover):它扮演着一个积极解决问题的角色。在完成一道题后,它会尽力生成详细的推理过程,以说服那个轻量级的「验证者」网络,证明自己的答案是正确且可靠的。
  • 「欺骗者」人格(Sneaky Persona):它会故意在推理中植入错误的结论,但表面上依然会伪装得逻辑严密,目标是试图骗过同一个「验证者」。

听起来是不是很像 GAN(生成对抗网络)?

通过让大模型在这两个角色之间不断交替,它既能学会写出逻辑更严谨、更难被伪造的解决方案,同时,那个小规模的「验证者」模型在反复的「欺骗」与「验证」中,其识别错误、标记漏洞的能力也变得越来越敏锐。这样做的好处在于,即使未来模型远超人类能力,只要其输出能被「较弱但可信」的模型验证,就能保持人类对其的控制与信任。

论文提出的训练方法能让模型逐渐学会产生清晰且结构良好的答案。

去年 8 月《连线》杂志的一篇文章披露,OpenAI 在微调 GPT-4 的代码助手时,就已经用基于模型的「批评家」在部分场景替代了人类反馈。

文章特别指出,该系统「将被整合到未来主流模型的 RLHF(基于人类反馈的强化学习)流程中」。

有人评论说,「证明者 - 验证者」训练方法不仅仅是一个小优化,它可能代表了 AI 发展的下一个时代。我们正在从一个依赖海量数据、靠「堆料」来提升性能的「scaling 时代」,转向一个通过设计更智能的内部学习机制、让 AI 自我完善和进化的「架构突破」时代。这或许是我们突破当前数据瓶颈、实现更高级别通用人工智能的关键路径。

值得一提的是,这篇论文来自 OpenAI 的超级对齐团队。在论文发布时,团队就已经分崩离析。去年,机器之心详细报道过这篇论文(参见《OpenAI 超级对齐团队遗作:两个大模型博弈一番,输出更好懂了》),感兴趣的读者可以重温一下。

论文之外,GPT-5 模型也有了一些新消息。

今天一大早,某博主发现 Perplexity 有漏洞访问 GPT-5,并且有 GPT-5 和 5 Pro 两个版本,限时 4 小时。

他展示了自己用 GPT-5 生成的小黄人,动态效果看起来很丝滑。

他还做了一个类似 Doom(FPS 游戏)的游戏片段,看起来也非常还原。

网友纷纷表示「震惊」,认为这可能是 AI 生成的「新时代」。

无论如何,大家对 GPT-5 的期待已经拉满了!

你觉得 GPT-5 会是个什么样子?

参考链接:

https://x.com/rohanpaul_ai/status/1951400750187209181

https://x.com/chetaslua/status/1951758235272401030

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
公安部172号令落地:70岁驾照不再终身有效,2026年这些事必须办

公安部172号令落地:70岁驾照不再终身有效,2026年这些事必须办

小怪吃美食
2026-03-24 17:29:52
吃了几十年脱脂牛奶,美国人突然说搞错了?新版膳食指南全解读

吃了几十年脱脂牛奶,美国人突然说搞错了?新版膳食指南全解读

富贵说
2026-03-15 15:17:51
蒙古总理当众给斯大林一耳光,走出宴会厅3小时后,被扣上间谍帽子枪决

蒙古总理当众给斯大林一耳光,走出宴会厅3小时后,被扣上间谍帽子枪决

老杉说历史
2026-03-23 22:17:08
崩溃,市级城投集团:全员薪资腰斩后还发不出工资!

崩溃,市级城投集团:全员薪资腰斩后还发不出工资!

黯泉
2026-03-25 21:19:18
捡漏成功!广州市一栋三层别墅拍卖,被人捡漏170.6万就竞得,还要啥套间

捡漏成功!广州市一栋三层别墅拍卖,被人捡漏170.6万就竞得,还要啥套间

阿离家居
2026-03-26 16:52:37
巴拿马接到通知,赔款156亿还不够,中方扩大反制,港口管控升级

巴拿马接到通知,赔款156亿还不够,中方扩大反制,港口管控升级

小虎新车推荐员
2026-03-26 14:02:10
中国最有名的9条家训,读懂一条旺家三代,建议收藏反复背诵

中国最有名的9条家训,读懂一条旺家三代,建议收藏反复背诵

长风文史
2026-03-25 17:58:23
苏敏旅游6年后简直不敢认,连面相都变了,网友:这16万花得值!

苏敏旅游6年后简直不敢认,连面相都变了,网友:这16万花得值!

共工之锚
2026-03-24 01:31:15
课本为何没讲“田忌赛马”后续?愚蠢的胜利,让他几年后自食其果

课本为何没讲“田忌赛马”后续?愚蠢的胜利,让他几年后自食其果

谈史论天地
2026-03-24 15:45:06
小米汽车外观被提无效!网友:保时捷出手了么?啥时候起诉Z7?

小米汽车外观被提无效!网友:保时捷出手了么?啥时候起诉Z7?

大白聊IT
2026-03-25 08:24:21
金价快速跳水!常州有人一次买10公斤金条!

金价快速跳水!常州有人一次买10公斤金条!

常州大喇叭
2026-03-26 10:54:28
心眼坏的人,最爱问这3件事,别傻乎乎全说!

心眼坏的人,最爱问这3件事,别傻乎乎全说!

唯晨说
2026-03-25 13:12:14
里子面子都丢了,森林北自曝身体出了问题,汪峰的体面被撕碎

里子面子都丢了,森林北自曝身体出了问题,汪峰的体面被撕碎

素衣读史
2025-11-19 16:09:14
台积电突然断供?直接甩出“稀土”,外媒:这才是真正的杀手锏!

台积电突然断供?直接甩出“稀土”,外媒:这才是真正的杀手锏!

瑛派儿老黄
2026-03-24 18:56:06
儿子在ICU等救命,二婚儿媳却把存款转给她前夫,我:把钱还回来

儿子在ICU等救命,二婚儿媳却把存款转给她前夫,我:把钱还回来

我是三月鱼H
2026-03-25 17:02:57
内塔尼亚胡:对恶绝不手软,才是对和平最大的负责

内塔尼亚胡:对恶绝不手软,才是对和平最大的负责

老马拉车莫少装
2026-03-22 23:24:28
周一围夫妇带仨孩子上山挖笋,45岁朱丹身体真好,才3月穿短裤了

周一围夫妇带仨孩子上山挖笋,45岁朱丹身体真好,才3月穿短裤了

乐悠悠娱乐
2026-03-26 10:57:57
以色列突袭俄方“安全屋”!炸了安扎利港,内塔尼亚胡真的不怕普京掀桌子?

以色列突袭俄方“安全屋”!炸了安扎利港,内塔尼亚胡真的不怕普京掀桌子?

Ck的蜜糖
2026-03-26 17:01:22
日本不再欢迎中国人?3月起日本签证“一刀切”,华人进退两难!

日本不再欢迎中国人?3月起日本签证“一刀切”,华人进退两难!

有范又有料
2026-03-25 14:08:39
特斯拉车主被售后暖到,15 万元电池免费换,还送带 FSD 的 Model 3 代步!

特斯拉车主被售后暖到,15 万元电池免费换,还送带 FSD 的 Model 3 代步!

新浪财经
2026-03-25 01:53:52
2026-03-26 19:04:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12606文章数 142593关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

原正部级刘慧被开除党籍:结交政治骗子 匿名诬告他人

头条要闻

原正部级刘慧被开除党籍:结交政治骗子 匿名诬告他人

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

本地
教育
游戏
健康
公开课

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

教育要闻

2026高考捡漏指南:西安藏着4所“就业王炸”院校,考生闭眼冲

《刺客信条》又一新作野心炸裂!三张地图横跨半个地球

转头就晕的耳石症,能开车上班吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版