网易首页 > 网易号 > 正文 申请入驻

GPT-5基准测试泄露,被曝两天后发布?打Minecraft震撼开挂网友直呼封神

0
分享至


新智元报道

编辑:Aeneas

【新智元导读】GPT-5要来了,来势汹汹!泄露的基准测试+Minecraft实测,直接让全网惊掉下巴:代号Zenith的GPT-5-pro在游戏中如行云流水,被称为「魔法级AI」。更有爆料称它将于7月31日发布,吊打Grok 4 Heavy!OpenAI这是又要掀桌了?

一大早,关于GPT-5的消息又来了。

这些泄露的GPT-5基准测试,很可能是真实的。






甚至还有一个炸裂消息:GPT-5将于7月31日发布。

为此,现在所有GPT-5模型,已正式退出WebDev竞技场。


不过还有另外的说法,来自Menlo Ventures投资人Deedy,以及The Verge、The Information等外媒,据说GPT-5会在8月亮相。


虽然GPT-5还没来,但有关它的实测已经全网满天飞了。

就在刚刚,又有一位放出了GPT-5在Minecraft中的实测。准确地说,是内部代号zenith的GPT-5-pro。

这位网友评价道:「令人印象深刻,简直就是魔法!OpenAI确实做出了一些令人难以置信的东西。」

在这个视频中,GPT-5行云流水地一次性完成了游戏任务,表现实在惊艳。

把网友们的期待值拉得这么高,GPT-5正式发布的时候必然得超级炸裂了,否则都不知道该怎么收场。


还有一个重磅爆料,来自知名爆料人Jimmy Apple。

根据他的说法,很多内部评估人员对GPT-5的评价是——比Grok 4 Heavy还要强。


GPT-5要来,全员屏息等待

现在,GPT-5的气息是越来越近了。

甚至有人发现,当自己在app中选择o3时,竟意外测试到了某个版本的GPT-5。


不小心测到GPT-5的人,越来越多。


关于它本周上线的消息,也得到了越来越多人的证实。


而The Verge的说法稍有不同,根据他们的情报,GPT-5将于8月初发布,包括mini和nano版本。


此前曾有开发者发现,GPT-5在内部被命名为「推理alpha版」。

同时,一个代号「o3-alpha」的模型,才上线了12小时就迅速下架,许多人公认:这就是GPT-5的早期壳。

根据OpenAI惯例,从测试到发布间隔最短仅4天,所以,GPT-5真的已经相当近了。

就在昨天,大家已经发现了GPT-5可以在LMArena上使用。同时被发现的还有Zenith模型。

下面这些实例,也已经被全网疯转。

生成来自遥远未来的星舰控制面板。


创建一个流媒体网站。


在机器人行走方面完美呈现SVG动画。


史上最好的菠萝防御游戏。


融合o系列和GPT系列

毫无疑问,现在GPT-5已经是全球最受期待的模型。

很多人相信,GPT-5将是一个意义非凡的里程碑,将吸引数百万用户加入AI生态系统。

接下来,我们会梳理一番过去这段时间,GPT-5被提及的种种蛛丝马迹。

在关于OpenAI智能体的一次直播中,GPT-5就曾被提及。


当时的关键信息是:这个令人惊叹的前沿模型,将首次统一两个系列的模型,集中了o系列在推理方面的突破,以及GPT系列在多模态方面的突破。


因为ChatGPT有各种型号的模型,每个模型都有自己独特的功能和突出的特点,如果GPT-5真的是每个单一模型最佳部分的集合,很显然用户体验将彻底改变。


比如用过o3的人就知道,从GPT-4o到o3的飞跃有多么疯狂。

这一点,早在今年2月,就得到了OpenAI CPO Kevin Weil的证实。


网友问道:你们会制作模型路由器,还是它们会以系统的方式更加统一?Weil表示,会更统一

另外还有一个疑似OpenAI内部员工的爆料。他表示,研究者们的确尝试了路由方法,不过产生了很多幻觉。

所以,他们在测试一个能规划、推理、可以像扩展一样运用智能体的模型。


然后就是外媒The Information的一些爆料了。

总结来说就是,GPT-5编码极强。

在自然科学领域,推理更深入;

在浏览器里自动完成复杂任务;

写作更流畅,逻辑更在线;

更重要的是:在编码上有炸裂提升!

根据一位体验者的说法,GPT-5不仅更善于解决学术和编程竞赛问题上,甚至在处理现实世界工程师面对的实际编程任务时,表现都更加惊艳了。

比如那种包含大量屎山遗留代码的庞杂代码库,它能都能进行修改,完全没在怕的。

正是这种处理复杂场景的细致能力,让OpenAI的模型过去始终落后于Anthropic。毕竟在开发者群体中,大家都公认,Claude才是真正的编程王者。

一位体验者亲测后表示,GPT-5在编程上,甚至直接胜过了Anthropic的Claude Sonnet 4!

另外的说法就是,GPT-5不是一个统一的模型,而是一个路由器机制。


它会根据问题的类型,把你的提问发送给一个擅长闲聊GPT大模型,或是一个擅长逻辑和推理的o系列模型。

最终我们所看到的GPT-5的表现,就是这俩模型组合拳的效果。

甚至还有OpenAI高管私下这样预言——

我们在不换架构的前提下,有信心做到GPT-8。

也就是说,OpenAI并没有打算卷新架构,而是靠更聪明的调度、更强的推理、更多的后训练数据,一步一步把现有技术用到极致。

GPT-5,会给世界带来什么?

同时,奥特曼在最近的采访中关于「GPT-5让自己觉得毫无用处」的说法,让更多人期待值拉满了。


也有人说,GPT-5很可能是目前AI领域正在发生的最危险的事情之一。

比如奥特曼就在这次采访中提到,很多人整天都在和AI聊天,甚至把它当作自己的男友或女友。

还有一些孩子们,在成长过程中完全靠着滚动屏幕的方式获取多巴胺。这几件事都很危险。

当主持人问出:如何防止AI产生与社交媒体相同的负面影响?奥特曼诚实地承认道:我很害怕这件事,我没有答案。


令人担忧的是,就在前几天,一位OpenAI的投资人承认,自己因为整天使用ChatGPT,已经出现了一些不正常的状况。

也就是说,即使是有钱人,也会因为跟AI聊天被诱发精神病。


奥特曼甚至表示,自己对给地球上的每个人发放免费运行的GPT-5十分感兴趣。

当这些AI产品和服务以1/100成本被提供时,很显然,某些经济体会迅速转型和瓦解。


但是,不管会给世界造成怎样的狂潮,GPT-5要上线的架势,如今已经是无法阻挡了。

参考资料:

https://x.com/chetaslua/status/1949905375546708242

https://www.youtube.com/watch?v=0jDsWemXi3U


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
CBA疯狂一夜!广东被3分压哨绝杀,广厦22分惨败,大黑马冲上榜首

CBA疯狂一夜!广东被3分压哨绝杀,广厦22分惨败,大黑马冲上榜首

侃球熊弟
2026-01-05 20:49:34
“i茅台”频现二手平台: 早上刚抢的1499元茅台,转手一瓶加价50元就卖了

“i茅台”频现二手平台: 早上刚抢的1499元茅台,转手一瓶加价50元就卖了

第一财经资讯
2026-01-05 17:50:22
北京警方刑拘1名“荒野求生”爱好者

北京警方刑拘1名“荒野求生”爱好者

极目新闻
2026-01-04 17:57:27
李在明到北京的第一件事,不是和中方见面,而是去了另外一个地方

李在明到北京的第一件事,不是和中方见面,而是去了另外一个地方

军机Talk
2026-01-05 10:10:17
52岁TVB花旦视后五强不入劲惨,入行多年始终与视后无缘

52岁TVB花旦视后五强不入劲惨,入行多年始终与视后无缘

TVB剧评社
2026-01-05 11:34:48
该反思了,国内军事专家预测不仅离谱,而且扯淡,别再纸上谈兵了

该反思了,国内军事专家预测不仅离谱,而且扯淡,别再纸上谈兵了

你食不食油饼
2026-01-04 18:19:10
中方下“逐客令”,直言:一粒大米也不要,直接叫停900万吨订单

中方下“逐客令”,直言:一粒大米也不要,直接叫停900万吨订单

爱吃醋的猫咪
2025-12-27 16:24:13
姚明观战!上海7连胜大胜终结广厦8连胜 张镇麟16分胡金秋22分

姚明观战!上海7连胜大胜终结广厦8连胜 张镇麟16分胡金秋22分

醉卧浮生
2026-01-05 21:48:36
在美国的马杜罗没想到,副总统只扛了一天,就带领全国人民投降了

在美国的马杜罗没想到,副总统只扛了一天,就带领全国人民投降了

瞳哥视界
2026-01-05 21:45:48
中美彻底变天了?中方正式向全世界宣布,禁止美军该项合作

中美彻底变天了?中方正式向全世界宣布,禁止美军该项合作

花花娱界
2026-01-03 20:23:38
高盛报告:建议高配中国股票 预计2026年和2027年中国股市将每年上涨15%至20%

高盛报告:建议高配中国股票 预计2026年和2027年中国股市将每年上涨15%至20%

财联社
2026-01-05 16:41:40
别再说运动裤丑了,那是你不会搭!学会这样穿,走路都带风

别再说运动裤丑了,那是你不会搭!学会这样穿,走路都带风

灼灼小齐
2026-01-06 00:25:03
朴娜来「车上活春宫」!2经纪人开车被逼看全程 做一半还狂踢椅背

朴娜来「车上活春宫」!2经纪人开车被逼看全程 做一半还狂踢椅背

ETtoday星光云
2026-01-05 09:42:04
联合国安理会就委内瑞拉局势举行紧急会议

联合国安理会就委内瑞拉局势举行紧急会议

界面新闻
2026-01-05 23:07:09
教育部扔下重磅炸弹:2026年开始,全国一律不准再买校外商业试卷

教育部扔下重磅炸弹:2026年开始,全国一律不准再买校外商业试卷

泠泠说史
2026-01-05 18:31:34
解放军围台演习各国已经选边站队,最大的“刺头”浮出水面

解放军围台演习各国已经选边站队,最大的“刺头”浮出水面

空天力量
2026-01-03 19:12:13
长沙15秒接吻同学会后续!两人信息被扒,女同学正脸曝光,很漂亮

长沙15秒接吻同学会后续!两人信息被扒,女同学正脸曝光,很漂亮

鋭娱之乐
2026-01-05 15:13:46
满是心酸!42岁著名歌手江苏走穴,宾客只顾吃席没人搭理

满是心酸!42岁著名歌手江苏走穴,宾客只顾吃席没人搭理

查尔菲的笔记
2026-01-04 13:13:57
“毒奶”李莉等专家之所以马杜罗判断失误,是因为它们的受众只喜欢“喝奶”

“毒奶”李莉等专家之所以马杜罗判断失误,是因为它们的受众只喜欢“喝奶”

林中木白
2026-01-05 12:26:02
64岁解放军中将逝世,网传感染流感病毒,战友披露最后通话内容

64岁解放军中将逝世,网传感染流感病毒,战友披露最后通话内容

博士观察
2026-01-05 20:15:51
2026-01-06 04:36:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14261文章数 66434关注度
往期回顾 全部

科技要闻

4100家科技企业集结赌城,CES揭开AI新战场

头条要闻

马杜罗庭审陈词:我是一个正派的人 是我们国家总统

头条要闻

马杜罗庭审陈词:我是一个正派的人 是我们国家总统

体育要闻

50年最差曼联主帅!盘点阿莫林尴尬纪录

娱乐要闻

《探索新境2》王一博挑战酋长岩

财经要闻

丁一凡:中美进入相对稳定的竞争共存期

汽车要闻

海狮06EV冬季续航挑战 "电"这事比亚迪绝对玩明白了

态度原创

家居
教育
旅游
时尚
房产

家居要闻

白色大理石 奢华现代

教育要闻

【堂堂上新!!!】2027TTS院校全程班|降低考研试错成本!!按部就班就是伟大!!!

旅游要闻

198.33万人次市民游客元旦假期畅游浦东,文旅市场迎来开门红

冬天穿衣其实很简单!上短下长、加点亮色,高级舒适又耐看

房产要闻

再次登顶海南楼市!超越阿那亚的,只有阿那亚!

无障碍浏览 进入关怀版