网易首页 > 网易号 > 正文 申请入驻

代码碾压一切!OpenAI神秘模型o3-alpha一夜刷屏,却遭41岁大神绝地反杀

0
分享至


新智元报道

编辑:定慧 好困

【新智元导读】OpenAI的神秘模型o3-alpha意外曝光,其强大的代码能力碾压众多AI。该模型疑似在东京AtCoder世界编程大赛2025中夺得亚军,最终不敌人类选手Psyho。

OpenAI果然藏了一手。

昨天夜里,一个名为「o3-alpha-responses-2025-07-17」的神秘模型被爆出。

网友们疯狂测试后,得出一致结论,这个模型强得离谱


WebDev Arena网页的源码

甚至有网友在实测后,大赞o3-alpha,将它称为目前「最佳编码和物理模型」


每次新模型出来后,小球的碰撞实验已经成为一种「传统」,这次「o3 Alpha」不仅完美的展示了物理碰撞,并且还能随时改变小球的大小。


在WebDev Arena上,「o3-alpha-responses-2025-07-17」以「Anonymous-Chatbot」的名称出现。


根据网友的猜测,它很有可能是在编码能力上得到了「史诗级」加强的o3升级版。

毕竟目前在WebDev Arena Leaderboard中,OpenAI只有一款专门编程的GPT-4.1-2025-04-14上榜。


不过,目前想要捕捉到这个匿名模型,需要在竞技场中多次尝试(我们在WebDev Arena多次尝试未能捕捉到这个匿名模型)。


Peter Gostev在竞技场中使用如下提示词「幸运的」捕捉到了o3-alpha,感兴趣的话你也可以试试。


还有网友爆出,OpenAI可能「派出」了这个模型去参加世界最难编程竞赛:东京举行的AtCoder世界巡回赛2025决赛。(需要OpenAI确定)


OpenAI的这个o3-alpha模型最终获得了第二,第一名是人类Psyho。


虽然o3-alpha可能已经被OpenAI下架,但网友们还是保留了丰富的实测案例。

从实测来看,「o3-alpha」在前端代码能力达到了领先水平——远胜于Claude Sonnet、o3、Gemini 2.5 Pro。

实测效果惊人

网友Peter Gostev发现该模型后,使用提示词「要求模型使用Three.js创建一个程序生成的星球」。


测试后,他很难相信,但是依然认为o3-alpha的编码水平达到一个全新的高度。


以下是完整的测试对比视频,可以看出o3-alpha的效果整体最好。

OpenAI模型在前端能力方面一直表现平平,Peter表示这次的模型似乎终于在这方面超越了其他所有模型。

有网友用经典的「骑自行车的鹈鹕」进行了测试,表示o3 alpha完全打败了o3 pro。


以下是o3 alpha生成的动画版的效果,你觉得这个效果如何。


o3-alpha还能一句话就生成的「我的世界」模拟器。


超mini版GTA的复刻,o3-alpha也能一句话搞定。

还能一键生成高度可定制的SVG应用。


有网友用o3-alpha造了一个魔方模拟器,甚至可以输入「魔方算法」来直接操控,确实太强大了。

仅仅靠着文字提示就可以实现。

网友还用o3-alpha创建了一个太空入侵模拟游戏,再次体现了OpenAI这个新模型的前端代码能力。

网友Mahi用只有2-3个单词的提示对比了o3-alpha和Gemini 2.5 Pro。


o3-alpha生成的网页效果要好于Gemini 2.5 Pro。


除了以上神秘的o3-alpha模型和OpenAI派出AI选手参与顶尖编程大赛外。

刚刚发布的ChatGPT Agent也实力惊人。

OpenAI的研究院Zhiqing Sun,表示ChatGPT Agent通过了ARC-AGI-3的第一关。


41岁大神击败AI

守住人类最后防线

o3-alpha被爆出的时机非常的「巧合」。

因为前两天在东京举行的AtCoder世界巡回赛2025决赛中,同样是OpenAI的一款匿名模型,获得了第二名。

根据网友爆料,这个模型很大概率就是o3-alpha。


我们推测OpenAI本来应该是打算「一鸣惊人」,但有一个名叫Psyho的人类戏剧性的打败了AI获得了第一名。

是的,这位来自波兰的编程大神——Przemysław Dębiak(aka Psyho),用一场惊心动魄的胜利告诉世界:人类,还没输!

地点是东京,AtCoder世界编程大赛的决赛现场。

空气中弥漫着紧张的气息,因为这次的对手非同寻常——一个由OpenAI亲自下场派出的AI模型。

在这里,人类和AI选手需要在10小时内,不断优化墙壁的设置以及机器人的分组,让它们能够在30x30的网格内以最少的步数回家。



从华沙一路飞到东京的「Psyho」,本来就已经身心俱疲。

而这场堪称马拉松的比赛,更是让他愈发感觉自己已经濒临极限。

「我累到爆炸,真的,有好几次我都想直接放弃算了,」他回忆道。

三天里,「Psyho」只睡了10个小时。


而他的对手,那个「不知疲倦」的AI,早已能够在诸如算法实现、代码优化等纯粹的工程任务中,凭借着更快地速度碾压人类。

不过,这次的比赛,是人类的主场。

原因在于,比赛时间越长,就越考验从零到一的创造性,AI就会越吃力。

  • 比赛一开始,AI很快就以绝对优势实现领先;

  • 直到第7小时,一步步稳扎稳打的大神「Psyho」才实现反超,而AI却陷入了困境;

  • 第8小时,AI突然发现了一个全新的思路,并一举超越了「Psyho」——新方法不仅实现了更好的墙体设计,还带来了更好的资源调度;

  • 即将进入倒计时阶段,剧情再次反转。「Psyho」灵感乍现,对AI完成了绝地反杀!虽然AI还在不断调整,但差距却越来越大。





最终,这个41岁的男人,成功在长达10小时鏖战的最后关头,凭借着血肉之躯和人类独有的创造力,战胜了冰冷的机器!


对于这场胜利,奥特曼亲自发文祝贺道:「干得好,Psyho。」

与此同时,OpenAI官方也发文表示:「我们的模型拿了第二。恭喜冠军,这次你成功地阻击了我们!」


更有趣的是,比赛的组织者都惊呆了。

他们坦言:「我们本来就觉得人类会赢,但说实话,我们被AI能拿到第二名给吓到了!」

他们一针见血地指出:「在代码优化的硬实力上,AI已经超越了人类,但它唯独缺少了人类那神来之笔的创造力。」

没错!「Psyho」赢得不靠蛮力,而是靠一个「完全不同的解题思路」。

当所有人都和AI在同一条赛道上狂奔时,他另辟蹊径,找到了AI视野之外的「最优解」。

而他用的武器也很简单,就是最常规的编程软件,连AI辅助工具都没用。


当然,这只是一场战役的胜利,远非「人·机」大战的结束。

从IBM「深蓝」到谷歌「AlphaGo」,AI战胜人类的传奇早已上演。奥特曼也预言,AI很快就会在编程竞赛中全面超越人类。

但至少在东京的那个不眠之夜,一位名叫「Psyho」的孤胆英雄,为人类赢得了一丝喘息。

参考资料:

https://x.com/chetaslua/status/1946154816691966227

https://x.com/chetaslua/status/1946165458048291091


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
黄金税收新规来了,你手上的金手镯可能卖不上价了。

黄金税收新规来了,你手上的金手镯可能卖不上价了。

流苏晚晴
2025-11-03 19:13:08
马斯克:我承诺在播客节目公布“外星人证据”

马斯克:我承诺在播客节目公布“外星人证据”

环球时报国际
2025-11-03 15:41:17
1965年,他早知道罗瑞卿要出事,对其不尊重,对梁必业:欲言又止

1965年,他早知道罗瑞卿要出事,对其不尊重,对梁必业:欲言又止

大运河时空
2025-11-04 12:35:03
汪东兴提反对意见,邓公起身质问:为什么你每次开会都唱反调?

汪东兴提反对意见,邓公起身质问:为什么你每次开会都唱反调?

瀚霖学史
2025-10-24 09:04:10
看哭了!舅舅18岁开始抚养三个外甥,九年时间感动全网!

看哭了!舅舅18岁开始抚养三个外甥,九年时间感动全网!

晓踏就是我
2025-11-02 16:55:18
越南知名女演员涉挪用数千两黄金被捕!曾获越南“奥斯卡”最佳女主角,被捕前还在晒照

越南知名女演员涉挪用数千两黄金被捕!曾获越南“奥斯卡”最佳女主角,被捕前还在晒照

红星新闻
2025-11-03 16:09:37
又一个卓识?王泉泽妹妹晒美照,NCAA场均1.5分,上季合计1板1断

又一个卓识?王泉泽妹妹晒美照,NCAA场均1.5分,上季合计1板1断

弄月公子
2025-11-04 10:09:10
三观不正的人到底有多恶心,多可怕?看到网友的分享我胆战心惊呀

三观不正的人到底有多恶心,多可怕?看到网友的分享我胆战心惊呀

娱乐洞察点点
2025-11-04 07:53:34
大跌眼镜!Angelababy在上海网红餐厅吃饭舔手指,用手擦嘴擦脸

大跌眼镜!Angelababy在上海网红餐厅吃饭舔手指,用手擦嘴擦脸

小娱乐悠悠
2025-11-03 09:29:44
毛主席临终前为何拿掉叶剑英军权?令人不解,多年后才知主席苦心

毛主席临终前为何拿掉叶剑英军权?令人不解,多年后才知主席苦心

云端书馆
2024-12-24 08:49:00
98年他花5万买下上海弄堂破阁楼,邻居都笑他痴,20年后全都闭嘴了

98年他花5万买下上海弄堂破阁楼,邻居都笑他痴,20年后全都闭嘴了

温情邮局
2025-10-21 11:41:22
郑丽文公布第四波人事任命,朱立伦尴尬了,洪秀柱罕见喊话郑丽文

郑丽文公布第四波人事任命,朱立伦尴尬了,洪秀柱罕见喊话郑丽文

策略述
2025-11-03 17:58:29
黑长直御姐,好唯美!

黑长直御姐,好唯美!

贵圈真乱
2025-11-04 13:44:51
北京公交通告!撤销三条线路

北京公交通告!撤销三条线路

大峰
2025-11-04 10:15:17
高三男孩喀纳斯湖失踪,母亲守岸7天后直言放弃,意外竟在此时发生

高三男孩喀纳斯湖失踪,母亲守岸7天后直言放弃,意外竟在此时发生

古怪奇谈录
2025-10-16 10:53:42
两性揭露:不论多大年龄;女人永远都想要这三大需求,男人别忽视

两性揭露:不论多大年龄;女人永远都想要这三大需求,男人别忽视

小鬼头体育
2025-11-04 14:11:19
曼城队内英超射手榜:哈兰德13球,乌龙2球,其他均为1球

曼城队内英超射手榜:哈兰德13球,乌龙2球,其他均为1球

懂球帝
2025-11-04 15:15:05
我退休金1万1,每月都会给女儿打6000,饭桌上女婿突然开口

我退休金1万1,每月都会给女儿打6000,饭桌上女婿突然开口

媛来这样
2025-11-04 09:41:18
天津市河西区常务副区长崔振平履新市科学技术局党委书记

天津市河西区常务副区长崔振平履新市科学技术局党委书记

澎湃新闻
2025-11-04 14:08:27
张艺谋没有撒谎,“不合群”的孙俪,才是娱乐圈真正的“聪明人”

张艺谋没有撒谎,“不合群”的孙俪,才是娱乐圈真正的“聪明人”

乡野小珥
2025-11-04 15:06:37
2025-11-04 15:56:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13781文章数 66237关注度
往期回顾 全部

科技要闻

硅谷甄嬛传:奥特曼优雅挑衅马斯克狠狠回击

头条要闻

男子为骗巨额保金推妻坠海已被执行死刑 检方披露细节

头条要闻

男子为骗巨额保金推妻坠海已被执行死刑 检方披露细节

体育要闻

27岁热刺门将,夺冠后退役当导演

娱乐要闻

《繁花》录音事件完整版长达43分钟

财经要闻

作价40亿美元!星巴克中国易主

汽车要闻

上汽旗舰智己LS9首发评测 可能是最好开的9系SUV

态度原创

健康
房产
旅游
数码
教育

超声探头会加重受伤情况吗?

房产要闻

信达·繁花里 | 老照片征集活动 温情启幕

旅游要闻

走!去荣成看大天鹅 共赴一场浪漫之约

数码要闻

海信电视U7S Pro评测:高阶家庭影院,RGB-Mini LED带来"视觉暴击"

教育要闻

五年级简算:33×35×37×39,有点难

无障碍浏览 进入关怀版