网易首页 > 网易号 > 正文 申请入驻

代码碾压一切!OpenAI神秘模型o3-alpha一夜刷屏,却遭41岁大神绝地反杀

0
分享至

新智元报道

编辑:定慧 好困

【新智元导读】OpenAI的神秘模型o3-alpha意外曝光,其强大的代码能力碾压众多AI。该模型疑似在东京AtCoder世界编程大赛2025中夺得亚军,最终不敌人类选手Psyho。

OpenAI果然藏了一手。

昨天夜里,一个名为「o3-alpha-responses-2025-07-17」的神秘模型被爆出。

网友们疯狂测试后,得出一致结论,这个模型强得离谱

WebDev Arena网页的源码

甚至有网友在实测后,大赞o3-alpha,将它称为目前「最佳编码和物理模型」

每次新模型出来后,小球的碰撞实验已经成为一种「传统」,这次「o3 Alpha」不仅完美的展示了物理碰撞,并且还能随时改变小球的大小。

在WebDev Arena上,「o3-alpha-responses-2025-07-17」以「Anonymous-Chatbot」的名称出现。

根据网友的猜测,它很有可能是在编码能力上得到了「史诗级」加强的o3升级版。

毕竟目前在WebDev Arena Leaderboard中,OpenAI只有一款专门编程的GPT-4.1-2025-04-14上榜。

不过,目前想要捕捉到这个匿名模型,需要在竞技场中多次尝试(我们在WebDev Arena多次尝试未能捕捉到这个匿名模型)。

Peter Gostev在竞技场中使用如下提示词「幸运的」捕捉到了o3-alpha,感兴趣的话你也可以试试。

还有网友爆出,OpenAI可能「派出」了这个模型去参加世界最难编程竞赛:东京举行的AtCoder世界巡回赛2025决赛。(需要OpenAI确定)

OpenAI的这个o3-alpha模型最终获得了第二,第一名是人类Psyho。

虽然o3-alpha可能已经被OpenAI下架,但网友们还是保留了丰富的实测案例。

从实测来看,「o3-alpha」在前端代码能力达到了领先水平——远胜于Claude Sonnet、o3、Gemini 2.5 Pro。

实测效果惊人

网友Peter Gostev发现该模型后,使用提示词「要求模型使用Three.js创建一个程序生成的星球」。

测试后,他很难相信,但是依然认为o3-alpha的编码水平达到一个全新的高度。

以下是完整的测试对比视频,可以看出o3-alpha的效果整体最好。

OpenAI模型在前端能力方面一直表现平平,Peter表示这次的模型似乎终于在这方面超越了其他所有模型。

有网友用经典的「骑自行车的鹈鹕」进行了测试,表示o3 alpha完全打败了o3 pro。

以下是o3 alpha生成的动画版的效果,你觉得这个效果如何。

o3-alpha还能一句话就生成的「我的世界」模拟器。

超mini版GTA的复刻,o3-alpha也能一句话搞定。

还能一键生成高度可定制的SVG应用。

有网友用o3-alpha造了一个魔方模拟器,甚至可以输入「魔方算法」来直接操控,确实太强大了。

仅仅靠着文字提示就可以实现。

网友还用o3-alpha创建了一个太空入侵模拟游戏,再次体现了OpenAI这个新模型的前端代码能力。

网友Mahi用只有2-3个单词的提示对比了o3-alpha和Gemini 2.5 Pro。

o3-alpha生成的网页效果要好于Gemini 2.5 Pro。

除了以上神秘的o3-alpha模型和OpenAI派出AI选手参与顶尖编程大赛外。

刚刚发布的ChatGPT Agent也实力惊人。

OpenAI的研究院Zhiqing Sun,表示ChatGPT Agent通过了ARC-AGI-3的第一关。

41岁大神击败AI

守住人类最后防线

o3-alpha被爆出的时机非常的「巧合」。

因为前两天在东京举行的AtCoder世界巡回赛2025决赛中,同样是OpenAI的一款匿名模型,获得了第二名。

根据网友爆料,这个模型很大概率就是o3-alpha。

我们推测OpenAI本来应该是打算「一鸣惊人」,但有一个名叫Psyho的人类戏剧性的打败了AI获得了第一名。

是的,这位来自波兰的编程大神——Przemysław Dębiak(aka Psyho),用一场惊心动魄的胜利告诉世界:人类,还没输!

地点是东京,AtCoder世界编程大赛的决赛现场。

空气中弥漫着紧张的气息,因为这次的对手非同寻常——一个由OpenAI亲自下场派出的AI模型。

在这里,人类和AI选手需要在10小时内,不断优化墙壁的设置以及机器人的分组,让它们能够在30x30的网格内以最少的步数回家。

从华沙一路飞到东京的「Psyho」,本来就已经身心俱疲。

而这场堪称马拉松的比赛,更是让他愈发感觉自己已经濒临极限。

「我累到爆炸,真的,有好几次我都想直接放弃算了,」他回忆道。

三天里,「Psyho」只睡了10个小时。

而他的对手,那个「不知疲倦」的AI,早已能够在诸如算法实现、代码优化等纯粹的工程任务中,凭借着更快地速度碾压人类。

不过,这次的比赛,是人类的主场。

原因在于,比赛时间越长,就越考验从零到一的创造性,AI就会越吃力。

  • 比赛一开始,AI很快就以绝对优势实现领先;

  • 直到第7小时,一步步稳扎稳打的大神「Psyho」才实现反超,而AI却陷入了困境;

  • 第8小时,AI突然发现了一个全新的思路,并一举超越了「Psyho」——新方法不仅实现了更好的墙体设计,还带来了更好的资源调度;

  • 即将进入倒计时阶段,剧情再次反转。「Psyho」灵感乍现,对AI完成了绝地反杀!虽然AI还在不断调整,但差距却越来越大。

最终,这个41岁的男人,成功在长达10小时鏖战的最后关头,凭借着血肉之躯和人类独有的创造力,战胜了冰冷的机器!

对于这场胜利,奥特曼亲自发文祝贺道:「干得好,Psyho。」

与此同时,OpenAI官方也发文表示:「我们的模型拿了第二。恭喜冠军,这次你成功地阻击了我们!」

更有趣的是,比赛的组织者都惊呆了。

他们坦言:「我们本来就觉得人类会赢,但说实话,我们被AI能拿到第二名给吓到了!」

他们一针见血地指出:「在代码优化的硬实力上,AI已经超越了人类,但它唯独缺少了人类那神来之笔的创造力。」

没错!「Psyho」赢得不靠蛮力,而是靠一个「完全不同的解题思路」。

当所有人都和AI在同一条赛道上狂奔时,他另辟蹊径,找到了AI视野之外的「最优解」。

而他用的武器也很简单,就是最常规的编程软件,连AI辅助工具都没用。

当然,这只是一场战役的胜利,远非「人·机」大战的结束。

从IBM「深蓝」到谷歌「AlphaGo」,AI战胜人类的传奇早已上演。奥特曼也预言,AI很快就会在编程竞赛中全面超越人类。

但至少在东京的那个不眠之夜,一位名叫「Psyho」的孤胆英雄,为人类赢得了一丝喘息。

参考资料:

https://x.com/chetaslua/status/1946154816691966227

https://x.com/chetaslua/status/1946165458048291091

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
深圳市委书记靳磊到华为、比亚迪等走访调研

深圳市委书记靳磊到华为、比亚迪等走访调研

界面新闻
2026-04-28 07:33:45
特朗普:伊朗刚告知我们,他们已处于“崩溃状态”,希望美国尽快开放海峡!伊朗:已绝对控制霍尔木兹,通过须缴费、用波斯语通讯

特朗普:伊朗刚告知我们,他们已处于“崩溃状态”,希望美国尽快开放海峡!伊朗:已绝对控制霍尔木兹,通过须缴费、用波斯语通讯

每日经济新闻
2026-04-28 22:58:06
4月底好运反扑!这3个生肖霉运清零,轻松上阵,财运主动找上门

4月底好运反扑!这3个生肖霉运清零,轻松上阵,财运主动找上门

毅谈生肖
2026-04-25 10:50:13
李斌现场演示做饭!蔚来全新车型预售15.98万起

李斌现场演示做饭!蔚来全新车型预售15.98万起

汽车工程师
2026-04-28 22:04:44
内娱疯批赛道挤爆了?这次,我劝你把目光从肖战的脸蛋上移开

内娱疯批赛道挤爆了?这次,我劝你把目光从肖战的脸蛋上移开

小椰的奶奶
2026-04-26 12:23:22
小米17T真机外观曝光:带徕卡标的天玑旗舰!

小米17T真机外观曝光:带徕卡标的天玑旗舰!

快科技
2026-04-28 23:39:13
入选住建部“美好家园案例集”成都高新这个小区凭啥出圈?

入选住建部“美好家园案例集”成都高新这个小区凭啥出圈?

红星新闻
2026-04-28 21:53:08
749局退休人员口述:外星人真实存在,我在秦岭深处亲眼见过一次

749局退休人员口述:外星人真实存在,我在秦岭深处亲眼见过一次

千秋文化
2026-04-09 15:56:25
徐昕战广东13+11,打脸杜锋 广州爆冷以下克上 崔永熙2分只打半场

徐昕战广东13+11,打脸杜锋 广州爆冷以下克上 崔永熙2分只打半场

替补席看球
2026-04-28 21:39:02
离婚后只字不提李琳!输给了经超后才发现,原来他们不是同类人

离婚后只字不提李琳!输给了经超后才发现,原来他们不是同类人

小兰聊历史
2026-04-27 15:10:56
是巧合吗?苏林是兴安春桥人,春桥的董事长叫苏勇,被传是亲兄弟

是巧合吗?苏林是兴安春桥人,春桥的董事长叫苏勇,被传是亲兄弟

纵拥千千晚星
2026-04-16 12:47:27
抢走王朔,睡遍京圈,定居国外9年的“坏种”徐静蕾,成最终赢家

抢走王朔,睡遍京圈,定居国外9年的“坏种”徐静蕾,成最终赢家

日落于西
2026-04-15 16:04:57
A股:明天,4月29日,大家要坐稳扶好了,不出意外,很可能这样走

A股:明天,4月29日,大家要坐稳扶好了,不出意外,很可能这样走

云鹏叙事
2026-04-28 15:26:29
断崖式下跌!中国人突然不爱喝酒了?真相太扎心!

断崖式下跌!中国人突然不爱喝酒了?真相太扎心!

达文西看世界
2026-01-18 20:56:11
九年神雕情缘碎一地!陈晓陈妍希离婚后互撕,多年隐忍终爆发!

九年神雕情缘碎一地!陈晓陈妍希离婚后互撕,多年隐忍终爆发!

別甾虛僞
2026-04-27 23:02:10
山姆轮胎的隐藏福利:4项服务别浪费

山姆轮胎的隐藏福利:4项服务别浪费

摸鱼算法
2026-04-28 11:51:06
偶遇甲骨文创始人一家四口,朱可人穿超短裙腿白又嫩,孩子拽走光

偶遇甲骨文创始人一家四口,朱可人穿超短裙腿白又嫩,孩子拽走光

嫹笔牂牂
2026-04-28 07:25:44
王思聪包养岛国外卖媛!文艺女星怀二胎有问题!

王思聪包养岛国外卖媛!文艺女星怀二胎有问题!

八卦疯叔
2026-04-28 13:03:35
钱再多有什么用?因嘴唇发紫去检查心脏的陆毅,给所有人提了个醒

钱再多有什么用?因嘴唇发紫去检查心脏的陆毅,给所有人提了个醒

青杉依旧啊啊
2026-04-27 17:45:13
爱吃猪脚饭的注意了!深圳43岁男子被紧急送医抢救!医生:再晚来一步命就没了

爱吃猪脚饭的注意了!深圳43岁男子被紧急送医抢救!医生:再晚来一步命就没了

环球网资讯
2026-04-27 13:18:16
2026-04-29 02:20:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15086文章数 66818关注度
往期回顾 全部

科技要闻

10亿周活目标落空!传OpenAI爆发内部分歧

头条要闻

19岁中国女孩被困缅甸 交20万赎金园区仍未放人

头条要闻

19岁中国女孩被困缅甸 交20万赎金园区仍未放人

体育要闻

魔术黑八活塞,一步之遥?!

娱乐要闻

蔡卓妍官宣结婚,老公比她小10岁

财经要闻

中央政治局会议定调,八大看点速览!

汽车要闻

拒绝疯狂套娃!现代艾尼氪金星长在未来审美点上

态度原创

家居
数码
游戏
房产
公开课

家居要闻

江景风格 流动的秩序

数码要闻

机械革命苍龙16 / 18 Pro游戏本RTX 5070 12GB款开启预约

这不爽翻了?曝PS6或能稳稳运行60帧+光追的游戏画面

房产要闻

红利爆发!海南,冲到全国人口增量第4省!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版