网易首页 > 网易号 > 正文 申请入驻

OpenAI以为GPT-5搞出了数学大新闻,结果…哈萨比斯都觉得尴尬

0
分享至

时令 发自 凹非寺
量子位 | 公众号 QbitAI

太尴尬了。

就在周末,GPT-5又双叒带来了数学方面的新突破,一道难题被宣称解决…

然鹅……很快就被发现是OpenAI的“营销过度”,小题大作,根本算不上什么突破。

友商大咖们也都不装了。

DeepMind CEO哈萨比斯贴脸热嘲得很直接:太尴尬了吧。

目前仍然供职于Meta的LeCun,吐起别人槽点时天赋全开——



目前:OpenAI方面已经把“大新闻”删除了。



GPT-5又搞出数学“大突破”

这一切的一切,还得从OpenAI研究员Mark Sellke在X上的一条推文说起。

Mark高调宣布GPT-5在数学上取得了重大突破。他们借助GPT-5成功找到了10个著名的厄尔多斯数学难题(Erdős problems)的解法,还兴奋表示到:

  • 经过数千次GPT-5的查询,我们发现了10个原本还处于“未解状态”的厄尔多斯难题的解答,分别是223、339、494、515、621、822、883(第二部分)、903、1043、1079。
  • 此外,还有11个难题取得了重要的部分进展,并更新到了官网上。甚至在第827题上,我们还发现厄尔多斯本人原始论文里存在错误,这个错误由Martínez和Roldán-Pensado两位学者后来进行了修正。看来,未来的科学研究真的要变得有趣了!



甚至连OpenAI高管Kevin Weil也在X上惊呼:

  • GPT-5 找到了10个此前未解决的Erdős问题的解答,并在另外11个问题上取得进展。

随后,OpenAI另一名知名研究员Sebastien Bubeck也兴奋地转发并补充道:

  • AI驱动的科学加速时代正式开启了!两位研究员仅靠一个周末、借助GPT-5成功解开10个厄尔多斯难题。

消息一出,全网震动,一时间不少人误以为GPT-5独立破解了这些困扰数学界数十年的难题。

但事情真这么简单吗?

哈萨比斯Lecun贴脸热嘲

这场欢呼很快被谷歌DeepMind CEO哈萨比斯狠狠泼了一盆冷水。哈萨比斯直接在Bubeck推文底下回复道:

  • 这真是尴尬啊!



咦?不是重大数学突破吗?咋还尴尬上了呢?

这时,哈萨比斯冷静地引导大家去查看Thomas Bloom发布的一则关键说明。

这里值得一提的是,Thomas正是OpenAI引用的那个erdosProblems.com网站的创始人兼维护人。

Thomas澄清到:

  • 作为erdosproblems .com网站的拥有者和维护者,我得声明:OpenAI的说法明显夸大了事实。GPT-5只是通过网络搜索,找到了早已存在的论文,这些论文中早就解答了这些问题,只是我个人不知道而已。网站上的“未解”状态只是说明我尚未发现相关的论文,而不代表全世界数学界没有解决方案。



简单来说,就是GPT-5实际上并没有独立地破解任何厄尔多斯难题。它所做的仅仅是比人类网站管理员更迅速地在互联网上检索到了已知的答案,而这些答案其实早已存在。

事后,Bubeck删除了之前的推文:

  • 我删除了之前的推文,我显然不是有意误导任何人,我原本以为自己的表达很清楚,对此感到抱歉。我们仅仅是发现了已经发表在文献中的解法,仅此而已。我认为这依然是一种巨大的进步,因为我知道检索文献有多么困难。



LeCun也在下面回复:

  • 这次他们被自己吹嘘GPT的言论坑惨了.



(梗注:原文为“Hoisted by their own GPTards”,源自英文俗语 “hoisted by their own petard”,意指“搬起石头砸自己的脚”,这里被LeCun改为GPTards,以讽刺那些盲目吹捧GPT的人。)

但话说回来,这次的乌龙事件也不是平白无故就发生的……

毕竟在解数学题方面,GPT-5的过往战绩确实有迹可循。

GPT-5有点数学能力在身上

在国庆期间,陶哲轩就用GPT-5解决数学难题:

  • 序列lcm(1,2,…,n)是否是高度丰数的一个子集?

天才甚至直言不讳地表示:

  • 如果没有AI帮忙,完成同样任务就需要花费数小时(主要是手动编写代码和调试)。

甚至难如量子复杂性理论,它也能在不到半小时内给出关键证明思路。

就在上个月,GPT-5还在数学教授引导下,首次将定性的第四矩定理扩展为带有显式收敛率的定量形式。



这一桩桩,一件件,GPT-5的能力确实不容小觑。

而此次乌龙事件的关键原因就在于:宣传的发言模棱两可,让人们误以为GPT-5真的自主解决了非常难的数学题。

更糟糕的是,这种误导性的说法还被自家人进一步夸大宣传,才造成了如此尴尬的局面。

当然,也有其他网友杀人诛心,主要还是GPT-5太拉胯了——越差劲越想证明自己优秀。



还有人拿出了卡帕西最新火爆的访谈论断:



总而言之,AI带来轰动大进展的节奏似乎正在过去,或者说大众已经开始对AI突破脱敏了,如果不是真正的大突破大进展,总想搞个大新闻,还是容易出偏差的…

参考链接:
[1]https://the-decoder.com/leading-openai-researcher-announced-a-gpt-5-math-breakthrough-that-never-happened/
[2]https://x.com/dotey/status/1979640848041071097?s=46&t=fzKJptGJMpr-yj3MUXd6HA
[3]https://x.com/demishassabis/status/1979417877590774063
https://x.com/ylecun/status/1979595060447416733

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
完胜!山东女排3-1力克江苏,攻手多点开花,吴梦洁35分独木难支

完胜!山东女排3-1力克江苏,攻手多点开花,吴梦洁35分独木难支

骑马寺的少年
2026-01-31 20:00:19
比哥哥谢振轩还帅,没想到谢霆锋小儿子谢振南才是个“明星脸”

比哥哥谢振轩还帅,没想到谢霆锋小儿子谢振南才是个“明星脸”

东方不败然多多
2026-02-01 02:06:26
亡国灭种,断子绝孙?欧洲反华先锋立陶宛,正在从地图上消失

亡国灭种,断子绝孙?欧洲反华先锋立陶宛,正在从地图上消失

安珈使者啊
2026-01-15 14:32:17
心脏决定寿命!8道养心神菜常吃,护心比补药实在,做法简单

心脏决定寿命!8道养心神菜常吃,护心比补药实在,做法简单

美食店主
2026-01-30 00:19:26
俄不提供技术转让,中国或不再购买俄发动机,吸取CR929教训

俄不提供技术转让,中国或不再购买俄发动机,吸取CR929教训

真正能保护你的
2026-01-31 23:06:21
水贝黄金店门口排长队,宝妈们押上全部积蓄,却连本金都拿不回来

水贝黄金店门口排长队,宝妈们押上全部积蓄,却连本金都拿不回来

王二哥老搞笑
2026-01-31 01:01:04
霍震霆没有想到,离过年不到一月,77岁的弟弟霍震寰给霍家争光了

霍震霆没有想到,离过年不到一月,77岁的弟弟霍震寰给霍家争光了

寒士之言本尊
2026-01-30 15:08:40
火箭怎么交易?有望2换1交易得到公牛悍将 亚当斯或成筹码

火箭怎么交易?有望2换1交易得到公牛悍将 亚当斯或成筹码

惊奇侃球
2026-01-31 21:28:41
澳大利亚态度大变!审查结果出炉,通告全球,强逼中方同意卖港口

澳大利亚态度大变!审查结果出炉,通告全球,强逼中方同意卖港口

小陆搞笑日常
2026-02-01 01:40:24
国乒坏消息!一哥遭遇严峻挑战,功勋陪练退役对王楚钦能力讲实话

国乒坏消息!一哥遭遇严峻挑战,功勋陪练退役对王楚钦能力讲实话

三十年莱斯特城球迷
2026-01-31 23:50:45
纳达尔重返墨尔本!展望澳网决赛:两场恶战后阿卡比德约恢复更快

纳达尔重返墨尔本!展望澳网决赛:两场恶战后阿卡比德约恢复更快

全景体育V
2026-01-31 10:02:46
王楚钦被表白了?女神身份曝光,18岁,长相甜美,孙颖莎一句话耐人寻味

王楚钦被表白了?女神身份曝光,18岁,长相甜美,孙颖莎一句话耐人寻味

乒乓网国球汇
2026-01-31 00:11:25
1980年失踪已久的彭加木“现身”美国,华主席严令:不惜一切找他

1980年失踪已久的彭加木“现身”美国,华主席严令:不惜一切找他

年代回忆
2026-01-31 20:15:04
醒醒吧,伊朗从来不是我们的“好朋友”

醒醒吧,伊朗从来不是我们的“好朋友”

苏格拉高
2026-01-11 07:42:04
还是做好准备吧,一美元只能兑换5.5元人民币时代,或许终会到来

还是做好准备吧,一美元只能兑换5.5元人民币时代,或许终会到来

娱乐八卦木木子
2026-01-31 10:52:14
58岁那英改走颜值路线?过度医美变化大到认不出,这是要闹哪出?

58岁那英改走颜值路线?过度医美变化大到认不出,这是要闹哪出?

锋哥与八卦哥
2026-01-25 13:26:51
炸锅!2026高考时间大调整!千万考生受影响

炸锅!2026高考时间大调整!千万考生受影响

老特有话说
2026-01-30 23:06:47
终结质疑!艾顿28+13统治内线,正负值+30打爆奇才

终结质疑!艾顿28+13统治内线,正负值+30打爆奇才

大眼瞄世界
2026-01-31 23:22:09
江苏南京一校花,身高162CM,体重47公斤,五官精致到无懈可击

江苏南京一校花,身高162CM,体重47公斤,五官精致到无懈可击

奇思妙想生活家
2026-01-31 14:53:58
广西超级工程,惠及1400万人,北部湾发展的重大转折点

广西超级工程,惠及1400万人,北部湾发展的重大转折点

王晓爱体彩
2026-01-31 18:36:37
2026-02-01 03:04:49
量子位 incentive-icons
量子位
追踪人工智能动态
12090文章数 176369关注度
往期回顾 全部

科技要闻

SpaceX申请部署百万卫星 打造太空数据中心

头条要闻

新年"打虎"不停歇 三天落马两个正部级

头条要闻

新年"打虎"不停歇 三天落马两个正部级

体育要闻

新时代得分王!东皇37+三双刷7纪录怒吼释放

娱乐要闻

李维嘉、吴昕、汪涵现身魏文彬追悼会

财经要闻

白银,暴跌!黄金,40年最大跌幅!

汽车要闻

新款宾利欧陆GT S/GTC S官图发布 V8混动加持

态度原创

数码
房产
教育
手机
本地

数码要闻

苹果发布2026新春影片《碰见你》:iPhone 17 Pro镜头下的温暖奇遇

房产要闻

藏不住的小城大事,海澄新城执掌自贸港风口,进阶兑现美好生活新篇

教育要闻

一年一度“花式”期末考,成都的小学今年做了哪些探索?又有哪些特别?

手机要闻

高通最强芯!骁龙8E5鸡血版来了:三星全球首发

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

无障碍浏览 进入关怀版