网易首页 > 网易号 > 正文 申请入驻

陶哲轩盖章!GPT-5.2杀疯了,我们终将沦为「硅基帕鲁」

0
分享至


新智元报道

编辑:倾倾

【新智元导读】币圈玩家Neel Somani带着GPT-5.2暴力踹开了数学圣殿的大门。陶哲轩亲自盖章确认,但这并非「AI成神」,而是一场成功率仅1%的算力挖矿。当数学证明变成工业流水线,我们失去的不仅是天才,还有对真理的最后一点敬畏。

总统先生,数学界的第四座塔倒了!

昨晚,这张总统耳语的Meme图,在美国学术圈引发了核爆级的讨论。


Paul Erdos留下的第281号难题,被一个「门外汉」用AI暴力破解了。


人类最严肃的智力高地,沦为一张Meme图的注脚。旧世界的规则,崩塌了。

第一现场:被GPT-5.2攻破的百年难题

这不仅是破解,更是「入侵」。

一个手持H100算力集群的「野蛮人」,一脚踹开了象牙塔的大门。

光看Neel Somani的履历表,就足以让传统数学家感到信仰崩塌:

  • 前Citadel量化研究员(以高频交易著称的华尔街巨头);

  • 前Eclipse创始人(Solana生态的高性能区块链项目);

  • 现役AI与区块链交叉领域的探索者。

他来自Eclipse,混迹于加密货币与区块链的丛林。在他的世界里,算力即权力,共识即真理。


2026年1月,他带着硅谷的算力崇拜,横冲直撞地闯入了数学界——通过投资或协作的方式,推动了ErdosProblems.com平台,把Paul Erdős留下的的数学悬赏,变成了一场公开的「猎杀游戏」。

他的武器不是天才的大脑,而是GPT-5.2Pro。

Somani的逻辑简单粗暴:既然数学证明可以被形式化,那它本质上和比特币挖矿没有任何区别。

只要显卡够多,只要AI试错速度够快,我就能通过穷举撞开真理的大门。


结果呢?他赌赢了。

就在几天前,作为这个收割月的重磅,GPT-5.2成功攻克了Erdős Problem#281。

Erdős Problem#281,源自1980年Erdős和Graham的工作,焦点是「覆盖系统」的极限行为:

给定一个无限递增的正整数序列n₁

这题卡了46年,牵扯到遍历理论、profinite整数上的Haar测度等硬核工具。

Somani的GPT-5.2Pro用遍历理论+点态遍历定理+Dini定理给出了证明,陶哲轩评价这个思路与已知的Rogers/Davenport-Erdős证明相当不同。

X上的网友也将其誉为「第一台真正达到博士级别的AI」。


这已经是2026年1月第三个被GPT-5.2Pro击落的Erdős问题了。

从圣诞节到现在,ErdosProblems.com上已有15个问题从「open」转为「solved」,其中11个明确标注AI参与。

陶哲轩甚至开了个wiki页面,专门记录「AI对Erdős问题的贡献」。


https://github.com/teorth/erdosproblems/wiki/AI-contributions-to-Erd%C5%91s-problems?referrer=grok.com

数学界从「会不会来」直接跳到「来得有多快、会扫荡多少」的恐慌阶段。

Somani用行动告诉世界:不需要理解数学之美,只要电费管够、GPU跑满,就能收割数学界的「圣杯」。

但是,在这一片欢呼声中,如果你去翻看Somani公布的后台数据,就能发现这场「胜利」的底色,其实是一片尸横遍野的荒原。

数据库尸横遍野

Neel Somani赢了,但赢得非常难看。

登陆ErdosProblems.com,关掉「只显示成功」的滤镜,你会看到,后台躺着成千上万具「尸体」。

根据数据库后台的真实统计,GPT-5.2 Pro对这类问题的一次性通过率,只有可怜的1%到2%。

这意味着,为了那个登上头条的完美证明,AI在后台进行了成百上千次的胡言乱语。

它会捏造不存在的引理,陷入逻辑死循环,甚至把数学证明写成一首打油诗。

如果只有一个GPT-5.2,这堆垃圾早就把数学界淹没了。

所以,在这场游戏中,真正的MVP根本不是GPT,而是一个被大众忽略的冷酷工具——「Aristotle」。

Aristotle其实是Harmonic公司开发的专用工具,它把GPT输出的自然语言(经常是胡说八道)自动翻译并强制转换成Lean形式语言,然后交给Lean内核做严格验证。


相当于给AI配了一个「无限试错+零容忍bug」的自动编译+单元测试系统。

没有它,GPT的1%到2%成功率根本无法浮出水面。

现在的AI解题流程越来越标准化。GPT疯狂猜→Aristotle强制形式化+杀垃圾→Lean验证通过→人类再读。

一次,两次,一万次。直到那个概率极低的「幸存者」出现,Aristotle才会放行。

大众以为的「神迹」,其实是统计学必然。

陶哲轩在Mastodon上一针见血。他拒绝使用「Intelligence(智能)」,而是发明了一个新词:「Artificial General Cleverness(人工通用小聪明)」。


注意这个词:小聪明。

就像是一个从来不听课、也没看懂课本的差生,靠着疯狂的作弊和试错,硬生生蒙对了一道奥数题。

而这,正是NeelSomani想要的。对于「挖矿」的人来说,只要能挖出金子,谁在乎矿机懂不懂地质学?

最后的防线:人类只负责「提问」,不再负责「解答」

那么,人类数学家要失业了吗?

未必。但他们的工种,将发生一次彻底的变异。

在Neel Somani开启的这个暴力版本里,数学研究不再是属于艺术家的吟唱,而变成了属于建筑师的图纸。


以前,数学家需要亲自下矿井,一镐一镐地去挖掘真理。现在,GPT-5.2接过了镐头。

人类唯一剩下的特权,也是最后的防线,叫做「定义问题」。

你需要告诉那个疯狂的AI矿工:去哪里挖?挖什么?以及最重要的——为什么值得挖?

这听起来像是升职了,从「矿工」变成了「包工头」。但这背后藏着一个巨大的隐忧:我们正在失去对「为什么」的掌控。

当GPT-5.2扔给你一个长达几千行的Lean证明代码时,Aristotle会告诉你「这是对的」,但你可能根本读不懂中间发生了什么。

表面上,人类从「矿工」升职成了「包工头」。实际上,我们正在丧失对「为什么」的解释权。

数学曾是人类理解宇宙的语言,追求的是极致的优雅和简洁。

而在AI的统治下,数学可能变成一堆虽然正确、但毫无美感的、乱七八糟的「逻辑堆砌物」。


这或许就是陶哲轩所说的「小聪明」的代价。我们用算力换来了效率,却把理解这件事,外包给了机器。

当然,陶哲轩也反复强调,这些被AI快速解决的Erdős问题多属于「最低垂的果实」——可以用标准工具、只是之前没人费心去组合的那一类。

真正最硬核的几十个(比如需要全新思想或新对象的)目前AI还远没有触及。

但问题在于:一旦算力×模型继续指数上升,昨天的「最硬核」可能就是明天的「最低垂果实」。这不是结束,而是加速。

那张500美元的支票,已经被Neel Somani的算法兑现了。

这笔钱很少,但代价昂贵。它兑现了天才的祛魅,瓦解了数学最后的神圣感。

真理不再是上帝的耳语,它只是服务器里风扇狂转后,吐出的一行代码。

从此,决定真理的不再是智商的高低,而是显卡的多少。

醒醒吧,大航海时代结束,工业革命开始了。

当年蒸汽机让肌肉贬值,电力让距离贬值,今天的GPU集群正在让「数学直觉的稀缺性」贬值。

下一个被收割的,可能不是Erdős题,而是某个价值5000万美元的工业优化问题、或者卡了二十年的药物分子设计关键引理。

数学的象牙塔倒了——就像那张总统耳语的Meme图,下一个可能是你的行业。

参考资料:

https://the-decoder.com/gpt-5-2-pro-solves-another-erdos-problem-while-a-new-database-reveals-most-attempts-still-fail/

https://www.erdosproblems.com/forum/thread/281

https://x.com/neelsomani/status/2012695714187325745

https://mathstodon.xyz/@tao/115911902186528812

https://www.erdosproblems.com/forum/thread/281#post-3327


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
Manus两名高管禁止离境? 外交部回应

Manus两名高管禁止离境? 外交部回应

每日经济新闻
2026-03-26 16:36:02
张雪峰6年前已离婚,独女张姩菡只能分16.5%遗产,现任妻子占大头

张雪峰6年前已离婚,独女张姩菡只能分16.5%遗产,现任妻子占大头

枫红染山径
2026-03-25 16:56:22
沙特国际电力和水务公司董事长预测中东局势将影响全球能源转型速度

沙特国际电力和水务公司董事长预测中东局势将影响全球能源转型速度

界面新闻
2026-03-26 16:51:04
末代港督彭定康夫妇,带3个漂亮女儿回英国,29年过去今过得咋样

末代港督彭定康夫妇,带3个漂亮女儿回英国,29年过去今过得咋样

揽星河的笔记
2026-03-26 00:26:09
315曝光10个最毒食黑名单!第8个你几乎天天在吃,看完脊背发凉

315曝光10个最毒食黑名单!第8个你几乎天天在吃,看完脊背发凉

现代小青青慕慕
2026-03-24 08:13:54
世预赛欧洲区开打!明晨将有8队出局 8队进决赛 意大利生死战

世预赛欧洲区开打!明晨将有8队出局 8队进决赛 意大利生死战

叶青足球世界
2026-03-26 08:47:10
2020年女子当众扇儿子耳光,儿子直接跳楼,如今女子已自杀身亡

2020年女子当众扇儿子耳光,儿子直接跳楼,如今女子已自杀身亡

观察鉴娱
2026-03-18 09:09:10
华为、商汤等873家机构遭AI顶会“封杀”,中国学界怒了

华为、商汤等873家机构遭AI顶会“封杀”,中国学界怒了

智东西
2026-03-26 20:49:23
NeurIPS拒收中国论文,计算机学会宣布抵制并警告将其移出A类目录

NeurIPS拒收中国论文,计算机学会宣布抵制并警告将其移出A类目录

DeepTech深科技
2026-03-25 22:49:10
东契奇创4大纪录仍无缘日最佳,抱歉约基奇打出前无古人的数据

东契奇创4大纪录仍无缘日最佳,抱歉约基奇打出前无古人的数据

毒舌NBA
2026-03-26 13:11:59
中国移动官宣!4月30日起全国统一执行,事关所有手机号

中国移动官宣!4月30日起全国统一执行,事关所有手机号

Thurman在昆明
2026-03-26 13:35:46
偶遇沈月拍戏,个子不高的情况下胸大真的太吃亏了!

偶遇沈月拍戏,个子不高的情况下胸大真的太吃亏了!

TVB的四小花
2026-03-24 12:22:03
最快护士张水华辞职后,靠比赛拿名次、一年广告费能拿200-400万

最快护士张水华辞职后,靠比赛拿名次、一年广告费能拿200-400万

魔都姐姐杂谈
2026-03-24 20:50:19
二百多名军官被枪毙、撤职、处分,长津湖战役中失职的志愿军88师

二百多名军官被枪毙、撤职、处分,长津湖战役中失职的志愿军88师

云霄纪史观
2026-03-25 12:16:14
惊呆了!网传某妇产医院一少妇哭求医生,改她儿子的血型鉴定书…

惊呆了!网传某妇产医院一少妇哭求医生,改她儿子的血型鉴定书…

火山詩话
2026-03-26 11:40:00
中国电信:全面转向token经营!

中国电信:全面转向token经营!

最通信
2026-03-25 20:45:14
俄罗斯宣传三天攻占爱沙尼亚!炮制公投,又是特别军事行动?

俄罗斯宣传三天攻占爱沙尼亚!炮制公投,又是特别军事行动?

项鹏飞
2026-03-24 20:28:43
伊朗战争还将持续多久?据传特朗普希望4-6周内终结战事

伊朗战争还将持续多久?据传特朗普希望4-6周内终结战事

财联社
2026-03-26 18:29:05
中方坚决扣留船只,美方及时干预 取消中企投标资格,巴拿马难挽

中方坚决扣留船只,美方及时干预 取消中企投标资格,巴拿马难挽

南宗历史
2026-03-25 16:04:15
恭喜!“CBA第一恶人”许钟豪,正式上任主教练,曾帮广厦夺冠

恭喜!“CBA第一恶人”许钟豪,正式上任主教练,曾帮广厦夺冠

吴朑爱游泳
2026-03-26 23:22:01
2026-03-27 00:43:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14821文章数 66721关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

本地
旅游
房产
公开课
军事航空

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

旅游要闻

老外为羊拿铁扎堆魔都街头 法国游客花式夸上海

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版