网易首页 > 网易号 > 正文 申请入驻

陶哲轩惊叹!数学奇点初现,AI首次给出人类无法企及的原创证明

0
分享至

  

  新智元报道

  编辑:KingHZ 好困

  【新智元导读】数学奇点初现!Gemini攻克全新数学定理,斯坦福大牛惊呼「想出来能吹一辈子」;陶哲轩预言数学家+AI共生未来;Grok发现黎曼猜想新的隐蔽通道……

  汉语是人类语言的一种。

  比特是计算机的语言。

  而数学则是宇宙的语言。

  正如「现代物理学之父」伽利略所言:「要理解宇宙,你必须理解它所书写的语言——数学的语言。」

  

  要测试人类是否实现了超级人工智能ASI,除了数学,还有谁?

  AI在数学上的原创能力是通向ASI(甚至理解物理本质)的必经之路,是核心中的核心。

  如果说AI斩获国际奥数IMO金牌,你可能对ASI还有所怀疑——

  毕竟,IMO所涉及的知识,还是高中数学;

  毕竟,这类问题人类必有答案;

  毕竟,可能只靠记忆力或许也能拿下IMO金牌 ……

  但现在不一样了。

  这不是在瞎吹,是菲尔兹奖得主陶哲轩(Terence Tao)、斯坦福教授兼Ravi Vakil亲自盖章。

  谷歌DeepMind的一个团队,用Gemini证明了一个代数几何领域的全新定理——

  注意,是全新的!

  不是像以前那样把人类已知的东西重写一遍,而是连斯坦福的大牛Ravi Vakil教授都惊呼:

  这种优雅的洞察力,如果是我自己想出来的,我会吹一辈子。

  

  对那些仍对AI智能存疑的人来说,这样的成果无疑具有震撼力。

  而这还不是唯一的突破。

  AI工具已经在数学领域遍地开花。AI已正式叩响思想创造之门!

  浩荡征程,由此启程。

  陶哲轩预言:AI或独自攻克15-2%的埃尔德什问题。

  与此同时,马斯克的Grok 4.20也不装了,被曝在5分钟内「秒杀」了困扰教授们许久的Bellman函数难题。

  这意味着什么?

  我们大胆预测一下:2026年将是「ASI元年」。人类负责定义问题,AI负责填补证明的空白。

  警报:数学界的「奥本海默时刻」到了?

  刚刚,Gemini 证明了一个代数几何领域的新定理。

  

  传送门:https://arxiv.org/abs/2601.07222

  数学家Ravi Vakil等四人,发表的这篇论文标题为:THE MOTIVIC CLASS OF THE SPACE OF GENUS 0 MAPS TO THE FLAG VARIETY「旗空间上的亏格零映射的Motivic类」。

  这个问题长期以来很难下手,而新论文的部分证明推广了已有框架下的相关论证方法。

  在一个足够强、又可计算的框架里(Grothendieck环/动机类)给了非常干净的闭式答案,并且还能导出可直接检验的有限域点数公式。

  但论文明晃晃写道:

  本论文核心成果的证明过程,正是在谷歌Gemini模型及其相关工具的大力推动下得以实现的——具体包括DeepThink系统,以及由第四作者基于Gemini框架专门开发的数学证明系统(暂定名为FullProof)。

  

  要知道论文的最后署名的作者Ravi Vakil是这方面的专家,这篇论文还参考了他2025年发表在顶刊《Duke Mathematical Journal》杜克数学杂志的文章。

  普通读者可能还没看明白标题是啥,AI都能协助数学家找到新的证明方法了。

  不得不感慨:AI与人类天才之间的差距正在缩小。

  

  斯坦福大学教授、美国数学会会长Ravi Vakil亲自认证了Gemini提供了关键且独创的洞见,给出的证明「严谨、正确,而且优雅」:

  作为熟悉相关文献的人,我认为:Gemini 的论证并非对既有证明的简单改写,而是带来了真正的洞见。

  这种洞见,即使出自我手,我也会引以为傲。

  

  他甚至表示,他也无法确定最终自己能否独自得到这个结论。

  而这次他最大的收获是:重要的数学进展,来自人类智慧与 Gemini 贡献之间的真实协同。

  

  Ravi Vakil的研究对代数几何的许多课题作出了基础性贡献,包括格罗莫夫-威滕理论、枚举几何和舒伯特演算。

  去年,Epoch AI报道过Ravi Vakil教授对AI的预计:AI对数学的影响是相变,而不是缓慢的爬坡。

  

  数学史上,每次重大变革都令专家措手不及,这一次也不会例外——区别只在于,我们所有的预测将错得更加彻底。

  数学奇幻漂流

  Grok 4.20发现平方级跃升

  无独有偶,加利福尼亚大学尔湾分校数学系教授Paata Ivanisvili,也提前拿到了Grok 4.20内部测试版的访问权限。

  这一版本的Grok展现出的惊人数学能力,让教授直呼「好家伙」。

  

  事情是这样的:

  Ivanisvili教授和他的学生N. Alpay之前正在寻找一个新的Bellman函数。

  简单来说,他们需要在两个约束条件下确定逐点最大函数 U(p,q),并搞清楚U(p,0)到底长什么样。

  经过一番「人类大脑」的苦战,他们在最新的论文中推导出了一个不错的下界:U(p,0) \geq I(p)。

  

  传送门:https://arxiv.org/pdf/2502.16045

  这里的I(p)是高斯等周轮廓。

  当p趋近于0时,它的精度大约在 p\sqrt{\log(1/p)} 这个级别。

  然后,高光时刻来了。

  教授把题目喂给了Grok 4.20。

  仅仅过了5分钟,Grok 就把一个漂亮的显式公式甩在了桌上:

  U(p,q) = E \sqrt{q^2+\tau}

  换句话说就是,Grok 引入了布朗运动从p点出发离开 (0,1) 区间的逃逸时间(exit time)tau。

  通过这个公式一算,结果变成了U(p,0) \sim p \log(1/p)。

  懂行的朋友可能已经发现了:Grok帮人类把那个讨厌的「根号」给摘掉了!

  这在对数因子上实现了一次实打实的平方根级别飞跃。

  这个公式,在数学好奇心的满足上可谓是价值连城。它让我们在理解「布尔函数导数的随机模拟究竟能有多小」这件事上,往前迈了一大步。

  更确切地说,Grok给出了二进平方函数(dyadic square function)L^1范数的一个紧确下界(sharp lower bound)

  Ivanisvili教授此前就曾经历过类似的数学奇幻漂流:他曾发现某些下界竟然和高木函数(Takagi function),甚至大名鼎鼎的黎曼猜想有着神秘的量子纠缠般的联系。

  而这次Grok挖掘出的新函数,虽然不像高木函数那样是分形的,却是一个平滑且完美的等周类型轮廓,而且完全不按高斯等周轮廓的套路出牌。

  在调和分析领域,关于平方函数如何「发散」(blow up)的问题一直引人入胜。让我们看看这张排行榜:

  铜牌(前人纪录):Burkholder—Davis—Gandy 给出的下界是 |A|(1-|A|)。

  银牌(教授团队):Ivanisvili 团队费劲心力,把它推进到了 |A| (1-|A|)\sqrt{\log(\dots)}的级别。

  金牌(Grok 4.20):AI 给出了 |A| (1-|A|) \log(\dots)。

  Grok不仅去掉了根号,更霸气的是,这个界被证实是紧确的(Sharp)。

  

  

  陶哲轩:AI单挑1%到2%的Erdős难题

  上周末,Neel Somani——一位软件工程师、前量化研究员、初创公司创始人——在测试OpenAI最新模型的数学能力时,意外发现了一件令人震惊的事。

  他将一道数学题贴进ChatGPT,离开十五分钟后回来,竟然发现模型已经写出了一份完整的证明。他用名为Harmonic的工具将这份推理形式化处理,结果一切无懈可击。

  

  自从GPT 5.2发布以来,Somani注意到一个趋势:这代模型在数学推理上「肉眼可见地更聪明了」,所解决的问题数量,也开始变得令人难以忽视。

  Somani专注研究的是「Erdős问题集」——这是一位匈牙利数学家留下的1000多个猜想,目前都被整理在网上。

  题目横跨多个数学分支,难度各异,是AI数学能力的绝佳试金石。

  早在去年11月,第一批由Gemini驱动的模型AlphaEvolve就已经解决了部分难题。而如今,Somani等人发现:GPT 5.2在处理高阶数学问题时,展现出了惊人的实力。

  从圣诞节以来,已有15道Erdős题目从「未解」状态被改为「已解」,其中11道明确标注,AI模型在解题过程中发挥了关键作用。

  知名数学家陶哲轩(Terence Tao)也在GitHub上进行了更详细的追踪。他

  统计出,目前AI模型在8道Erdős难题上实现了「自主推进式」的实质性进展,还有6道是通过查找和延续已有研究取得了突破。

  虽然距离AI真正实现「全自动数学」还有一段距离,但大型模型在数学研究中的重要性,已经不容忽视。

  在Mastodon上,陶哲轩更进一步提出「AI扩展」猜想:

  它们拓展性强,非常适合系统性地清理那些「长尾」的Erdős难题,其中很多其实并不复杂。

  


  「这些相对容易的Erdős题目,未来更可能由AI纯自主解决,而非人类或人机合作。」他补充道。

  他个人猜测,大概在1%到2%目前尚未解决的Erdős难题中,能在几乎不依赖人类干预的情况下,被现有AI工具直接攻克。

  AI在数学界的「出道」,从一开始就带着争议和好奇心。

  但现在,它正悄悄扎根在研究最前沿。无论是像Aristotle这样专为形式化设计的AI助手,还是像GPT-5.2这样通用型、却在高等数学问题上频频「开挂」的大模型,它们都在改变我们对「数学探索者」身份的传统想象。

  从某种意义上说,这场变化也不仅仅是技术性的。

  数学界素来以谨慎著称,一项新方法若想获得主流认可,往往需要长时间的验证与辩论。

  而AI带来的,不只是「工具变了」,而是整个研究过程的范式正在被重塑。

  参考资料:

  1https://x.com/_sholtodouglas/status/2011325979650900396

  https://x.com/A_G_I_Joe/status/2011213878395617571

  https://x.com/PI010101/status/2011560477688463573

  https://techcrunch.com/2026/01/14/ai-models-are-starting-to-crack-high-level-math-problems/

  https://mathstodon.xyz/@tao/115891256726420022

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
进口针一支1.7万,年生长11厘米,国人怒了

进口针一支1.7万,年生长11厘米,国人怒了

果壳
2026-06-02 19:13:32
贵州能源集团电力投资有限公司副总工程师、贵州盘江电投发电有限公司副总工程师陈明彦被查

贵州能源集团电力投资有限公司副总工程师、贵州盘江电投发电有限公司副总工程师陈明彦被查

界面新闻
2026-06-02 14:13:55
多个伊拉克民兵组织宣布拟解除武装

多个伊拉克民兵组织宣布拟解除武装

财联社
2026-06-03 01:24:05
“白嫖党”压力来了!吊牌全面升级,用硬塑料卡扣,边缘磨砂处理

“白嫖党”压力来了!吊牌全面升级,用硬塑料卡扣,边缘磨砂处理

火山詩话
2026-06-02 08:54:07
屋漏偏逢连夜雨!60岁郭富城再迎噩耗,方媛疑产后抑郁是冰山一角

屋漏偏逢连夜雨!60岁郭富城再迎噩耗,方媛疑产后抑郁是冰山一角

悄悄史话
2026-05-28 11:44:23
穿着阿森纳球衣庆祝夺冠,WWE女星遭摔角迷调侃!

穿着阿森纳球衣庆祝夺冠,WWE女星遭摔角迷调侃!

乐道足球C
2026-06-02 15:31:22
僵持七年拿不到认证!中国不等了,外媒:已暂停批准空客飞机交付

僵持七年拿不到认证!中国不等了,外媒:已暂停批准空客飞机交付

大卫聊科技
2026-06-02 13:48:50
反常!何超盈缺席弟弟婚礼,疑似与四房关系变淡,反倒亲近何超琼

反常!何超盈缺席弟弟婚礼,疑似与四房关系变淡,反倒亲近何超琼

TVB的四小花
2026-06-02 13:13:49
王嘉尔晒何猷君奚梦瑶婚礼幕后照片 身穿西服当伴郎好帅气

王嘉尔晒何猷君奚梦瑶婚礼幕后照片 身穿西服当伴郎好帅气

TVB的四小花
2026-06-03 01:25:22
央视再曝新毒物!长期用会致癌,已流窜至全国,不少婴儿孕妇中招

央视再曝新毒物!长期用会致癌,已流窜至全国,不少婴儿孕妇中招

凡知
2026-06-03 05:12:25
98年香港金融保卫战:中国动用1200亿对轰,犹太资本从未输这么惨

98年香港金融保卫战:中国动用1200亿对轰,犹太资本从未输这么惨

小正说娱乐
2026-05-31 11:33:33
云南元阳客车侧翻事故已致7死12伤,涉事企业被交通运输部通报

云南元阳客车侧翻事故已致7死12伤,涉事企业被交通运输部通报

新京报
2026-06-01 17:26:15
柯基犬预测了马刺打尼克斯的NBA总决赛,此前它已准确预测了西决

柯基犬预测了马刺打尼克斯的NBA总决赛,此前它已准确预测了西决

好火子
2026-06-03 00:43:55
黄仁勋拿下宇树科技,全网破防了!

黄仁勋拿下宇树科技,全网破防了!

新浪财经
2026-06-02 17:08:19
前香奈儿设计师闯入户外:自研“龙脊”专利,3年品牌年销冲击6000万

前香奈儿设计师闯入户外:自研“龙脊”专利,3年品牌年销冲击6000万

字节漫游指南
2026-06-01 11:45:28
暴雨、大暴雨、雷暴大风来袭!多部门六预警齐发!局地将有大雾或冰雹天气|国是早班车

暴雨、大暴雨、雷暴大风来袭!多部门六预警齐发!局地将有大雾或冰雹天气|国是早班车

新浪财经
2026-06-03 04:16:14
葵花药业发布严正声明!从未生产、销售或授权任何驱蚊类产品,涉事产品与公司无任何关联

葵花药业发布严正声明!从未生产、销售或授权任何驱蚊类产品,涉事产品与公司无任何关联

每日经济新闻
2026-06-02 23:20:35
俄罗斯官员告知普京,俄乌冲突已超出了俄财政承受能力!

俄罗斯官员告知普京,俄乌冲突已超出了俄财政承受能力!

闻号说经济
2026-06-02 10:43:10
G4出现名场面!王博亲自为他递水,楼明为他鼓掌:获胜的最大奇兵

G4出现名场面!王博亲自为他递水,楼明为他鼓掌:获胜的最大奇兵

南海浪花
2026-06-03 05:25:34
纽卡官方:拉姆斯代尔等四名球员离队,吉莱斯皮续约一年

纽卡官方:拉姆斯代尔等四名球员离队,吉莱斯皮续约一年

懂球帝
2026-06-03 00:09:06
2026-06-03 08:00:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15372文章数 66896关注度
往期回顾 全部

科技要闻

烧掉千亿后,美团、阿里、京东谁先止血?

头条要闻

特朗普:已同以黎通话协调停火 一周内将与伊达成协议

头条要闻

特朗普:已同以黎通话协调停火 一周内将与伊达成协议

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君补办婚礼超幸福

财经要闻

智元和宇树的“暗战”愈演愈烈

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

亲子
游戏
房产
艺术
公开课

亲子要闻

姐弟俩画画的欢乐时光

离发售不远了!《寂静岭》系列新作已公开游戏评级

房产要闻

5200巨量投资曝光!未来五年,海南格局大变!

艺术要闻

二十年前割麦的场景

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版