网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

陶哲轩惊叹！数学奇点初现，AI首次给出人类无法企及的原创证明

2026-01-15 21:19:52　来源: 新智元

北京举报

0

分享至

　　新智元报道

　　编辑：KingHZ 好困

　　【新智元导读】数学奇点初现！Gemini攻克全新数学定理，斯坦福大牛惊呼「想出来能吹一辈子」；陶哲轩预言数学家+AI共生未来；Grok发现黎曼猜想新的隐蔽通道……

　　汉语是人类语言的一种。

　　比特是计算机的语言。

　　而数学则是宇宙的语言。

　　正如「现代物理学之父」伽利略所言：「要理解宇宙，你必须理解它所书写的语言——数学的语言。」

　　要测试人类是否实现了超级人工智能ASI，除了数学，还有谁？

　　AI在数学上的原创能力是通向ASI（甚至理解物理本质）的必经之路，是核心中的核心。

　　如果说AI斩获国际奥数IMO金牌，你可能对ASI还有所怀疑——

　　毕竟，IMO所涉及的知识，还是高中数学；

　　毕竟，这类问题人类必有答案；

　　毕竟，可能只靠记忆力或许也能拿下IMO金牌 ……

　　但现在不一样了。

　　这不是在瞎吹，是菲尔兹奖得主陶哲轩（Terence Tao）、斯坦福教授兼Ravi Vakil亲自盖章。

　　谷歌DeepMind的一个团队，用Gemini证明了一个代数几何领域的全新定理——

　　注意，是全新的！

　　不是像以前那样把人类已知的东西重写一遍，而是连斯坦福的大牛Ravi Vakil教授都惊呼：

　　这种优雅的洞察力，如果是我自己想出来的，我会吹一辈子。

　　对那些仍对AI智能存疑的人来说，这样的成果无疑具有震撼力。

　　而这还不是唯一的突破。

　　AI工具已经在数学领域遍地开花。AI已正式叩响思想创造之门！

　　浩荡征程，由此启程。

　　陶哲轩预言：AI或独自攻克15-2%的埃尔德什问题。

　　与此同时，马斯克的Grok 4.20也不装了，被曝在5分钟内「秒杀」了困扰教授们许久的Bellman函数难题。

　　这意味着什么？

　　我们大胆预测一下：2026年将是「ASI元年」。人类负责定义问题，AI负责填补证明的空白。

　　警报：数学界的「奥本海默时刻」到了？

　　刚刚，Gemini 证明了一个代数几何领域的新定理。

　　传送门：https://arxiv.org/abs/2601.07222

　　数学家Ravi Vakil等四人，发表的这篇论文标题为：THE MOTIVIC CLASS OF THE SPACE OF GENUS 0 MAPS TO THE FLAG VARIETY「旗空间上的亏格零映射的Motivic类」。

　　这个问题长期以来很难下手，而新论文的部分证明推广了已有框架下的相关论证方法。

　　在一个足够强、又可计算的框架里（Grothendieck环/动机类）给了非常干净的闭式答案，并且还能导出可直接检验的有限域点数公式。

　　但论文明晃晃写道：

　　本论文核心成果的证明过程，正是在谷歌Gemini模型及其相关工具的大力推动下得以实现的——具体包括DeepThink系统，以及由第四作者基于Gemini框架专门开发的数学证明系统（暂定名为FullProof）。

　　要知道论文的最后署名的作者Ravi Vakil是这方面的专家，这篇论文还参考了他2025年发表在顶刊《Duke Mathematical Journal》杜克数学杂志的文章。

　　普通读者可能还没看明白标题是啥，AI都能协助数学家找到新的证明方法了。

　　不得不感慨：AI与人类天才之间的差距正在缩小。

　　斯坦福大学教授、美国数学会会长Ravi Vakil亲自认证了Gemini提供了关键且独创的洞见，给出的证明「严谨、正确，而且优雅」：

　　作为熟悉相关文献的人，我认为：Gemini 的论证并非对既有证明的简单改写，而是带来了真正的洞见。

　　这种洞见，即使出自我手，我也会引以为傲。

　　他甚至表示，他也无法确定最终自己能否独自得到这个结论。

　　而这次他最大的收获是：重要的数学进展，来自人类智慧与 Gemini 贡献之间的真实协同。

　　Ravi Vakil的研究对代数几何的许多课题作出了基础性贡献，包括格罗莫夫-威滕理论、枚举几何和舒伯特演算。

　　去年，Epoch AI报道过Ravi Vakil教授对AI的预计：AI对数学的影响是相变，而不是缓慢的爬坡。

　　数学史上，每次重大变革都令专家措手不及，这一次也不会例外——区别只在于，我们所有的预测将错得更加彻底。

　　数学奇幻漂流

　　Grok 4.20发现平方级跃升

　　无独有偶，加利福尼亚大学尔湾分校数学系教授Paata Ivanisvili，也提前拿到了Grok 4.20内部测试版的访问权限。

　　这一版本的Grok展现出的惊人数学能力，让教授直呼「好家伙」。

　　事情是这样的：

　　Ivanisvili教授和他的学生N. Alpay之前正在寻找一个新的Bellman函数。

　　简单来说，他们需要在两个约束条件下确定逐点最大函数 U(p,q)，并搞清楚U(p,0)到底长什么样。

　　经过一番「人类大脑」的苦战，他们在最新的论文中推导出了一个不错的下界：U(p,0) \geq I(p)。

　　传送门：https://arxiv.org/pdf/2502.16045

　　这里的I(p)是高斯等周轮廓。

　　当p趋近于0时，它的精度大约在 p\sqrt{\log(1/p)} 这个级别。

　　然后，高光时刻来了。

　　教授把题目喂给了Grok 4.20。

　　仅仅过了5分钟，Grok 就把一个漂亮的显式公式甩在了桌上：

　　U(p,q) = E \sqrt{q^2+\tau}

　　换句话说就是，Grok 引入了布朗运动从p点出发离开 (0,1) 区间的逃逸时间（exit time）tau。

　　通过这个公式一算，结果变成了U(p,0) \sim p \log(1/p)。

　　懂行的朋友可能已经发现了：Grok帮人类把那个讨厌的「根号」给摘掉了！

　　这在对数因子上实现了一次实打实的平方根级别飞跃。

　　这个公式，在数学好奇心的满足上可谓是价值连城。它让我们在理解「布尔函数导数的随机模拟究竟能有多小」这件事上，往前迈了一大步。

　　更确切地说，Grok给出了二进平方函数（dyadic square function）L^1范数的一个紧确下界（sharp lower bound）。

　　Ivanisvili教授此前就曾经历过类似的数学奇幻漂流：他曾发现某些下界竟然和高木函数（Takagi function），甚至大名鼎鼎的黎曼猜想有着神秘的量子纠缠般的联系。

　　而这次Grok挖掘出的新函数，虽然不像高木函数那样是分形的，却是一个平滑且完美的等周类型轮廓，而且完全不按高斯等周轮廓的套路出牌。

　　在调和分析领域，关于平方函数如何「发散」（blow up）的问题一直引人入胜。让我们看看这张排行榜：

　　铜牌（前人纪录）：Burkholder—Davis—Gandy 给出的下界是 |A|(1-|A|)。

　　银牌（教授团队）：Ivanisvili 团队费劲心力，把它推进到了 |A| (1-|A|)\sqrt{\log(\dots)}的级别。

　　金牌（Grok 4.20）：AI 给出了 |A| (1-|A|) \log(\dots)。

　　Grok不仅去掉了根号，更霸气的是，这个界被证实是紧确的（Sharp）。

　　陶哲轩：AI单挑1%到2%的Erdős难题

　　上周末，Neel Somani——一位软件工程师、前量化研究员、初创公司创始人——在测试OpenAI最新模型的数学能力时，意外发现了一件令人震惊的事。

　　他将一道数学题贴进ChatGPT，离开十五分钟后回来，竟然发现模型已经写出了一份完整的证明。他用名为Harmonic的工具将这份推理形式化处理，结果一切无懈可击。

　　自从GPT 5.2发布以来，Somani注意到一个趋势：这代模型在数学推理上「肉眼可见地更聪明了」，所解决的问题数量，也开始变得令人难以忽视。

　　Somani专注研究的是「Erdős问题集」——这是一位匈牙利数学家留下的1000多个猜想，目前都被整理在网上。

　　题目横跨多个数学分支，难度各异，是AI数学能力的绝佳试金石。

　　早在去年11月，第一批由Gemini驱动的模型AlphaEvolve就已经解决了部分难题。而如今，Somani等人发现：GPT 5.2在处理高阶数学问题时，展现出了惊人的实力。

　　从圣诞节以来，已有15道Erdős题目从「未解」状态被改为「已解」，其中11道明确标注，AI模型在解题过程中发挥了关键作用。

　　知名数学家陶哲轩（Terence Tao）也在GitHub上进行了更详细的追踪。他

　　统计出，目前AI模型在8道Erdős难题上实现了「自主推进式」的实质性进展，还有6道是通过查找和延续已有研究取得了突破。

　　虽然距离AI真正实现「全自动数学」还有一段距离，但大型模型在数学研究中的重要性，已经不容忽视。

　　在Mastodon上，陶哲轩更进一步提出「AI扩展」猜想：

　　它们拓展性强，非常适合系统性地清理那些「长尾」的Erdős难题，其中很多其实并不复杂。

　　「这些相对容易的Erdős题目，未来更可能由AI纯自主解决，而非人类或人机合作。」他补充道。

　　他个人猜测，大概在1%到2%目前尚未解决的Erdős难题中，能在几乎不依赖人类干预的情况下，被现有AI工具直接攻克。

　　AI在数学界的「出道」，从一开始就带着争议和好奇心。

　　但现在，它正悄悄扎根在研究最前沿。无论是像Aristotle这样专为形式化设计的AI助手，还是像GPT-5.2这样通用型、却在高等数学问题上频频「开挂」的大模型，它们都在改变我们对「数学探索者」身份的传统想象。

　　从某种意义上说，这场变化也不仅仅是技术性的。

　　数学界素来以谨慎著称，一项新方法若想获得主流认可，往往需要长时间的验证与辩论。

　　而AI带来的，不只是「工具变了」，而是整个研究过程的范式正在被重塑。

　　参考资料：

　　1https://x.com/_sholtodouglas/status/2011325979650900396

　　https://x.com/A_G_I_Joe/status/2011213878395617571

　　https://x.com/PI010101/status/2011560477688463573

　　https://techcrunch.com/2026/01/14/ai-models-are-starting-to-crack-high-level-math-problems/

　　https://mathstodon.xyz/@tao/115891256726420022

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

17岁高中生用AI解决数学界难题，陶哲轩、Jeff Dean点赞

机器之心Pro 2026-01-26 14:24:45
0 跟贴 0
陶哲轩亲调AI人设,权游小恶魔、贱女孩蕾吉娜版物理教学,你接受不

机器之心Pro 2026-04-13 10:49:43
0 跟贴 0

397B参数追平万亿模型，上海AI Lab发布科学智能体新基座 | WAIC 2026

量子位 2026-07-17 17:18:51
0 跟贴 0

文远知行发布物理AI大模型WITT，以物理事实重构AI认知

雷科技 2026-07-18 10:58:01
0 跟贴 0
“AI领域最被滥用的术语”李飞飞终于把世界模型讲明白了

量子位 2026-06-07 04:37:43
0 跟贴 0

WAIC官宣进化！千问AI眼镜补齐感知，开始智能体化

雷科技 2026-07-18 15:26:16
0 跟贴 0

TRAE Work上线 40 万字的“AI 打工说明书”！一手实测在此

钛媒体APP 2026-07-18 16:12:21
0 跟贴 0
努比亚全球首款AI智能体手机正式亮相WAIC 2026

财联社 2026-07-18 15:54:46
0 跟贴 0

00后小哥复刻Claude最强神话模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟贴 0
菲尔兹奖揭晓！两位北大校友改写百年数学难题

科技三棱镜 2026-07-16 20:16:00
3 跟贴 3
做数学一定要是天才吗？

返朴 2026-07-18 12:33:55
0 跟贴 0
网传清华丘班30%学生面临清退，那么丘班退的是什么货？

天使支教 2026-07-18 08:22:14
221 跟贴 221
意外泄漏！2026世界数学家大会日程被破译，两位北大校友名字在列

世界圈 2026-07-18 09:10:30
1 跟贴 1
敢不敢来挑战数学名人堂评论告诉我你卡在哪个数学家了

奇妙科技说 2026-07-17 10:02:37
1 跟贴 1
家长给孩子打印暑假作业，一晚上全写完了，真是让人省心的好孩子

大红爱搞笑 2026-07-17 13:56:44
1 跟贴 1
0.999…到底为什么等于1啊终于有老师说明白了

下复新鲜事 2026-07-17 01:29:27
0 跟贴 0
这才是九亿少女的梦啊王虹菲尔兹奖数学女性力量

娱小白ou 2026-07-16 23:39:03
0 跟贴 0
三年级的小朋友说太难了，不会做

公考客栈店小二 2026-07-18 08:00:00
0 跟贴 0
初中数学绝技：x^5+x+1=0 解x³-x²，倒挂金钩法大揭秘！

远梦归晓r 2026-07-15 06:01:45
3 跟贴 3
6566除以67的简便计算,多数孩子都没思路

长腿嗑叽君 2026-07-14 01:25:13
0 跟贴 0
半天都没算出来，这是一个大学生家长说的

公考客栈店小二 2026-07-18 14:00:00
4 跟贴 4
几何难题一招破解：割补法求面积，必学技巧！

青树柠檬q 2026-07-14 01:44:53
1 跟贴 1
一招破解小学数学鸡兔同笼难题

食暖食光 2026-07-17 02:12:42
3 跟贴 3
揭秘大数读法：跟随老师一起学习

隐龙天下o 2026-07-15 03:08:45
3 跟贴 3
为什么巨轮再强也不会超80公里每小时？真相是物理在限制一切

七叶说篮球 2026-07-15 14:59:10
1 跟贴 1
巧用一半模型秒解小升初常考题！

公考客栈店小二 2026-07-14 11:00:00
1 跟贴 1
六年级数学 -98÷99×101简便计算

姬海棠羽笠果 2026-07-16 03:07:52
0 跟贴 0
一次两个菲尔兹奖？北大“新黄金一代”将载入历史

未名林 2026-07-17 10:45:49
0 跟贴 0
不了解几何模型的同学看到无从下手

公考客栈店小二 2026-07-18 12:00:00
0 跟贴 0
激动！中国数学有望历史性突破！本土教育数学天才，或获菲尔兹奖！

网易科技态度见闻 2026-07-15 17:56:50
0 跟贴 0
数三角形，速解规律秘籍

隐龙天下o 2026-07-14 02:41:35
1 跟贴 1
694高考数学全国卷理-12函数的单调性涉及换元

我服子佩 2026-07-17 21:21:50
1 跟贴 1
不用复杂公式！用辅助线巧解四边形面积！

秒懂奥数李菁老师 2026-07-15 14:54:24
6 跟贴 6
武契奇称支持乌领土主权完整俄议员：他要对得起良心

澎湃新闻 2026-07-17 21:28:17
50252 跟贴 50252
王坚：人工智能像数学一样基础，对科研起重要作用

究竟视频 2026-07-18 00:41:37
1 跟贴 1
不装了，我摊牌了！AI大模型变聪明的秘密就藏在线性代数。带

纪录每一个故事 2026-07-17 14:45:21
0 跟贴 0
试卷上的模拟：高考爱心题

帆雨动画 2026-07-15 17:09:15
5 跟贴 5
30年数学悬案，Claude一小时破解，88岁图灵奖得主震惊

量子位 2026-03-07 20:19:13
0 跟贴 0
公式相声为何引发争议？交大博士夫妻与郭德纲的现场交流

浴池橙子 2026-07-15 04:00:16
3 跟贴 3
宇宙根本没有外面！这是物理学百年的共识

老友地理 2026-07-17 09:46:03
3 跟贴 3

四川2市（州）人大常委会通过人事任免

四川2市（州）人大常委会通过人事任免

金台资讯

2026-07-18 09:37:28

74岁贾平凹晚节不保！多重糗事被扒，网友：什么鸡下什么蛋！

74岁贾平凹晚节不保！多重糗事被扒，网友：什么鸡下什么蛋！

普陀动物世界

2026-07-18 03:38:31

《八仙》上映1小时票房破亿，连破20项纪录，周星驰粉丝要加把劲了

《八仙》上映1小时票房破亿，连破20项纪录，周星驰粉丝要加把劲了

白公子探剧

2026-07-18 10:18:11

新股长鑫科技中签通知已发，中签人很多，你中签了吗？

新股长鑫科技中签通知已发，中签人很多，你中签了吗？

数据挖掘分析

2026-07-18 07:28:07

失误太多！郑钦文0-2克雷吉茨科娃无缘雅典四强！美网遭重创！

失误太多！郑钦文0-2克雷吉茨科娃无缘雅典四强！美网遭重创！

篮球资讯达人

2026-07-18 00:30:57

邹市明亏光2亿真相追踪！原本他可以不亏钱的，只想开个小拳击馆，无奈妻子是“冉总”

邹市明亏光2亿真相追踪！原本他可以不亏钱的，只想开个小拳击馆，无奈妻子是“冉总”

火山詩话

2026-07-15 15:23:09

巴图喊梁天二舅被调侃蹭饭，现场笑声不断

巴图喊梁天二舅被调侃蹭饭，现场笑声不断

东方不败然多多

2026-07-18 01:23:33

一招“王炸”废掉美国AI收割梦？29国上海签约，中方这步棋绝了

一招“王炸”废掉美国AI收割梦？29国上海签约，中方这步棋绝了

战友老邓

2026-07-17 10:31:23

她是外交部长乔冠华的掌上明珠，父亲再婚之后饱受继母冷落，就连家里佣人也敢借机刁难

她是外交部长乔冠华的掌上明珠，父亲再婚之后饱受继母冷落，就连家里佣人也敢借机刁难

磊子讲史

2026-07-16 15:05:38

降低“坏胆固醇”的方法找到了！研究：吃够优质蛋白，坏胆固醇下降37%

降低“坏胆固醇”的方法找到了！研究：吃够优质蛋白，坏胆固醇下降37%

人民日报健康客户端

2026-07-17 07:37:29

“韩红基金会”被实名举报！向疑似“空壳公司”花6000万采购救护车，涉事单位注册资本300万，员工仅2人

“韩红基金会”被实名举报！向疑似“空壳公司”花6000万采购救护车，涉事单位注册资本300万，员工仅2人

火山詩话

2026-07-17 07:54:53

任泽平的付费群

哲空空

2026-07-17 14:51:18

明查｜伊朗导弹击中美国“林肯”号航母是AI生成视频

明查｜伊朗导弹击中美国“林肯”号航母是AI生成视频

澎湃新闻

2026-07-17 12:09:19

伊朗一通乱打的第二个后果出来了！

伊朗一通乱打的第二个后果出来了！

种花岛

2026-07-18 10:09:48

逆天！乌克兰禁止俄罗斯在大海上航行

逆天！乌克兰禁止俄罗斯在大海上航行

高博新视野

2026-07-15 19:09:47

LV法务部忙疯了，股价却跌惨了！全民硬刚，告不完！

LV法务部忙疯了，股价却跌惨了！全民硬刚，告不完！

户外钓鱼哥阿旱

2026-07-18 11:26:01

体制内人员充当“内鬼”，在自媒体账号上以“挂简历”等方式“预告”官员落马，夸大、炒作贪腐情节，并靠此赚钱，办案人员披露→

体制内人员充当“内鬼”，在自媒体账号上以“挂简历”等方式“预告”官员落马，夸大、炒作贪腐情节，并靠此赚钱，办案人员披露→

吉刻新闻

2026-07-18 10:42:58

山东大学，狂跌8800位次，发生了什么？

山东大学，狂跌8800位次，发生了什么？

勋哥教你填志愿

2026-07-18 14:16:52

全A唯一，社保连续3次抄底的固态电池，暴跌70%，社保被深套

全A唯一，社保连续3次抄底的固态电池，暴跌70%，社保被深套

鹏哥投研

2026-07-18 11:51:23

再见NBA！24岁进攻天才！连底薪合同都没了

再见NBA！24岁进攻天才！连底薪合同都没了

篮球教学论坛

2026-07-18 15:47:45

AI产业主平台领航智能+时代

15720文章数 66961关注度

往期回顾全部

科技要闻

WAIC2026看什么？这份"不迷路"攻略请收好

头条要闻

男子八战清华终上岸:曾被女子骗100多万为赚钱做保洁

头条要闻

男子八战清华终上岸:曾被女子骗100多万为赚钱做保洁

体育要闻

德尚是非典型法国人 14年执教留下丰厚遗产

娱乐要闻

大S给具俊晔留遗产是昏头？实际上她清醒得很

财经要闻

股民当街砍博主！韩国股市终极大屠杀

汽车要闻

把中国超跑卖到英国，比亚迪正在被世界看见

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

亲子

家居

时尚

游戏

本地新闻

十年了，为什么鬼怪CP还能让人美美嗑上？

亲子要闻

幼童颅内有“鸡蛋”大肿瘤，深大华南医院多学科联手“摘瘤”

家居要闻

2026建博会(广州) 公装联探展交流活动

今年最好看的4种颜色，太适合夏天了！

《古剑》线下试玩报告：老大，俺最近又有长进"/> 主站商城论坛自运营登录注册《古剑》线下试玩报告：老大，俺最近又有长进 Marv...

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版