网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

陶哲轩敲警钟！谷歌DeepMind联手五大神殿，用AI向世纪难题宣战

2025-10-30 10:58:14　来源: 新智元

北京举报

0

分享至

新智元报道

编辑：桃子

【新智元导读】谷歌DeepMind再出重拳，集结全球五大顶尖机构，以AI之力直指数学界圣杯！同时，陶哲轩也发出冷静警示：须警惕AI滥用带来的潜在风险。

今天，谷歌DeepMind重磅发起「AI赋能数学计划」，集结了全球五大顶尖机构。

他们将用上谷歌最强数学AI，去探索发现新的疆域。

这其中，有夺下IMO金牌的Gemini Deep Think，有算法发现AI智能体AlphaEvolve，还有形式化证明自动补全AlphaProof。

目前，首批合作机构阵容，堪称豪华：

伦敦帝国学院
普林斯顿高等研究院（IAS）
法国高等科学研究所（IHES）
西蒙斯计算理论研究所（加州大学伯克利分校）
塔塔基础科学研究所（TIFR）

这五大机构有着一个共同的使命，发掘可以被AI点亮的数学难题，加速科学发现。

然而，陶哲轩担忧的是，「当前AI在数学研究中应用加深，除了负责任的使用，AI滥用的案例也屡见不鲜」。

因此他认为，现在正是时候，启动关于如何最佳融入AI、透明披露其作用，并缓解风险的讨论。

或许，这不仅能守护数学研究的严谨性，还将为AI+数学融合铺就道路。

五大顶尖机构，联手强攻数学难题

数学，是宇宙最基础的语言。

在谷歌DeepMind看来，AI可以作为强大工具，与数学家合作，激发其创造力。

「AI赋能数学计划」的诞生，就是为了：

发掘有望借助AI获得深刻见解的新一代数学难题；

构建支持这些前沿探索所需的基础设施与工具；

最终加速科学发现的步伐。

这项计划，将由Google.org提供资金支持，以及谷歌DeepMind的顶尖技术。

几个月来，谷歌DeepMind自身的研究，取得了飞速进步。

2024年，AlphaGeometry和AlphaProof在IMO竞赛中，拿下了银牌。

而搭载Deep Think的最新Gemini模型，更是在今年IMO中取得了金牌水平的表现，完美破解5题拿下35分。

在数学分析、几何学、组合数学和数论领域50个公开难题上，20%题目中，AlphaEvolve取得了最优解。

而且，在数学与算法发现领域，它发明了一种全新的、更高效的矩阵乘法方法。

具体来说，在4x4矩阵乘法这一特定问题上，它发现了仅需48次标量乘法的算法。

这一结果，打破了1969年由Strassen算法，创下长达50年的历史纪录。

不仅如此，在计算机科学领域，AlphaEvolve协助研究员发现了全新的数学结构。

同时，它还发现了有些复杂问题的求解难度，其实比人们过去想的还要高，这让研究者对计算边界看得更清楚、更精准，为未来的研究探明方向。

以上这些进展，都是当前AI模型快速发展的有力证明。

对于AI的全部潜力，还有它怎么搞定思考最深奥的科学问题，人类的理解才刚刚开始。

AI+数学，边界在哪？

一直以来，陶哲轩是「AI+数学」领域应用的看好者，也是最佳实践者。

他曾多次联手GPT-5 Pro等顶尖AI，破解了许多数学领域的难题，大大提升了效率。

毋庸置疑，在数学领域，LLM和证明助手等AI工具，正悄然改变研究范式。

最近，一些顶尖论文开始融合AI，推动了从形式化证明到复杂计算的创新。

论文地址：https://borisalexeev.com/pdf/erdos707.pdf

然而，随着AI的深度介入，也引发了一个关键问题：

如何确保这些工具的使用，不损害论文的严谨性和价值？

陶哲轩献策

借此契机，陶哲轩在公开平台上发起了讨论，在长帖中，他提出了三大建议。

以下，AI一词，它不仅涵盖LLM，也包括神经网络、可满足性求解器、证明助手以及任何其他复杂的工具。

1AI使用声明

论文中，所有对AI实质性的使用，超出其基础功能，比如自动补全、拼写检查，或搜索引擎AI摘要，都必须明确声明。

2AI风险讨论与缓解措施

论文中，应讨论所用AI工具可能带来的一般性风险，并说明为缓解这些风险已采取的措施。

以下将举例说明：

2.1. 内容虚构，出现了「幻觉」

AI可能会编造参考文献、证明过程或文本，导致事实错误。

建议不要在论文正文中，使用AI生成的文本；若必须使用AI输出，则用不同字体或标记清晰标注。

2.2. 缺乏可复现性

专有AI或高计算成本的结果难以复现。解决方案是，开源提示词、工作流程、认证数据等，让他人能低成本验证。

2.3. 缺乏可解释性

AI输出往往晦涩，其解释可能站不住脚。建议为每个AI输出配以人类撰写的、可读性强的对应内容。

比如，一个定理可以同时包含一个由人类撰写、易于阅读的非形式化证明，以及一个由AI生成但不易阅读的形式化证明。

2.4. 缺乏可验证性

AI易藏细微错误，检查耗时。

形式化验证，一致性检查，都有助于缓解这一问题，并采用多层次方法。

关键是标注验证范围，在定理旁加「校验标记」，未验证部分则明确说明。

2.5. 目标形式化不当

AI可能精确解决「错位」目标，即形式化后的命题偏离作者意图。为此，应从独立来源获取形式化目标，或由人类深入审视形式化过程。

2.6. 可能利用漏洞达成目标

与上一问题相关联，AI可能会钻形式化表述的空子，如添加任意公理「证明」命题。

应对方法是，列出已知漏洞，并讨论排除机制确保过程严谨。

2.7. AI生成代码有Bug

AI生成代码bug更加隐蔽，难以用传统标准方法来检测修复。

为此，建议采用大量单元测试、外部验证，或将AI使用限于简单场景，复杂任务需由人类修改适配。

3 责任归属

最终，论文的所有作者，必须为AI贡献内容承担责任，包括任何不准确、疏漏或虚假陈述。

除非明确标记为「未经核实」，否则作者不能推卸。

以上这些，仅是陶哲轩的抛砖引玉，他希望加入更多的讨论，和业界研究人员进一步完善这份清单。

评论下方，一位研究者John Dvorak直戳痛点——

除非我们能跨过临界点，让所有数学证明都用Lean做形式化验证，成为学界的标配，否则这个问题基本无解。

说到底，在Lean普及之前，这些法子虽然治标不治本。

对此，陶哲轩抛出了最近看到的一个观点，即用AI审稿质量是可以的，但它并非是主要的筛选工具质之一。

否则就会触发「古德哈特定律」（Goodhart's law），AI工具就会找到漏洞，用一些异常、分布之外的文本字符串就能绕开审核。

说白了，AI评估器顶多给人类审核当个辅助，而不能完全取代人类评估者。

参考资料：

https://blog.google/technology/google-deepmind/ai-for-math/?utm_source=x&utm_medium=social&utm_campaign=&utm_content=

https://ai-math.zulipchat.com//channel/539992-Web-public-channel---AI-Math/topic/Best.20practices.20for.20incorporating.20AI.20etc.2E.20in.20papers/near/546518354

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

17岁高中生用AI解决数学界难题，陶哲轩、Jeff Dean点赞

机器之心Pro 2026-01-26 14:24:45
6 跟贴 6
再见了， OpenAI！三年老用户忍痛卸载ChatGPT

新智元 2026-01-25 17:04:44
12 跟贴 12

Transformer作者创办日本最贵AI独角兽，如今又被谷歌投资

DeepTech深科技 2026-01-26 16:48:19
10 跟贴 10

不读博士，照样进OpenAI！o1核心成员现身说法了

量子位 2026-01-25 20:04:15
0 跟贴 0
2026，进入AI记忆元年

36氪 2026-01-27 18:45:51
0 跟贴 0

大学无用？奥特曼辍学当了CEO，但名校生撑起了整个OpenAI！

36氪 2026-01-18 10:45:08
32 跟贴 32

陶哲轩：AI看似在推理，其实是在背答案

量子位 2026-01-05 09:20:21
0 跟贴 0
聊天框装不下的野心，被百度文心 APP 塞进了 AI 群聊里

爱范儿 2026-01-27 20:47:25
0 跟贴 0

ICLR 2026 放榜了！28%接收率，欢迎投稿机器之心

机器之心Pro 2026-01-27 18:14:32
0 跟贴 0
我国将出台应对人工智能影响促就业文件

界面新闻 2026-01-27 10:04:47
585 跟贴 585
机器人要会跳舞更要能“搬砖” 魔法原子、银河通用、宇树科技抢滩“春晚”：2026具身智能迈入产业深水区

每日经济新闻 2026-01-27 20:31:08
0 跟贴 0
AI会计会是下一个“杀手级”应用吗？

华尔街见闻官方 2026-01-27 21:13:17
0 跟贴 0
三角形是最小的吗？球面几何给出的意外答案

星星科普 2026-01-24 14:12:51
1 跟贴 1
深度长文：数学，到底是人类的发明还是发现？

宇宙时空 2026-01-27 16:40:03
1 跟贴 1
五年级几何，求阴影面积，全军覆没

大力小学数学 2026-01-24 14:04:00
12 跟贴 12
100个7相乘积的个位是多少

鲍向露 2026-01-27 04:05:08
1 跟贴 1
祖坟冒青烟了，儿子考满分，妈妈一个动作笑不活了

爆笑生活记 2026-01-26 09:18:58
1 跟贴 1
五年级数学求阴影部分面积

天天数理学习分享 2026-01-26 10:20:22
1 跟贴 1
小学数学求面积，正方形条件很重要

天天数理学习分享 2026-01-27 09:49:51
1 跟贴 1
1249三年级数学上册第三单元测试卷，注意画星号题目

我服子佩 2026-01-27 11:49:05
1 跟贴 1
五年级数学简便计算，题目不难但容易出错

天天数理学习分享 2026-01-23 10:18:37
3 跟贴 3
邻居强占我家宅基地半米，爷爷不准我理论，只让我每晚去墙根浇水

下复新鲜事 2026-01-23 15:51:45
0 跟贴 0
1250四年级数学上册第二三单元测试卷，附加题太难了

我服子佩 2026-01-27 12:41:59
1 跟贴 1
1235一年级数学上册：从前面数会数，后转之后还会数吗？

我服子佩 2026-01-25 13:06:34
1 跟贴 1
遮羞布被扯掉了！丘成桐直言：中国数学水平比美国落后了80多年

忙着解说可爱 2026-01-27 11:01:52
1 跟贴 1
有限与无限的哲科思辨：数学无限概念的解读

老友地理 2026-01-25 17:56:45
18 跟贴 18
期末考前，杭州数学前30%的娃都来了

杭城村叔 2026-01-27 20:26:41
0 跟贴 0
小学数学，还原问题！

秒懂奥数李菁老师 2026-01-26 16:43:01
5 跟贴 5
河南郑州：多名家长称花上万元报名数学思维班，刚交完钱就停课，家长：联系不上负责人

小莉帮忙 2026-01-26 02:00:27
0 跟贴 0
理论上，人类可以从南非一路徒步走到南美洲

名人堂典客 2026-01-24 07:00:00
2942 跟贴 2942
到底是谁发明的数学，看看都把孩子，逼成什么了！

搞笑的兴兴 2026-01-27 09:34:25
1 跟贴 1
每个国家都有独门速算秘技

兔八哥影视 2026-01-26 10:42:48
2 跟贴 2
A4纸为什么是297乘以210？这不是随便来的，数学决定一切

胡晓闲 2026-01-23 18:52:16
0 跟贴 0
孩子数学差？是不是没找对方法！

奥数轻松学 2026-01-27 17:04:34
3 跟贴 3
贵州CMO首金背后的育才密码

中国教育新闻网 2026-01-27 17:30:01
1 跟贴 1
倒三角符号在数学和物理公式里的意义

量子位 2026-01-08 13:59:54
0 跟贴 0
数学，让生活更美好1%25

落落的简约生活 2026-01-26 02:30:08
0 跟贴 0
这个倒三角 ∇，为什么总在数学和物理公式里出现？

量子位 2026-01-07 15:33:23
0 跟贴 0
26岁陶中恺教授，加盟法国数学象牙塔

量子位 2025-08-13 12:29:21
19 跟贴 19
初中生哥哥辅导数学题，小学生妹妹咋算都不明白，最终把哥哥气笑

生活不缺欢乐 2026-01-24 00:00:00
20 跟贴 20

奥迪设计总监痛批汽车大屏幕：为了技术而技术

奥迪设计总监痛批汽车大屏幕：为了技术而技术

太平洋汽车

2026-01-27 12:11:13

中国斯诺克2胜2负！斯佳辉德比逆转，肖国栋轰2破百，赵心童登场

中国斯诺克2胜2负！斯佳辉德比逆转，肖国栋轰2破百，赵心童登场

刘姚尧的文字城堡

2026-01-27 20:22:44

帕尔默发布个人品牌logo：名字首字母C、P组成标志性庆祝动作

帕尔默发布个人品牌logo：名字首字母C、P组成标志性庆祝动作

懂球帝

2026-01-27 15:49:05

1276个！吴前生涯三分命中数超越西热力江，升至CBA历史第四位

1276个！吴前生涯三分命中数超越西热力江，升至CBA历史第四位

懂球帝

2026-01-27 23:26:14

影后辛芷蕾，这张照片摄影师得加鸡腿，抓拍的太到位了

影后辛芷蕾，这张照片摄影师得加鸡腿，抓拍的太到位了

徐帮阳

2025-12-23 18:33:38

流亡一年后，阿萨德已成“透明人”，连约普京吃顿饭都做不到

流亡一年后，阿萨德已成“透明人”，连约普京吃顿饭都做不到

朔方瞭望

2026-01-06 11:11:51

去世男星爸妈改口了！鲸鱼默认有孩子！

去世男星爸妈改口了！鲸鱼默认有孩子！

八卦疯叔

2026-01-26 13:34:34

打虎！包惠被查

新京报政事儿

2026-01-27 18:48:05

人形机器人量产前夜，确定性最大的环节，是这4家减速器厂商！

人形机器人量产前夜，确定性最大的环节，是这4家减速器厂商！

小白鸽财经

2026-01-25 20:30:02

国际刑事法院正式裁定，80岁的菲律宾前总统杜特尔特身体状况符合

国际刑事法院正式裁定，80岁的菲律宾前总统杜特尔特身体状况符合

胥言

2026-01-27 17:31:12

商务部新闻发言人就中英经贸合作情况答记者问

商务部新闻发言人就中英经贸合作情况答记者问

界面新闻

2026-01-27 15:38:35

成飞官曝：多架歼-20A正在试飞；全球唯一的五代半正在快速上量

成飞官曝：多架歼-20A正在试飞；全球唯一的五代半正在快速上量

啸鹰评

2026-01-26 23:26:51

六旬老人跟团北京5日游，第3天猝死！连续两天凌晨集合，导游临时在车上通知增加游览项目，法院判了

六旬老人跟团北京5日游，第3天猝死！连续两天凌晨集合，导游临时在车上通知增加游览项目，法院判了

扬子晚报

2026-01-24 22:29:57

我出售南京的大平层搬进女儿家，女儿以为我睡熟了，跟女婿密谋

我出售南京的大平层搬进女儿家，女儿以为我睡熟了，跟女婿密谋

朝暮书屋

2026-01-21 17:26:45

巴萨暗锁 2 张王牌，莱万接班人终露馅？1 亿死磕 VS 免费捡漏

巴萨暗锁 2 张王牌，莱万接班人终露馅？1 亿死磕 VS 免费捡漏

奶盖熊本熊

2026-01-27 07:49:02

伊朗神权崩塌前夜：9000万高知青年与内战危机

伊朗神权崩塌前夜：9000万高知青年与内战危机

夏至陌离殇

2026-01-14 15:34:27

12年过去了，当初嫁71岁老头的湖南少女，在丈夫去世后已经再婚

12年过去了，当初嫁71岁老头的湖南少女，在丈夫去世后已经再婚

丰谭笔录

2026-01-10 07:35:08

101岁余宝珠：相貌普通击败正房，独占百亿资产，抽烟喝酒霸气足

101岁余宝珠：相貌普通击败正房，独占百亿资产，抽烟喝酒霸气足

照见古今

2026-01-09 19:08:21

王哲林：十几年生涯达成万分非常开心，希望未来实现更多目标

王哲林：十几年生涯达成万分非常开心，希望未来实现更多目标

懂球帝

2026-01-27 23:16:03

胖东来调改的超市，连房租都交不起了？

胖东来调改的超市，连房租都交不起了？

中国新闻周刊

2026-01-27 15:10:40

AI产业主平台领航智能+时代

14424文章数 66543关注度

往期回顾全部

科技要闻

马化腾3年年会讲话透露了哪些关键信息

头条要闻

因楼下邻居关闭水阀女子家中断水400天起诉索赔被驳

头条要闻

因楼下邻居关闭水阀女子家中断水400天起诉索赔被驳

体育要闻

冒充职业球员，比赛规则还和对手现学？

娱乐要闻

张雨绮风波持续发酵，曝多个商务被取消

财经要闻

多地对垄断行业"近亲繁殖"出手了

汽车要闻

标配华为乾崑ADS 4/鸿蒙座舱5 华境S体验车下线

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

时尚

家居

健康

艺术

军事航空

这些韩系穿搭最适合普通人！多穿深色、衣服基础，简洁耐看

家居要闻

现代古典中性又显韵味

耳石脱落为何让人天旋地转+恶心？

艺术要闻

日本东京国立博物馆中的100幅宋画

军事要闻

美海军"林肯"号航母打击群抵达中东地区

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版