网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

陶哲轩敲警钟！谷歌DeepMind联手五大神殿，用AI向世纪难题宣战

2025-10-30 10:58:14　来源: 新智元

北京举报

0

分享至

新智元报道

编辑：桃子

【新智元导读】谷歌DeepMind再出重拳，集结全球五大顶尖机构，以AI之力直指数学界圣杯！同时，陶哲轩也发出冷静警示：须警惕AI滥用带来的潜在风险。

今天，谷歌DeepMind重磅发起「AI赋能数学计划」，集结了全球五大顶尖机构。

他们将用上谷歌最强数学AI，去探索发现新的疆域。

这其中，有夺下IMO金牌的Gemini Deep Think，有算法发现AI智能体AlphaEvolve，还有形式化证明自动补全AlphaProof。

目前，首批合作机构阵容，堪称豪华：

伦敦帝国学院
普林斯顿高等研究院（IAS）
法国高等科学研究所（IHES）
西蒙斯计算理论研究所（加州大学伯克利分校）
塔塔基础科学研究所（TIFR）

这五大机构有着一个共同的使命，发掘可以被AI点亮的数学难题，加速科学发现。

然而，陶哲轩担忧的是，「当前AI在数学研究中应用加深，除了负责任的使用，AI滥用的案例也屡见不鲜」。

因此他认为，现在正是时候，启动关于如何最佳融入AI、透明披露其作用，并缓解风险的讨论。

或许，这不仅能守护数学研究的严谨性，还将为AI+数学融合铺就道路。

五大顶尖机构，联手强攻数学难题

数学，是宇宙最基础的语言。

在谷歌DeepMind看来，AI可以作为强大工具，与数学家合作，激发其创造力。

「AI赋能数学计划」的诞生，就是为了：

发掘有望借助AI获得深刻见解的新一代数学难题；

构建支持这些前沿探索所需的基础设施与工具；

最终加速科学发现的步伐。

这项计划，将由Google.org提供资金支持，以及谷歌DeepMind的顶尖技术。

几个月来，谷歌DeepMind自身的研究，取得了飞速进步。

2024年，AlphaGeometry和AlphaProof在IMO竞赛中，拿下了银牌。

而搭载Deep Think的最新Gemini模型，更是在今年IMO中取得了金牌水平的表现，完美破解5题拿下35分。

在数学分析、几何学、组合数学和数论领域50个公开难题上，20%题目中，AlphaEvolve取得了最优解。

而且，在数学与算法发现领域，它发明了一种全新的、更高效的矩阵乘法方法。

具体来说，在4x4矩阵乘法这一特定问题上，它发现了仅需48次标量乘法的算法。

这一结果，打破了1969年由Strassen算法，创下长达50年的历史纪录。

不仅如此，在计算机科学领域，AlphaEvolve协助研究员发现了全新的数学结构。

同时，它还发现了有些复杂问题的求解难度，其实比人们过去想的还要高，这让研究者对计算边界看得更清楚、更精准，为未来的研究探明方向。

以上这些进展，都是当前AI模型快速发展的有力证明。

对于AI的全部潜力，还有它怎么搞定思考最深奥的科学问题，人类的理解才刚刚开始。

AI+数学，边界在哪？

一直以来，陶哲轩是「AI+数学」领域应用的看好者，也是最佳实践者。

他曾多次联手GPT-5 Pro等顶尖AI，破解了许多数学领域的难题，大大提升了效率。

毋庸置疑，在数学领域，LLM和证明助手等AI工具，正悄然改变研究范式。

最近，一些顶尖论文开始融合AI，推动了从形式化证明到复杂计算的创新。

论文地址：https://borisalexeev.com/pdf/erdos707.pdf

然而，随着AI的深度介入，也引发了一个关键问题：

如何确保这些工具的使用，不损害论文的严谨性和价值？

陶哲轩献策

借此契机，陶哲轩在公开平台上发起了讨论，在长帖中，他提出了三大建议。

以下，AI一词，它不仅涵盖LLM，也包括神经网络、可满足性求解器、证明助手以及任何其他复杂的工具。

1AI使用声明

论文中，所有对AI实质性的使用，超出其基础功能，比如自动补全、拼写检查，或搜索引擎AI摘要，都必须明确声明。

2AI风险讨论与缓解措施

论文中，应讨论所用AI工具可能带来的一般性风险，并说明为缓解这些风险已采取的措施。

以下将举例说明：

2.1. 内容虚构，出现了「幻觉」

AI可能会编造参考文献、证明过程或文本，导致事实错误。

建议不要在论文正文中，使用AI生成的文本；若必须使用AI输出，则用不同字体或标记清晰标注。

2.2. 缺乏可复现性

专有AI或高计算成本的结果难以复现。解决方案是，开源提示词、工作流程、认证数据等，让他人能低成本验证。

2.3. 缺乏可解释性

AI输出往往晦涩，其解释可能站不住脚。建议为每个AI输出配以人类撰写的、可读性强的对应内容。

比如，一个定理可以同时包含一个由人类撰写、易于阅读的非形式化证明，以及一个由AI生成但不易阅读的形式化证明。

2.4. 缺乏可验证性

AI易藏细微错误，检查耗时。

形式化验证，一致性检查，都有助于缓解这一问题，并采用多层次方法。

关键是标注验证范围，在定理旁加「校验标记」，未验证部分则明确说明。

2.5. 目标形式化不当

AI可能精确解决「错位」目标，即形式化后的命题偏离作者意图。为此，应从独立来源获取形式化目标，或由人类深入审视形式化过程。

2.6. 可能利用漏洞达成目标

与上一问题相关联，AI可能会钻形式化表述的空子，如添加任意公理「证明」命题。

应对方法是，列出已知漏洞，并讨论排除机制确保过程严谨。

2.7. AI生成代码有Bug

AI生成代码bug更加隐蔽，难以用传统标准方法来检测修复。

为此，建议采用大量单元测试、外部验证，或将AI使用限于简单场景，复杂任务需由人类修改适配。

3 责任归属

最终，论文的所有作者，必须为AI贡献内容承担责任，包括任何不准确、疏漏或虚假陈述。

除非明确标记为「未经核实」，否则作者不能推卸。

以上这些，仅是陶哲轩的抛砖引玉，他希望加入更多的讨论，和业界研究人员进一步完善这份清单。

评论下方，一位研究者John Dvorak直戳痛点——

除非我们能跨过临界点，让所有数学证明都用Lean做形式化验证，成为学界的标配，否则这个问题基本无解。

说到底，在Lean普及之前，这些法子虽然治标不治本。

对此，陶哲轩抛出了最近看到的一个观点，即用AI审稿质量是可以的，但它并非是主要的筛选工具质之一。

否则就会触发「古德哈特定律」（Goodhart's law），AI工具就会找到漏洞，用一些异常、分布之外的文本字符串就能绕开审核。

说白了，AI评估器顶多给人类审核当个辅助，而不能完全取代人类评估者。

参考资料：

https://blog.google/technology/google-deepmind/ai-for-math/?utm_source=x&utm_medium=social&utm_campaign=&utm_content=

https://ai-math.zulipchat.com//channel/539992-Web-public-channel---AI-Math/topic/Best.20practices.20for.20incorporating.20AI.20etc.2E.20in.20papers/near/546518354

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

突发｜Yann LeCun离职，要创业？

机器之心Pro 2025-11-12 10:09:57
0 跟贴 0
OpenAI头号叛徒，竟然是自学的AI?

量子位 2025-08-22 16:06:15
1 跟贴 1

雷军挖来前DeepSeek大将！大模型团队40人合影曝光，疑进军具身智能

智东西 2025-11-12 15:45:12
1 跟贴 1

曝OpenAI布道黑幕！MIT华人记者：他用全人类未来，赌一个AGI神话

新智元 2025-11-11 09:27:00
1 跟贴 1
罗福莉C位亮相小米，离职DeepSeek后首次官宣

量子位 2025-11-12 16:16:00
0 跟贴 0

DeepMind让AI当「上帝」，导演一场只有AI演员的「西部世界」

机器之心Pro 2025-07-16 13:55:45
0 跟贴 0

95后“AI才女”罗福莉，宣布加入小米！曾被雷军千万元年薪挖角，是DeepSeek关键开发者！她出身农村普通家庭，“是家族骄傲”

每日经济新闻 2025-11-12 16:02:11
0 跟贴 0
失衡的乌托邦：Meta的开源AI路线是如何遭遇滑铁卢的

钛媒体APP 2025-11-12 15:31:58
0 跟贴 0

长视频AI数字人来了！字节×浙大(1)

机器之心Pro 2025-09-04 17:27:37
0 跟贴 0
忍无可忍，LeCun离职！Meta市值应声蒸发1400亿

量子位 2025-11-12 14:53:06
7 跟贴 7
MIT破解救援机器人导航瓶颈，无需标定，数秒生成3D场景

DeepTech深科技 2025-11-11 18:54:31
0 跟贴 0
扎克伯格承诺捐款超2000亿美元，加大AI投入，誓要攻克所有疾病

生物世界 2025-11-12 17:06:16
0 跟贴 0
蚂蚁国际开源AI预测大模型超90%预测准确率+60%成本降幅

华尔街见闻官方 2025-11-12 16:45:51
0 跟贴 0
一个叫高斯的AI，只用了三周完成强素数定理

量子位 2025-09-20 00:57:38
0 跟贴 0
五年级数学，宝妈们都说超纲了，其实是不懂整体思想

郎老师趣味数学课堂 2025-11-11 14:17:22
0 跟贴 0
华罗庚杯小学数学竞赛题，会做的孩子寥寥无几

公考客栈店小二 2025-11-08 14:28:00
14 跟贴 14
小升初奥数培优专题分数的复杂化简，从整体入手或局部分解都可行

唐老师小课堂 2025-11-11 13:13:07
0 跟贴 0
675一年级奥数：孩子看到这题就头大，别说还真不好做

我服子佩 2025-11-09 20:45:23
1 跟贴 1
数学不好别慌！跟着视频轻松掌握面积计算！

奥数轻松学 2025-11-11 15:05:56
3 跟贴 3
695一年级思维训练四：问○+△=？可把孩子难住了，难吗？

我服子佩 2025-11-11 19:55:00
0 跟贴 0
2026高考数学世纪金榜一轮复习第十二节导数的与函数的单调性(15)

邹老实课堂 2025-11-11 12:33:35
1 跟贴 1
小学数学课要求做一个表，女孩把“争分夺秒”这个词具象化了

逛吃青岛 2025-11-09 21:19:03
0 跟贴 0
解方程，普通生只会硬算，看看高手的巧妙解法

智慧的小老虎 2025-11-10 22:54:35
3 跟贴 3
人被逼急了什么都会做出来，除了数学，数学不会就是不会！

史襉的生活科普 2025-11-11 01:52:01
1 跟贴 1
何小鹏和雷军真正的塑料兄弟

雷科技 2025-06-06 21:23:05
0 跟贴 0
等量代换原来这么简单！跟着我学，数学难题不再难！

秒懂奥数李菁老师 2025-11-12 15:32:27
3 跟贴 3
3~8岁数学启蒙的秘密，藏在你家的水果、积木和洗澡水里

何圣君 2025-11-11 02:33:32
0 跟贴 0
恭喜你，发明了年龄问题的算法

趣说知识 2025-11-12 09:06:43
0 跟贴 0
祝贺！北京大学两校友当选美国数学会会士

微言校园 2025-11-12 06:51:15
0 跟贴 0
重生之在美国当学霸，美国初中生的数学作业也简单了吧！

快乐车生活1 2025-11-10 17:11:58
0 跟贴 0
高中数学专题点到直线的距离公式的应用，注意分析的顺序

唐老师小课堂 2025-11-11 13:15:36
0 跟贴 0
分享下两周备考意外过了数学教资科三的感受

阿柯考研百宝箱 2025-11-08 19:53:11
0 跟贴 0
高中数学专题不等式参数问题的应用，利用函数方法数形结合来解

唐老师小课堂 2025-11-11 13:16:48
0 跟贴 0
苏州升学不迷路每日一道数学题学完强的可怕第3集

Ponyking 2025-11-10 17:30:07
5 跟贴 5
孩子数学不好，怎么办？

张涔汐 2025-11-11 19:48:17
3 跟贴 3
699你知道这个游乐场的出入口在哪里呢？

我服子佩 2025-11-11 19:56:00
0 跟贴 0
六年级易错题，全班仅2人做对，错误率太高了

郎老师趣味数学课堂 2025-11-11 14:14:54
0 跟贴 0
求三角形面积，根据比例模型求解

公考客栈店小二 2025-11-12 14:33:00
0 跟贴 0
黄仁勋：中国的AI市场无论有没有英伟达都会进步与华为是竞争对手不是敌人

财联社 2025-07-21 10:22:14
6 跟贴 6
数学家看到的世界和我们到底有什么不同？加州理工教授的这本降维书打动了无数读者！

算法与数学之美 2025-11-11 21:12:16
1 跟贴 1

乒乓球全运会：林诗栋0-2落后大逆转！11-3大胜，3-0领先冲16强！

乒乓球全运会：林诗栋0-2落后大逆转！11-3大胜，3-0领先冲16强！

刘姚尧的文字城堡

2025-11-11 18:30:46

今晚19-30直播表：CCTV5+节目单及乒乓球赛程安排

今晚19-30直播表：CCTV5+节目单及乒乓球赛程安排

阿薎美食

2025-11-12 15:17:27

副院长与门诊副主任不雅照，背后的警示？

副院长与门诊副主任不雅照，背后的警示？

小小一米月儿

2025-11-08 08:57:20

全军仅此一例：师长授中将，军长和另外3名师长仅被授予少将

全军仅此一例：师长授中将，军长和另外3名师长仅被授予少将

冰雅忆史

2025-11-12 09:19:39

中字头，突然拉升！

证券时报

2025-11-12 12:59:03

“被三耳光打晕的武术传人”赵鸿刚不过是一个“穿着西服的阿Q”

“被三耳光打晕的武术传人”赵鸿刚不过是一个“穿着西服的阿Q”

壹家言

2025-11-11 15:39:27

李德新已任大连市委副书记

大风新闻

2025-11-12 10:15:05

曾主任和祖院长是真爱？都是久经考验的人，哪有什么真爱

曾主任和祖院长是真爱？都是久经考验的人，哪有什么真爱

合赞历史

2025-11-12 15:12:27

家庭存款11大等级曝光，50%的人难以跨越第四层，你在哪一层？

家庭存款11大等级曝光，50%的人难以跨越第四层，你在哪一层？

历史求知所

2025-11-12 11:35:03

宣布大裁员！4.8万人面临失业

宣布大裁员！4.8万人面临失业

最江阴

2025-11-12 16:10:42

自我勉励，内马尔在社交媒体上晒出科比的经典照片

自我勉励，内马尔在社交媒体上晒出科比的经典照片

懂球帝

2025-11-11 21:35:02

曾琦，女，1981年出生，博士，主任医师，副教授

曾琦，女，1981年出生，博士，主任医师，副教授

岁月有情1314

2025-11-09 09:56:33

10分击败北京，山东斩获第5，鞠维松完成任务，陶汉林收官战26+17

10分击败北京，山东斩获第5，鞠维松完成任务，陶汉林收官战26+17

萌兰聊个球

2025-11-12 15:22:52

全国各地医保亏损，新乡限制医保报销额度，统筹日支付限额50元！

全国各地医保亏损，新乡限制医保报销额度，统筹日支付限额50元！

你食不食油饼

2025-11-11 07:00:06

买了66台苹果手机总价50多万！男子放在平台出租，如今租金拿不到，手机也要不回来

买了66台苹果手机总价50多万！男子放在平台出租，如今租金拿不到，手机也要不回来

潇湘晨报

2025-11-09 22:27:27

郭晶晶没想到，79岁的公公霍震霆再破天花板，让整个豪门圈沉默了

郭晶晶没想到，79岁的公公霍震霆再破天花板，让整个豪门圈沉默了

陈意小可爱

2025-11-10 09:56:04

泪目！全红婵深夜发文，14字道尽心声，告别全运会，陈芋汐送祝福

泪目！全红婵深夜发文，14字道尽心声，告别全运会，陈芋汐送祝福

大秦壁虎白话体育

2025-11-12 09:32:53

赵露思生日音乐会造型封神！又纯又欲氛围感拉满

赵露思生日音乐会造型封神！又纯又欲氛围感拉满

述家娱记

2025-11-09 19:00:42

广汽丰田全新威兰达11月20日上市：RAV4姊妹车型，内外全面换代

广汽丰田全新威兰达11月20日上市：RAV4姊妹车型，内外全面换代

IT之家

2025-11-12 10:02:16

惠特莫尔反戈，火箭首发5将变阵谢泼德与底薪后卫竞争新援缺阵

惠特莫尔反戈，火箭首发5将变阵谢泼德与底薪后卫竞争新援缺阵

钱说体育

2025-11-12 16:42:02

AI产业主平台领航智能+时代

13849文章数 66244关注度

往期回顾全部

科技要闻

Meta"宫斗"持续，AI教父杨立昆被"气"走了

头条要闻

"大客户"租两豪车后人间蒸发车行找到车后一看天塌了

头条要闻

"大客户"租两豪车后人间蒸发车行找到车后一看天塌了

体育要闻

太阳三连胜&活塞东部第一哪个更想不到

娱乐要闻

再王珞丹和白百何明白两人"差别"在哪

财经要闻

专家建议设立5万亿房地产稳定基金

汽车要闻

7座皆独立座椅/新增5座版体验第三代吉利豪越L

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房产

亲子

教育

时尚

本地

房产要闻

海垦城建·鹿城壹号品牌发布会暨美学示范区璀璨启幕

亲子要闻

爸爸说今天让孩子们自制披萨

教育要闻

教育部重磅部署为教师减负，这次能带来彻底好转吗？ “除了畜牧局，都在使唤我们”，教育部重磅部署为教师...

“廓形穿衣法”太火了！掌握这5个法则让你美一整个冬天

本地新闻

云游安徽 | 凌滩玉魄淬千年，诗意钢城马鞍山

© 1997-2025 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版