网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

陶哲轩泼冷水：我不相信AGI！但又一数学难题被GPT-5.2 Pro攻克

2026-01-03 13:28:45　来源: 新智元

北京举报

0

分享至

新智元报道

编辑：Aeneas

【新智元导读】就在刚刚，陶哲轩po文揭秘：当前的AI无法实现真正的AGI，不过，他们倒是拥有一些有用的小聪明，或者可以说「通用狡猾」。而就在同时，又一多年数学难题被GPT-5.2 Pro攻克了。

就在今天，即将离职Meta的LeCun再次给当前AI判死刑——这条路行不通，而且永远不会成功。

前不久，谷歌DeepMind首席科学家Shane Legg给出预测：最小AGI有50%的可能性在2028年实现。

业界都在讨论的AGI之争，陶哲轩是如何看待的？

就在刚刚，陶哲轩po文明确了自己的态度——还不行。

他认为，目前还无法实现AGI。

我怀疑目前工具还无法实现真正意义上的「人工通用智能」。然而，我认为一种较弱但仍然非常有价值的「人工通用才智」，正在以各种方式成为现实。

而他的观点，立马在网上引起了广泛讨论。

网友们表示，陶哲轩这样聪明的人，都认为AGI并未实现，这样太令人绝望了——希望他是错的吧。

陶哲轩：不是AGI，只是魔术师

什么叫通用才智？

陶哲轩是这样解释的。

「通用才智」是指通过某种临时手段解决广泛复杂问题的能力。

这些手段可能是随机的，也可能是暴力计算的成果；它们可能缺乏根基或容易出错；它们可能难以解释，也可能能追溯到AI训练数据中类似的技巧。

因此，它们不能被视为任何真正「智能」的结果。

然而，它们在实现日益广泛的任务时，可以拥有非同寻常的成功率，尤其是在结合严格的验证程序以过滤掉错误或不具前景的方法时，其规模已超出了单个人类所能达到的范围。

可以理解为，这是一种「通用狡猾」AI。

而这种「通用狡猾」AI，就会让人感觉非常匪夷所思。

比如在有时候，这些技术非常实用，令人印象深刻，然而从根本上说，它却令人不满和失望。

AI是「最强大脑」魔术师？

想象这样一个场景：一位魔术师上台，凭空变出鸽子、猜中你选的牌、把水杯变成金鱼。全场掌声雷动，观众目瞪口呆。

结果他平静自曝：「其实我袖子藏了十八个机关，桌下有暗格，牌是特制的，金鱼是提前藏好的。」掌声戛然而止。

如今的AI，就像这位魔术师一样。

它能写诗、编程、解数学题——但如果你问它：「你是怎么想到这个答案的？」

它可能会诚实坦白：「我在训练数据里见过类似题目，概率上这个回答匹配度最高。」

所以，这其实不是智能，而是基于海量数据的「聪明把戏」。

「通用狡猾AI」，反而起了大作用

对于这种「通用狡猾AI」，陶哲轩是怎么解释的。

虽然聪明才智和智力在人类身上是某种程度上相关的特质，但对于AI工具（这些工具通常被优化以追求聪明才智）来说，它们却更加解耦，将当前一代这样的工具主要视为一个随机生成有时聪明，且往往有用的思想和输出的生成器，在尝试使用它们解决难题时，可能是一种更具生产性的视角。

也就是说，智能≠聪明。

对人来说，二者是同时存在的；但对于AI而言，所谓的「聪明」，也就是快速解决复杂问题，可以独立存在。

当前AI的「聪明」，是随机的，暴力的，可错的，难解释的。

最终，它并不是靠智慧取胜，而是靠「大规模试错与匹配」，就像用超级望远镜，在答案星海里捞最亮的几颗。

当今的AI，并不是全知全能，然而这个「不够智能但足够聪明」的工具，却已经悄悄改变知识工作的每一个环节。

对于陶哲轩的说法，网友们表示的确如此。

对于目前的AI来说，看似便利但难以预测的思想，似乎是一种主要应用场景。

可以说，陶哲轩所说的，就是目前AI能力「参差不齐的边界」。

甚至评论区还出现了中文留言，认为目前的AI底层架构就决定了，即使投入无限多的算力，产出的东西也依然有边际。

而在Reddit的帖子中，网友们也对此展开热议。

有人对表示，自己非常尊重陶哲轩，但对他的部分观点表示反驳。

有人说，他用「狡猾」或「巧妙」一词，来针对现代LLM缺乏系统性思维的缺点。

目前，他或许是对的。不过，ChatGPT还只有3岁，如果要宣布所有LLM都有此局限，至少还应该再等待十年。

又一数学难题被AI破解

巧的是，就在陶哲轩发出这个论点不久，又有一道数学难题被AI破解了！

滑铁卢大学计算机系的助理教授Kimon Fountoulakis激动发帖称，GPT-5.2刚刚解决了COLT 2022开放问题——

使用标准加速梯度算法和互补性边界假设，证明加速L1正则化PageRank的运行时间复杂度。

其中，所有证明都由GPT-5.2 Pro生成。算法总工作量的关键界限，则是使用 GPT-5.2 Pro、Aristotle和Antigravity上的Gemini 3 Pro (High) 组合完成了自动的形式化。

多伦多大学的教授Daniel Litt也出来表示，GPT-5.2 Pro的确很强，它对于自己的代数几何和数论研究，都产生了巨大飞跃。

悬赏8年难题，GPT-5.2用数学证明封神

这道难题，已经困扰了教授8年。

自2024年以来，每次OpenAI或谷歌发布一个新模型，他都会拿过来尝试一下。

令人没想到的是，这一次，GPT-5.2竟然成功了！

教授这样回忆道：这个开放性问题，我们尝试了三年，失败了；找博士生做，也失败了；问了多位顶尖学者，都说太难了。

2022年，这道关于「加速L1正则化PageRank算法时间复杂度」的难题，被正式列为COLT国际顶级会议的开放问题之一，悬赏求解。

谁也没想到，两年后，这道难倒无数学者的题目，竟被GPT-5.2悄然攻克。

悬赏

故事要从2016年说起。当时，教授在优化PageRank算法时发现，经典迭代软阈值算法在求解带L1正则的PageRank问题时，其运行时间竟然只与最终解的非零节点数有关，出奇地高

一个很自然的追问随之而来：如果用上加速算法，比如在优化领域声名显赫的FISTA，会不会更快？

理论上应该如此。但现实却泼了一盆冷水：FISTA在迭代过程中会「激活」大量本应为零的节点，虽然最终能收敛到正确的稀疏解，但中间过程却很铺张浪费。

开始，教授尝试了三个月，想从理论上界定FISTA的总计算量，失败了。后来断断续续又试了几次，直到2021年，无论是教授最杰出的学生，还是几位大牛研究者，都对这个问题束手无策。

团队决定，将这个难题公之于众。

2022年，它被正式列为COLT的开放问题，向全球机器学习社区发起挑战。

破局

第一个成功的解法，出现在2023年。David Martínez-Rubio等人提出了一种新颖的加速算法，从完全不同的角度给出解答。

然而，这个算法为了达到加速效果，需要在每一步求解一个昂贵的子问题，在实际应用中效率很低。

直到GPT-5.2发布后，真正的转折点来了。

这一次，GPT-5.2给出了完整的证明。

而且令人震惊的是，它给出的恰恰是针对经典FISTA算法的证明。

它揭示了在一种被称为「互补性边界」的合理假设下，FISTA的总计算量可以被优雅地界定，并且在特定的图结构上，能展现出明确优于经典算法的加速效果。

更关键的是，这个证明解释了长期困扰学界的现象：尽管FISTA在迭代中会激活更多节点，但这些「多余激活」是可控的、暂时的。一旦迭代进入最优解的一个邻域，算法就会迅速收敛。

怎么证明？三重验证

GPT-5.2的证明能令人信服吗？为此，团队搭建了一个三重验证体系。

首先，GPT-5.2 Pro生成了完整的证明初稿。

接着，团队借助@HarmonicMath的Aristotle系统，结合Gemini 3 Pro模型，将证明中的关键不等式和复杂度上界，逐行转化成了形式化的Lean代码。

而且除了形式化验证之外，教授自己也把证明从头到尾证明了两遍。目前看来，证明是没问题的。

陶哲轩会被说服吗

又一数学难题被GPT-5.2 Pro攻克，这不由得引起网友讨论——

它会成为AGI吗？陶哲轩会看到希望吗？

至少，目前GPT-5.2再一次证明了LLM在深度数学推理上的惊人潜力。

而且，它也弥合了理论分析与实际算法之间的鸿沟。它的证明，为最经典的加速算法提供了缺失的理论基石。

当然，这并不意味着AI能取代理论科学家。

可以说，它更像是一个拥有惊人直觉和不知疲倦的协作者。

人类提出关键问题、界定框架、判断价值，AI则能在庞大的数学空间里，帮我们找到那条通往答案的隐秘小径。

参考资料：

https://mathstodon.xyz/@tao/115722360006034040

https://x.com/kfountou/status/2000957773584974298

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标，锁定新智元极速推送！

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

17岁高中生用AI解决数学界难题，陶哲轩、Jeff Dean点赞

机器之心Pro 2026-01-26 14:24:45
6 跟贴 6
陶哲轩亲调AI人设,权游小恶魔、贱女孩蕾吉娜版物理教学,你接受不

机器之心Pro 2026-04-13 10:49:43
0 跟贴 0

90 后正在掌管中国 AI，凭实力活成了「爽文」主角

爱范儿 2026-01-19 18:14:14
0 跟贴 0

山姆·奥特曼的炒作史

DeepTech深科技 2025-12-24 14:02:44
0 跟贴 0
世界引擎：Post-Training开启Physical AGI新纪元

机器之心Pro 2026-04-19 20:00:03
0 跟贴 0

深度｜AGI是不是一个阴谋论？

DeepTech深科技 2025-12-08 15:01:46
0 跟贴 0

陶哲轩：AI不能全用，深度思考不行

量子位 2026-03-19 01:35:49
0 跟贴 0
断网解题，Claude Mythos推翻Erdős 80年猜想！比OpenAI更短更漂亮

新智元 2026-05-27 16:16:12
6 跟贴 6

为什么科技行业越繁荣，岗位越少？

钛媒体APP 2026-05-27 21:44:33
0 跟贴 0
黄仁勋：AGI时代已经到来，“龙虾开公司”不是梦！

财联社 2026-03-26 23:15:59
0 跟贴 0
00后小哥复刻Claude最强神话模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟贴 0
Meta开启“付费时代”：AI聊天机器人、社交流量全装进订阅服务

财联社 2026-05-28 05:02:08
0 跟贴 0
小阶必考压轴题，难度大分值相当高

人间小惬意啊 2026-05-26 19:03:30
0 跟贴 0
初中数学求梯形面积考了好几个知识点

天天数理学习分享 2026-05-26 16:35:51
3 跟贴 3
初中数学求正切值有没有超纲

天天数理学习分享 2026-05-27 15:50:24
3 跟贴 3
小学数学盈亏问题不列方程怎么解

天天数理学习分享 2026-05-25 18:37:07
5 跟贴 5
辅助线还能这样用？小学数学解题新思路！

奥数轻松学 2026-05-25 17:09:19
6 跟贴 6
北京大妈，数学高级教师，55岁退休工作到66岁，退休金令人羡慕

养老规划罗姐说 2026-05-27 09:01:02
0 跟贴 0
五年级数学最大公因数最大公倍数

天天数理学习分享 2026-05-26 16:35:50
4 跟贴 4
妈妈看到孩子做数学作业，他掐指一算，我还以为胜券在握了！

安安生活家 2026-05-26 16:05:00
3 跟贴 3
小升初数学，一片白卷，其实就是分数的通分

大力小学数学 2026-05-26 20:21:00
0 跟贴 0
数学难题解答！快来看看这位老师的巧思妙解吧！

布布丁动漫 2026-05-25 01:04:22
17 跟贴 17
七年级简便计算，你用几秒搞定？

郎老师趣味数学课堂 2026-05-25 20:11:28
0 跟贴 0
中考数学几何，学会这模型秒杀难题

大力小学数学 2026-05-24 09:51:00
0 跟贴 0
307函数问题-2020国考（副省）66将一个圆盘形零件匀

我服子佩 2026-05-26 13:03:41
1 跟贴 1
《生命是大模型，但不仅仅是大语言模型》第十四期：走向工具驱动的时空模型——结论与展望

尹烨 2026-05-26 19:46:15
0 跟贴 0
小学数学思维升级必备，家长收藏，孩子受益！

胡如意 2026-05-26 00:02:57
3 跟贴 3
我不是最聪明的，但我是最踏实的！考研上岸哈工大，数学满分，方向第一！

民生大参考 2026-05-24 06:21:16
0 跟贴 0
你的第一反应谁对了？

言西早老师 2026-05-25 18:16:40
13 跟贴 13
这两天，数学界集体失眠了！听听大哥怎么说的

眼前空城 2026-05-27 06:36:25
0 跟贴 0
小学数学找规律填数：6种基本题型，必须掌握

大力小学数学 2026-05-27 22:12:00
0 跟贴 0
数学想要进步，一定要学会反着学，男子从300分逆袭211

小莉帮忙 2026-05-26 15:07:29
0 跟贴 0
当数学改到最后一道大题时让人一度以为是静止画面网友：老师慢点我写了解记得给一分

重庆城市TV 2026-05-27 14:55:45
0 跟贴 0
AEIS数学对中国孩子，是送分还是坑

新加坡留学助手 2026-05-26 10:15:31
1 跟贴 1
5月24日河南平顶山高二男孩年级第一，数学稳定在140-150分

小莉帮忙 2026-05-26 15:08:12
0 跟贴 0
“数学15分也能成天才？特级教师一眼识破非凡潜力！”

劳子明 2026-05-27 08:26:16
1 跟贴 1
这是你心里想的数字吗

碰个冷知识 2026-05-26 16:32:00
3 跟贴 3
这就是学好数学的理由

武体 2026-05-26 05:18:08
0 跟贴 0
一部图论发展史：从柯尼斯堡七桥到改变世界的现代数学语言

中科院物理所 2026-05-27 13:28:46
0 跟贴 0
压轴题，学霸蒙圈

智慧的小老虎 2026-05-27 19:03:32
0 跟贴 0

朝阳高温来了！

本账号停运

2026-05-27 21:19:04

一人毁掉整部剧？央视剧《主角》唯一败笔，观众：看他演戏真别扭

一人毁掉整部剧？央视剧《主角》唯一败笔，观众：看他演戏真别扭

老黯谈娱

2026-05-26 12:47:27

房龄超过30年的老房子注意了！新规已确定：“收3不收1”，早准备

房龄超过30年的老房子注意了！新规已确定：“收3不收1”，早准备

专业聊房君

2026-05-26 10:22:42

波多野结衣公开择偶标准，想嫁给中国男人，她远比你想象的更优秀

波多野结衣公开择偶标准，想嫁给中国男人，她远比你想象的更优秀

花哥扒娱乐

2026-05-14 20:10:50

一个奇怪的社会现象，凡是有退休金的老人，都不愿意和儿女住一起

一个奇怪的社会现象，凡是有退休金的老人，都不愿意和儿女住一起

艺鉴在线

2026-04-27 13:25:20

这三个星座，能把你爱到怀疑人生

这三个星座，能把你爱到怀疑人生

星座不求人

2026-05-27 20:07:06

王欣瑜法网2-0-2-1连胜晋级16强，冲击150万奖金

王欣瑜法网2-0-2-1连胜晋级16强，冲击150万奖金

吴蛛旅行ing

2026-05-27 06:43:24

山东一民企飞无人机催县农业局“快还钱”，当地回应：正协商解决

山东一民企飞无人机催县农业局“快还钱”，当地回应：正协商解决

上游新闻

2026-05-26 19:50:19

雅克科技，一战封神！

飞鲸投研

2026-05-27 18:45:08

墙倒众人推！王鹤棣离谱行径被扒底朝天，沈月处境让人心酸不已

墙倒众人推！王鹤棣离谱行径被扒底朝天，沈月处境让人心酸不已

勇敢的人享受生活

2026-05-28 01:17:24

“晾了三天，终于臭了”！最近不少人连夜抢购，已卖爆

“晾了三天，终于臭了”！最近不少人连夜抢购，已卖爆

环球网资讯

2026-05-27 09:33:10

米体：伊劳拉即将接手水晶宫帅位，不会执教米兰

米体：伊劳拉即将接手水晶宫帅位，不会执教米兰

懂球帝

2026-05-28 04:50:10

油价要跌破天了！5月26日油价迎来大幅暴跌，调价后全国油价价格

油价要跌破天了！5月26日油价迎来大幅暴跌，调价后全国油价价格

刘哥谈体育

2026-05-26 14:06:15

Mac mini M5重磅曝光 AI算力暴涨3.5倍堪比小型服务器

Mac mini M5重磅曝光 AI算力暴涨3.5倍堪比小型服务器

辉哥说动漫

2026-05-27 00:19:33

最佳睡眠时长又更新了！Nature和Cell：6.4-7.8小时最抗衰，少于6小时死亡风险激增50%；每晚9-11点入睡能年轻3岁，肝脏40岁就率先加速衰老

最佳睡眠时长又更新了！Nature和Cell：6.4-7.8小时最抗衰，少于6小时死亡风险激增50%；每晚9-11点入睡能年轻3岁，肝脏40岁就率先加速衰老

梅斯医学

2026-05-26 07:52:52

医生发现：每天早起后先排便的人，用不了半年身体或迎来5改变

医生发现：每天早起后先排便的人，用不了半年身体或迎来5改变

垚垚分享健康

2026-05-15 16:59:08

知名户外主播发生意外，Z疮发作大便失禁，恶臭难挡被取笑

知名户外主播发生意外，Z疮发作大便失禁，恶臭难挡被取笑

新游戏大妹子

2026-05-27 12:54:49

“免费采摘”不实视频致258亩荠菜地遭数百人哄抢！种植户称未获赔偿，已申请刑事立案

“免费采摘”不实视频致258亩荠菜地遭数百人哄抢！种植户称未获赔偿，已申请刑事立案

浪潮新闻

2026-05-26 20:36:57

王欣瑜回应争议：对手故意指错误球印误导主裁赛后说拒与我握手

王欣瑜回应争议：对手故意指错误球印误导主裁赛后说拒与我握手

我爱英超

2026-05-27 21:27:16

重案实录——“买命钱” 山东菏泽刘娜杀夫案纪实

重案实录——“买命钱” 山东菏泽刘娜杀夫案纪实

重案实录

2026-05-26 15:55:18

AI产业主平台领航智能+时代

15321文章数 66892关注度

往期回顾全部

科技要闻

韬定律：全球在卷纳米数华为换了一把尺子

头条要闻

特朗普警告盟友阿曼：不守规矩会被“炸飞”

头条要闻

特朗普警告盟友阿曼：不守规矩会被“炸飞”

体育要闻

这群老阿姨，是最硬核的马刺球迷

娱乐要闻

王鹤棣风波连累父亲炸串店遭差评?

财经要闻

中国半导体的阳谋

汽车要闻

限时补贴价9.28-10.98万 MG 4X正式上市

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

艺术

旅游

房产

数码

本地

艺术要闻

蚂蚁新总部封顶了！大圆环到底有啥魔力，科技公司都抢着用？

旅游要闻

5月27日最佳情报|晨韵如诗超治愈，蜀葵绽放花枝温婉雅致

房产要闻

合生创展前总裁被查！直指房企违规放贷、利益输送等问题

数码要闻

别盲目跟风！今年618买笔记本，认准这6款就够了

本地新闻

用剪纸的方式，打开江苏扬州

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版