网易首页 > 网易号 > 正文 申请入驻

GPT-5.4 Pro两小时解出百年数学难题,这算"发现"还是"检索"?

0
分享至

陶哲轩盯着屏幕看了很久。这位菲尔兹奖得主在论坛上敲下一行字:模型揭示的整数结构与马尔可夫过程之间的关联,"远超解决这个具体问题的意义"。

让顶级数学家如此动容的,是OpenAI的GPT-5.4 Pro。它用约80分钟解出了埃尔德什开放问题第1196号——一个悬置多年的数论难题,又花30分钟把证明写成LaTeX论文。形式验证正在进行中。


正方:这就是"新发现"

支持者的证据很具体。即将加入OpenAI科学团队的Kevin Barreto指出,模型使用的马尔可夫链技巧是人类数学家"多年工作都忽略的创造性步骤"。

陶哲轩的观察更深层:解法建立了"此前未被描述的关联"。这不是在已知答案里做匹配,而是从已知数据中提炼出人类未曾看见的结构。

这场讨论触及AI研究的核心焦虑:大语言模型能否超越训练数据,产生真正的新知识?这个案例似乎给出了肯定答案——新知识可以"隐藏"在旧数据里,等待被足够强的模式识别能力解锁。

反方:只是"高级检索"

怀疑者的质疑同样尖锐。80分钟解题、30分钟写论文的速度,是否暗示模型曾在训练数据中见过类似结构?埃尔德什问题虽开放,但数论领域的工具库相对有限。

更深层的反驳是方法论层面的:即使输出是"新"的,过程是否算"发现"?人类数学家的创造性往往伴随试错、直觉跳跃和概念重构,而LLM的推理仍是概率性的token生成。

形式验证的结果至关重要——它区分了"看起来对的证明"和"确实对的证明"。历史上不乏看似优雅实则错误的数学论证。

我的判断:边界正在模糊

这件事的真正价值不在于"AI是否比人聪明",而在于它迫使我们重新定义"发现"本身。

传统认知中,发现需要意图、直觉和系统性探索。但GPT-5.4 Pro展示了一种新型认知劳动:以超人类尺度关联 distant concepts(远距离概念),在数据密度的缝隙中定位人类视线盲区。

陶哲轩说的"远超具体问题",点出了关键——工具的价值不在于替代人类提问,而在于扩展人类可问的问题范围。当AI能自动建立整数结构与随机过程之间的桥梁,数学家的工作重心必然向问题定义和意义阐释迁移。

更值得观察的是组织层面:OpenAI将"AI for Science"设为专门团队,Barreto的加盟只是最新动作。这意味着数学突破不是副产品,而是产品路线图上的明确站点。

形式验证完成后,这个证明将被拆解、审视、教学。无论最终结论如何,它已经成为一个测试案例——关于人机认知分工的边界,关于"理解"是否需要被重新定义。

如果机器能在两小时内完成人类数年未竟的工作,我们是否应该重新设计数学教育的核心目标?当发现的速度超越验证的速度,学术共同体的质量控制机制又该如何进化?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
离谱!24岁中国萨娃忘记报名+从资格赛打起 对手崩溃:虐菜很爽吗

离谱!24岁中国萨娃忘记报名+从资格赛打起 对手崩溃:虐菜很爽吗

风过乡
2026-04-16 13:17:51
祖巴茨与娇妻观战快船附加赛憾负勇士!妻子生娃后仍是高颜值

祖巴茨与娇妻观战快船附加赛憾负勇士!妻子生娃后仍是高颜值

Emily说个球
2026-04-16 19:20:27
伊拉克开始通过叙利亚港口出口原油

伊拉克开始通过叙利亚港口出口原油

新华社
2026-04-16 22:59:06
这是青年时期毛岸青,这张照片眉眼神态极像母亲杨开慧

这是青年时期毛岸青,这张照片眉眼神态极像母亲杨开慧

乡野小珥
2026-04-11 18:37:43
突然,跳水!美伊谈判,突传大消息!油价,大幅拉升

突然,跳水!美伊谈判,突传大消息!油价,大幅拉升

数据宝
2026-04-16 19:56:18
惊人的两倍电力鸿沟,让所有制裁成了笑话

惊人的两倍电力鸿沟,让所有制裁成了笑话

李荣茂
2026-01-20 08:45:13
40岁王丽坤现身浙江街头,个儿高挑还瘦,皮肤贼白,长得老好看了

40岁王丽坤现身浙江街头,个儿高挑还瘦,皮肤贼白,长得老好看了

东方不败然多多
2026-04-15 13:37:46
张凌赫一句“不方便吗”,金靖大方回“来月经了”,全场默契护驾

张凌赫一句“不方便吗”,金靖大方回“来月经了”,全场默契护驾

情感大头说说
2026-04-16 20:42:51
美国宣布:启动“经济狂怒”行动,对伊朗施加最大化经济压力!伊朗航运物资封锁范围被扩大,军火、原油、钢铁等被纳入

美国宣布:启动“经济狂怒”行动,对伊朗施加最大化经济压力!伊朗航运物资封锁范围被扩大,军火、原油、钢铁等被纳入

扬子晚报
2026-04-16 21:06:29
78年前的老报纸,以色列建国时,人民日报是这样报道的

78年前的老报纸,以色列建国时,人民日报是这样报道的

梦在深巷aqa
2026-03-17 13:52:26
新娘确实漂亮,但我更喜欢戴眼镜那个。

新娘确实漂亮,但我更喜欢戴眼镜那个。

动物奇奇怪怪
2026-04-12 12:44:36
美封锁霍尔木兹海峡:自嗨式“霸权秀”,遭盟友反水成国际笑柄

美封锁霍尔木兹海峡:自嗨式“霸权秀”,遭盟友反水成国际笑柄

利刃号
2026-04-16 22:25:44
沧州阻击战,1.3万杂牌军七天耗弹140万发,以强悍重创日军千余人

沧州阻击战,1.3万杂牌军七天耗弹140万发,以强悍重创日军千余人

唠叨说历史
2026-03-05 17:12:55
事实证明,被奶奶“雪藏”的神童王恒屹,如今已走上另一条大道

事实证明,被奶奶“雪藏”的神童王恒屹,如今已走上另一条大道

云景侃记
2026-04-15 19:45:04
心源性猝死的人越来越多?医生强调:宁可打打牌,建议别做这7事

心源性猝死的人越来越多?医生强调:宁可打打牌,建议别做这7事

医学原创故事会
2026-03-29 23:50:13
一场126-121的大逆转,让快船认清现实、太阳绝望,雷霆也失算了

一场126-121的大逆转,让快船认清现实、太阳绝望,雷霆也失算了

毒舌NBA
2026-04-16 13:43:07
教育部新规落地!9月上学全变了,家长趁早看,早了解早安排

教育部新规落地!9月上学全变了,家长趁早看,早了解早安排

小谈食刻美食
2026-04-16 07:28:48
张兰沉默了!马筱梅直接下通知要同住,还给她戴了好奶奶的高帽子

张兰沉默了!马筱梅直接下通知要同住,还给她戴了好奶奶的高帽子

橙星文娱
2026-04-16 15:52:02
格力怒斥海信,称其没资格用“真铜实料”四字进行宣传,海信高管回怼:又当又立

格力怒斥海信,称其没资格用“真铜实料”四字进行宣传,海信高管回怼:又当又立

大风新闻
2026-04-15 15:07:03
石油涨价,正把国产车送上「霸主」地位?

石油涨价,正把国产车送上「霸主」地位?

道总有理
2026-04-15 19:11:42
2026-04-16 23:44:49
野生运营
野生运营
懂点产品,懂点AI,正在努力给平淡日子搞点新花样。
1502文章数 25关注度
往期回顾 全部

科技要闻

赵明:智驾之战,看谁在大模型上更高效

头条要闻

东北男子投诉公交提前发车丢工作 单位被施压将其解雇

头条要闻

东北男子投诉公交提前发车丢工作 单位被施压将其解雇

体育要闻

皇马拜仁踢出名局,但最抢镜的还是他

娱乐要闻

丝芭传媒创始人王子杰去世,享年63岁

财经要闻

海尔与医美女王互撕 换血抗衰生意迷雾

汽车要闻

空间大五个乘客都满意?体验岚图泰山X8

态度原创

艺术
健康
时尚
亲子
军事航空

艺术要闻

张大千『 花菓荟萃册』

干细胞抗衰4大误区,90%的人都中招

爆火的前额叶梗,让多少年轻人主动确诊「脑残」?

亲子要闻

有两娃的家庭每天都有断不完的官司

军事要闻

封锁霍尔木兹海峡后 美释放双重信号

无障碍浏览 进入关怀版