网易首页 > 网易号 > 正文 申请入驻

陶哲轩联手GPT-5,1小时攻克数学难题!全程无需编码,OpenAI副总惊呼

0
分享至


新智元报道

编辑:桃子

【新智元导读】陶哲轩联手ChatGPT,多轮交互一个小时,最终破解了MathOverflow复杂数学题。让他惊喜的是,AI不仅省去了数小时编码,还优化了工作流。

两年前,陶哲轩曾预言,「2026年的AI,将成为数学研究和其他很多领域的可靠的合作者」。


现在,不用等到2026年,AI已经做到了!

在Mathstodon上,陶哲轩称,自己联手ChatGPT攻克了一个MathOverflow难题,节省了数小时的编码时间。

在此期间,对话持续长达一小时。


OpenAI副总Kevin Weil激动表示,「陶哲轩+AI解决了复杂数学难题」。


OpenAI科学家Sebastien Bubeck自豪地表示,「这次,是陶哲轩本人的」。

几天前,GPT-5成功破解三大猜想,通过了「哥德尔测试」,以往需要耗费人类博士生数日时间才能完成。


如今,越来越多的证据表明,AI正为数学发现做出实质性的贡献。

这一次,陶哲轩携手ChatGPT,攻克了怎样的难题?

陶哲轩+GPT-5,破解数学难题

这个MathOverflow的问题,探讨了「最小公倍数序列是否为某一特定集合的子集」——

序列lcm(1,2,…,n)是否是高度丰数的一个子集?


陶哲轩本人通过理论分析,已经得出结论:答案是否定的。

然而,要完全证明这一点,他需要找到具体的数值参数,以便确凿地构建一个反例。


这一过程看似简单,实则需要繁琐的计算和参数搜索,稍有不慎便可能陷入低效的泥潭。

初试ChatGPT,多轮交互

起初,陶哲轩尝试让ChatGPT直接生成Python代码,以搜索满足条件的不等式参数。

这样一来,就可以自己运行和调整。

不过,这一方法很快暴露了局限性——

生成的代码运行时间过长,且初始参数选择不当,最终会导致搜索的失败。


于是接下来,他改变了策略,转而与AI展开分步对话,让它通过启发式计算来寻找可行的参数选项。

这种方法的核心在于:将复杂问题拆解为小步骤,每一步都由AI提供计算支持,并在陶哲轩的指导下不断优化。


最终,AI成功生成了符合要求的参数。

为了确保结果的可靠性,陶哲轩使用了一个由AI生成的29行Python脚本进行独立验证。

这个脚本简洁明了,易于人工检查,且验证的数值结果与之前的启发式预测完全吻合。


不用手动编码,优化工作流

陶哲轩坦言,AI在这一过程中的作用不可忽视。

AI不仅帮助他发现了初始尝试中的多处数学错误,还将原本可能耗费数小时的编程与调试工作,压缩为一个高效的流程。

如果没有AI的协助,他根本不会尝试这种数值搜索,而是转而寻求更传统的理论分析方法。


更重要的是,陶哲轩强调,他没有遇到AI常见的「幻觉」问题。

这得益于他清晰的任务规划,以及分步引导的对话方式。

每一步计算,都在自己的监督下完成,AI仅在最后阶段提供了数值结果和验证代码,确保了整个过程的严谨性。

我认为,这是因为对需要执行的那些繁琐的计算任务,我心里已经有了比较清晰的规划,并且能够以分步的方式向AI详细解释,每一步都在对话中得到确认后,再继续下一步。

在切换到对话式策略后,我只在最后阶段才用Python进行外部验证,也就是当AI生成了它声称满足约束条件的数值输出时。


顺便提一句,陶哲轩本人用的就是,所有人接触到的GPT-5。


陶哲轩的这次尝试,为我们揭示了AI在数学研究中的巨大潜力。

它不仅能执行繁琐的计算任务,还能在数学家的引导下,参与复杂的探索过程。

AI的价值在于解放研究者的时间与精力,让他们能够专注于更高层次的思考与创新。

正如陶哲轩所言,「如果没有 AI 的帮助,我很可能不会去尝试这种数值搜索」。

从AI拿下IMO金牌,到成为天才数学家的得力助手,或许未来,类似的故事将更多领域不断上演。

参考资料:

https://x.com/kevinweil/status/1974161952260624459

https://x.com/minilek/status/1974118573569421650

https://x.com/slow_developer/status/1974238028743811544

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中美贸易变化,CNN做了4张图

中美贸易变化,CNN做了4张图

环球时报国际
2025-11-04 00:12:16
全红婵夺金,新搭档身份不简单,赛后发文信息量大,郭晶晶没说错

全红婵夺金,新搭档身份不简单,赛后发文信息量大,郭晶晶没说错

白面书誏
2025-11-03 16:36:30
“不孝之人罪逆天”!台网红“馆长”帮赖清德寻根,宗亲喊话

“不孝之人罪逆天”!台网红“馆长”帮赖清德寻根,宗亲喊话

海峡导报社
2025-11-04 07:23:03
美国将正式废除航母电磁弹射,但造蒸汽弹射器的美国企业已经有党委书记了

美国将正式废除航母电磁弹射,但造蒸汽弹射器的美国企业已经有党委书记了

远方青木
2025-11-04 00:36:51
特朗普最新涉华表态

特朗普最新涉华表态

政知新媒体
2025-11-03 21:46:45
俄罗斯最大石油港口遇袭!5艘万吨油轮起火爆炸

俄罗斯最大石油港口遇袭!5艘万吨油轮起火爆炸

项鹏飞
2025-11-03 20:38:50
伏尸百万,这个国家已经进入大屠杀模式 | 地球知识局

伏尸百万,这个国家已经进入大屠杀模式 | 地球知识局

地球知识局
2025-11-03 21:00:07
中国汽车出海,高德点亮世界地图

中国汽车出海,高德点亮世界地图

晚点LatePost
2025-11-03 11:29:51
字母哥33+13+5压哨绝杀雄鹿险胜步行者 西卡32+8+5

字母哥33+13+5压哨绝杀雄鹿险胜步行者 西卡32+8+5

醉卧浮生
2025-11-04 10:42:01
胡锡进:美国4200万人失去食物援助!网友冷笑,先关心下同胞吧!

胡锡进:美国4200万人失去食物援助!网友冷笑,先关心下同胞吧!

你食不食油饼
2025-11-04 05:05:12
阿里前高管掌舵山姆,APP界面遭狂喷:一股盒马味!

阿里前高管掌舵山姆,APP界面遭狂喷:一股盒马味!

雷科技
2025-11-03 22:13:43
北京房价“回到解放前”?2022至今,二手房成交均价降了34.9%

北京房价“回到解放前”?2022至今,二手房成交均价降了34.9%

知识圈
2025-11-04 09:28:45
狂轰74+22+15!三巨头齐发威,火箭豪取四连胜!华盛顿空砍29+12

狂轰74+22+15!三巨头齐发威,火箭豪取四连胜!华盛顿空砍29+12

鬼魅突破上篮
2025-11-04 11:54:29
“饿了么”将更名为“淘宝闪购”?骑手已同步更换橙黑新工服

“饿了么”将更名为“淘宝闪购”?骑手已同步更换橙黑新工服

澎湃新闻
2025-11-04 11:32:28
现在整个AI投资逻辑都错了!微软CEO首次承认:成排的H100正在积灰,插不上电

现在整个AI投资逻辑都错了!微软CEO首次承认:成排的H100正在积灰,插不上电

AI寒武纪
2025-11-03 22:57:12
雷人呀,军!您的视频号居然限制评论

雷人呀,军!您的视频号居然限制评论

不主流讲话
2025-11-04 00:14:37
苏丹爆发大屠杀!数万人被杀尸体堆积如山

苏丹爆发大屠杀!数万人被杀尸体堆积如山

亚太观澜
2025-11-02 21:27:06
星巴克中国易主,博裕投资40亿美元拿下至多60%股权

星巴克中国易主,博裕投资40亿美元拿下至多60%股权

界面新闻
2025-11-04 08:33:42
尼日尔撕毁4亿美元合同,驱逐中国高管,我方暗藏后手,给它狠狠教训

尼日尔撕毁4亿美元合同,驱逐中国高管,我方暗藏后手,给它狠狠教训

诡谲怪谈
2025-04-30 23:32:55
美交通部长称或因政府“停摆”关闭空域

美交通部长称或因政府“停摆”关闭空域

界面新闻
2025-11-03 22:37:43
2025-11-04 12:12:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13779文章数 66236关注度
往期回顾 全部

科技要闻

OpenAI“杀”疯了!又一笔380亿大单

头条要闻

牛弹琴:想想不对劲 德国外长又主动给中方打来了电话

头条要闻

牛弹琴:想想不对劲 德国外长又主动给中方打来了电话

体育要闻

27岁热刺门将,夺冠后退役当导演

娱乐要闻

《繁花》录音事件完整版长达43分钟

财经要闻

作价40亿美元!星巴克中国易主

汽车要闻

上汽旗舰智己LS9首发评测 可能是最好开的9系SUV

态度原创

艺术
本地
房产
家居
公开课

艺术要闻

赵孟頫66岁行书,精到劲健!

本地新闻

全网围观,到底多少人被这个野人大学生笑疯了

房产要闻

信达·繁花里 | 老照片征集活动 温情启幕

家居要闻

年轻态度 功能舒适兼备

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版