网易首页 > 网易号 > 正文 申请入驻

陶哲轩联手GPT-5,1小时攻克数学难题!全程无需编码,OpenAI副总惊呼

0
分享至


新智元报道

编辑:桃子

【新智元导读】陶哲轩联手ChatGPT,多轮交互一个小时,最终破解了MathOverflow复杂数学题。让他惊喜的是,AI不仅省去了数小时编码,还优化了工作流。

两年前,陶哲轩曾预言,「2026年的AI,将成为数学研究和其他很多领域的可靠的合作者」。


现在,不用等到2026年,AI已经做到了!

在Mathstodon上,陶哲轩称,自己联手ChatGPT攻克了一个MathOverflow难题,节省了数小时的编码时间。

在此期间,对话持续长达一小时。


OpenAI副总Kevin Weil激动表示,「陶哲轩+AI解决了复杂数学难题」。


OpenAI科学家Sebastien Bubeck自豪地表示,「这次,是陶哲轩本人的」。

几天前,GPT-5成功破解三大猜想,通过了「哥德尔测试」,以往需要耗费人类博士生数日时间才能完成。


如今,越来越多的证据表明,AI正为数学发现做出实质性的贡献。

这一次,陶哲轩携手ChatGPT,攻克了怎样的难题?

陶哲轩+GPT-5,破解数学难题

这个MathOverflow的问题,探讨了「最小公倍数序列是否为某一特定集合的子集」——

序列lcm(1,2,…,n)是否是高度丰数的一个子集?


陶哲轩本人通过理论分析,已经得出结论:答案是否定的。

然而,要完全证明这一点,他需要找到具体的数值参数,以便确凿地构建一个反例。


这一过程看似简单,实则需要繁琐的计算和参数搜索,稍有不慎便可能陷入低效的泥潭。

初试ChatGPT,多轮交互

起初,陶哲轩尝试让ChatGPT直接生成Python代码,以搜索满足条件的不等式参数。

这样一来,就可以自己运行和调整。

不过,这一方法很快暴露了局限性——

生成的代码运行时间过长,且初始参数选择不当,最终会导致搜索的失败。


于是接下来,他改变了策略,转而与AI展开分步对话,让它通过启发式计算来寻找可行的参数选项。

这种方法的核心在于:将复杂问题拆解为小步骤,每一步都由AI提供计算支持,并在陶哲轩的指导下不断优化。


最终,AI成功生成了符合要求的参数。

为了确保结果的可靠性,陶哲轩使用了一个由AI生成的29行Python脚本进行独立验证。

这个脚本简洁明了,易于人工检查,且验证的数值结果与之前的启发式预测完全吻合。


不用手动编码,优化工作流

陶哲轩坦言,AI在这一过程中的作用不可忽视。

AI不仅帮助他发现了初始尝试中的多处数学错误,还将原本可能耗费数小时的编程与调试工作,压缩为一个高效的流程。

如果没有AI的协助,他根本不会尝试这种数值搜索,而是转而寻求更传统的理论分析方法。


更重要的是,陶哲轩强调,他没有遇到AI常见的「幻觉」问题。

这得益于他清晰的任务规划,以及分步引导的对话方式。

每一步计算,都在自己的监督下完成,AI仅在最后阶段提供了数值结果和验证代码,确保了整个过程的严谨性。

我认为,这是因为对需要执行的那些繁琐的计算任务,我心里已经有了比较清晰的规划,并且能够以分步的方式向AI详细解释,每一步都在对话中得到确认后,再继续下一步。

在切换到对话式策略后,我只在最后阶段才用Python进行外部验证,也就是当AI生成了它声称满足约束条件的数值输出时。


顺便提一句,陶哲轩本人用的就是,所有人接触到的GPT-5。


陶哲轩的这次尝试,为我们揭示了AI在数学研究中的巨大潜力。

它不仅能执行繁琐的计算任务,还能在数学家的引导下,参与复杂的探索过程。

AI的价值在于解放研究者的时间与精力,让他们能够专注于更高层次的思考与创新。

正如陶哲轩所言,「如果没有 AI 的帮助,我很可能不会去尝试这种数值搜索」。

从AI拿下IMO金牌,到成为天才数学家的得力助手,或许未来,类似的故事将更多领域不断上演。

参考资料:

https://x.com/kevinweil/status/1974161952260624459

https://x.com/minilek/status/1974118573569421650

https://x.com/slow_developer/status/1974238028743811544

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
库里31+5勇士不敌老鹰结束连胜,巴特勒30+7+6约翰逊23+11

库里31+5勇士不敌老鹰结束连胜,巴特勒30+7+6约翰逊23+11

湖人崛起
2026-01-12 11:58:38
多款茅台酒降价!酒商意见很大

多款茅台酒降价!酒商意见很大

食悟
2026-01-12 21:29:32
有哪些以为是小罪,其实是重罪,判刑很重的案例?网友:不敢了

有哪些以为是小罪,其实是重罪,判刑很重的案例?网友:不敢了

另子维爱读史
2026-01-11 19:22:33
高血糖的6个 “致命信号”,出现1个就赶紧干预!

高血糖的6个 “致命信号”,出现1个就赶紧干预!

医药养生保健报社
2026-01-12 22:18:09
曝周定洋将加盟新鹏城!双方已签约,记者:一点让他选择深圳

曝周定洋将加盟新鹏城!双方已签约,记者:一点让他选择深圳

奥拜尔
2026-01-12 23:03:08
载誉归来,西超杯冠军奖杯已随队抵达巴塞罗那

载誉归来,西超杯冠军奖杯已随队抵达巴塞罗那

懂球帝
2026-01-12 16:03:20
“青提”是大陆用语?基隆一甜品店被轰“滚出台湾”,台网友:文字狱

“青提”是大陆用语?基隆一甜品店被轰“滚出台湾”,台网友:文字狱

海峡导报社
2026-01-12 16:12:04
司晓迪嫂子事件后续,外网她的账号曝出猛料,承认鹿晗床上能力强

司晓迪嫂子事件后续,外网她的账号曝出猛料,承认鹿晗床上能力强

花哥扒娱乐
2026-01-11 20:19:22
一锤在锤!檀健次恋情升级,女方再放猛料,这次恐凉凉了

一锤在锤!檀健次恋情升级,女方再放猛料,这次恐凉凉了

洲洲影视娱评
2026-01-11 14:59:31
师胜杰:至死不肯戒酒,离世4年后,遗孀宋艳的坚持让人泪目

师胜杰:至死不肯戒酒,离世4年后,遗孀宋艳的坚持让人泪目

丰谭笔录
2026-01-10 07:40:11
古人指出北平建都有巨大弊端,毛主席也犹豫,一高人帮他下定决心

古人指出北平建都有巨大弊端,毛主席也犹豫,一高人帮他下定决心

鹤羽说个事
2026-01-03 11:17:57
2012年安徽30岁医学博士孕期瘫痪,生子后丈夫提离婚,如今翻盘​

2012年安徽30岁医学博士孕期瘫痪,生子后丈夫提离婚,如今翻盘​

小熊侃史
2026-01-12 07:35:07
本分与表演,假发与短裤:王石与段永平的认知鸿沟

本分与表演,假发与短裤:王石与段永平的认知鸿沟

数局
2025-12-14 17:00:19
这应该是目前世界上最美的女总统了。

这应该是目前世界上最美的女总统了。

南权先生
2026-01-03 17:05:59
原形毕露!特朗普称:美国靠战争赚钱!露馅后,又慌忙甩锅拜登?

原形毕露!特朗普称:美国靠战争赚钱!露馅后,又慌忙甩锅拜登?

王爷说图表
2026-01-12 23:04:14
扒一扒商业航天的“独家饭碗”公司,火箭发射,卫星通信

扒一扒商业航天的“独家饭碗”公司,火箭发射,卫星通信

风风顺
2026-01-11 03:00:03
你是否愿意在一个小县城待一辈子?这是我见过最简明易懂的回答!

你是否愿意在一个小县城待一辈子?这是我见过最简明易懂的回答!

夜深爱杂谈
2026-01-12 17:44:32
什么原因导致毛不易高开低走?网友的评论,已经给出了答案

什么原因导致毛不易高开低走?网友的评论,已经给出了答案

夜深爱杂谈
2025-12-01 20:18:52
进口药悄悄 “消失”?公立医院基本买不着,进口药咋越来越少了

进口药悄悄 “消失”?公立医院基本买不着,进口药咋越来越少了

百科密码
2025-12-29 15:36:14
徐达常遇春他们都是农民,为何起义后却成了军事天才?原因很现实

徐达常遇春他们都是农民,为何起义后却成了军事天才?原因很现实

铭记历史呀
2026-01-10 13:09:37
2026-01-13 00:04:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14319文章数 66454关注度
往期回顾 全部

科技要闻

面对SpaceX疯狂“下饺子” 中国正面接招

头条要闻

外媒问王毅调整索马里行程是否出于安全考虑 中方回应

头条要闻

外媒问王毅调整索马里行程是否出于安全考虑 中方回应

体育要闻

一场安东尼奥式胜利,给中国足球带来惊喜

娱乐要闻

蔡少芬结婚18周年,与张晋过二人世界

财经要闻

倍轻松信披迷雾 实控人占用资金金额存疑

汽车要闻

增配不加价 北京现代 第五代 胜达2026款上市

态度原创

时尚
健康
教育
数码
亲子

看了日本主妇的搭配才明白,年纪大了这么穿,优雅又不油腻

血常规3项异常,是身体警报!

教育要闻

劝退:英国挨骂率最高的专业!

数码要闻

2025年全球PC出货量近2.8亿台 笔记本超2.2亿台

亲子要闻

轮班,宝妈理所应当固定周日休,网友:家庭地位低,把同事当老公

无障碍浏览 进入关怀版