网易首页 > 网易号 > 正文 申请入驻

AI模型开始攻克高难度数学问题

0
分享至


软件工程师、前量化研究员兼创业公司创始人Neel Somani在周末测试OpenAI新模型的数学能力时,有了意外发现。他将数学问题粘贴到ChatGPT中,让它思考15分钟后,回来时发现了一个完整的解答。他使用名为Harmonic的工具评估并形式化了这个证明,结果全部正确。

"我想确定一个基准线,了解大语言模型何时能够有效解决开放性数学问题,以及它们在哪些地方存在困难,"Somani说。令人惊讶的是,使用最新模型时,这个前沿界限开始向前推进。

ChatGPT的思维链条更加令人印象深刻,它熟练运用勒让德公式、贝特兰定理和大卫之星定理等数学公理。最终,该模型找到了一篇2013年的Math Overflow帖子,哈佛数学家Noam Elkies在其中给出了类似问题的优雅解答。但ChatGPT的最终证明在重要方面不同于Elkies的工作,并对传奇数学家保罗·厄尔德什提出的问题版本给出了更完整的解答。厄尔德什留下的大量未解问题已经成为AI的试验场。

对于任何对机器智能持怀疑态度的人来说,这是一个令人惊讶的结果,而且这并非唯一案例。AI工具在数学领域已经变得无处不在,从专注形式化的大语言模型如Harmonic的Aristotle,到文献综述工具如OpenAI的深度研究。但自GPT 5.2发布以来——Somani形容其"在数学推理方面明显比以往版本更熟练"——已解决问题的庞大数量变得难以忽视,这引发了关于大语言模型推进人类知识前沿能力的新问题。

Somani研究的是厄尔德什问题集,这是由这位匈牙利数学家提出的1000多个猜想的在线合集。这些问题已成为AI驱动数学研究的诱人目标,在主题和难度上都存在显著差异。第一批自主解答出现在11月,来自名为AlphaEvolve的Gemini驱动模型,但最近,Somani和其他人发现GPT 5.2在高级数学方面表现出色。

自圣诞节以来,厄尔德什网站上已有15个问题从"开放"状态转为"已解决",其中11个解答明确指出AI模型参与了求解过程。

备受尊敬的数学家陶哲轩在其GitHub页面上对这一进展持更加细致的看法,他统计了8个不同的问题,AI模型在厄尔德什问题上取得了有意义的自主进展,另有6个案例通过定位和基于先前研究取得了进展。AI系统距离无需人工干预进行数学计算还有很长的路要走,但显然大语言模型可以发挥重要作用。

陶哲轩在Mastodon上推测,AI系统的可扩展性使其"更适合系统性地应用于那些鲜为人知的厄尔德什问题的'长尾',其中许多实际上有直接的解答。"

"因此,许多较简单的厄尔德什问题现在更可能通过纯AI方法解决,而不是通过人工或混合方式,"陶哲轩继续说道。

另一个推动因素是最近向形式化的转变,这是一项劳动密集型任务,使数学推理更容易验证和扩展。形式化不需要使用AI甚至计算机,但一批新的自动化工具使这一过程变得容易得多。2013年在微软研究院开发的开源"证明助手"Lean,已在该领域得到广泛应用作为形式化证明的方法,而像Harmonic的Aristotle这样的AI工具承诺将大部分形式化工作自动化。

对于Harmonic创始人Tudor Achim来说,厄尔德什问题解答数量的突然增加不如世界上最伟大的数学家开始认真对待这些工具重要。"我更关心数学和计算机科学教授正在使用[AI工具]这一事实,"Achim说。"这些人有声誉需要保护,所以当他们说使用Aristotle或ChatGPT时,这是真实的证据。"

Q&A

Q1:GPT 5.2在数学问题求解方面有什么突破?

A:GPT 5.2在数学推理方面比以往版本更熟练,能够独立解决高难度数学问题。软件工程师Somani测试发现,该模型能够在15分钟内给出完整的数学证明,甚至解决了传奇数学家保罗·厄尔德什提出的问题,并给出比以往更完整的解答。

Q2:AI在厄尔德什问题上取得了哪些成果?

A:自圣诞节以来,厄尔德什网站上已有15个问题从"开放"状态转为"已解决",其中11个解答明确指出AI模型参与了求解过程。数学家陶哲轩统计显示,AI模型在8个不同问题上取得了有意义的自主进展,另有6个案例通过定位先前研究取得了进展。

Q3:什么是数学形式化?AI如何改变这一过程?

A:形式化是一项使数学推理更容易验证和扩展的劳动密集型任务。开源"证明助手"Lean已在数学领域广泛应用于形式化证明,而像Harmonic的Aristotle这样的AI工具承诺将大部分形式化工作自动化,使这一过程变得更加容易。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“白宫简直就是个无知的笑话”

“白宫简直就是个无知的笑话”

鲁中晨报
2026-01-25 10:19:03
解放军报社论:坚决打赢军队反腐败斗争攻坚战持久战总体战

解放军报社论:坚决打赢军队反腐败斗争攻坚战持久战总体战

新华社
2026-01-24 23:03:04
德国约37%的黄金储备存放于纽约,总计1200多吨,德议员最新呼吁联邦政府撤回储备:美国政策难以预测

德国约37%的黄金储备存放于纽约,总计1200多吨,德议员最新呼吁联邦政府撤回储备:美国政策难以预测

鲁中晨报
2026-01-24 21:59:21
广东女子3年仅退款2万单,金额达183万,赃物堆满5间屋,网友炸锅

广东女子3年仅退款2万单,金额达183万,赃物堆满5间屋,网友炸锅

离离言几许
2026-01-24 19:44:41
雪豹咬人后续:女游客脸部曝光已经毁容,知情人曝内幕,被咬不冤

雪豹咬人后续:女游客脸部曝光已经毁容,知情人曝内幕,被咬不冤

阿燕姐说育儿
2026-01-25 04:00:18
断层领先!日本用U21踢U23:4-0横扫中国队卫冕+无解16-1 3次捧杯

断层领先!日本用U21踢U23:4-0横扫中国队卫冕+无解16-1 3次捧杯

风过乡
2026-01-25 01:14:43
钱再多也没用,林子祥叶倩文如今现状,给“老少恋”夫妻提了个醒

钱再多也没用,林子祥叶倩文如今现状,给“老少恋”夫妻提了个醒

查尔菲的笔记
2026-01-24 20:06:02
门将李昊迅速蹿红,下一站留洋or加盟中超豪门?

门将李昊迅速蹿红,下一站留洋or加盟中超豪门?

澎湃新闻
2026-01-25 08:24:15
多地将器官捐献纳入“见义勇为”评定,专家称概念扩展需审慎

多地将器官捐献纳入“见义勇为”评定,专家称概念扩展需审慎

澎湃新闻
2026-01-24 22:55:05
房东慌了!身份被实锤,真实目的被扒,嫣然医院新址确定后着急了

房东慌了!身份被实锤,真实目的被扒,嫣然医院新址确定后着急了

有范又有料
2026-01-24 16:26:39
炸场!杨兰兰澳洲当庭低头,车祸案藏三大反转,特权与法律的博弈

炸场!杨兰兰澳洲当庭低头,车祸案藏三大反转,特权与法律的博弈

戗词夺理
2026-01-24 16:27:37
官方:日本门将荒木琉伟获得本届U23亚洲杯最佳门将

官方:日本门将荒木琉伟获得本届U23亚洲杯最佳门将

懂球帝
2026-01-25 01:41:11
李亚鹏曝光捐赠名单,向太发声:我捐了几百万,王菲默默支持了几千万,也是不够的……

李亚鹏曝光捐赠名单,向太发声:我捐了几百万,王菲默默支持了几千万,也是不够的……

都市快报橙柿互动
2026-01-24 19:48:42
欧洲议会503票赞成,投票结果一边倒,中方强硬表态

欧洲议会503票赞成,投票结果一边倒,中方强硬表态

军机Talk
2026-01-24 14:07:38
黄健翔评U23国足亚洲杯决赛:4个丢球里两个折射一个点球,运气守恒

黄健翔评U23国足亚洲杯决赛:4个丢球里两个折射一个点球,运气守恒

上游新闻
2026-01-25 09:29:06
老百姓没等来“房价如葱”,12%的房产税、20%的“遗产税”已开始

老百姓没等来“房价如葱”,12%的房产税、20%的“遗产税”已开始

猫叔东山再起
2026-01-24 09:25:03
王欣瑜:在比赛暂停的时候,我给自己泡了三杯神奇的绿茶

王欣瑜:在比赛暂停的时候,我给自己泡了三杯神奇的绿茶

懂球帝
2026-01-24 18:27:05
青岛回应“学生械斗”:系AI生成的不实信息

青岛回应“学生械斗”:系AI生成的不实信息

极目新闻
2026-01-24 23:30:18
男子生病怕拖累家人,留下深情遗书后徒步回老家,民警追到时他已靠面包红薯走了22天

男子生病怕拖累家人,留下深情遗书后徒步回老家,民警追到时他已靠面包红薯走了22天

潇湘晨报
2026-01-24 22:09:40
日本球员被问怎么评价中国队后懵了21秒 教练低声提醒:要保持尊重

日本球员被问怎么评价中国队后懵了21秒 教练低声提醒:要保持尊重

风过乡
2026-01-24 12:59:45
2026-01-25 11:12:49
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
15659文章数 49687关注度
往期回顾 全部

科技要闻

马斯克SpaceX背后的她:现实版钢铁侠小辣椒

头条要闻

牛弹琴:特朗普称"中国想吞并加拿大" 全世界目瞪口呆

头条要闻

牛弹琴:特朗普称"中国想吞并加拿大" 全世界目瞪口呆

体育要闻

当家球星打替补,他们在故意摆烂?

娱乐要闻

田亮一家新年全家福!森碟变清纯少女

财经要闻

隋广义等80人被公诉 千亿骗局进入末路

汽车要闻

别克至境E7内饰图曝光 新车将于一季度正式发布

态度原创

本地
亲子
教育
公开课
军事航空

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

亲子要闻

孩子三岁前别瞎教 家长只需做好这些事

教育要闻

马年特色寒假作业清单来了!各科全覆盖,老师一定用得上!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

俄美乌三方首轮会谈细节披露

无障碍浏览 进入关怀版