网易首页 > 网易号 > 正文 申请入驻

大模型开始“批量破解”数学难题

0
分享至

人工智能在数学领域的突破正在加速。自圣诞节以来,著名数学家保罗·埃尔德什遗留的1000多道未解难题中,已有15道从"未解决"状态转为"已解决",其中11道明确标注AI模型参与了求解过程。这一进展标志着大语言模型在推进人类知识前沿方面展现出前所未有的能力。

据TechCrunch周四报道,OpenAI最新发布的GPT 5.2模型在数学推理能力上实现显著提升。软件工程师、前量化研究员Neel Somani在测试中发现,该模型能够在15分钟内给出完整的数学证明,并通过形式化工具Harmonic验证无误。这一表现远超此前版本,使AI工具从辅助角色转向能够独立攻克高难度数学问题的新阶段。

菲尔兹奖得主陶哲轩在其GitHub页面上统计,AI模型已在8道不同的埃尔德什问题上取得实质性自主进展,另有6例通过定位和扩展先前研究实现突破。尽管距离完全自主的数学研究仍有距离,但大模型在数学领域的作用已不容忽视。

这一进展对数学研究生态和AI应用市场均产生直接影响。形式化工具如微软研究院开发的开源证明助手Lean,以及Harmonic公司的Aristotle等AI工具,正在被顶尖数学家和计算机科学教授广泛采用,预示着学术研究工作流程的深刻变革。

从意外发现到系统性突破

Somani的发现始于一次常规测试。他将一道数学难题输入ChatGPT,让模型思考15分钟后,返回了一个完整解答。该证明引用了勒让德公式、伯特兰假设和大卫之星定理等数学公理,最终找到了哈佛大学数学家Noam Elkies在2013年Math Overflow论坛上发布的类似问题的优雅解法。但ChatGPT的最终证明在关键方面与Elkies的工作有所不同,并给出了埃尔德什问题某个版本的更完整解答。

"我想建立一个基准,了解大语言模型何时能够有效解决开放数学问题,以及它们在哪些方面仍有困难,"Somani表示。令人意外的是,使用最新模型后,这一前沿界限开始向前推进。

埃尔德什问题集包含超过1000个猜想,由这位匈牙利数学家提出并在线维护。这些问题在主题和难度上差异显著,已成为AI驱动数学研究的诱人目标。首批自主解决方案于去年11月由Gemini驱动的AlphaEvolve模型产生,但最近GPT 5.2在高级数学方面表现得更为出色。Somani将其描述为"在数学推理方面比以前的版本更熟练"。

顶尖数学家的审慎评估

陶哲轩对这一进展持更为细致的看法。他在Mastodon上推测,AI系统的可扩展性使其“更适合系统性地应用于那些不为人知的埃尔德什问题的'长尾',其中许多实际上有直接的解决方案”。

"因此,许多较简单的埃尔德什问题现在更有可能通过纯AI方法解决,而非人类或混合方式,"陶哲轩补充道。

这一评估揭示了AI在数学研究中的定位:并非取代人类数学家处理最前沿的复杂问题,而是高效处理大量中等难度、但因人力有限而长期未被关注的问题。这种分工可能重塑数学研究的资源配置。

形式化工具推动应用落地

另一个关键驱动因素是数学界近期向形式化的转变。形式化是一项劳动密集型任务,能使数学推理更易于验证和扩展。虽然形式化不必依赖AI或计算机,但新一代自动化工具大幅降低了工作难度。

微软研究院2013年开发的开源"证明助手"Lean已在该领域广泛使用,而Harmonic公司的Aristotle等AI工具承诺将形式化工作的大部分自动化。

Harmonic创始人Tudor Achim认为,埃尔德什问题解决数量的突然增加不如顶尖数学家开始认真对待这些工具更重要。“我更关心数学和计算机科学教授正在使用这些AI工具,”Achim表示,“这些人需要保护自己的声誉,所以当他们说使用Aristotle或ChatGPT时,这是真实的证据。”

这一趋势表明,AI工具已从实验阶段进入学术界的主流应用,可能为相关技术公司开辟新的商业机会,同时也对传统数学研究方法论提出挑战。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
纪实:广西刑警酒后开枪射杀孕妇案,夫妻因不提供服务,被打4枪

纪实:广西刑警酒后开枪射杀孕妇案,夫妻因不提供服务,被打4枪

谈史论天地
2026-01-13 14:30:03
5年来首次半决赛赢球 阿森纳有什么可批判的?

5年来首次半决赛赢球 阿森纳有什么可批判的?

体坛周报
2026-01-15 16:52:15
即将暂停营业!无锡著名大酒店

即将暂停营业!无锡著名大酒店

江南晚报
2026-01-15 15:32:08
电网设备概念异动拉升 三变科技回封涨停

电网设备概念异动拉升 三变科技回封涨停

每日经济新闻
2026-01-15 14:38:06
伊朗推迟处决,川普暂缓行动;中东上空“山雨欲来风满楼”

伊朗推迟处决,川普暂缓行动;中东上空“山雨欲来风满楼”

近距离
2026-01-15 11:21:15
47天消费42笔,遭山姆超市封卡!

47天消费42笔,遭山姆超市封卡!

常州大喇叭
2026-01-14 17:05:19
《寻秦记》郭羡妮25年前上台综宣传片翻红,靓到令主持人两眼发光

《寻秦记》郭羡妮25年前上台综宣传片翻红,靓到令主持人两眼发光

粤睇先生
2026-01-15 00:13:17
郭晶晶没想到,被国家队开除的田亮,如今以这种方式让人刮目相看

郭晶晶没想到,被国家队开除的田亮,如今以这种方式让人刮目相看

无心小姐姐
2026-01-09 17:46:24
真服了,一个女子怀孕了八个月了,去饭店,又喝啤酒,又抽烟

真服了,一个女子怀孕了八个月了,去饭店,又喝啤酒,又抽烟

岁月有情1314
2026-01-09 09:15:38
安徽小伙在小国家创业,“享受”一夫多妻、开放生活的他如今怎样

安徽小伙在小国家创业,“享受”一夫多妻、开放生活的他如今怎样

牛牛叨史
2026-01-06 12:59:43
我们必须要永远保持对吕蒙“白衣渡江”严厉的批判态度!保持警惕

我们必须要永远保持对吕蒙“白衣渡江”严厉的批判态度!保持警惕

吕醿极限手工
2026-01-09 21:45:13
高市早苗提前大选被爆竟是一场豪赌 日本在野党合力对抗

高市早苗提前大选被爆竟是一场豪赌 日本在野党合力对抗

财联社
2026-01-15 18:38:10
理想L6累计交付突破36万辆,成为2025年中大型SUV销冠

理想L6累计交付突破36万辆,成为2025年中大型SUV销冠

IT之家
2026-01-15 18:33:07
1-3爆冷!樊振东遭302位小将羞辱,却逆袭打服德国媒体

1-3爆冷!樊振东遭302位小将羞辱,却逆袭打服德国媒体

卿子书
2026-01-14 18:45:32
朱芳雨赌对了!CBA“新中锋”打成大腿,加盟广东队成定局?

朱芳雨赌对了!CBA“新中锋”打成大腿,加盟广东队成定局?

绯雨儿
2026-01-15 13:40:59
梅德韦杰夫调侃:美国再不抓紧,格陵兰就要入俄了 捍卫格陵兰,欧盟北约还能做些啥?

梅德韦杰夫调侃:美国再不抓紧,格陵兰就要入俄了 捍卫格陵兰,欧盟北约还能做些啥?

红星新闻
2026-01-13 13:34:29
美紧急撤侨,大战前就绪,中方油轮掉头,伊朗:让特朗普永生难忘

美紧急撤侨,大战前就绪,中方油轮掉头,伊朗:让特朗普永生难忘

聚焦真实瞬间
2026-01-15 04:10:47
警惕!东南亚航班多人中招!飞机上熟睡半小时,信用卡、现金都没了,刚落地就收到盗刷短信

警惕!东南亚航班多人中招!飞机上熟睡半小时,信用卡、现金都没了,刚落地就收到盗刷短信

鲁中晨报
2026-01-15 16:43:15
好友透露贺娇龙坠马细节,头部被踢,那匹马她养了很多年

好友透露贺娇龙坠马细节,头部被踢,那匹马她养了很多年

辣条叨叨叨
2026-01-15 14:56:56
老道士揭秘:家中这三样东西消失,一定是被人借运了!千万要小心

老道士揭秘:家中这三样东西消失,一定是被人借运了!千万要小心

古怪奇谈录
2026-01-05 11:32:51
2026-01-15 19:44:49
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
140165文章数 2652133关注度
往期回顾 全部

科技要闻

阿里最狠的一次“自我革命”

头条要闻

男子为戒毒植入电极:开机后疯狂性冲动给母亲发黄图

头条要闻

男子为戒毒植入电极:开机后疯狂性冲动给母亲发黄图

体育要闻

聂卫平:黑白棋盘上的凡人棋圣

娱乐要闻

传奇棋圣聂卫平离世,网友集体悼念

财经要闻

央行再次结构性降息0.25个百分点

汽车要闻

吉利帝豪/缤越推冠军一口价 起售价4.88万

态度原创

教育
亲子
本地
公开课
军事航空

教育要闻

为什么要对孩子客客气气说话

亲子要闻

既在意料之中,又在意料之外

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美国已正式开始出售委内瑞拉石油

无障碍浏览 进入关怀版