网易首页 > 网易号 > 正文 申请入驻

大模型开始“批量破解”数学难题

0
分享至

人工智能在数学领域的突破正在加速。自圣诞节以来,著名数学家保罗·埃尔德什遗留的1000多道未解难题中,已有15道从"未解决"状态转为"已解决",其中11道明确标注AI模型参与了求解过程。这一进展标志着大语言模型在推进人类知识前沿方面展现出前所未有的能力。

据TechCrunch周四报道,OpenAI最新发布的GPT 5.2模型在数学推理能力上实现显著提升。软件工程师、前量化研究员Neel Somani在测试中发现,该模型能够在15分钟内给出完整的数学证明,并通过形式化工具Harmonic验证无误。这一表现远超此前版本,使AI工具从辅助角色转向能够独立攻克高难度数学问题的新阶段。

菲尔兹奖得主陶哲轩在其GitHub页面上统计,AI模型已在8道不同的埃尔德什问题上取得实质性自主进展,另有6例通过定位和扩展先前研究实现突破。尽管距离完全自主的数学研究仍有距离,但大模型在数学领域的作用已不容忽视。

这一进展对数学研究生态和AI应用市场均产生直接影响。形式化工具如微软研究院开发的开源证明助手Lean,以及Harmonic公司的Aristotle等AI工具,正在被顶尖数学家和计算机科学教授广泛采用,预示着学术研究工作流程的深刻变革。

从意外发现到系统性突破

Somani的发现始于一次常规测试。他将一道数学难题输入ChatGPT,让模型思考15分钟后,返回了一个完整解答。该证明引用了勒让德公式、伯特兰假设和大卫之星定理等数学公理,最终找到了哈佛大学数学家Noam Elkies在2013年Math Overflow论坛上发布的类似问题的优雅解法。但ChatGPT的最终证明在关键方面与Elkies的工作有所不同,并给出了埃尔德什问题某个版本的更完整解答。

"我想建立一个基准,了解大语言模型何时能够有效解决开放数学问题,以及它们在哪些方面仍有困难,"Somani表示。令人意外的是,使用最新模型后,这一前沿界限开始向前推进。

埃尔德什问题集包含超过1000个猜想,由这位匈牙利数学家提出并在线维护。这些问题在主题和难度上差异显著,已成为AI驱动数学研究的诱人目标。首批自主解决方案于去年11月由Gemini驱动的AlphaEvolve模型产生,但最近GPT 5.2在高级数学方面表现得更为出色。Somani将其描述为"在数学推理方面比以前的版本更熟练"。

顶尖数学家的审慎评估

陶哲轩对这一进展持更为细致的看法。他在Mastodon上推测,AI系统的可扩展性使其“更适合系统性地应用于那些不为人知的埃尔德什问题的'长尾',其中许多实际上有直接的解决方案”。

"因此,许多较简单的埃尔德什问题现在更有可能通过纯AI方法解决,而非人类或混合方式,"陶哲轩补充道。

这一评估揭示了AI在数学研究中的定位:并非取代人类数学家处理最前沿的复杂问题,而是高效处理大量中等难度、但因人力有限而长期未被关注的问题。这种分工可能重塑数学研究的资源配置。

形式化工具推动应用落地

另一个关键驱动因素是数学界近期向形式化的转变。形式化是一项劳动密集型任务,能使数学推理更易于验证和扩展。虽然形式化不必依赖AI或计算机,但新一代自动化工具大幅降低了工作难度。

微软研究院2013年开发的开源"证明助手"Lean已在该领域广泛使用,而Harmonic公司的Aristotle等AI工具承诺将形式化工作的大部分自动化。

Harmonic创始人Tudor Achim认为,埃尔德什问题解决数量的突然增加不如顶尖数学家开始认真对待这些工具更重要。“我更关心数学和计算机科学教授正在使用这些AI工具,”Achim表示,“这些人需要保护自己的声誉,所以当他们说使用Aristotle或ChatGPT时,这是真实的证据。”

这一趋势表明,AI工具已从实验阶段进入学术界的主流应用,可能为相关技术公司开辟新的商业机会,同时也对传统数学研究方法论提出挑战。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
北电新院长扈强曝光!被小 12 岁学生张龄心执着 20 年

北电新院长扈强曝光!被小 12 岁学生张龄心执着 20 年

南万说娱26
2026-05-15 10:11:44
詹姆斯还值顶薪吗?已有球队准备报价,湖人或给出2个“诚意”

詹姆斯还值顶薪吗?已有球队准备报价,湖人或给出2个“诚意”

以茶带书
2026-05-14 20:44:24
果不其然,检调约谈高金素梅,对李乾龙、尹乃菁出手,绿营露马脚

果不其然,检调约谈高金素梅,对李乾龙、尹乃菁出手,绿营露马脚

坠入二次元的海洋
2026-05-15 12:52:30
山东两位企业家出席特朗普访华欢迎晚宴

山东两位企业家出席特朗普访华欢迎晚宴

喜欢历史的阿繁
2026-05-15 11:59:25
分析:乌克兰真的在扭转战局吗?

分析:乌克兰真的在扭转战局吗?

被误解的时候能微微一笑
2026-05-12 16:39:15
爽快!中美会晤提出要求,中方开场定调,一招锁死主动权

爽快!中美会晤提出要求,中方开场定调,一招锁死主动权

春之寞陌
2026-05-15 13:44:33
A股分红派息转增一览:30股今日股权登记

A股分红派息转增一览:30股今日股权登记

每日经济新闻
2026-05-15 07:44:08
做孝庄的女儿有多幸福?这是哲哲三个女儿不能比的

做孝庄的女儿有多幸福?这是哲哲三个女儿不能比的

清史迷
2026-04-28 13:56:59
英伟达H200获批卖10家中国公司,但货能不能到还得看中方脸色

英伟达H200获批卖10家中国公司,但货能不能到还得看中方脸色

别打我我投降
2026-05-14 18:51:05
枪声响起!小马科斯大势已去,菲军方紧急切割,中菲关系或迎转机

枪声响起!小马科斯大势已去,菲军方紧急切割,中菲关系或迎转机

音乐时光的娱乐
2026-05-15 12:33:27
游戏中的中国背景永远都是脏乱差,“不随地吐痰”显得格外刺眼

游戏中的中国背景永远都是脏乱差,“不随地吐痰”显得格外刺眼

街机时代
2026-05-06 15:00:03
当年身患渐冻症,还坚持在抗疫一线的张定宇院长,如今境况如何?

当年身患渐冻症,还坚持在抗疫一线的张定宇院长,如今境况如何?

长星寄明月
2026-05-14 15:44:53
崩溃!父亲一句“家里没有你的饭”一语成谶,17岁少年被“逼死”

崩溃!父亲一句“家里没有你的饭”一语成谶,17岁少年被“逼死”

火山詩话
2026-05-15 11:54:04
主角:四个女人四种结局,李青娥惨死,米兰嫁富商,花彩香最可惜

主角:四个女人四种结局,李青娥惨死,米兰嫁富商,花彩香最可惜

阿废冷眼观察所
2026-05-13 01:40:05
朱温被杀前夜,叫儿媳王氏前来服侍,儿媳告诫:小心你父亲要杀你

朱温被杀前夜,叫儿媳王氏前来服侍,儿媳告诫:小心你父亲要杀你

铭记历史呀
2026-05-02 00:11:01
番禺一酒楼收取早茶茶位费,但未提供任何基础茶叶,泡茶叶还需另行付费,市监部门:立即整改

番禺一酒楼收取早茶茶位费,但未提供任何基础茶叶,泡茶叶还需另行付费,市监部门:立即整改

番禺台
2026-05-15 09:09:25
珠海原市长何宁卡,曾执掌广东发改委,退休数年仍难"安全着陆"

珠海原市长何宁卡,曾执掌广东发改委,退休数年仍难"安全着陆"

王姐懒人家常菜
2026-05-15 12:54:40
俯卧撑数量出卖真实体能:40-60岁男性对照表

俯卧撑数量出卖真实体能:40-60岁男性对照表

解说阿洎
2026-05-15 00:49:28
拿下两笔最重要订单,一辈子不喝酒的特朗普,居然在中国举了酒杯

拿下两笔最重要订单,一辈子不喝酒的特朗普,居然在中国举了酒杯

喜欢历史的阿繁
2026-05-15 12:13:34
网传央视发出邀请函:将全程直播世界杯 2天后举办发布会正式官宣

网传央视发出邀请函:将全程直播世界杯 2天后举办发布会正式官宣

念洲
2026-05-15 11:20:35
2026-05-15 14:43:00
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
146110文章数 2653572关注度
往期回顾 全部

科技要闻

两年联姻一地鸡毛,传苹果OpenAI濒临决裂

头条要闻

牛弹琴:中美元首历史性会晤 向世界释放五个信号

头条要闻

牛弹琴:中美元首历史性会晤 向世界释放五个信号

体育要闻

德约科维奇买的球队,从第6级联赛升入法甲

娱乐要闻

方媛为何要来《桃花坞6》没苦硬吃?

财经要闻

特朗普的北京时刻

汽车要闻

双零重力座椅/AI智能体/调光天幕 启境GT7内饰发布

态度原创

家居
健康
本地
公开课
军事航空

家居要闻

110㎡淡而有致的生活表达

专家揭秘干细胞回输的安全风险

本地新闻

用苏绣的方式,打开江西婺源

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

乌克兰首都基辅遭空袭 死亡人数增至12人

无障碍浏览 进入关怀版