网易首页 > 网易号 > 正文 申请入驻

刚刚,AI破解50年未解数学难题!南大校友用OpenAI模型完成首个非平凡数学证明

0
分享至

新智元报道

编辑:Aeneas KingHZ

【新智元导读】AI辅助人类,完成了首个非平凡研究数学证明,破解了50年未解的数学难题!在南大校友的研究中,这个难题中q=3的情况,由o3-mini-high给出了精确解。

就在刚刚,AI完成了首个非平凡研究数学证明!

完成这项研究的,是美国纽约布鲁克海文国家实验室凝聚态物理与材料科学分部的一位华人学者Weiguo Yin。

论文地址:https://arxiv.org/abs/2503.23758

在这项研究中,作者在一维J_1-J_2 q态Potts模型,通过引入最大对称子空间(MSS)方法,对其精确求解。

具体来说,作者将q^2×q^2的传递矩阵进行块对角化。

而q=3的情况,正是基于OpenAI的最新推理模型o3-mini-high来精确求解的。

在AI的帮助下,研究者成功证明,模型可以映射为一维q态Potts模型,其中J_2作为最近邻相互作用,J_1则作为有效的磁场,这一结果扩展了之前在q=2,即Ising模型的证明。

注意,这个问题,在数学界有50年没有解决。

论文引用了关于J_1−J_2伊辛模型(即q=2的Potts模型)的工作,这些工作可以追溯到1969年和1970年。

而o3-mini-high帮忙完成的这项证明,为众多悬而未决的物理问题(层状材料中原子或电子顺序堆叠的问题,以及非常规超导体中常见的T_c-拱形相的形成等),提供了全新的见解。

AI模型在科学研究中的巨大潜力,也再一次被证实!

Weiguo于2004年加入布鲁克海文国家实验室担任研究员,并于2006年晋升为助理物理学家,2008年晋升为副物理学家,2011年晋升为物理学家。

他的专长在于结合第一性原理、有效哈密顿量和机器学习方法,研究强关联体系、挫败磁性、超导性、多铁性、混合的3d-5d化合物、拓扑材料和非平衡态。

1998年,他获得南京大学的博士学位,并荣获2000年国家优秀博士学位论文奖。

五十年未解的数学难题,被AI解决了

在凝聚态物理、材料科学、量子信息学和微电子学等研究领域中,发现新的相和相变是一个核心挑战。

挫败磁体中存在许多不寻常的相,这些磁体通常用伊辛模型(Ising model)或量子海森堡模型(quantum Heisenberg model)来描述。

统计力学的第三个基本模型是q状态Potts模型。

它是伊辛模型(q=2)的推广,可以作为研究从离散(伊辛)对称性到连续(海森堡)对称性转变的有效中介。

特别是,一维J_1-J_2 Potts模型可能与众多问题相关,这些问题涵盖了从层状材料中原子或电子有序的面外堆叠,如1T-TaS_2 中的「大卫之星」电荷密度波,到每个时间步都有多种选择的时间序列问题,如乒乓球训练设计。

1T-TaS2中的「大卫之星」电荷密度波相关论文插图

一维J_1-J_2 Potts模型

尽管一维和二维的J_1-J_2伊辛模型和海森堡模型已被广泛研究,但只有一维J_1-J_2伊辛模型通过转移矩阵法得到了精确解。

对于一维J_1-J_2 Potts模型,至今仍没有精确的解析解。

因为当q=3时,该模型已经展现出与q=2(即伊辛模型)不同的基态相行为(见下图),因此精确求解任意q的模型具有基础性的重要性。

伊辛模型:不同的基态相行为

挑战在于转移矩阵的阶数迅速增加,阶数为q^2。

可想而知,q=3时的9×9矩阵已经很难进行解析求解,而q=10^10时的10^10×10^10矩阵,即使是数值计算也无能为力。

先前的研究将任务转化为数值计算有效的q×q矩阵,采用整数q形式的转移矩阵法,或连续q形式的转移矩阵。

尽管物理学的透明度较低,但仍然无法得到精确的解析结果。

因此,对于一维J_1-J_2 Potts模型,至今仍然缺乏其中丰富相行为的直观理解。

OpenAI o3-mini的创举:非平凡证明

最近的两个发展为这一长期未解问题提供了新的视角。

第一个发展是通过基于对称性的块对角化,将装饰伊辛梯形的4×4转移矩阵简化为有效的2×2矩阵。

这些发现为一维挫败Potts模型找到精确解,可能成为这一重要新方向的里程碑。

第二个发展是OpenAI最新的推理模型o3-mini-high,推导出了一个优雅的方程,在外部磁场下,可以确定装饰伊辛模型中UNPC的临界温度

论文链接:https://arxiv.org/abs/2502.11270

因此,作者受到启发,逐步提示AI推理模型,去处理整数q形式的转移矩阵。

尽管AI的回答中有不少错误,针对q=3的情况,最终找到了一种基于对称性的块对角化方法,可以将一维J_1-J_2三状态Potts模型的9×9转移矩阵解析地简化为有效的2×2矩阵。

对于一般的q,关键的对称性是q个Potts状态的全排列对称性。

换句话说,哈密顿量(因此在整数q形式中的转移矩阵)在任何对标签{1,2,3,...,q}的排列下都是不变的;它的对称群是Sq。

虽然AI未能进一步推进,但警告说随着q的增大,排列的数量急剧增加。

然而,q=2和q=3的精确结果,特别是两者都归结为2×2矩阵,启发了作者:

由于在热力学极限下只有转移矩阵的最大特征值(λ)才重要,因此任务简化为识别包含λ的对称分离子空间。

随后,作者发现这个子空间由两个最大对称向量张成,因为所有转移矩阵元素都是正的,这使得最终得到了一个解析的2×2矩阵。

因此,任意q的一维J_1-J_2 Potts模型的精确解,就这样被找到了,而且过程出奇的简单

o3-mini-high具体起了什么作用

下面我们就来看看,o3-mini-high是如何在这项研究中推导出关键方程,对q=3的情况精确求解,从而确定了装饰伊辛模型中UNPC的临界温度的。

首先,o3-mini-high证明,根据其知识,1D J_1-J_2 Potts模型尚未被精确求解。

接着,模型被提示使用1D J_1-J_2三态Potts模型的之字形梯形版本。

在这种情况下,AI正确地给出了以下哈密顿量表达式:

随后,AI正确地生成了以下传递矩阵的表达式。

其中,(a, b)是由一对自旋组成的「梯级」状态,(a', b')是邻近梯级状态。

假设一组梯级状态按以下顺序排列:(1, 1), (1, 2), (1, 3), (2, 1), (2, 2), (2, 3), (3, 1), (3, 2), (3, 3)。

若使用简写符号,则传递矩阵可以明确地表达为如下形式。

对于上面这个T'矩阵,AI被提示说,一定要确保,从而纠正它的错误,并且识别出S_3的对称群。

然后,AI被提示将T'进行块对角化。

它发现,T'可以通过变换下列这个矩阵来进行块对角化,从而得到。

因此,得到的块对角化传递矩阵的前2×2块由

给出,其较大的特征值是λ,即传递矩阵T'的最大特征值。

最后,AI被提示生成上述对话的原生Wolfram Mathematica 14.2代码。

这个任务在几秒钟内就完成了,几乎不需要修正。

然而,AI却未能生成适用于一般q的可用Mathematica代码。

相反,它警告说,随着q的增加,S_q对称群中的排列数会急剧增加。

当被进一步要求时,AI创建了一些假Mathematica函数,并表示「这些函数可能值得实现」。

五十年数学难题的精确解

考虑以下哈密顿量[图1(a)]:

为了构建转移矩阵,研究者使用了重叠对的形式化方法来处理方程(1),每个单位格有一个自旋,得到转移矩阵T。

同时使用该模型的等效锯齿梯形表示,其中每个单位格有两个自旋来获得T′。

而且要满足T′=T^2。

在热力学极限N→∞时,配分函数为

其中λ是转移矩阵T的最大特征值。

每个自旋的自由能由下式给出:

其中,β=1/(k_BT),T是绝对温度,k_B是玻尔兹曼常数。

由此得到的变换矩阵是一个q^2×2矩阵,它将q^2×q转移矩阵T投影到与其余部分解耦的2×2块矩阵T_2,并且该矩阵由于不同的对称性,得到如下方程4:

需要注意的是,最大对称子空间意味着u、v和w的表达式可以通过组合分析直接得到。

转移矩阵T的最大特征值是T_2的较大特征值,为

方程(4)的简洁性为理解一维J_1-J_2 Potts模型中的丰富相行为提供了直观的视角。

图1:(a)单链J_1−J_2 Potts模型的示意图和(b)其等效的锯齿梯形表示。图中的小球代表具有q个状态的自旋。橙色的键表示最近邻相互作用J_1,绿色的键表示次近邻相互作用J_2

Potts模型的历史性进展

为了深入理解这些丰富的相图,首先分析基态的相行为。

在T=0时,对于所有q值,一维J_1-J_2 Potts模型有三个相,这些相由两个临界点(CPs)分开,这些临界点由方程(4)中u、w、v的相对大小决定。

对于q=2(即伊辛模型),与q≥3情况有两个方面的不同:

(1)q=2的两个临界点是对称相关的,位于J_1=±2,而对于q≥3,它们位于J_1=0和J_1=2。

(2)对于q=2,三个相没有宏观的简并性,而对于q≥3,存在一个或两个具有残余熵的非平凡状态

图3总结了左侧和中间相以及两个临界点(CPs)残余熵的q依赖关系。

对于小的q,临界点的残余熵(虚线)明显大于相邻相的残余熵(实线)。

因此,每个临界点在J_1−T相图中随着温度升高发展出V形区域(图2左,q=2,3,4)。

两个临界点的V形区域汇聚在一起,形成一个类似T_c圆顶的区域,代表q≥3的中间随机二聚化相。

当系统靠近临界点时,它并不遵循常规的现象——即转变到具有更高宏观简并性的相,而是转变到临界点发展的V形区域,这也在熵的T曲线中表现为平坦区域(图2右q=2,3,4),此时熵值等于对应临界点的残余熵。

图2:q=2,3,4和10^6的相图

图2左:在J_1−T平面上,归一化熵2S(J_1,T)/ln(q)的密度图。

图2右:在临界点附近,选定J_1值的2S(J_1,T)/ln(q)的温度依赖性。−J_2=1被设定为能量单位。

另一方面,图3显示,对于大的q,临界点的残余熵(虚线)趋近于其相邻相的残余熵(实线),最终变得无法区分——不再有V形的临界点区域(图2左,q=10^6)。

图3:对于q≥3,在J_1的四个不同区域下,零温度归一化熵2S(J_1,0)/ln⁡q的依赖关系

当系统靠近相边界时,它似乎遵循常规的现象,即转变到具有更高宏观简并性的相。

特别是,当J_1>2时,低温铁磁相将经历一个两步的相交叉:首先转变到中间的随机二聚化相,然后转变到左侧的顺磁相。

Tc圆顶是非常规超导性(如铜氧化物、铁基超导体、扭曲双层石墨烯等)中的一个关键现象。

它已被解释为(i)一种预形成的有序状态,随着相位相干性的逐渐建立,或(ii)两种竞争相的结果。

目前通过q依赖性出现和消失的类似圆顶的结构,这一结构由相的两个临界点的残余熵的相对强度控制,为形成圆顶形相提供了另一种可能性。

AI辅助科学研究,潜力巨大

总而言之,用简单的话概括就是,一维J_1-J_2 q状态Potts模型得到了精确解,其中的关键在于发现q^2×q^2转移矩阵的最大特征值位于一个2×2的最大对称子空间。

而且维J_1-J_2 q状态Potts模型被证明与一维q状态Potts模型等价,其中J_2充当最近邻(NN)相互作用,J_1充当磁场。

模型的基态被发现包含三个相,这些相由两个临界点分开,对于所有q值均如此。

两个临界点的残余熵的相对强度,随着q变大而变大。

对于小q和大q出现和消失的类似圆顶的随机二聚化相,新研究提供了一种新的形成圆顶形相的机制。

而这项研究之所以能完成,都是基于o3-mini-high精确解决了q=3的情况。

这也提示我们,AI提供的广泛信息中,能给研究者提供充分的洞察和激励,尽管它的结论可能并不完美。

就在最近,诺奖得主、GoogleDeepMind CEO Demis Hassabis 评论AlphaFold时这样表示:通过AI,人类现在可以在一年内完成10亿年的博士研究时间。

可以想见,未来AI辅助做出的科研突破还将层出不穷。

参考资料:

https://www.bnl.gov/staff/wyin

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大溃败!中国网贷公司,在印度全军覆没

大溃败!中国网贷公司,在印度全军覆没

首席品牌评论
2026-01-07 18:20:00
研究生教成人骑车2年赚27万元 当事人:市场需求大

研究生教成人骑车2年赚27万元 当事人:市场需求大

大象新闻
2026-01-09 08:13:04
伊朗、委内瑞拉、南非、阿根廷,还有前苏联,有共同点

伊朗、委内瑞拉、南非、阿根廷,还有前苏联,有共同点

虚声
2026-01-07 20:50:43
太行山采药人发现1943年跳崖八路军遗骸,腰带里缝着党员证

太行山采药人发现1943年跳崖八路军遗骸,腰带里缝着党员证

鹤羽说个事
2026-01-08 11:02:25
深圳香蜜公园惊现“私人菜园”?管理方:菜不是用来吃的,仅科普用

深圳香蜜公园惊现“私人菜园”?管理方:菜不是用来吃的,仅科普用

深圳晚报
2026-01-09 08:11:21
央视直播1月9日多哈冠军赛, 林诗栋战杜达,王曼昱对帕瓦德

央视直播1月9日多哈冠军赛, 林诗栋战杜达,王曼昱对帕瓦德

乒乓球球
2026-01-09 06:32:19
深圳国资委“深夜输血”46亿,这家两千亿巨头的弹药库满了

深圳国资委“深夜输血”46亿,这家两千亿巨头的弹药库满了

商业不许冷
2026-01-08 20:49:13
随着日本5-0,澳大利亚2-1,国足0-0,U23亚洲杯最新晋级形势出炉

随着日本5-0,澳大利亚2-1,国足0-0,U23亚洲杯最新晋级形势出炉

侃球熊弟
2026-01-09 00:12:23
又一行业没落!曾是世界第一,如今18家大国企几乎全军覆没

又一行业没落!曾是世界第一,如今18家大国企几乎全军覆没

朔方瞭望
2026-01-08 09:50:55
彻底飘了!美防长公然“警告”中国,振臂高呼:美国威慑力回来了

彻底飘了!美防长公然“警告”中国,振臂高呼:美国威慑力回来了

南宫一二
2026-01-08 17:31:55
美国官员称:主宰这个世界的是实力 武力与权力

美国官员称:主宰这个世界的是实力 武力与权力

看看新闻Knews
2026-01-08 11:01:03
媒体终于报道伊朗了,但评论却是经过精心筛选的

媒体终于报道伊朗了,但评论却是经过精心筛选的

清书先生
2026-01-08 16:55:15
字母哥放话永不申请交易:想在雄鹿打完生涯 除非他们不再想要我

字母哥放话永不申请交易:想在雄鹿打完生涯 除非他们不再想要我

罗说NBA
2026-01-08 22:56:51
太顶了!明明什么都没露,却性感得要命!

太顶了!明明什么都没露,却性感得要命!

贵圈真乱
2025-12-20 12:02:06
央企重组大动作!中国石油化工集团与中国航空油料集团实施重组

央企重组大动作!中国石油化工集团与中国航空油料集团实施重组

新京报
2026-01-08 18:20:05
特朗普威胁伊朗!伊朗:已做好战争准备

特朗普威胁伊朗!伊朗:已做好战争准备

第一财经资讯
2026-01-09 08:13:29
美国衰落,就是一个巨大的谎言

美国衰落,就是一个巨大的谎言

枫冷慕诗
2026-01-06 12:28:30
放过保时捷,咱换一家抄好不好?

放过保时捷,咱换一家抄好不好?

爱范儿
2026-01-08 18:16:20
广州商户遭精准打击,广州“扬尘逼迁”调查后续,又是自罚三杯!

广州商户遭精准打击,广州“扬尘逼迁”调查后续,又是自罚三杯!

你食不食油饼
2026-01-08 20:42:00
暴跌70%!又一个老牌客运站将关停,昔日“交通顶流”被抛弃了?

暴跌70%!又一个老牌客运站将关停,昔日“交通顶流”被抛弃了?

品牌观察官
2026-01-08 21:58:31
2026-01-09 09:19:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14288文章数 66451关注度
往期回顾 全部

科技要闻

内存一天一个价,华强北老板们却高兴不起来

头条要闻

男子与女友吵架飙车泄愤撞死1家3口 当时讨论鹦鹉学舌

头条要闻

男子与女友吵架飙车泄愤撞死1家3口 当时讨论鹦鹉学舌

体育要闻

世乒赛银牌得主,说自己梦里都是孙颖莎

娱乐要闻

抗战剧《马背摇篮》首播,获观众好评

财经要闻

郁亮的万科35年:从"宝万之争"到"活下去"

汽车要闻

从量变到"智"变 吉利在CES打出了五张牌

态度原创

艺术
游戏
教育
时尚
本地

艺术要闻

毛主席致陈委员信:笔法与结体,谁更难掌握?

《2077》开发人员认为第一幕长度正好 不宜再延长

教育要闻

校长的“五势”智慧

60+女性穿搭指南来了:4招告别“大妈感”,解锁冬日优雅气质

本地新闻

1986-2026,一通电话的时空旅程

无障碍浏览 进入关怀版