网易首页 > 网易号 > 正文 申请入驻

AI赋能数学研究

0
分享至

作者:陈小杨

半个多世纪以来,数学家已能借助计算机进行辅助计算或验证命题,但仍不满足于此,如今的AI或许能更上层楼,挑战那些人类长年未解的难题。这将对数学、科学乃至人类社会产生深远的影响。本文回顾了历史,阐述了当下的发展状况,并对未来做出了激动人心的展望。


数学,这门探索宇宙真理的语言,正经历一场前所未有的变革。自20世纪中叶计算机诞生以来,人类就一直梦想让机器参与数学研究。从早期的符号计算到今天的深度学习,人工智能(AI)在数学领域的应用已经从简单的辅助工具发展为能够发现新规律、证明定理甚至挑战猜想的“研究伙伴”。本文将带您了解AI与数学交织的精彩历程,探索当前最前沿的应用,并展望这一领域令人振奋的未来。

从机器证明到深度学习

机器证明的发展历程

机器证明的历史可以追溯到17世纪莱布尼茨的“推理演算”构想,但直到20世纪计算机技术发展后才真正实现突破。1950年代,人工智能先驱纽厄尔(A. Newell)等人首次尝试用计算机程序证明数学定理。而1976年,数学家借助计算机完成了四色定理的证明,这一里程碑事件引起了数学界的广泛关注。四色定理的证明需要的穷举分析远超人类手工处理的能力范围,这一成功案例充分展示了计算机在解决超大规模数学问题中的独特价值。

机器证明的发展经历了几个重要阶段:从早期的穷举法证明,到吴文俊的代数化方法,再到后来的自动推理和交互式证明系统。随着计算机性能的指数级提升,机器证明的能力也在不断增强。现代证明辅助系统如Coq、Isabelle等,不仅能验证一些数学猜想的正确性,还能帮助数学家发现证明思路。特别值得一提的是,这些系统采用形式化验证方法,可以确保证明的绝对严谨性,避免了传统数学证明中可能存在的疏漏。


吴文俊先生与机器证明

机器证明的价值不仅体现在提高数学研究效率上,更深刻地改变了数学研究的思维方式。它突破了人类认知的局限性,能够处理极其复杂的计算和推理过程;同时它也促进了数学的严格化发展,使数学证明变得更加可靠和可验证。未来随着人工智能技术的发展,机器证明必将在数学研究中发挥更加重要的作用。

深度学习革命

在现代人工智能的发展中,深度学习十分耀眼。深度学习作为机器学习的重要分支,其发展历程可追溯至1940年代神经网络概念的提出,但真正迎来爆发式发展是在2010年后。这一技术革命的核心在于通过构建多层非线性变换的神经网络架构,使计算机获得了前所未有的特征学习和模式识别能力。2012年AlexNet在ImageNet竞赛中的突破性表现,标志着深度学习时代的正式来临。随后,随着算力的提升、算法的优化和大数据的积累,深度学习在计算机视觉、自然语言处理等领域取得了一系列令人瞩目的成就。

在数学研究领域,深度学习的价值主要体现在三个关键维度。在发现新数学规律方面,深度学习展现了惊人的潜力。2021年DeepMind团队在《自然》发表的研究中,通过图神经网络分析纽结理论中的不变量,发现了人类数学家长期未能察觉的数学联系。

在数学证明验证方面,深度学习与形式化证明系统的结合开创了新局面。通过将神经网络与符号推理相结合,AI系统能够辅助完成复杂的证明过程。例如在多项式时间可解性问题的证明中,AI可以自动完成大量中间引理的证明工作,显著提升了证明效率。这种“神经-符号”系统既保留了严格的逻辑性,又具备了强大的模式识别能力。

在识别数学规律局限性方面,深度学习同样表现出色。通过强化学习算法,AI系统能够在巨大的组合空间中高效搜索潜在的反例结构。在图论领域,这种方法已经成功构造了多个著名猜想的反例。

深度学习的独特价值在于它突破了人类思维的固有局限。它能够处理人类难以驾驭的高维数据空间,发现非直观的数学模式,并在证明和反例构造中提供新的思路。随着神经符号系统等新技术的发展,深度学习正在推动数学研究进入人机协同的新时代。这项技术不仅提高了研究效率,更重要的是拓展了人类对数学本质的理解,为这一最古老学科注入了崭新的活力。


深度学习(多层神经网络)

AI如何辅助数学研究?

数学研究作为一个系统性的认知活动,主要包括三个核心环节:发现新的数学规律、验证这些规律的正确性(证明),以及识别其局限性(构造反例)。近年来,人工智能技术在这三个关键领域都展现出强大的辅助能力,正在深刻改变数学研究的范式。

AI发现数学规律

2021年,DeepMind团队在《自然》杂志发表突破性成果,他们开发的AI系统能够帮助数学家发现纽结不变量之间的新联系。这项研究证明,AI可以引导数学家的直觉,发现人类可能忽略的数学联系。

纽结(knot)是三维空间中的闭合曲线,数学家通常用琼斯多项式(Jones polynomial)、双曲体积(hyperbolic volume)等不变量来描述其性质。DeepMind将纽结的代数不变量和几何不变量编码为高维向量,并利用深度神经网络(DNN)学习它们之间的潜在关系,即学习如何从一种不变量(如琼斯多项式)预测另一种不变量(如双曲体积)。数学家基于AI的预测,进一步构建了严格的数学证明,最终在纽结理论中发现了不变量之间的新联系。


非平凡纽结

在另一项发表在《自然》的论文里,DeepMind利用深度强化学习(Deep Reinforcement Learning, DRL)发现了更高效的矩阵乘法算法,突破了人类数学家在该领域的最佳纪录。这一成果展示了AI如何通过自主探索发现人类未曾想到的数学优化策略。矩阵乘法是计算机科学和数学中的基础运算,传统算法(如Strassen算法)已经优化了数十年。对于两个n×n矩阵相乘,标准方法需要O(n3)次标量乘法。DeepMind的目标是找到更少的乘法组合,从而降低计算复杂度。DeepMind采用AlphaTensor(基于AlphaZero的改进模型),其核心组件包括:

状态表示(State Representation)

将矩阵乘法问题编码为三维张量(Tensor),每个元素代表可能的乘法组合。

例如,(2×2)矩阵乘法可表示为(4×4×4)张量,其中每个维度对应输入/输出矩阵的元素。

动作空间(Action Space)

每一步动作对应一个基本乘法操作(如标量乘加)。

AI的目标是通过一系列动作分解张量,找到最少的乘法步骤。

奖励函数(Reward Function)

主要优化目标:减少乘法次数(即张量分解的秩)。

额外奖励:发现结构化模式(如对称性),以便推广到更大矩阵。

通过将蒙特卡洛树搜索(MCTS)与深度学习结合,DeepMind最终发现了更高效的矩阵乘法算法。

AI自动证明定理

现代人工智能系统在数学证明领域取得了显著进展,其技术实现主要体现在两个重要方向:奥林匹克级几何题求解和形式化数学证明。这些突破性进展展示了AI在数学推理方面的强大能力。

在几何证明方面,DeepMind开发的AlphaGeometry系统代表了当前最先进的技术水平。该系统采用神经符号混合架构,结合了神经语言模型的模式识别能力和符号引擎的逻辑推理能力。具体而言,AlphaGeometry首先分析几何图形,生成潜在的辅助构造点(如中点、垂足等)。然后,符号推理引擎会将这些构造点纳入演绎数据库,应用几何公理和定理进行严格的逻辑推导。系统在训练过程中使用了超过1亿个合成几何问题,这些问题通过随机定理生成算法创建,确保了训练数据的多样性和复杂性。值得注意的是,AlphaGeometry完全不需要人类提供的示范证明,仅通过自主探索就能达到国际数学奥林匹克金牌得主的水平。在2023年的测试中,该系统解决了30道选中的IMO几何题中的25道,平均解题时间仅为10分钟。

在形式化证明领域,以Lean证明助手为代表的AI系统展现了另一条技术路径。这类系统基于依赖类型理论,将数学陈述转化为形式化的代码表述。AI组件通过以下方式提升证明效率:首先,使用预训练的语言模型(如GPT-f)理解数学命题的语义,生成可能的证明策略建议;其次,应用强化学习算法优化证明搜索过程,通过价值网络评估不同证明路径的成功概率;最后,集成自动化定理证明技术来填补证明细节。例如,在多项式时间可解性问题的证明中,AI辅助的Lean系统能够自动完成约60%的中间引理证明,将原本需要数周的人工验证工作缩短到几天内完成。

这些AI系统的核心技术突破在于:①将神经网络的直觉能力与符号系统的严格推理相结合;②开发了高效的数学表示学习方法,使AI能够理解抽象数学概念的结构关系;③构建了大规模的数学问题数据集来训练和验证系统性能。当前的研究重点正在向更复杂的数学领域拓展,预示着AI将成为数学研究不可或缺的智能助手。


AlphaGeometry解决IMO几何题

AI构造猜想反例

近年来,强化学习算法在图论领域取得了突破性进展,特别是在构造组合数学猜想反例方面展现出独特优势。这种方法通过精心设计的算法框架,能够在巨大的组合可能性空间中高效地搜索潜在的反例结构,其核心技术主要包括:

问题建模与状态表示

首先将图论问题转化为适合机器学习的形式。对于图论猜想,状态空间通常表示为图的邻接矩阵或特征向量。例如,在构造反例时,系统会初始化一个n个顶点的图,其中每个可能的边都作为一个独立的决策变量。

强化学习框架设计

采用强化学习算法,其中:

1.动作空间:包括添加/删除边、改变顶点属性等图修改操作。

2.奖励函数:精心设计为多目标优化形式,包含:

(1)主要奖励:违反目标猜想的程度(如违反某个不等式的大小),

(2)辅助奖励:保持图的其他性质(如连通性、正则性等)。

3.惩罚项:控制图的复杂度(如边数、顶点数)。


强化学习构造图论猜想反例

通过强化学习,AI成功构造了多个著名猜想的反例,展示了AI在探索数学问题上的独特优势。

大模型时代的数学革命

数学,这门探索宇宙真理的古老学科,正在经历一场由人工智能大模型带来的深刻变革。从ChatGPT到AlphaGeometry,这些拥有数百亿参数的人工智能系统不仅改变了数学研究的方式,更在重新定义数学发现的本质。这场变革的核心在于,人工智能正在突破人类认知的局限,以前所未有的方式整合数学知识、发现隐藏模式,并创造性地解决开放性问题。这种转变不仅提高了数学研究的效率,更重要的是拓展了数学探索的疆界,为这门最严谨的科学注入了新的活力。

在知识整合方面,人工智能大模型正在成为打破学科壁垒的“超级助手”。传统数学研究面临的一个主要挑战是学科的高度专业化。随着数学的发展,各个分支领域变得越来越精深,一个领域的专家可能对相邻领域的进展知之甚少,而这种知识割裂常常阻碍重大突破的产生。著名数学家希尔伯特曾指出:“数学是一个有机整体,它的生命力正来自各个部分之间意想不到的联系。”然而,在实践层面,发现这些联系往往需要研究者具备罕见的广博学识和非凡的洞察力。

大语言模型通过其海量的知识储备和强大的关联能力,正在改变这一局面。以GPT-4为代表的大模型可以即时调用数万篇数学论文的知识,建立跨领域的知识图谱,发现不同分支间的深层联系。例如,当研究者研究代数几何中的某个难题时,AI可能提示“这个结构与拓扑学中的同调理论有惊人的相似性”;或者在研究数论问题时指出:“这个猜想与量子计算中的相位估计算法存在对应关系。”这种跨学科的联想能力,在过去需要数学家数十年的广泛阅读和深入思考才能获得,现在则可以通过AI的辅助在短时间内实现。

DeepMind开发的FunSearch系统生动展示了这种知识整合的威力。该系统通过巧妙结合大型语言模型的创造性思维和评估代码的精确验证,在组合数学中发现了新的上限构造,解决了开放多年的帽集问题。这一突破性进展的关键在于,AI能够自由地在离散数学、算法设计和信息理论等看似不相关的领域间建立连接,发现人类研究者可能忽略的关联模式。正如该项目的首席研究员所说:“AI在这里扮演的不是计算器的角色,而更像是一个具有跨学科视野的合作者,它能够从完全不同的角度审视问题。” 这种知识整合的价值不仅体现在具体问题的解决上,更重要的是它正在改变数学研究的范式。首先,AI辅助可以大大缩短数学家的“学习曲线”,使研究者能够快速掌握相关领域的基础知识;其次,它能够揭示不同数学分支之间的“隐藏桥梁”,为新的研究方向提供线索;最后,这种跨领域的知识融合往往能催生全新的数学工具和方法,推动学科的创新发展。

展望未来,随着多模态大模型的发展,AI在数学知识整合方面的能力还将持续增强。可以预见,下一代数学研究AI将不仅能处理文本形式的数学知识,还能理解图表、公式、证明过程等多元信息,实现更深入的知识融合。这将进一步降低学科间的交流壁垒,加速数学的整体进步,或许会帮助我们解决那些长期悬而未决的数学难题,如黎曼猜想或纳维-斯托克斯方程的存在性问题。在这个意义上,人工智能不仅是一个研究工具,更是一个拓展人类数学认知边界的“思维伙伴”。

AI能够创造新的数学吗?

创造性思维是人类智慧皇冠上最耀眼的明珠。从欧几里得的公理化体系到高斯的微分几何,从黎曼的复变函数到格罗滕迪克的概形理论,数学史上的每一次重大突破都闪耀着创造性思维的光芒。这种思维究竟包含哪些关键要素?当前的人工智能又为何难以企及?

真正的数学创造性思维至少包含三个相互关联的层面。

概念抽象能力是数学创造的基石。优秀的数学家能从具体问题中抽离出本质特征,形成新的数学概念。比如欧拉看到柯尼斯堡七桥问题时,没有停留在具体的桥与河,而是抽象出拓扑的基本概念。这种从具体到抽象的飞跃,需要深刻的直觉洞察力。

类比迁移能力使数学思想在不同领域间流动。19世纪,黎曼将高斯曲面理论的思想迁移到复变函数研究,开创了黎曼曲面理论。这种跨领域的联想能力,依赖于对数学本质的深刻理解,而非表面特征的简单对应。

构建全新的数学理论是最高级的数学创造。格罗滕迪克在代数几何中建立的概形理论,不仅解决具体问题,更构建了全新的理论框架。这种体系化的创造需要宏观的数学视野和严谨的逻辑思维相结合。

然而,当前的人工智能,尤其是基于深度学习的大模型,在数学创造性方面存在结构性缺陷:①缺乏真正的概念抽象,AI可以通过模式识别发现数据中的规律,但无法自主形成具有数学意义的新概念,AI的“发现”停留在操作层面,无法上升为概念层面;②类比流于表面,大语言模型虽然能建立跨领域联系,但这些联系往往基于表面对应而非深层结构,当被要求将数论问题与拓扑学建立联系时,AI可能给出形式上的类比,但难以把握两者内在的数学结构;③体系建构能力缺失,现有的AI系统擅长解决定义明确的问题,但无法自主构建新的数学理论体系,它们能证明特定定理,却提不出类似范畴论这样的全新数学框架,这种体系化创造需要整体性的数学观,而这恰恰是AI最欠缺的。

数学创造性思维的本质,在于将直觉的飞跃与逻辑的严谨完美结合。当前AI还无法复制人类数学家那种“灵感乍现”的创造过程。研究数学创造性思维不仅关乎数学发展本身,也是推动人工智能向更高层次进化的重要途径。

从吴文俊的机器证明到今天的AlphaGeometry,AI与数学的融合正在创造新的研究范式。虽然AI目前还无法完全替代数学家的创造力和洞察力,但它已经成为不可或缺的研究伙伴。未来,随着技术的进步,我们或许将见证AI提出全新的数学理论,开启数学研究的新纪元。在这个人机协作的新时代,数学的发展将不再受限于个人智慧,而是由人类与AI共同推动。这场变革不仅会改变数学研究的方式,更可能帮助我们揭开宇宙更深层的数学奥秘。

陈小杨:长聘副教授,同济大学数学科学学院,上海200092。

Chen Xiaoyang: Tenured Associate Professor, School of Mathematical Sciences, Tongji University, Shanghai 200092.

[1]Davies A, Velikovi P, Buesing L, et al. Advancing mathematics by guiding human intuition with AI. Nature, 2021 (600): 70-74.

[2]Fawzi A, Balog M, Huang A, et al. Discovering faster matrix multiplication algorithms with reinforcement learning. Nature, 2022 (610): 47-53.

[3]Appel K, Haken W. The solution of the four-color-map problem. Scientific American, 1977 (237): 108-121.

[4]Polu S, Sutskever I. Generative language modeling for automated theorem proving. arXiv: 2009.03393.

[5]Trinh T H, Wu Y H, Le Q V, et al. Solving olympiad geometry without human demonstrations. Nature, 2024(625): 476–482.

[6]Adam Z. Wagner Constructions in combinatorics via neural networks. https://arxiv.org/abs/2104.14516.

关键词:数学 AI DeepMind■

本文刊载于2025年第77卷第5期《科学》杂志(P35-P39)

本文转载自《科学杂志1915》微信公众号

《物理》50年精选文章

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
广东省委书记黄坤明2026年元旦首站走访亿航智能调研,寄语企业持续技术创新引领低空行业发展

广东省委书记黄坤明2026年元旦首站走访亿航智能调研,寄语企业持续技术创新引领低空行业发展

无人机网
2026-01-03 15:52:25
日本为什么挑衅中国,西班牙专家:中国错就错在没跟日本彻底清算

日本为什么挑衅中国,西班牙专家:中国错就错在没跟日本彻底清算

我心纵横天地间
2025-12-08 18:32:33
阳气就是最好的药,医生研究建议:想要补充阳气,可以多吃这9物

阳气就是最好的药,医生研究建议:想要补充阳气,可以多吃这9物

摇感军事
2026-01-02 13:05:34
真的别再把肉泡水里解冻了!正确的解冻方法

真的别再把肉泡水里解冻了!正确的解冻方法

科普中国
2026-01-03 13:49:13
日本丰满美女主播,因身材太辣遭投诉,观众直言看新闻如少儿不宜

日本丰满美女主播,因身材太辣遭投诉,观众直言看新闻如少儿不宜

韩驰
2025-12-28 15:16:10
为何有那么多人不愿意再看新闻联播了

为何有那么多人不愿意再看新闻联播了

霹雳炮
2025-10-09 23:03:44
伊朗突发,崩溃,失控,到底发生了什么?

伊朗突发,崩溃,失控,到底发生了什么?

扶苏聊历史
2026-01-03 10:58:42
多地开始严查电动车,商家拍手称快,不买新国标等着罚款扣车!

多地开始严查电动车,商家拍手称快,不买新国标等着罚款扣车!

眼光很亮
2026-01-03 16:03:00
委内瑞拉首都多地发生爆炸,美媒称特朗普下令空袭

委内瑞拉首都多地发生爆炸,美媒称特朗普下令空袭

凤凰卫视
2026-01-03 16:51:13
影后辛芷蕾,这张照片摄影师得加鸡腿,抓拍的太到位了

影后辛芷蕾,这张照片摄影师得加鸡腿,抓拍的太到位了

徐帮阳
2025-12-23 18:33:38
1949年美苏联手,毛主席看斯大林密电后,吸了一夜烟,仅回7个字

1949年美苏联手,毛主席看斯大林密电后,吸了一夜烟,仅回7个字

清澈之玹
2025-12-09 12:35:03
一位在巴西开超市十年的老乡说:当地人恨我们,不是因为东西便宜

一位在巴西开超市十年的老乡说:当地人恨我们,不是因为东西便宜

南权先生
2025-12-13 16:51:47
英媒:当初德日不该逼迫中国自研机床技术,如今他们垄断全球市场

英媒:当初德日不该逼迫中国自研机床技术,如今他们垄断全球市场

科普100克克
2026-01-02 17:00:09
掘金10倍股!低价低估值+高景气度,15只绩优潜力“黑马”揭晓

掘金10倍股!低价低估值+高景气度,15只绩优潜力“黑马”揭晓

数据宝
2026-01-03 12:39:15
司晓迪事件再添猛料!早就有征兆,多张私密照实锤,王安宇最无辜

司晓迪事件再添猛料!早就有征兆,多张私密照实锤,王安宇最无辜

阿纂看事
2026-01-03 15:44:05
再掏10万获谅解!永州美女老板正式表态不送车:企业+家庭有困难

再掏10万获谅解!永州美女老板正式表态不送车:企业+家庭有困难

风过乡
2026-01-03 17:10:37
CBA积分榜更新:卫冕冠军强势领跑

CBA积分榜更新:卫冕冠军强势领跑

小哆说体育
2026-01-03 22:35:56
特朗普下令打击,委内瑞拉总统马杜罗:立即进入武装斗争阶段!

特朗普下令打击,委内瑞拉总统马杜罗:立即进入武装斗争阶段!

都市快报橙柿互动
2026-01-03 16:09:56
网友们把当下国企的内幕说得明明白白

网友们把当下国企的内幕说得明明白白

清晖有墨
2025-11-21 19:56:40
全网吐槽济南地铁!

全网吐槽济南地铁!

天下泉城
2026-01-03 18:58:16
2026-01-04 01:12:49
中国物理学会期刊网 incentive-icons
中国物理学会期刊网
最权威的物理学综合信息网站
4060文章数 21900关注度
往期回顾 全部

科技要闻

雷军:骂小米汽车有流量,但别故意抹黑

头条要闻

牛弹琴:美国入侵委内瑞拉 给世界带来三个血的教训

头条要闻

牛弹琴:美国入侵委内瑞拉 给世界带来三个血的教训

体育要闻

青岛西海岸官宣:郑智出任一线队主教练

娱乐要闻

司晓迪事件再升级 司晓迪称鹿晗最好

财经要闻

具身智能抢人大战:毕业一年 年薪300万

汽车要闻

奕派科技全年销量275,752辆 同比增长28.3

态度原创

健康
亲子
教育
时尚
艺术

这些新疗法,让化疗不再那么痛苦

亲子要闻

后续!月嫂给婴儿偷喂安眠药被抓,身份被扒,知情人曝行业内幕

教育要闻

2026年高考会更轻松吗?扩容背后,录取率未必“水涨船高”

好美啊!58岁的她开挂了

艺术要闻

色彩能愉悦你的眼睛,黑白则能慰藉你的心灵!

无障碍浏览 进入关怀版