据研发团队介绍,中国一个人工智能框架已自主解决了美国数学家在十多年前提出的一个公开问题——安德森猜想。
![]()
前不久,北京大学牵头的研究团队发了一篇预印本论文,论文称,通过整合数十年的数学文献,他们的AI框架弥合了自然语言推理与机器形式验证之间的鸿沟,成功解决了美国数学家丹·安德森早在2014年就提出的一个悬而未决的问题,并在几乎无需人类干预的情况下自动完成了证明的形式化。
其实这些年随着大语言模型发展,AI搞数学已经不是新鲜事了,比如谷歌的Gemini Deep Think,都已是能在最顶尖的青年数学竞赛国际奥数上拿到金牌水平了。但要说AI能完全自己搞定研究级别的数学难题,之前还真不行。
这是因为数学证明最讲究的就是百分之百严谨,哪怕是大专家写的证明,都可能藏着你看不出来的小漏洞,大语言模型本身又容易“胡编乱造”,结果根本靠不住,所以此前就算是利用AI执行数学计算,都得大量靠人类盯着,没法实现全自动。
这次中国团队的思路就特别妙,直接让两个AI智能体分工干活。第一个叫Rethlas,专门“想思路”,它就像人类数学家一样,借助数学定理搜索引擎Matlas探索解题策略,先攒出一个像模像样的候选证明草稿;第二个叫Archon,专门“把草稿变严谨”,它会用专门的定理搜索工具,把非正式证明转换成可以被机器完全验证的正式项目。
![]()
他们拿这套方法去试安德森那道交换代数里的问题——交换代数是现代代数几何、数论的基础。AI自己给了一个反例的非正式证明,推翻了原来问题的前提,随后仅用80小时的智能体运行时间,就把整个证明的形式化验证全做完了。整个过程中,人类只干了一件事:帮AI下了几个它无法自行获取的付费文件,连“这个证明对不对”这种数学判断,都完全没用人类出手。
研究人员写道:“总的来说,我们的结果表明,对于真正的数学公开问题,非正式推理智能体和形式智能体可以有效协作。”事实上,AI和数学本来就是互相成就的,数学为AI发展提供理论基础,而AI工具则可以加速数学研究本身。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.