网易首页 > 网易号 > 正文 申请入驻

656行代码5小时搞定,Axiom AI自主完成两项Erdős猜想形式化证明

0
分享至

近日,AI 初创公司 Axiom 宣布其模型在没有人类干预的情况下,自动完成了两个数学猜想的证明——埃尔德什问题(Erdős Problem)中的 481 号和 124 号。

据称,481 号问题仅用时 5 小时,代码量为 656 行;124 号问题则耗时超 24 小时。值得关注的是,这些证明均通过 Lean 验证,Lean 的特点是其形式化证明过程无需人工干预,为数学正确性提供了保障。




(来源:X)

据悉,本次完成两个数学猜想的证明的并不是 Axiom 推出的 API 或完整的产品,而是一个由多个模型组成的系统,包括 Axiom 的通过强化学习后训练研发的模型。

该公司 CEO 洪乐潼(Carina Hong)对 DeepTech 表示:“六百多行代码对于形式化的证明来说,算是比较简洁和漂亮的证明。”




(来源:X)

该证明在社交媒体发布后,有用户评价称“埃尔德什问题的精简形式化令人耳目一新”,也有用户评价本次证明是一个“好的起点”,还有用户这样评价:“几周前 OpenAI 曾称声称用 GPT-5 解决了埃尔德什问题,但社区指出它只检索了现有文献。而 Axiom 实际上证明了这个问题。”


图丨X 上用户评论(来源:X)

埃尔德什问题是匈牙利数学家保罗·埃尔德什(Paul Erdős)提出的一系列悬而未决的数学猜想,长期被视为检验推理能力的试金石。


图丨埃尔德什问题 481 号(来源:Erdős Problem)

481 号问题是一个社区近 45 年未被解决的问题,即某种迭代算术过程是否必然在某一步产生重复,从而进入循环或重复状态。


图丨Axiom 模型证明的 481 号问题(来源:洪乐潼)

而 124 号问题是:考虑若干整数基数 (d_1 < d_2 < \cdots < d_r)(且每个 (d_i \ge 3)),构造由这些基数的不同比例幂构成的序列。这是一个近 30 年未被解决的问题,也是最近比较火热的话题之一。

几天前,我们对 Harmonic 公司开发的 Aristotle 模型自主解决埃尔德什问题 124 号进行了报道,该公司由 Robinhood 的 CEO 弗拉德·特涅夫(Vlad Tenev)创立。


图丨埃尔德什问题 124 号(来源:Erdős Problem)

“关于 124 号问题,我们跑了超过一天的时间,中途一定是走到某个‘死胡同’里了。尽管目前跑出来的证明比较长,不如我们期望的简练,但至少它跑出来了。”洪乐潼说。


图丨Axiom 模型证明的 124 号问题(来源:洪乐潼)

Axiom 是一家成立不到 4 个月的公司,据公开资料其目前已融资 6,400 万美元的种子轮融资,成员不到 20 人。该公司 CEO 洪乐潼是 00 后,她在美国麻省理工学院获得数学和物理双学士学位,并在英国牛津大学获得神经科学硕士学位。此前,她曾在美国斯坦福大学攻读数学和法学博士学位,后辍学。

Axiom 官网称,其创新性体现在通过融合 AI、编程语言和数学,开发能够解决复杂数学问题的人工智能系统,其初始模型是 AI 数学家。一方面,其可启发人类数学家的科研灵感,另一方面可成为人类数学家的合作者,而非替代者。最新公开消息显示,著名数学家小野健(Ken Ono)刚从美国弗吉尼亚大学离职加入 Axiom 担任创始数学家,他曾在 2020 年担任洪乐潼研究项目的导师。

该公司官网提到,我们现在处于一个“数学发现”的时代。其在博客中曾提到过一个想法:人类在自然语言中进行推理,而该公司的模型在进行形式化推理时,会把自然语言的推理过程转化为形式化代码。在这个过程中,形式化代码的运行结果会反馈回来,进而影响人类在自然语言推理上的直觉和思考方式。

实际上,这个过程可以拓展到更广泛的应用领域,比如金融、量化交易、芯片、硬件和软件的形式验证、物理定律的形式化推导等。

自动形式化是近年来被关注新的方向,其把自然语言的证明转换到 Lean 语言中,这个过程与证明和形式化证明同样重要,且在一个系统中同时训练,而不是分开训练。

洪乐潼对 DeepTech 解释道:“我们对数据主要依赖自动生成,无论是从自然语言到形式化的自动转换,还是在形式化的基础上自动生成 100 到 1,000 倍的变体,甚至可以借鉴类似编译器中的想法和手段。”

据了解,Axiom 目前正在设计内部的基准数据集,旨在用更难的数据集来挑战其模型能否进一步突破极限。此外,他们还希望让猜想和证明可以做持续的非对称自我博弈以及事后重演。

洪乐潼认为,AI for Maths 是 AI for Science 的理论层和算法层,她表示:“大家可能觉得解决了埃尔德什问题很了不起,但我认为这只能说明模型具备了一定的能力,但我们也必须清醒地看到,它距离成为真正的 AI 数学家还有一定的距离,比如在数论、代数几何、代数拓扑、微分拓扑等方向上我们还有很大的进步空间。”

从融资规模与公司体量来看,Axiom 当前进展已引发行业关注。后续能否进一步与竞争对手拉开差距并形成落地产品,还需多一些的耐心与观察。

参考资料:

https://x.com/carinalhong/status/1995905801719066763?s=46

https://b.capital/why-we-invested/toward-mathematical-superintelligence-why-we-invested-in-axiom/

https://axiommath.ai/

https://www.erdosproblems.com/

https://techfundingnews.com/axiom-math-ai-mathematician-64m-seed/

https://www.wsj.com/tech/ai/math-ken-ono-carina-hong-axiom-startup-649bc417

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
超越寒武纪、直逼茅台,10倍CPO牛股赴港上市

超越寒武纪、直逼茅台,10倍CPO牛股赴港上市

和讯网
2026-03-26 17:22:13
油价降了!3月26日全国油价下调85元吨,4月7日油价将迎下跌!

油价降了!3月26日全国油价下调85元吨,4月7日油价将迎下跌!

沙雕小琳琳
2026-03-26 15:31:42
人不会无缘无故患心源性猝死!研究发现:猝死的人,多半爱干3事

人不会无缘无故患心源性猝死!研究发现:猝死的人,多半爱干3事

垚垚分享健康
2026-03-25 13:25:46
王毅同加拿大外长阿南德通电话

王毅同加拿大外长阿南德通电话

齐鲁壹点
2026-03-26 21:33:12
伊朗越打越顺?卡塔尔向伊朗交60亿“保护费”,特朗普看懵圈了!

伊朗越打越顺?卡塔尔向伊朗交60亿“保护费”,特朗普看懵圈了!

讲者普拉斯
2026-03-26 21:19:51
彻底撕破脸,马英九亲自下场,萧旭岑深夜反击,郑丽文送致命一击

彻底撕破脸,马英九亲自下场,萧旭岑深夜反击,郑丽文送致命一击

叹知
2026-03-25 14:27:24
雷军彻底疯狂,小米拿下4000亿

雷军彻底疯狂,小米拿下4000亿

新浪财经
2026-03-25 23:42:55
财政部:对于参保长期护理保险的城乡居民 政府会按规定给予补助

财政部:对于参保长期护理保险的城乡居民 政府会按规定给予补助

北青网-北京青年报
2026-03-26 11:11:12
一瓶3块,爆卖2亿!喝一口能把人送走的广东神饮,让老表们疯抢了

一瓶3块,爆卖2亿!喝一口能把人送走的广东神饮,让老表们疯抢了

毒sir财经
2026-03-16 21:37:01
小小的但有硬派味,丰田酷路泽 FJ 正式发售,约 26.7 万元

小小的但有硬派味,丰田酷路泽 FJ 正式发售,约 26.7 万元

爱范儿
2026-03-26 15:27:20
旅游+演艺,激活消费新空间(大数据观察)

旅游+演艺,激活消费新空间(大数据观察)

人民网
2026-03-26 06:17:20
美伊谈崩内幕:伊万卡是“肉票”,特朗普女婿是“以色列内线”?

美伊谈崩内幕:伊万卡是“肉票”,特朗普女婿是“以色列内线”?

瞩望云霄
2026-03-25 18:20:59
香港艳星下嫁山东农村,曾不雅照满天飞,现状曝光,生了一个儿子

香港艳星下嫁山东农村,曾不雅照满天飞,现状曝光,生了一个儿子

深度解析热点
2026-02-13 11:55:13
上海交大解剖405名心梗死者,惊讶发现患心梗的人,有3个共性

上海交大解剖405名心梗死者,惊讶发现患心梗的人,有3个共性

健康之光
2026-03-26 13:55:06
特朗普的大炮一响,伊朗卖给中国的石油,为什么反而比以前更多了?

特朗普的大炮一响,伊朗卖给中国的石油,为什么反而比以前更多了?

爱史纪
2026-03-26 19:30:35
姆巴佩:说我在皇马遭误诊是假的,也怪我留下了可解读的空间

姆巴佩:说我在皇马遭误诊是假的,也怪我留下了可解读的空间

懂球帝
2026-03-26 04:09:06
黄巢虽然残忍,却做了件好事:为我国破除了危害近600年的祸根

黄巢虽然残忍,却做了件好事:为我国破除了危害近600年的祸根

铭记历史呀
2026-03-26 11:26:09
张雪峰,倒在上市前夜

张雪峰,倒在上市前夜

帅真商业
2026-03-25 11:31:43
俄罗斯警告日本!俄输油重港接连遭攻击,“现场浓烟滚滚”;俄乌战场惊现持枪机器人:身高180cm,可AI评估战场并侦察射击

俄罗斯警告日本!俄输油重港接连遭攻击,“现场浓烟滚滚”;俄乌战场惊现持枪机器人:身高180cm,可AI评估战场并侦察射击

每日经济新闻
2026-03-26 15:53:05
国民党败退台湾,留下许多官太太,她们向我军提的要求简单但很痛

国民党败退台湾,留下许多官太太,她们向我军提的要求简单但很痛

新一说史
2026-03-25 13:26:51
2026-03-26 22:12:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16491文章数 514798关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

美国总统特朗普公开宣布访华行程 外交部回应

头条要闻

美国总统特朗普公开宣布访华行程 外交部回应

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

亲子
艺术
教育
数码
房产

亲子要闻

你好,我是馒头,快开门!

艺术要闻

哪一座桥不是风景?

教育要闻

江苏省教育厅公布全省中小学生竞赛活动名单

数码要闻

iQOO Z11x发布:LCD党的护眼神机 1499元起

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

无障碍浏览 进入关怀版