网易首页 > 网易号 > 正文 申请入驻

啥?陶哲轩18个月没搞定的数学挑战,被这个“AI高斯”三周完成了

0
分享至

金磊 发自 凹非寺
量子位 | 公众号 QbitAI

不得了,这个名叫Gauss(高斯)的新AI Agent,有点杀疯了的感觉。

因为它只用了三周的时间,就完成了陶哲轩和Alex Kontorovich提出的数学挑战——

在Lean中形式化强素数定理(Prime Number Theorem,PNT)。



要知道,陶哲轩和Kontorovich在2024年1月提出这个挑战后,足足花了18个月(今年7月)的时间,也才取得阶段性的进展。

那么这个Gauss到底是什么来头?

它的背后是一家叫做Math的AI公司,据介绍,Gauss是首个可以协助顶级数学家进行形式验证的自动形式化(autoformalization)Agent:



这里的形式化(formalization),指的是把人类写的数学内容转换成一种机器可读、可检查、严密无歧义的形式语言,然后利用计算机帮助验证其正确性。

而陶哲轩和Alex Kontorovich之所以目前仅取得阶段性进展,问题就卡在了复分析(complex analysis)的核心难题上。

而这个Gauss作为硅基生命,它的特点就是可以不停的工作,极大地压缩了以前只有顶尖形式化专家才能完成的工作量;与此同时,Gauss还形式化了上面提到的复分析中关键的缺失结果。

这就是为什么它能三周解决陶哲轩18个月都未能完成的数学挑战的原因了。

Gauss是如何实现的?

目前Math公司官方并没有发布具体的技术报告。

但从最终结果来看,Gauss生成了大约25000行Lean代码,包含上千个定理和定义。

要知道,这种规模的形式化证明,以前往往需要多年才能完成。

历史上最大的单个形式化项目(往往需要跨甚至10年的时间),也只是比这大一个数量级(最多50万行代码)。

相比之下,Lean的标准数学库Mathlib有约200万行代码,包含35万个定理,但却由600多位贡献者花了8年时间才建立起来。



为了支撑Gauss的运行,团队还和Morph Labs合作开发了Trinity环境基础设施。

因为要让Gauss如此大规模运行,会涉及数千个并发Agent,且每个Agent都有自己的Lean运行环境,会消耗数TB的集群内存,是一个极其复杂的系统工程挑战。

Math团队还表示:

  • Gauss将大幅缩短完成大型数学项目所需的时间。
  • 随着算法不断进步,我们计划在未来12个月内,让形式化代码的总量提升100到1000倍。
  • 这将成为新范式的训练场——走向“可验证的超级智能”和“通才型机器数学家”。

而就在刚刚,陶哲轩本人在Mastodon上对形式化相关的问题做了一番解释(以下为陶哲轩的陈述)。

任何复杂的项目往往都有明确陈述的目标和隐含的未陈述目标。例如,一个Lean形式化项目的明确目标可能是获得某个数学命题X的形式化证明;但通常还有一些未陈述的目标,例如以适合上游到 Mathlib 库的方式形式化X的关键子命题和定义X1, X2, …;学习如何使用各种协作工具和分配任务;有机地发现X证明的更精细结构,这在以前的非形式化证明中可能没有被强调;为新手形式化者提供实际培训和经验;以及更普遍地建立一个精通形式化艺术的人类社区。

过去,通常没有必要阐明这些隐含目标,因为这些目标的实现与明确目标的实现之间存在很强的经验相关性。在形式化项目的例子中,几乎任何以人为中心的努力来实现明确目标,最终都会自然而然地实现上述大部分隐含目标。因此,明确目标有效地成为了更广泛实际目标的可行替代。

然而,随着功能强大的AI工具的出现,情况正在发生变化,这些工具采用与人类截然不同的方法。这些工具可以被指示去解决一个明确的目标,而不必实现如果由人类团队执行任务时可能同时实现的所有隐含目标。事实上,AI优化算法的性质决定了它们甚至可能以牺牲所有隐含目标为代价,在明确目标上取得高绩效。(参见古德哈特定律:“当一个衡量标准成为目标时,它就不再是一个好的衡量标准。”)

鉴于这些工具的日益部署,这向我表明,项目组织者现在需要付出更大的努力,明确阐述项目的所有目标,而不仅仅是名义上的目标。在某些情况下,这些目标甚至可能最初对组织者自己来说并不明显,可能需要参与者之间进行一些讨论。而有兴趣用其AI工具测试此类项目的外部各方,则应提前与组织者协调,以防他们遗漏了一个或多个其工具不会优化的关键隐含目标。



创始人是ICML’25时间检验奖作者

值得一提的是,Math这家公司的老板也是有点实力在身上的。

因为他正是拿下今年AI定会ICML时间检验奖论文的作者之一,Christian Szegedy



这篇论文是他和另一位作者Sergey Loffe在2015年提出的Batch Normalization(批次归一化,简称BatchNorm)。



如今,这篇论文的引用量超过6万次,是深度学习发展史上一个里程碑式的突破,极大地推动了深层神经网络的训练和应用。

可以说它是让深度学习从小规模实验,走向大规模实用化和可靠性的关键技术之一。

当然,网友们看罢Gauss之后虽然惊呼Amazing,但同时也在喊官方赶紧把论文公开喽。

至于更细节的技术内容,我们可以蹲一波了~

参考链接:
[1]https://x.com/mathematics_inc/status/1966194751847461309
[2]https://www.math.inc/gauss
[3]https://www.math.inc/vision

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一个沈伯洋摁下去,一大群沈伯洋冒出来?都得挨收拾,一个不会少

一个沈伯洋摁下去,一大群沈伯洋冒出来?都得挨收拾,一个不会少

飞花逐月大帝
2025-11-04 10:30:59
全网聚焦!原配妻子强势反攻,这波操作简直“杀人诛心”

全网聚焦!原配妻子强势反攻,这波操作简直“杀人诛心”

一杯咖啡语
2025-11-04 15:08:15
被曝核酸造假,半年敛财4.5亿,核酸大王张核子最终下场如何?

被曝核酸造假,半年敛财4.5亿,核酸大王张核子最终下场如何?

蜉蝣说
2025-10-05 23:57:52
河北小伙娶小12岁乌克兰绝色美女,结婚11年后,妻子出轨波兰农民

河北小伙娶小12岁乌克兰绝色美女,结婚11年后,妻子出轨波兰农民

青史楼兰
2025-09-16 10:44:15
陈晋一跑不动也不换,斯帅保守 放着3攻击手不用 申花排倒数第三

陈晋一跑不动也不换,斯帅保守 放着3攻击手不用 申花排倒数第三

替补席看球
2025-11-05 22:33:19
欧冠狂欢夜:拜仁2-1赢巴黎登顶 利物浦送皇马首败 阿森纳10连胜

欧冠狂欢夜:拜仁2-1赢巴黎登顶 利物浦送皇马首败 阿森纳10连胜

侃球熊弟
2025-11-05 05:09:46
郑钧儿子长大变丑,15岁长得很成熟,他没下巴,越长越像刘芸!

郑钧儿子长大变丑,15岁长得很成熟,他没下巴,越长越像刘芸!

小熊侃史
2025-11-05 00:22:15
男子被警方扣押1000万元,无罪后申诉要求返还 当地公安局:严格按照判决执行,有异议可申诉

男子被警方扣押1000万元,无罪后申诉要求返还 当地公安局:严格按照判决执行,有异议可申诉

红星新闻
2025-11-04 21:58:11
因臀部过于性感 日恐怖游戏未通过Steam审核

因臀部过于性感 日恐怖游戏未通过Steam审核

3DM游戏
2025-11-04 21:29:04
李云迪再陷桃色风波,女主照片被扒疑似有两人视频流出

李云迪再陷桃色风波,女主照片被扒疑似有两人视频流出

挪威森林
2025-11-02 12:56:16
1976年为什么被认为是最诡异的一年,那一年到底发生了什么?

1976年为什么被认为是最诡异的一年,那一年到底发生了什么?

历史有些冷
2025-11-04 21:20:03
重庆燃气抄表员不足工人一年净减121人 整改不力被罚810万李金陆掌舵17月离任

重庆燃气抄表员不足工人一年净减121人 整改不力被罚810万李金陆掌舵17月离任

长江商报
2025-11-05 09:54:55
中国国防部首次强硬表态:解放军将全力打击“台独”及外部干预!

中国国防部首次强硬表态:解放军将全力打击“台独”及外部干预!

Ck的蜜糖
2025-11-05 00:42:42
海港夺冠彻底稳了!不仅因为申花以已无力追赶,而是因为这三点!

海港夺冠彻底稳了!不仅因为申花以已无力追赶,而是因为这三点!

田先生篮球
2025-11-05 11:48:35
如果在家突发心梗,黄金5分钟自救法,快了解,关键时刻可自救

如果在家突发心梗,黄金5分钟自救法,快了解,关键时刻可自救

风信子的花
2025-10-24 23:59:39
美国试射“民兵III”型洲际弹道导弹,俄罗斯宣布准备恢复核试验

美国试射“民兵III”型洲际弹道导弹,俄罗斯宣布准备恢复核试验

山河路口
2025-11-05 22:56:11
弗州竞选惊爆冷门:琼斯逆袭,民主党以64%胜率上演惊天翻盘

弗州竞选惊爆冷门:琼斯逆袭,民主党以64%胜率上演惊天翻盘

老玮是个手艺人
2025-11-05 12:59:08
全球第一,固态电池巨头,拿下120亿订单!

全球第一,固态电池巨头,拿下120亿订单!

飞鲸投研
2025-11-05 09:08:06
发型奇怪、不讲卫生、又装又尴尬,他来《你好星期六》是谁邀请的

发型奇怪、不讲卫生、又装又尴尬,他来《你好星期六》是谁邀请的

老汆古装影视解说
2025-11-03 22:24:00
baby新男友已获小海绵认可?街头带娃遛大型犬,像幸福的一家三口

baby新男友已获小海绵认可?街头带娃遛大型犬,像幸福的一家三口

八星人
2025-11-05 15:55:40
2025-11-06 00:07:00
量子位 incentive-icons
量子位
追踪人工智能动态
11633文章数 176326关注度
往期回顾 全部

科技要闻

大转弯!特朗普再提名马斯克盟友任NASA局长

头条要闻

丈夫突然病亡2天后妻子也离世留下一儿一女 妹妹发声

头条要闻

丈夫突然病亡2天后妻子也离世留下一儿一女 妹妹发声

体育要闻

赢下皇马,会是利物浦的转折点吗?

娱乐要闻

港星林尚武突发心脏病去世

财经要闻

事关加快建设金融强国 中央金融办发声

汽车要闻

智己LS9入局"9系"混战 全尺寸SUV市场迎来新变量

态度原创

本地
游戏
健康
亲子
公开课

本地新闻

这届干饭人,已经把博物馆吃成了食堂

遭日本禁止发售恐怖游戏上架Steam!内容过于凄惨

超声探头会加重受伤情况吗?

亲子要闻

温暖守护小患者 上海这家医院的眼科有个“儿童乐园”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版