网易首页 > 网易号 > 正文 申请入驻

把数学变成谜题:SAT 求解器如何让机器自动写出人类做不到的证明

0
分享至


来源:ScienceAI

Marijn Heule 近十年来致力于破解数学难题,倘若将他的工作写成小说,可能更像特工代号:空六边形、舒尔数 5、凯勒猜想、七维。事实上,这些曾是几何学和组合数学中最顽固的问题之一,困扰了人们 90 年甚至更长时间。

Heule 使用了一种名为可满足性(SAT)的计算方式将它们一一攻克。现在,作为卡内基梅隆大学计算辅助数学推理研究所的一员,他认为 SAT 可以与大型语言模型(LLMs)结合,创造出足以解决更难纯数学问题的工具。

其实,SAT 就是人工智能的一个基础,它属于符号人工智能(也称为 GOFAI,即“传统的人工智能”),依赖于只有是否判断的陈述,并依照严密的逻辑将其串联起来。这一链条可能会很长,长到人类自己根本无法解析。


图示:3-SAT 实例。(来源:网络)

但是 AI 可以。

Heule 表示,他一直对计算机是否可以解决人类推理之外的问题很感兴趣。Quanta 杂志与 Heule 就机器与人类推理的差异,SAT 的简单性如何成为其秘密武器,以及为什么在数学中理解被高估了等问题进行了深入探讨。

Q:首先:什么是 SAT?

大致可以将其想象为一个棋盘,每个单元格中只能放 0 或 1。现在已经知道了每行每列中可以放多少 0 或 1, 只需要把这个棋盘摆出来就行了。尽管这种形式很简单,但它非常强大。各种重要问题,包括硬件和软件验证、调度,甚至纯数学领域,都可以翻译成 SAT。

Q:SAT 求解与数字计算机做其他任何事情有什么不同?

SAT 工具做的事情与普通计算从根本上不同。它不是用 0 和 1 进行计算。相反,是在寻找一个满足所有约束的组合。

Q:生成式人工智能可以帮助研究过程本身。SAT 在这种情况下扮演什么角色?

在这种情境下,LLM 可以生成许多听起来似是而非的引理,「用于证明更大定理的陈述」。自动推理会检验这些是否正确。

一旦出现错误,SAT 求解器就可以返回反例——理想情况下,是最小的反例。毕竟,实验者并不希望在询问 SAT 求解器时,它返回一个巨大的、难以理解的对象。

这看上去有点像 AI 的「目标计算机」。它们都将整个局面拆分为若干小段,自动推理在此时就可以一一对其进行检查。同样重要的是,它还可以检查这些部件是否真正涵盖了所有内容,这样就不会有任何遗漏。


图注:欧几里得的《几何要素》深刻地影响了数学家对严谨性的看法。但在过去的 400 年里,数学变得越来越抽象。(来源:网络)

Q:如果本身就很难理解的 LLMs 进入到复杂的场景,难道问题不会更加严重吗?

事实上,当今世上没有哪位数学家能完全理解所有数学。更多的是,有些信誉良好的数学家能够针对每个拼图的小部分说:“好的,我检查过了。这是正确的。”然后其他人可以在此基础上继续构建。

LLMs 可以胡说八道,但只要自动化推理能够说:“好的,但这一部分实际上是正确的,这里有一个证明,”这实际上比大多数纸笔证明更加可信。

Q:假设你所描述的 LLMs 与 SAT 之间的生产性互动已经被构建了,人类数学家还能剩下什么工作要做?

在之前,我用 SAT 解决开放问题时,总是会与数学家共事。我吸收学习他们的看法并将其编码,以便求解器能完成工作。未来的协作方式可能与之类似。LLMs 可以帮助更多数学家学习如何自己做到这一点。

在数学家、生成式 AI 和自动化推理的共同努力下,我们有机会攻克长期存在的开放问题。但完全剔除人工会是一个错误。创造性直觉、概念重构,这些仍然是人类独特擅长的事情。真正的魔力仍来自于合作。

原文链接:https://www.quantamagazine.org/to-have-machines-make-math-proofs-turn-them-into-a-puzzle-20251110/

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828


未来知识库是“ 欧米伽 未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。 欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

声明:包含AI生成内容

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2-0击败德米纳尔,辛纳连续三年打进ATP年终总决赛决赛

2-0击败德米纳尔,辛纳连续三年打进ATP年终总决赛决赛

懂球帝
2025-11-16 00:14:21
唐嫣与罗晋最新消息

唐嫣与罗晋最新消息

动物奇奇怪怪
2025-11-16 01:44:34
家里托关系找的工作有多抽象?网友:真离谱,这是什么家人

家里托关系找的工作有多抽象?网友:真离谱,这是什么家人

解读热点事件
2025-11-14 00:10:03
王楚钦讲樊振东赢球原因,刘国梁WTT该脸红!央视解说被吐槽

王楚钦讲樊振东赢球原因,刘国梁WTT该脸红!央视解说被吐槽

三十年莱斯特城球迷
2025-11-15 15:17:40
一夜负债200亿?电动车巨头轰然倒塌:终于活成了贾跃亭信徒

一夜负债200亿?电动车巨头轰然倒塌:终于活成了贾跃亭信徒

奇思妙想生活家
2025-11-16 01:50:39
山西血案死者妹妹双标发引众怒!自私刻进骨子里,网友:脸都不要

山西血案死者妹妹双标发引众怒!自私刻进骨子里,网友:脸都不要

三农老历
2025-11-15 03:17:52
热点丨刚刚,关税大消息!降至15%

热点丨刚刚,关税大消息!降至15%

钱眼
2025-11-15 19:13:54
广东女篮全运强势夺冠,湛江籍小将亮眼,7人来自广东无人查户籍

广东女篮全运强势夺冠,湛江籍小将亮眼,7人来自广东无人查户籍

越岭寻踪
2025-11-16 00:26:45
悲催!嘉兴一母亲哭诉:25岁女儿留学而归,执意嫁给大20岁的男人

悲催!嘉兴一母亲哭诉:25岁女儿留学而归,执意嫁给大20岁的男人

火山诗话
2025-11-13 06:47:04
特斯拉:FSD驾驶经验远超任何人类驾驶员

特斯拉:FSD驾驶经验远超任何人类驾驶员

界面新闻
2025-11-15 07:15:27
台湾神秘队伍出击,扬言要铲除“台独”分子,这个组织到底是谁?

台湾神秘队伍出击,扬言要铲除“台独”分子,这个组织到底是谁?

小莜读史
2025-11-14 21:43:13
缅北女魔头魏榕:建立血牛库,别墅藏帅哥,不听话就赏“肉灵芝”

缅北女魔头魏榕:建立血牛库,别墅藏帅哥,不听话就赏“肉灵芝”

刀刃故事
2024-10-08 23:39:48
金一南曾发表观点:如果战争来了,一大批“办公室将军”将被淘汰

金一南曾发表观点:如果战争来了,一大批“办公室将军”将被淘汰

文史旺旺旺
2025-11-13 21:42:07
如果有人问:你觉得美国好,你为什么不去美国?怎么回答比较好?

如果有人问:你觉得美国好,你为什么不去美国?怎么回答比较好?

翻开历史和现实
2025-11-15 09:03:25
山西狗咬人反杀事件最新后续来了

山西狗咬人反杀事件最新后续来了

大张的自留地
2025-11-15 08:32:00
八十年代影坛“12朵金花”现状,有人无子无孙,有人一生只爱一人

八十年代影坛“12朵金花”现状,有人无子无孙,有人一生只爱一人

乡野小珥
2025-11-16 00:22:44
爆冷韩国!中国男足扬眉吐气升榜首,熊猫杯全乱了,韩媒集体破防

爆冷韩国!中国男足扬眉吐气升榜首,熊猫杯全乱了,韩媒集体破防

大秦壁虎白话体育
2025-11-16 01:19:28
000695,终止重大资产重组!股价大涨超30%!

000695,终止重大资产重组!股价大涨超30%!

证券时报e公司
2025-11-15 22:30:12
回顾四川女教师与黑人视频被流出:如此恶性传播,坑害了多少人?

回顾四川女教师与黑人视频被流出:如此恶性传播,坑害了多少人?

就一点
2025-10-11 10:42:22
00后沪漂女孩发文:将永远维护上海人!

00后沪漂女孩发文:将永远维护上海人!

看看新闻Knews
2025-11-15 19:44:16
2025-11-16 03:28:49
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4324文章数 37339关注度
往期回顾 全部

科技要闻

撕掉流量外衣,小米还剩什么?

头条要闻

大量日本民众围堵首相官邸 大喊:高市早苗下台

头条要闻

大量日本民众围堵首相官邸 大喊:高市早苗下台

体育要闻

樊振东和他的尖子班 勇闯地表最强乒乓球赛

娱乐要闻

钟嘉欣婚变风波升级!被骗婚?

财经要闻

小米之“惑”

汽车要闻

"冰彩沙"全配齐 红旗HS6 PHEV预售17.88万起

态度原创

艺术
教育
旅游
家居
公开课

艺术要闻

她的笔下女子如此动人,晚年却名声扫地!

教育要闻

天塌了啊:英国大学又开始搞大裁员了!

旅游要闻

百年巴洛克老建筑夜景刷屏全网,哈尔滨40年坚守:让历史活成顶流

家居要闻

现代简逸 寻找生活的光

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版