随着人工智能科技的不断发展,其在逻辑推理能力上的表现也在不断给人留下深刻的印象。知名数学家陶哲轩对AI在数学中的应用早已从怀疑转向拥抱。
而这一次被震惊的科学家是理论计算机科学界的知名科学家Scott Aaronson(斯考特阿伦森),他在最近的中提到自己在证明一个与量子复杂性理论相关的问题时,使用GPT-5辅助完成了一个关键步骤的证明。
“This is the first paper I’ve ever put out for which a key technical step in the proof of the main result came from AI—specifically, from GPT5-Thinking."
“这是我发表的首篇主要结论的证明有AI参与的论文,证明中的核心步骤由AI——即GPT5-Thinking——所给出。”
![]()
▲图片来源:https://scottaaronson.blog/?p=9183
当然,GPT-5也并非聪明到可以独自完成该项研究,事实上它在最初的几次回复中也出现了明显的错误。
![]()
▲图片来源:https://chatgpt.com/share/68db5e26-78bc-8011-b484-2422836e94f4
但在与其多次沟通后,GPT-5也成功给出了令Scott Aasonson满意的结果。
“...there’s not the slightest doubt that, if a student had given it to me, I would’ve called it clever."
“……毫无疑问,如果是一个学生交给我这个证明,那我肯定会称赞其巧妙。”
什么是QMA?
在介绍Scott尝试解决的具体问题前,我们有必要简单的科普一下什么是QMA(Quantum Merlin-Arthur)。
也许有些读者听说过与黎曼猜想、庞加莱猜想同属于千禧年七大难题之一的“P =NP?”问题。其中,P和NP是理论计算机科学中按照问题难易程度对可计算问题划分出的两个类别。
简单来说,如果一个问题属于P类问题,那么我们可以“高效”地得到其答案,这里的“高效”是指我们可以将解决该问题所需要的计算时间写成以该问题规模为自变量的一个多项式。而如果一个问题属于NP类问题,那么我们可以“高效”地验证一个该问题的解的正确性。
因此我们也许会好奇“对于一个问题,如果我们能高效地验证其解的正确性,那么是否存在一种方法能够使我们高效地得到它的一个解呢?”,虽然目前大部分科学家们认为这种假设不成立,也即P不等于NP,但是目前尚未有人成功地证明或证伪该命题。
而QMA类问题在量子计算复杂性中的角色可以类比于NP类问题在经典计算复杂性中的角色。
![]()
▲图片来源:知乎答主“Climber.pl”(https://zhuanlan.zhihu.com/p/20562470)
我们可以想象这样的一个虚构法庭:在法庭上一位拥有量子计算能力的巫师(Merlin) 正在试图向一位国王(Arthur)证明一个命题的真实性,在双方的辩论中,Merlin会向Arthur提交证据(一个量子态)。如果一个问题属于QMA类问题,那么Arthur将能够高效的验证Merlin提交的证据的正确性,并且
·完备性:若Merlin提交了正确的证据,那么Arthur采纳它的概率不低于2/3
·可靠性:如果Merlin提交了错误的证据,那么Arthur采纳它的概率不超过1/3
Scott用GPT做了什么?
在Scott的研究中,他将GPT-5(具体为GPT-5-Thinking模型)运用到了证明使用黑盒放大对QMA进行增强的极限在哪里,即通过黑盒放大这种方法是否能使得当Merlin提交正确证据时Arthur采纳的概率等于1。
![]()
在证明的过程中,有一个步骤涉及到分析一个实参数三角多项式构成的厄米矩阵的最大特征满足的某些性质。实际上,该步骤的证明对于顶级科学家而言,并不非常困难,Scott花上一两周进行尝试亦可独立完成。在其博客的评论区,也有人提出了更好的函数构造。但令Scott惊讶的点在于:一年前的GPT尚不能在类似的问题上取得令人满意的回答,然而现在它已经能涉足人类智力活动中最精妙的领域之一。
这并不令人惊讶,在AI产品种类越来越多的当下,使用AI辅助工作已经成为随处可见的日常。从搜集信息到推导公式、编程,AI早已悄悄从我们印象里前两年的那个会在初等算数上犯错的”小学生“,变成了只要加以适当的指导便能完成复杂任务的“大学生”。
虽然目前的AI尚不能独立完成整个研究工作,但是目前它完全可以充当一个听话的“小助手”,让它帮你完成一些小任务;而你则可以充当一个“导师”,为其分解任务并验证其结果的正确性。当然,前提是你得对该领域有基础的了解,否则遇到AI胡编乱造的结论你也难以辨别真伪。但是谁又知道距离下一次AI能力的突变还有多久呢?连Scott也开玩笑称还好自己早已拿到终生教职。
"I guess I should be grateful that I have tenure."
“我想,我应该庆幸我已经有终生教职了。”
![]()
▲图片来源:https://scottaaronson.blog/?p=9183
总的来说,人与AI的交互目前已经进入了某种程度上的”蜜月期“,只要掌握好方法,哪怕是在计算理论这种高难度的领域也能助你一臂之力。对于我们的读者,如果你仍然觉得AI距离实用仍有一段距离,那么不妨尝试在你的日常工作中使用AI来帮你完成一些小任务。也许体验过后,你也能理解为什么连著名的理论计算机科学家也会为之震惊。
*本文部分内容由AI生成与校验(笑)
来源:墨子沙龙
编辑:ThymolBlue
转载内容仅代表作者观点
不代表中科院物理所立场
如需转载请联系原公众号
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.