网易首页 > 网易号 > 正文 申请入驻

AI辅助量子理论证明?量子计算科学家:让我来看看谁还在质疑AI

0
分享至

随着人工智能科技的不断发展,其在逻辑推理能力上的表现也在不断给人留下深刻的印象。知名数学家陶哲轩对AI在数学中的应用早已从怀疑转向拥抱。

而这一次被震惊的科学家是理论计算机科学界的知名科学家Scott Aaronson(斯考特阿伦森),他在最近的中提到自己在证明一个与量子复杂性理论相关的问题时,使用GPT-5辅助完成了一个关键步骤的证明。


“This is the first paper I’ve ever put out for which a key technical step in the proof of the main result came from AI—specifically, from GPT5-Thinking."

“这是我发表的首篇主要结论的证明有AI参与的论文,证明中的核心步骤由AI——即GPT5-Thinking——所给出。”


▲图片来源:https://scottaaronson.blog/?p=9183

当然,GPT-5也并非聪明到可以独自完成该项研究,事实上它在最初的几次回复中也出现了明显的错误。


▲图片来源:https://chatgpt.com/share/68db5e26-78bc-8011-b484-2422836e94f4

但在与其多次沟通后,GPT-5也成功给出了令Scott Aasonson满意的结果。


“...there’s not the slightest doubt that, if a student had given it to me, I would’ve called it clever."

“……毫无疑问,如果是一个学生交给我这个证明,那我肯定会称赞其巧妙。”

什么是QMA?

在介绍Scott尝试解决的具体问题前,我们有必要简单的科普一下什么是QMA(Quantum Merlin-Arthur)

也许有些读者听说过与黎曼猜想、庞加莱猜想同属于千禧年七大难题之一的“P =NP?”问题。其中,P和NP是理论计算机科学中按照问题难易程度对可计算问题划分出的两个类别。

简单来说,如果一个问题属于P类问题,那么我们可以“高效”地得到其答案,这里的“高效”是指我们可以将解决该问题所需要的计算时间写成以该问题规模为自变量的一个多项式。而如果一个问题属于NP类问题,那么我们可以“高效”地验证一个该问题的解的正确性。

因此我们也许会好奇对于一个问题,如果我们能高效地验证其解的正确性,那么是否存在一种方法能够使我们高效地得到它的一个解呢?,虽然目前大部分科学家们认为这种假设不成立,也即P不等于NP,但是目前尚未有人成功地证明或证伪该命题。

而QMA类问题在量子计算复杂性中的角色可以类比于NP类问题在经典计算复杂性中的角色。


▲图片来源:知乎答主“Climber.pl”(https://zhuanlan.zhihu.com/p/20562470)

我们可以想象这样的一个虚构法庭:在法庭上一位拥有量子计算能力的巫师(Merlin) 正在试图向一位国王(Arthur)证明一个命题的真实性,在双方的辩论中,Merlin会向Arthur提交证据(一个量子态)。如果一个问题属于QMA类问题,那么Arthur将能够高效的验证Merlin提交的证据的正确性,并且

·完备性:若Merlin提交了正确的证据,那么Arthur采纳它的概率不低于2/3

·可靠性:如果Merlin提交了错误的证据,那么Arthur采纳它的概率不超过1/3

Scott用GPT做了什么?

在Scott的研究中,他将GPT-5(具体为GPT-5-Thinking模型)运用到了证明使用黑盒放大对QMA进行增强的极限在哪里,即通过黑盒放大这种方法是否能使得当Merlin提交正确证据时Arthur采纳的概率等于1


在证明的过程中,有一个步骤涉及到分析一个实参数三角多项式构成的厄米矩阵的最大特征满足的某些性质。实际上,该步骤的证明对于顶级科学家而言,并不非常困难,Scott花上一两周进行尝试亦可独立完成。在其博客的评论区,也有人提出了更好的函数构造。但令Scott惊讶的点在于:一年前的GPT尚不能在类似的问题上取得令人满意的回答,然而现在它已经能涉足人类智力活动中最精妙的领域之一。

这并不令人惊讶,在AI产品种类越来越多的当下,使用AI辅助工作已经成为随处可见的日常。从搜集信息到推导公式、编程,AI早已悄悄从我们印象里前两年的那个会在初等算数上犯错的”小学生“,变成了只要加以适当的指导便能完成复杂任务的“大学生”。

虽然目前的AI尚不能独立完成整个研究工作,但是目前它完全可以充当一个听话的“小助手”,让它帮你完成一些小任务;而你则可以充当一个“导师”,为其分解任务并验证其结果的正确性。当然,前提是你得对该领域有基础的了解,否则遇到AI胡编乱造的结论你也难以辨别真伪。但是谁又知道距离下一次AI能力的突变还有多久呢?连Scott也开玩笑称还好自己早已拿到终生教职。


"I guess I should be grateful that I have tenure."

“我想,我应该庆幸我已经有终生教职了。”


▲图片来源:https://scottaaronson.blog/?p=9183

总的来说,人与AI的交互目前已经进入了某种程度上的”蜜月期“,只要掌握好方法,哪怕是在计算理论这种高难度的领域也能助你一臂之力。对于我们的读者,如果你仍然觉得AI距离实用仍有一段距离,那么不妨尝试在你的日常工作中使用AI来帮你完成一些小任务。也许体验过后,你也能理解为什么连著名的理论计算机科学家也会为之震惊。

*本文部分内容由AI生成与校验(笑)

来源:墨子沙龙

编辑:ThymolBlue

转载内容仅代表作者观点

不代表中科院物理所立场

如需转载请联系原公众号


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陈数首谈14年婚姻,盲目听从丈夫安排,身患重病后现状如何?

陈数首谈14年婚姻,盲目听从丈夫安排,身患重病后现状如何?

一娱三分地
2025-11-10 22:18:27
名字起得越狂,死得就越惨?金庸把最狂的名字给了这8个三流高手

名字起得越狂,死得就越惨?金庸把最狂的名字给了这8个三流高手

耳东文史
2025-11-16 00:02:43
周薪27万镑,伤停10个月,世界杯梦提前碎了,耶稣来了也要没用

周薪27万镑,伤停10个月,世界杯梦提前碎了,耶稣来了也要没用

95帕尔马
2025-11-16 09:52:36
中国棋手连续3届包揽三星杯冠亚军!韩棋迷,韩国围棋正在崩塌!

中国棋手连续3届包揽三星杯冠亚军!韩棋迷,韩国围棋正在崩塌!

L76号
2025-11-16 08:50:27
比弗利富婆集体回春,桑切斯展少女般皮肤状态,美貌不逊于肯豆

比弗利富婆集体回春,桑切斯展少女般皮肤状态,美貌不逊于肯豆

刘蕳爱下厨
2025-11-14 22:30:55
终于有个日本将军,把窗户纸给捅破了:再打仗,日本可能就没了

终于有个日本将军,把窗户纸给捅破了:再打仗,日本可能就没了

李子橱
2025-11-06 21:30:03
乒乓球男团:北京3-2战胜上海,王楚钦独得两分锁定胜局

乒乓球男团:北京3-2战胜上海,王楚钦独得两分锁定胜局

懂球帝
2025-11-15 21:18:11
斯诺克赛程:19局10胜决出冠军,小特拒绝决赛3连败,新王或登基

斯诺克赛程:19局10胜决出冠军,小特拒绝决赛3连败,新王或登基

刘姚尧的文字城堡
2025-11-16 08:01:12
爱泼斯坦文件曝光,特朗普果然参与其中,撕开美国政坛遮羞布

爱泼斯坦文件曝光,特朗普果然参与其中,撕开美国政坛遮羞布

蓝色海边
2025-11-16 10:17:58
日本民众怒了!首相官邸前集会抗议高喊“高市下台!”

日本民众怒了!首相官邸前集会抗议高喊“高市下台!”

新华社
2025-11-16 10:50:19
不是36万亿而是230万亿?美专家:美国已经破产,美元成“假钞”

不是36万亿而是230万亿?美专家:美国已经破产,美元成“假钞”

凡知
2025-11-15 14:09:09
AI重磅!英伟达,即将发布!

AI重磅!英伟达,即将发布!

证券时报
2025-11-16 08:23:04
瑞银:居民收入全面放缓

瑞银:居民收入全面放缓

谭谈投研
2025-11-15 18:30:26
周鹏中肯点评,道出徐杰为何会无缘中国男篮大名单

周鹏中肯点评,道出徐杰为何会无缘中国男篮大名单

体育哲人
2025-11-15 16:07:19
刘銮雄长子移居英国晒近照,两鬓花白身姿健硕,在当地陪子女生活

刘銮雄长子移居英国晒近照,两鬓花白身姿健硕,在当地陪子女生活

揽星河的笔记
2025-11-11 19:10:19
4-0!世预赛神奇一组:西班牙5连胜还没出线,下轮不输7球=晋级

4-0!世预赛神奇一组:西班牙5连胜还没出线,下轮不输7球=晋级

体育知多少
2025-11-16 10:04:48
50多年后终于明白,当年苏联挖穿地球,为何挖到12262米就停了

50多年后终于明白,当年苏联挖穿地球,为何挖到12262米就停了

博览历史
2025-11-12 16:28:15
8+13+4!正式达成首秀!太阳十号秀点评杨瀚森

8+13+4!正式达成首秀!太阳十号秀点评杨瀚森

篮球实战宝典
2025-11-15 14:14:37
陈慧琳演唱会穿三角裤衩,五十多了合适吗

陈慧琳演唱会穿三角裤衩,五十多了合适吗

草莓解说体育
2025-11-16 10:12:58
000695,终止重大资产重组!

000695,终止重大资产重组!

中国基金报
2025-11-16 10:43:41
2025-11-16 11:32:49
中科院物理所 incentive-icons
中科院物理所
爱上物理,改变世界。
9577文章数 136369关注度
往期回顾 全部

科技要闻

苹果最新爆料:库克或最早明年卸任

头条要闻

牛弹琴:中国看透了高市早苗 采取前所未有的反制措施

头条要闻

牛弹琴:中国看透了高市早苗 采取前所未有的反制措施

体育要闻

樊振东和他的尖子班 勇闯地表最强乒乓球赛

娱乐要闻

宋佳二封,易烊千玺拿奖张艺谋乐开花

财经要闻

中国县城的打工人,快被AI培训班包围了

汽车要闻

"冰彩沙"全配齐 红旗HS6 PHEV预售17.88万起

态度原创

教育
游戏
数码
公开课
军事航空

教育要闻

社团课程校本化新路径!全国近200位教育同仁聚东城一中 共探好课程

多人合作肉鸽冒险《UnderMire》将于12月开启测试

数码要闻

满血版麒麟9030架构曝光:Mate80系列却全系“残血”!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

解密福建舰电磁弹射背后的硬核支撑

无障碍浏览 进入关怀版