网易首页 > 网易号 > 正文 申请入驻

AI辅助量子理论证明?量子计算科学家:让我来看看谁还在质疑AI

0
分享至

随着人工智能科技的不断发展,其在逻辑推理能力上的表现也在不断给人留下深刻的印象。知名数学家陶哲轩对AI在数学中的应用早已从怀疑转向拥抱。

而这一次被震惊的科学家是理论计算机科学界的知名科学家Scott Aaronson(斯考特阿伦森),他在最近的中提到自己在证明一个与量子复杂性理论相关的问题时,使用GPT-5辅助完成了一个关键步骤的证明。


“This is the first paper I’ve ever put out for which a key technical step in the proof of the main result came from AI—specifically, from GPT5-Thinking."

“这是我发表的首篇主要结论的证明有AI参与的论文,证明中的核心步骤由AI——即GPT5-Thinking——所给出。”


▲图片来源:https://scottaaronson.blog/?p=9183

当然,GPT-5也并非聪明到可以独自完成该项研究,事实上它在最初的几次回复中也出现了明显的错误。


▲图片来源:https://chatgpt.com/share/68db5e26-78bc-8011-b484-2422836e94f4

但在与其多次沟通后,GPT-5也成功给出了令Scott Aasonson满意的结果。


“...there’s not the slightest doubt that, if a student had given it to me, I would’ve called it clever."

“……毫无疑问,如果是一个学生交给我这个证明,那我肯定会称赞其巧妙。”

什么是QMA?

在介绍Scott尝试解决的具体问题前,我们有必要简单的科普一下什么是QMA(Quantum Merlin-Arthur)

也许有些读者听说过与黎曼猜想、庞加莱猜想同属于千禧年七大难题之一的“P =NP?”问题。其中,P和NP是理论计算机科学中按照问题难易程度对可计算问题划分出的两个类别。

简单来说,如果一个问题属于P类问题,那么我们可以“高效”地得到其答案,这里的“高效”是指我们可以将解决该问题所需要的计算时间写成以该问题规模为自变量的一个多项式。而如果一个问题属于NP类问题,那么我们可以“高效”地验证一个该问题的解的正确性。

因此我们也许会好奇对于一个问题,如果我们能高效地验证其解的正确性,那么是否存在一种方法能够使我们高效地得到它的一个解呢?,虽然目前大部分科学家们认为这种假设不成立,也即P不等于NP,但是目前尚未有人成功地证明或证伪该命题。

而QMA类问题在量子计算复杂性中的角色可以类比于NP类问题在经典计算复杂性中的角色。


▲图片来源:知乎答主“Climber.pl”(https://zhuanlan.zhihu.com/p/20562470)

我们可以想象这样的一个虚构法庭:在法庭上一位拥有量子计算能力的巫师(Merlin) 正在试图向一位国王(Arthur)证明一个命题的真实性,在双方的辩论中,Merlin会向Arthur提交证据(一个量子态)。如果一个问题属于QMA类问题,那么Arthur将能够高效的验证Merlin提交的证据的正确性,并且

·完备性:若Merlin提交了正确的证据,那么Arthur采纳它的概率不低于2/3

·可靠性:如果Merlin提交了错误的证据,那么Arthur采纳它的概率不超过1/3

Scott用GPT做了什么?

在Scott的研究中,他将GPT-5(具体为GPT-5-Thinking模型)运用到了证明使用黑盒放大对QMA进行增强的极限在哪里,即通过黑盒放大这种方法是否能使得当Merlin提交正确证据时Arthur采纳的概率等于1


在证明的过程中,有一个步骤涉及到分析一个实参数三角多项式构成的厄米矩阵的最大特征满足的某些性质。实际上,该步骤的证明对于顶级科学家而言,并不非常困难,Scott花上一两周进行尝试亦可独立完成。在其博客的评论区,也有人提出了更好的函数构造。但令Scott惊讶的点在于:一年前的GPT尚不能在类似的问题上取得令人满意的回答,然而现在它已经能涉足人类智力活动中最精妙的领域之一。

这并不令人惊讶,在AI产品种类越来越多的当下,使用AI辅助工作已经成为随处可见的日常。从搜集信息到推导公式、编程,AI早已悄悄从我们印象里前两年的那个会在初等算数上犯错的”小学生“,变成了只要加以适当的指导便能完成复杂任务的“大学生”。

虽然目前的AI尚不能独立完成整个研究工作,但是目前它完全可以充当一个听话的“小助手”,让它帮你完成一些小任务;而你则可以充当一个“导师”,为其分解任务并验证其结果的正确性。当然,前提是你得对该领域有基础的了解,否则遇到AI胡编乱造的结论你也难以辨别真伪。但是谁又知道距离下一次AI能力的突变还有多久呢?连Scott也开玩笑称还好自己早已拿到终生教职。


"I guess I should be grateful that I have tenure."

“我想,我应该庆幸我已经有终生教职了。”


▲图片来源:https://scottaaronson.blog/?p=9183

总的来说,人与AI的交互目前已经进入了某种程度上的”蜜月期“,只要掌握好方法,哪怕是在计算理论这种高难度的领域也能助你一臂之力。对于我们的读者,如果你仍然觉得AI距离实用仍有一段距离,那么不妨尝试在你的日常工作中使用AI来帮你完成一些小任务。也许体验过后,你也能理解为什么连著名的理论计算机科学家也会为之震惊。

*本文部分内容由AI生成与校验(笑)

来源:墨子沙龙

编辑:ThymolBlue

转载内容仅代表作者观点

不代表中科院物理所立场

如需转载请联系原公众号


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
绝不让高安国和蔡正元含冤,大陆终于出手了,请大家记住这张鬼脸

绝不让高安国和蔡正元含冤,大陆终于出手了,请大家记住这张鬼脸

影孖看世界
2026-01-10 18:50:04
老人离世切记:别先联系殡仪馆,第一步错了,子女白忙活还多花

老人离世切记:别先联系殡仪馆,第一步错了,子女白忙活还多花

好笑娱乐君每一天
2026-01-05 12:15:02
演都不演了,徐帆回应离婚5个月后,冯小刚的小心思藏不住了

演都不演了,徐帆回应离婚5个月后,冯小刚的小心思藏不住了

卷史
2026-01-10 06:07:44
阿斯:居莱尔失去核心地位,皇马已将卡马文加的出场顺位提前

阿斯:居莱尔失去核心地位,皇马已将卡马文加的出场顺位提前

懂球帝
2026-01-11 10:31:59
78岁何庆魁新伴姓张,享高秀敏当年未享受的待遇

78岁何庆魁新伴姓张,享高秀敏当年未享受的待遇

枫尘余往逝
2026-01-10 11:05:18
随着卡塔尔0-1,伊朗0-0,亚洲杯最新积分榜出炉:中国男足倒数第二

随着卡塔尔0-1,伊朗0-0,亚洲杯最新积分榜出炉:中国男足倒数第二

侧身凌空斩
2026-01-11 02:40:58
2025,蔚小理的“生死时速”

2025,蔚小理的“生死时速”

伯虎财经
2026-01-10 10:15:08
浙江一房东每年过年送租客两瓶红酒、一幅画当礼物:好关系并不会让租金谈判困难

浙江一房东每年过年送租客两瓶红酒、一幅画当礼物:好关系并不会让租金谈判困难

台州交通广播
2026-01-11 07:43:36
瓦良格号送到中国后有多震撼?专家刮掉表面的锈迹:钢材品质极佳

瓦良格号送到中国后有多震撼?专家刮掉表面的锈迹:钢材品质极佳

古书记史
2026-01-06 16:31:56
美媒通告全球:歼-20飞越台岛上空,台军根本抓不到,统一成定局

美媒通告全球:歼-20飞越台岛上空,台军根本抓不到,统一成定局

来科点谱
2026-01-11 08:57:18
12月汽车销量榜出炉!Model Y比第二名多卖近3万辆?

12月汽车销量榜出炉!Model Y比第二名多卖近3万辆?

热点科技
2026-01-10 13:44:23
伊朗网络连接现多区域中断  IPv6网络全球切断

伊朗网络连接现多区域中断 IPv6网络全球切断

老马拉车莫少装
2026-01-09 01:37:03
官方通报“亚运冠军遭索要奖金”调查结果

官方通报“亚运冠军遭索要奖金”调查结果

南方都市报
2026-01-11 10:14:28
1.6万亿消费大迁徙!商场空到只剩导购,中产的钱都流向了这里

1.6万亿消费大迁徙!商场空到只剩导购,中产的钱都流向了这里

墨印斋
2026-01-10 21:32:39
大利好!周末,彻底沸腾了!

大利好!周末,彻底沸腾了!

中国基金报
2026-01-11 00:11:13
这反转惊掉下巴!当初要整蔡正元的检察官陈舒怡,觉都睡不踏实了

这反转惊掉下巴!当初要整蔡正元的检察官陈舒怡,觉都睡不踏实了

扶苏聊历史
2026-01-10 12:05:03
刮一个穴位,把肝胆里面的瘀滞排干净,还能治难言之隐!!

刮一个穴位,把肝胆里面的瘀滞排干净,还能治难言之隐!!

神奇故事
2025-12-13 23:55:36
在华刚拜完抗日英雄,李在明火速宣布访日,中国3亿大单白签了?

在华刚拜完抗日英雄,李在明火速宣布访日,中国3亿大单白签了?

博览历史
2026-01-10 12:06:09
拜登预言成真,让特朗普干完这4年,美国大概率成为“世界老二”

拜登预言成真,让特朗普干完这4年,美国大概率成为“世界老二”

兴史兴谈
2026-01-11 11:14:53
有人问及如何评价周总理,黄永胜回忆:外交上是一把好手,搞内政堪称八级泥瓦

有人问及如何评价周总理,黄永胜回忆:外交上是一把好手,搞内政堪称八级泥瓦

源溯历史
2025-12-22 12:14:13
2026-01-11 12:15:00
中科院物理所 incentive-icons
中科院物理所
爱上物理,改变世界。
9763文章数 136427关注度
往期回顾 全部

科技要闻

“我们与美国的差距也许还在拉大”

头条要闻

马杜罗之子:马杜罗在美监狱说"我们很好我们是斗士"

头条要闻

马杜罗之子:马杜罗在美监狱说"我们很好我们是斗士"

体育要闻

詹皇晒照不满打手没哨 裁判报告最后两分钟无误判

娱乐要闻

网友偶遇贾玲张小斐崇礼滑雪

财经要闻

外卖平台"烧钱抢存量市场"迎来终局?

汽车要闻

2026款宋Pro DM-i长续航补贴后9.98万起

态度原创

艺术
数码
时尚
亲子
教育

艺术要闻

福布斯最佳CEO榜单!马化腾第一!东哥呢?

数码要闻

美菱冻鲜生·宋雅冰箱首发亮相 打造新鲜与国风融合新范式

动物纹回潮,那很狂野了

亲子要闻

深度长文:原始社会婴儿哭声会引来大量天敌,婴儿如何生存下看?

教育要闻

“这就是补课的下场”,家长晒学霸女儿高一成绩,哀叹着

无障碍浏览 进入关怀版