网易首页 > 网易号 > 正文 申请入驻

GPT-5攻克「量子NP难题」,首篇论文引爆学界!人类2周压缩至30分钟

0
分享至


新智元报道

编辑:桃子

【新智元导读】GPT-5正改写科学发现的规则!一篇重磅论文揭秘,「量子版NP难题」竟被GPT-5在30分钟之内攻克了,然而这要耗费人类1-2周的时间。照这种速度发展下去,AI离完成「诺奖级」突破真的不远了。

意想不到的是,这一次,GPT-5又「攻陷」了量子领域的难题。


量子计算专家Scott Aaronson首次发表论文,证明其中一个老难题竟被GPT-5助攻破解了。

论文中,Scott一直在死磕量子计算中的一个核心问题——QMA复杂度类别,堪称「量子版的NP问题」。

其中,关键在于证明过程中的误差概率,能否被无限降低,特别是,能否实现完美完备性。


论文地址:https://arxiv.org/pdf/2509.21131

之前学界研究中已经把误差压到很低,但最新研究却发现:「双指数级误差」是现有方法的理论极限,无法进一步突破。

在关键推导环节受阻后,作者开始向GPT-5寻求帮助。一开始,AI给出了错误的思路。

但在大约30分钟交互后,它最终提出一个精妙的数学函数,精确分析出特征值行为。

研究证明,这一构想成为了论文中最关键的突破。

在最新博文中,Scott惊叹地表示,「这思路要是哪个学生想出来的,我绝对会夸一句——真是绝了」!


这个难题预估需要1-2周人力才能完成

OpenAI科学家Sebastien、产品负责人Kevin再次激动转发,并称「一场重大变革开始了」。




量子版NP难题:QMA奇点

这篇于25日提交至arXiv的论文,主要研究了量子复杂性类「QMA中黑盒放大的局限性」。


那么,QMA是什么?

QMA,即量子梅林-亚瑟(Quantum Merlin Arthur),可以看作是NP的典型量子版本。

它包含了一类决策问题:

如果答案是「是」,Merlin可以发送给Arthur一个量子见证态,能让Arthur(在经过多项式时间的量子计算后)以至少2/3的概率接受;

而如果答案是「否」,无论Merlin发送什么见证态,Arthur接受的概率都至多为1/3。


在这里,如同复杂性理论中常见的那样,常数2/3和1/3只是惯例,可以通过放大替换为,比如1-2⁻ⁿ和2⁻ⁿ。

在这个领域,一个长期悬而未决的问题是——

QMA是否等于QMA₁,其中QMA₁是QMA的一个子类,允许协议具有「完美完备性」?

2008年,Scott Aaronson通过实用分析方法,证明了存在一个「量子预言机」,使得QMA≠QMA₁。

这意味着,任何证明QMA=QMA₁的尝试,都需要「量子非相对化技术」。

这倒并不是说这个障碍难以逾越,但至少说明了问题的复杂性。


突破:双指数放大局限

直到今年6月,Freek Witteveen和Stacey Jeffery发表了一篇重磅论文,证明了QMA协议可通过黑盒方式放大,让完备性误差达到了「双指数级小」,即 1/exp(exp(n))。


论文地址:https://arxiv.org/pdf/2506.15551

他们采用了一种Scott从未想过的方法:将接受概率编码到一个量子态的振幅中,而这些振幅以几何级数递减。

事实证明,QMA这位相识25年的「老朋友」,依然能带来惊喜。

在8月的线上会议,Scott问道:

这个双指数的完备性,是黑盒技术的极限吗?能否进一步放大到三指数级小,即1/exp(exp(exp(n)))。

30分钟攻克,GPT-5上大分

一周后,Scott联手Freek写出了完整证明,表明在黑盒技术下,双指数级小的完备性误差已是极限。

换句话说,他们将2008年的「QMA≠QMA₁」预言机分离结果量化,得到的「下界」(lower bound)恰好与6月论文的协议相匹配。


这项研究最引人注目的部分,或许并不是量子复杂性本身,而是AI在其中的角色。

如前所述,这是Scott Aaronson第一篇论文,其主要成果证明中的一个关键技术步骤来自AI。

具体来说,是GPT5-Thinking。


当时,作者面临的一个问题是:分析一个N×N的厄米矩阵E(θ)(比如,N=2ⁿ),其每个元素都是一个关于实参数θ的poly(n)次三角多项式。

需要证明的是,当θ从0变化到1时E(θ)的最大特征值,以证明λₘₐₓ(E(θ))不可能从一个接近0的值开始,然后长时间「停留」在接近1的状态,例如接近 1/exp(exp(exp(n)))。


针对这一问题,如有1-2周的时间,Scott和合著者查阅文献也可以解决。

但他选择了GPT5-Thinking,5分钟后,它给出了一个自信但明显错误的答案。

Scott并没有嘲笑AI,而是告诉它错在哪里。GPT5-Thinking在思考片刻后,再次尝试给出了一个更好的方案。

就这样,经过了几次反复迭代,如同研究生/同事交流一样,GPT-5给出了以下函数:


它正确指出,这是一个关于θ的次数可控的有理函数,并且恰好编码了最大特征值 λₘₐₓ(E(θ))与1的接近程度的相关信息。

令人欣喜的是,这个方法奏效了,不用AI协助就能轻松完成验证。

Scott认为,或许GPT5在训练数据中,某个地方见过类似结构,但若是学生提出的方案,他会毫不犹豫地称其为「巧妙」。

最后,他回忆道,一年前,自己曾用当时的GPT推理模型尝试类似问题,结果远不如人意。

现在,是2025年9月,我可以明确告诉你——

AI已经开始真正触及那些我认为最具人类智慧特征的核心工作:证明量子复杂性类之间的预言机分离。

虽然它现在还做不到独立撰写整篇研究论文,但如果你清楚自己在做什么,它能帮你摆脱困境,这可以说是一个绝佳的应用场景。

谁知道,这种情况会持续多久?

Scott Aaronson调侃道,「想到这儿,不禁庆幸自己还有个铁饭碗——终身教职」。


参考资料:

https://scottaaronson.blog/?p=9183

https://x.com/SebastienBubeck/status/1972368891239375078

https://x.com/kimmonismus/status/1972399015825203463

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美国114页报告得出结论:若跟中国开战,战争将在1个月内结束

美国114页报告得出结论:若跟中国开战,战争将在1个月内结束

古史青云啊
2026-03-26 15:24:31
3.26今日金价:大家不必等待了!接下来,金价有可能会重演历史!

3.26今日金价:大家不必等待了!接下来,金价有可能会重演历史!

牛锅巴小钒
2026-03-26 02:29:18
当孩子问,“同学爸爸说考第一名就给他买ipad,我考第一名,你也给我买吗?”这样回答很关键…

当孩子问,“同学爸爸说考第一名就给他买ipad,我考第一名,你也给我买吗?”这样回答很关键…

二胎妈妈圈
2026-02-08 21:50:30
TOP14位身高170以上的女神,有颜有灯有演技

TOP14位身高170以上的女神,有颜有灯有演技

素然追光
2026-01-02 02:45:02
中国3大长寿食物,茼蒿排第三;第一名天天见,却很少人爱吃

中国3大长寿食物,茼蒿排第三;第一名天天见,却很少人爱吃

健身狂人
2026-03-26 13:47:51
你家吃灰的旧手机突然成了香饽饽,但着急卖可能吃大亏

你家吃灰的旧手机突然成了香饽饽,但着急卖可能吃大亏

金融界
2026-03-25 22:05:13
不吹不黑!iOS 26.4正式版体验,老iPhone直接封神

不吹不黑!iOS 26.4正式版体验,老iPhone直接封神

叮当当科技
2026-03-26 01:51:54
马云预言成真?2026年开始,房地产市场或会迎来4大转变?

马云预言成真?2026年开始,房地产市场或会迎来4大转变?

二大爷观世界
2026-03-26 13:49:44
桑托斯31分生涯之夜!勇士逆转送篮网9连败 波杰22分波神17分

桑托斯31分生涯之夜!勇士逆转送篮网9连败 波杰22分波神17分

醉卧浮生
2026-03-26 12:45:06
大崩盘!骑士最多落后高达21分:全队三分15中3,哈登心不在焉

大崩盘!骑士最多落后高达21分:全队三分15中3,哈登心不在焉

体坛小李
2026-03-26 08:53:49
实锤了!歼10C飞行员明确披露,我军预警机可直接制导空空弹

实锤了!歼10C飞行员明确披露,我军预警机可直接制导空空弹

策略述
2026-03-25 14:07:39
柯文哲被判17年,褫夺公权6年

柯文哲被判17年,褫夺公权6年

新京报政事儿
2026-03-26 15:09:02
真不能怪祖院长,就曾医生这颜值、这才华和魅力,谁遭的住?

真不能怪祖院长,就曾医生这颜值、这才华和魅力,谁遭的住?

吃瓜局
2025-11-11 16:23:49
49年他婉拒了新中国外长职务:若不拒绝,恐怕开国元帅名单要改写

49年他婉拒了新中国外长职务:若不拒绝,恐怕开国元帅名单要改写

浩渺青史
2026-03-25 13:59:19
以色列要让全世界禁声?斩首俄罗斯记者,普京下令,撞枪口上了

以色列要让全世界禁声?斩首俄罗斯记者,普京下令,撞枪口上了

林子说事
2026-03-24 00:50:49
事情闹大了,日本内阁连发公告,中国的态度,告诉了世界一个事实

事情闹大了,日本内阁连发公告,中国的态度,告诉了世界一个事实

阿天爱旅行
2026-03-26 13:48:08
为什么氰化物入口几秒,还没到胃呢,人立马就会死了?

为什么氰化物入口几秒,还没到胃呢,人立马就会死了?

心中的麦田
2026-03-24 19:53:20
勇士双杀篮网锁定附加赛,桑托斯生涯之夜,库明加换波神真赚了?

勇士双杀篮网锁定附加赛,桑托斯生涯之夜,库明加换波神真赚了?

司峰阿道
2026-03-26 14:45:09
美方提“15点计划”,伊朗称“又一个谎言”,美国“一边准备谈判一边握拳”

美方提“15点计划”,伊朗称“又一个谎言”,美国“一边准备谈判一边握拳”

环球网资讯
2026-03-26 06:58:33
余承东宣布华为手机全面回归!大方公布CPU型号 支持5A网络 麒麟处理器全国产突破美国制裁

余承东宣布华为手机全面回归!大方公布CPU型号 支持5A网络 麒麟处理器全国产突破美国制裁

快科技
2026-03-24 15:22:21
2026-03-26 16:40:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14819文章数 66720关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

国防部:日本侵略过所有周边国家 至今都没有真正反省

头条要闻

国防部:日本侵略过所有周边国家 至今都没有真正反省

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

长护险谁能享受?享受多少?解答来了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

家居
本地
旅游
游戏
健康

家居要闻

傍海而居 静观蝴蝶海

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

旅游要闻

德阳绵竹:赏花、览文旅精品......沿山旅游“火”起来

商业互吹or真心话?制作人玩《红色沙漠》忘记工作

转头就晕的耳石症,能开车上班吗?

无障碍浏览 进入关怀版