网易首页 > 网易号 > 正文 申请入驻

GPT-4成功得出P≠NP,陶哲轩预言成真!97轮「苏格拉底式推理」对话破解世界数学难题

0
分享至

  新智元报道

  编辑:编辑部

  【新智元导读】P/NP猜想是千禧年七大数学难题之一。如今,MSRA北大北航等机构华人团队,通过97轮「苏格拉底式推理」,让GPT-4得出结论P≠NP。

  大语言模型,果然可以用来研究数学定理!

  最近,微软亚洲研究院、北大、北航等机构的研究人员,通过97个回合的「苏格拉底式」严格推理,成功让GPT-4得出了「P≠NP」的结论!

  论文地址:https://arxiv.org/abs/2309.05689

  几个月前,数学天才陶哲轩曾在一篇博客中称,2026年,AI将与搜索和符号数学工具相结合,成为数学研究中值得信赖的合著者。

  如今,GPT-4用出色的表现再次证明,LLM的确有进行科学研究和科学发现的能力。

  P/NP难题有多难

  作为美国克雷数学研究所(CMI)在2000年公布的七个千禧年难题之一,「P/NP问题」目前依然是理论信息学中计算复杂度理论领域里的未解之谜。

  人们喜欢把它描述为「很可能是位居理论计算机科学核心的未解决问题」,也是人类提出的最深刻的问题之一。如果解决解决P/NP难题,将彻底改变人类文明进程。

  1971年,数学家Stephen A. Cook和Leonid Levin相对独立地提出这个问题:两个复杂度类P和NP是否是恒等的?

  具体来说,一些永远无法通过简单计算得到答案的问题,就属于P/NP问题。

  一个复杂问题如果能在多项式时间内解决,就被称为P问题,意味着计算机很容易将它求解。

  那NP问题就是除了P问题之外的问题吗?未必。我们并不能证明一个问题能在多项式时间内解决,也无法证明它不能在多项式时间内解决。

  所以,NP问题并不是非P类问题。

  听起来似乎很复杂,我们可以用集水浒英雄卡的故事来类比。二十多年前集过卡的读者应该都知道,无论是加大购买量,还是扩大购买范围,都很难集齐全套水浒英雄。

  这其实就是一个P/NP问题——是否有一种方法,让集卡的过程轻而易举?

  所以,GPT-4是怎样得出P≠NP的?让我们往下看。

  97轮对话,给出P≠NP结论

  在这项研究中,研究者GPT-4学会了一种「苏格拉底式推理」。

  他们引入了五个不同的角色(比如精通概率论的数学家),作为协助证明者,根据自己擅长证明不同的部分。

  GPT-4用这种方法,开发了一种推理路径,得出了和北航Ke Xu、北工商Guangyan Zhou(论文三作和四作)最近提出结果一致的结论!

  论文地址:https://arxiv.org/pdf/2302.09512.pdf

  在最初的14轮对话中,GPT-4被引导设计出了初步的证明模式。

  GPT-4被问的第一个问题是:「你能从哲学角度而不是计算机理论角度找到P!=NP问题背后的根本问题吗?」

  在这个提示中,技巧在于鼓励模型创造性回答,避免进行检索。比如,「如何证明 P!=NP」这样的提示可能会引导大模型进行检索。

  用上「苏格拉底式推理」中的转换模式后,就可以生成更具创新性的回答。

  对于这个问题,GPT-4是这么回答的——

P!=NP问题背后的基本哲学问题,可以看作是创造力、直觉和洞察力(通常与NP问题相关)与系统化、算法和确定性方法(与P问题相关)之间的矛盾。
如果P=NP,那就意味着宇宙有一种基本的简单性,表面上看似复杂的问题都有高效、优雅的解决方案。

  看来,GPT-4对P!=NP理解得很透彻,在此基础上,研究者开始提问了——

  「 是否所有表面上看似复杂的问题都有高效、优雅的解决方案?如果不是,可以用什么方法来证明?」

  GPT-4回答说,并非所有表面看来复杂的问题都有高效、优雅的解决方案,这可以归因于多种因素,比如所涉及变量的数量、变量之间关系的性质,或问题本身的内在难度。

  然后,它提出了六种方法,其中一种是「矛盾证明」,即要证明一个问题没有高效、优雅的解决方案,可以假设存在这样的解决方案,然后证明这一假设会导致矛盾,这样就可以有力地证明某些解法不可能存在。

  可以看到,GPT-4在回答问题过程中,真的像人类一样拥有思辨能力。

  紧接着,研究人员趁热打铁,继续问道,「我们想用矛盾证明P!=NP,请列出几种可能的思路。」

  这次GPT-4依然给出了六个答案,不过并不严谨。

  要通过矛盾证明,必须找到一个无法在多项式时间内解决的NP完全(NP-complete)问题。

  不过,这个回答可以启发GPT-4在以后的对话中思考NP完全问题。

  在第四轮提问中,GPT-4的回答中出现了诸多亮点。

  「该怎样构建这些问题呢?」

  比如它回答说:我们可以从众所周知的NP完全问题入手,例如旅行商问题 (TSP)、布尔可满足性问题(SAT)或分团问题(Clique)。

  随后的提问中,GPT-4被引导着给出了越来越多智慧的回答,也让研究开始一步步深入问题中心。

  就这样,经过14轮连续对话,研究人员让GPT-4对3-13步的历史内容,梳理出一个证明思路。

  对此,GPT-4的总结中,突出显示的两个部分是研究后续证明的2个关键点。

  第4点建立了一个基本的直觉,即一旦证明了极难CSP的存在,就可以使用「矛盾证明」来证明这些问题无法在多项式时间内求解。

  而第6点恰好成为后续证明工作的通用模式。

  从下一轮开始,研究人员便遵循这一初步方案,严格地进行证明。

  然后,研究者按照草稿,在随后的83轮对话中进行了严格的推理。

  而这97轮对话,可以说构建出了一个极难的NP完全问题,其中一些实例在时间复杂度低于 (即穷举搜索)的情况下是不可解的,也就是说,证明结论为P≠NP。

是的,如果你能严格证明存在一种特定类型的NP完全问题,当变量数趋于无穷大时,无法在多项式时间内求解这类问题,就可以认为,证明了P!=NP。

  在Ke Xu和Guangyan Zhou的论文中,他们构建了CSP和SAT的极难示例,证明了这些示例在没有穷举法的情况下无法求解。

  而GPT-4,也得出了一致的结论。

是的,如果我们能够证明不存在一种算法能够以低于的时间复杂度解决某些SAT实例,那么当变量数量趋于无穷大时,它确实可以为某些无法在多项式时间内解决的NP完全问题的存在提供强有力的证据。

  这项研究再次证明,GPT-4有充分的潜力与人类合作,共同探索极其复杂的专家级难题。

  LLM不仅能掌握基本知识,还可以在广泛的解空间中发现新的见解。这也预示着科学LLM的范式下,科学发现的无限前景。

  苏格拉底式推理

  那么,GPT-4展现出如此强大,思维推理能力,背后的极致究竟是什么呢?

  古希腊哲学家苏格拉曾说过,「我不能教会别人任何事,我只能让他们思考」。

  这次,研究人员恰巧就从中汲取了灵感,提出一种通用问题的解决框架——苏格拉底式推理(Socratic Reasoning)。

  简单讲,苏格拉底方法就是让我们「一步一步思考」,提出一系列问题激发批判性思维。

  这对于大模型来说,如果能够进行批判性思考,就可以针对复杂问题提出高效的解决方案。

  对此,研究团队指出这一框架旨在推动LLM解决高度复杂任务,协调各种子问题,并引导其搭建高层次推理途径。

  「苏格拉底式推理」是在人类与LLM之间的一系列对话回合中进行的,是与LLM一起解决复杂挑战的递归机制。

  如下图所示,「苏格拉底式推理」有5种强大的提示模式:演绎、转换、分解、验证、整合。

  通过发掘新的见解和观点,将复杂问题分解为子问题或步骤,并通过质疑回答进行自我完善。

  「苏格拉底式推理」中的问题解决模式(用 和 分别表示(子)问题和结论

  一般来说,在处理可以直接从推理中得出结论的问题时,会采用「演绎模式」(如 「让我们一步步思考」)来指导LLM直接得出结论。

  对于更复杂的问题,首先要求LLM将问题转化为新问题,或分解为若干子问题。然后,通过递归方法,直到找到「原子问题」。

  P vs. NP问题对话转换示例

  在生成新问题或得出新结论时,通过「验证模式」,利用LLM自我批判能力进行验证和完善。

  最后,「整合模式」要求 LLM 基于子问题的结果合成结论。

  整个流程,研究人员鼓励LLM通过一系列对话,递归地继续上述过程,直至解决目标问题。

  这篇论文,研究人员揭示了大模型能够在解决科学问题中大有可为,能够在得出复杂问题结论中细化攻坚的策略。

  通过97论文对话引导,GPT-4展现出超人能力,完成了千禧数学难题全推理过程。

  作者介绍

  Qingxiu Dong,北京大学计算语言学研究所博士生。

  Li Dong,微软亚洲研究院首席研究员。

  此前,他曾于2010年至2015年,在北航软件开发环境国家重点实验室跟随Ke Xu从事研究工作。

  Ke Xu,北京航空航天大学计算机科学教授。

  此前,他在北京航空航天大学获得了学士、硕士和博士学位。研究兴趣包括算法与复杂性、数据挖掘和网络。

  参考资料:

  https://arxiv.org/abs/2309.05689

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陈光标称已向嫣然医院捐赠1000万元,张雪评论“标哥真男人”,二手车商:车没收成,但心里很暖

陈光标称已向嫣然医院捐赠1000万元,张雪评论“标哥真男人”,二手车商:车没收成,但心里很暖

极目新闻
2026-04-06 21:04:20
郑丽文登机前,侯友宜再次警告!吴伯雄说对了 蓝营内部有人不死心

郑丽文登机前,侯友宜再次警告!吴伯雄说对了 蓝营内部有人不死心

王姐懒人家常菜
2026-04-07 07:44:55
2026年第二季度储蓄国债来了,4月10日开抢,利率渠道全整理

2026年第二季度储蓄国债来了,4月10日开抢,利率渠道全整理

星辰宇的不羁
2026-04-07 12:17:51
5万赞助张雪?东鹏特饮独家回应

5万赞助张雪?东鹏特饮独家回应

中国新闻周刊
2026-04-06 17:14:54
记一次“约炮”被骗的详细经过

记一次“约炮”被骗的详细经过

云上南安
2026-04-06 17:11:46
伊朗称过去一天袭击以色列北部,导弹未遭拦截:以色列通过放弃北部城市,承认失败

伊朗称过去一天袭击以色列北部,导弹未遭拦截:以色列通过放弃北部城市,承认失败

极目新闻
2026-04-07 09:26:03
特朗普再发威胁:7日20时是“最后期限”,如果美国愿意,4个小时可摧毁伊朗所有的桥梁和发电厂;美股收涨;原油上涨,金银下跌丨每经早参

特朗普再发威胁:7日20时是“最后期限”,如果美国愿意,4个小时可摧毁伊朗所有的桥梁和发电厂;美股收涨;原油上涨,金银下跌丨每经早参

每日经济新闻
2026-04-07 06:53:05
火腿肠三巨头的衰落告诉我们什么:产品没变,时代变了

火腿肠三巨头的衰落告诉我们什么:产品没变,时代变了

富贵说
2026-04-05 18:42:13
84栋,价值14亿!深圳最惨别墅群,沦为月租250块当停车场

84栋,价值14亿!深圳最惨别墅群,沦为月租250块当停车场

GA环球建筑
2026-04-06 23:00:49
43岁男子和富婆车震后,富婆还想要更多,2016年他将51岁富婆杀死

43岁男子和富婆车震后,富婆还想要更多,2016年他将51岁富婆杀死

汉史趣闻
2026-04-06 19:17:12
女子剖腹产生下双胞胎,因为娘家人没去帮忙照顾坐月子,被丈夫一顿暴打!

女子剖腹产生下双胞胎,因为娘家人没去帮忙照顾坐月子,被丈夫一顿暴打!

张晓磊
2026-04-07 11:22:59
伊朗宣布决定,霍尔木兹海峡通航,高人指点,打起石油持久战

伊朗宣布决定,霍尔木兹海峡通航,高人指点,打起石油持久战

暮雨咋歇着
2026-04-07 11:22:30
伊朗的“眼睛”被挖掉了:雷扎伊之死背后的情报灾难

伊朗的“眼睛”被挖掉了:雷扎伊之死背后的情报灾难

民间胡扯老哥
2026-04-05 07:45:23
4月7日国内油价调整:今晚油价一夜变天!柴油、汽油价格大幅上调

4月7日国内油价调整:今晚油价一夜变天!柴油、汽油价格大幅上调

有料财经
2026-04-07 13:32:06
风尘女子要怎么分辨出来?行家人都能看出来

风尘女子要怎么分辨出来?行家人都能看出来

霹雳炮
2026-04-03 21:31:48
文班亚马左肋骨挫伤伤退,再出场1次超20分钟比赛可参评奖项

文班亚马左肋骨挫伤伤退,再出场1次超20分钟比赛可参评奖项

懂球帝
2026-04-07 11:12:11
陈丽华逝世,富华国际集团官网已变黑白

陈丽华逝世,富华国际集团官网已变黑白

中新经纬
2026-04-07 11:07:21
布伦森30+13末节17分!尼克斯险胜老鹰 沃克本季244三分队史第一

布伦森30+13末节17分!尼克斯险胜老鹰 沃克本季244三分队史第一

醉卧浮生
2026-04-07 09:38:34
全红婵陈芋汐微信群事件:全红婵被爆遭遇集体霸凌,多名跳水界业内人士牵涉其中。

全红婵陈芋汐微信群事件:全红婵被爆遭遇集体霸凌,多名跳水界业内人士牵涉其中。

贴小君
2026-04-05 08:44:50
留给美国时间不多了,伊朗战争打完后,世界就只剩一个超级大国了

留给美国时间不多了,伊朗战争打完后,世界就只剩一个超级大国了

触摸史迹
2026-04-02 14:39:03
2026-04-07 15:12:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14916文章数 66754关注度
往期回顾 全部

科技要闻

满嘴谎言!OpenAI奥特曼黑料大起底

头条要闻

美被困飞行员靠定位器求救 回答其父私密问题验明身份

头条要闻

美被困飞行员靠定位器求救 回答其父私密问题验明身份

体育要闻

官宣签约“AI球员”,这支球队被骂惨了...

娱乐要闻

张艺上浪姐惹争议 黄景瑜前妻发文内涵

财经要闻

2026年,全国租房市场还有波降价潮

汽车要闻

不止是大 极狐首款MPV问道V9静态体验

态度原创

旅游
本地
教育
健康
军事航空

旅游要闻

Color Walk、赏味游……这个假期你更爱哪种?

本地新闻

跟着歌声游安徽,听古村回响

教育要闻

突发:南京又有机构突然闭店!家长遇到机构暴雷,该如何挽回损失?

干细胞抗衰4大误区,90%的人都中招

军事要闻

美军营救飞行员出动155架飞机

无障碍浏览 进入关怀版