网易首页 > 网易号 > 正文 申请入驻

高德纳:「震惊!震惊!」Claude破解《计算机程序设计艺术》难题

0
分享至

来源:市场资讯

(来源:机器之心)

编辑|Panda

「震惊!震惊!」

是什么让著名计算机科学家和数学家、《计算机程序设计艺术》作者、图灵奖得主高德纳(Donald Knuth)发出了如此惊呼?


图片由 AI 生成

你没有猜错,正是 AI。

在他近期在斯坦福大学官网上公布的一篇论文《Claude’s Cycles》中,开篇的「Shock! Shock!」非常直白地表达了他对于 AI 强大能力的震惊。


论文地址:https://cs.stanford.edu/~knuth/papers/claude-cycles.pdf

紧接着他便写到:「我昨天得知,我已经研究了几周的一个开放性问题刚刚被 Claude Opus 4.6——Anthropic 公司三周前发布的混合推理模型 —— 解决了!看来我得在某个时候重新审视我对『生成式 AI』的看法了。不仅我的猜想有了一个不错的解决方案,而且这标志着自动推理和创造性问题解决领域的巨大进步,这真是一件令人高兴的事。我会在这篇短文中简要讲述这个过程。」

此事引发了广泛关注,网友们纷纷点评,感叹新时代的到来。



这是 Hacker News 用户 Ian Danforth 给出的太长不读版本:高德纳提出一个问题,他的朋友借助 Claude 进行了 30 多次探索,在人类的仔细指导下,Claude 最终编写了一个 Python 程序,能够为所有奇数找到解。高德纳随后为该方法撰写了证明,并对 Claude 的贡献感到非常满意。偶数情况仍是未解之谜(Claude 在这方面未能取得太大进展)。


困扰算法泰斗的图论难题

高德纳在为《计算机程序设计艺术》未来卷撰写关于有向哈密顿环的内容时,遇到了一个棘手的开放性问题。

具体而言,需要考虑一个具有 m³ 个顶点的有向图,顶点坐标记为 ijk,其中 0≦ i, j, k2 的情况。

高德纳此前已经解决了 m=3 的基础情况,并将其作为书中的一道练习题。他的朋友 Filip Stappers 随后通过实验发现了 4≦ m≦16 的解,这使得所需分解法存在的可能性极高。为了寻找通解,Stappers 将这个问题原封不动地交给了 Claude 处理。

31 步探索:AI 的解题逻辑

在交互过程中,Stappers 对 Claude 设定了严格的规则指令:

  • 在运行完任何探测代码后,必须立即更新 plan.md 文件。

  • 在记录完成之前,绝对不允许开始下一步的探索。

Claude 采取了多种数学工具进行尝试。它最初尝试了简单的线性与二次函数,但均未奏效。接着,它尝试使用暴力深度优先搜索,最终因为搜索空间过大而放弃。随后,它引入了「2D 蛇形分析」,并准确识别出该有向图是一个带有两个生成元的凯莱图(Cayley digraph)。

问题的突破发生在后半程的探索中:

  • 在第 15 次探索时,Claude 引入了「纤维分解」框架,将问题转化为在坐标上选择算子的排列组合。

  • 在第 25 次探索后,它自主得出结论,认为模拟退火算法虽然能找到解,却无法给出通用构造,此时需要纯粹的数学推导。

  • 最终在第 31 次探索时,Claude 注意到每个纤维的选择仅依赖于单个坐标,并据此给出了一个具体的 Python 构造程序,成功得出了 m=3, 5, 7, 9, 11 的完美分解方案。


简化版的 Python 程序,用 C 语言形式写的

严谨的数学证明与偶数域的挑战

得出构造代码仅仅是第一步。Stappers 验证了 3 到 101 之间所有奇数 m 的情况,均获得了完美的分解方案。随后,高德纳接手进行了严谨的数学证明。他详细推导了生成的第一个环包含所有具备相同特征的 m² 个顶点,从而证实其长度确为 m³,是一个真正的哈密顿环。

高德纳进一步研究发现,在所有类似 Claude 生成逻辑的分解法中,恰好有 760 种对所有奇数 m>1 均有效的解。Claude 凭借自身推导准确找到了其中的一种。

目前,偶数 m 的情况依然悬而未决。

  • Claude 在探索中曾找到 m=4, 6, 8 的解,但未能发现其中的通用规律。

  • 当被要求继续攻克偶数情况时,Claude 陷入了困境,后续甚至无法正确编写探索程序。

  • 另一位研究者 Ho Boon Suan 借助 gpt-5.3-codex 生成了处理大于 8 的偶数 m 的代码,并在高达 m=2000 的规模下测试成功。

  • 但由于其模式过于复杂,目前人工证明其正确性的难度极大。

在 Hacker News 和 Reddit 等技术社区中,开发者们普遍认为这次事件的核心意义在于,AI 在数学辅助证明中展现出了自主更换探索工具、排查无效路径的能力。

正如高德纳在文末所感叹的那样,克劳德・香农(Claude Shannon)在天之灵若能知晓他的名字与此类进步联系在一起,定会感到骄傲。

Hats off to Claude!

AI 进军数学殿堂:从竞赛夺金到前沿探索

高德纳的惊叹并非孤例。事实上,在过去的一年多时间里, AI 在解决复杂数学和逻辑问题上已经取得了多个具有实质性意义的突破。

  • 国际奥数突破:2025 年 7 月,Google DeepMind 发布的 Gemini(Deep Think 模式)在 IMO 试题评测中达到金牌标准成绩,取得 35 分,并能在接近正式考试条件下输出完整自然语言证明。与此同时,OpenAI 也披露其内部模型达到了类似水平,但官方认证与评测细节相对有限。

  • 编程竞赛能力跃升:2025 年 9 月,OpenAI 和 Gemini 都声称达到了 ICPC 金牌水平,能够在严格时间限制内解决高难度算法问题。不过,这些成绩主要来自平行测试或基准评估,并非以正式参赛身份在 International Collegiate Programming Contest 中获得官方金牌。

  • 从解题到科研协作:如今,AI 在科研中的角色显著增强。模型开始借助外部工具参与数学研究与问题验证,在复杂猜想与定理探索中发挥辅助作用。例如, GPT-5.2 借助外部工具,协助数学家解决了数个悬而未决的 Erdős 猜想,并得到了著名数学家陶哲轩的验证。部分系统已展示出生成研究草稿与进行结构化推理的能力。

驱动这些突破的核心机制也发生了改变。 AI 开始减少对单次快速生成的依赖。现在的模型普遍采用「测试时计算扩展」或「慢思考」策略。通过在推理阶段投入更多算力,模型能够并行探索多条解题路径并进行严格的自我验证。

展望未来, AI 与数学的结合将突破封闭环境下的标准化考题。随着自然语言理解力与形式化逻辑的深度融合,AI 将成为数学家与工程师身边得力的合作者,帮助人类共同攻克那些停滞多年的科学难题。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美军超5万名士兵、200架战斗机和两艘航母参战;伊朗:打赢“存亡之战”!

美军超5万名士兵、200架战斗机和两艘航母参战;伊朗:打赢“存亡之战”!

上观新闻
2026-03-04 15:41:05
回顾:辽宁一小三被原配刺死,判刑时原配说出一句话,让丈夫崩溃

回顾:辽宁一小三被原配刺死,判刑时原配说出一句话,让丈夫崩溃

谈史论天地
2026-03-05 20:20:03
18岁伊斯兰少女直播拒戴头巾,被冷血父亲荣誉处决。

18岁伊斯兰少女直播拒戴头巾,被冷血父亲荣誉处决。

环球趣闻分享
2026-01-07 13:30:09
侄子入股我公司赚了600万,他拿走600万一分没给我留,我没说话

侄子入股我公司赚了600万,他拿走600万一分没给我留,我没说话

小秋情感说
2026-03-06 14:11:09
2014年,黄海波刚走出收容所的大门,曲栅栅迎了上来

2014年,黄海波刚走出收容所的大门,曲栅栅迎了上来

忠于法纪
2026-01-20 18:30:40
巴拿马“撕合同”翻车现场:美国点头后才发现21%中国货说跑就跑!

巴拿马“撕合同”翻车现场:美国点头后才发现21%中国货说跑就跑!

阿芒娱乐说
2026-03-06 00:05:14
2011年,她全裸接受记者采访,并称:我敢看你们,你们敢看我吗?

2011年,她全裸接受记者采访,并称:我敢看你们,你们敢看我吗?

小嵩
2026-03-05 23:54:14
伊朗导弹直扑以色列,沙特阿联酋向中国寻求援助

伊朗导弹直扑以色列,沙特阿联酋向中国寻求援助

有你便是晴天呢
2026-03-06 16:17:59
科普:东正教与天主教的区别在哪?

科普:东正教与天主教的区别在哪?

海佑讲史
2026-03-02 10:45:08
一夫一妻制逐渐难维持!社会学家分析:未来3种模式将成为主流?

一夫一妻制逐渐难维持!社会学家分析:未来3种模式将成为主流?

流云青史
2025-11-24 19:15:05
有人大胆预测,樊振东若不回归,洛杉矶奥运男单:国乒丢金概率高达八成

有人大胆预测,樊振东若不回归,洛杉矶奥运男单:国乒丢金概率高达八成

最爱乒乓球
2026-03-06 12:05:17
华为比亚迪两天连炸:中国双雄亮剑,全球车厂颤抖!

华为比亚迪两天连炸:中国双雄亮剑,全球车厂颤抖!

娱乐圈的笔娱君
2026-03-06 06:49:50
F-35I击落雅克-130,美军潜艇击沉伊朗护卫舰,连土耳其也被打了

F-35I击落雅克-130,美军潜艇击沉伊朗护卫舰,连土耳其也被打了

鹰眼Defence
2026-03-05 13:18:07
回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

就一点
2025-11-22 10:36:39
最讨厌的主持人排名:谢娜仅第六,张大大第二,第一无人质疑

最讨厌的主持人排名:谢娜仅第六,张大大第二,第一无人质疑

叶公子
2026-01-06 20:02:45
全线下跌!黄金、白银直线跳水!美股突变!美军,被曝大消息!

全线下跌!黄金、白银直线跳水!美股突变!美军,被曝大消息!

证券时报e公司
2026-03-05 23:12:55
肝癌后才懂放手!孙志浩全部遗产归梧桐妹,这结局谁也没料到

肝癌后才懂放手!孙志浩全部遗产归梧桐妹,这结局谁也没料到

小椰的奶奶
2026-03-01 10:32:16
老虎和猫是啥关系?本是同根生,基因相似为啥活成两个极端?

老虎和猫是啥关系?本是同根生,基因相似为啥活成两个极端?

向航说
2026-03-06 03:05:03
齐达内亲口承认!史上最强球员远超自己,曾一度力挺另一人

齐达内亲口承认!史上最强球员远超自己,曾一度力挺另一人

澜归序
2026-03-02 04:35:45
1965年飞行员高长吉违令击落对岸侦察机,主席批示后结局令人感慨

1965年飞行员高长吉违令击落对岸侦察机,主席批示后结局令人感慨

唠叨说历史
2026-03-04 10:46:38
2026-03-06 17:36:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2381502文章数 5702关注度
往期回顾 全部

科技要闻

独家|除夕加班、毫无黑料!林俊旸无奈离场

头条要闻

辽宁省委书记:有些干部热衷于当官 没想为老百姓服务

头条要闻

辽宁省委书记:有些干部热衷于当官 没想为老百姓服务

体育要闻

跑了24年,他终于成为英超“最长的河”

娱乐要闻

周杰伦社交媒体晒昆凌,夫妻感情稳定

财经要闻

经济主题记者会 潘功胜吴清等出席演讲

汽车要闻

岚图梦想家OTA升级:华为乾崑智驾ADS V4.1满血登场

态度原创

房产
时尚
教育
旅游
军事航空

房产要闻

传统学区房熄火?2月海口二手房爆火的板块竟然是…

看来看去还是这些穿搭最高级,不老套、不死板,舒适又显气质

教育要闻

长大后我就成了你:深山“禁区”里的教育接力

旅游要闻

【花Young贵阳】长滩河童话小镇:千亩金浪迎客来

军事要闻

伊朗:使用无人机击中美军"林肯"号航母

无障碍浏览 进入关怀版