网易首页 > 网易号 > 正文 申请入驻

《大西洋月刊》丨陶哲轩:数学的边界

0
分享至

The Edge of Mathematics

传奇数学家陶哲轩阐释生成式人工智能的前景。

作者:马特奥·王 (Matteo Wong)


插图:《大西洋月刊》绘制。图片来源:Kimberly White / Getty Images

2026年2月24日

在过去的几个月里,几位研究人员开始提出一个相同的挑衅性主张:他们利用生成式人工智能工具解决了一个此前未解的数学难题。

那些最极端的承诺——即人工智能辅助解决数学界一些最棘手的问题——很可能最终被证明是空洞的炒作。但是,许多由人工智能撰写的解答(尽管针对的是远没那么受赞誉的问题)已经通过了验证。这些答案针对的是“埃尔德什问题”(Erdős Problems)中的一部分——这是由匈牙利数学家保罗·埃尔德什(Paul Erdős)提出的1000多个数学问题——是利用包括ChatGPT在内的生成式人工智能模型写成的。OpenAI迅速宣布了一场胜利:“GPT-5.2 Pro解决了另一个开放的埃尔德什问题,”OpenAI总裁格雷格·布罗克曼(Greg Brockman)于一月份在X平台上发帖称,“这将是数学和科学进步狂野的一年!”

围绕这一新闻的大部分兴奋之情,源于这些人工智能所写证明的裁决者:陶哲轩。他是加州大学洛杉矶分校(UCLA)的教授,被广泛认为是当今世界上最伟大的在世数学家。他的认可似乎赋予了生成式人工智能最大的承诺以合法性——即推动人类知识和文明的边界。当我本月早些时候致电陶哲轩,询问他对人工智能能为数学带来什么的看法时,他的态度更为温和。他告诉我,人工智能生成的埃尔德什问题解答令人印象深刻,但并非压倒性的:陶哲轩表示,这些机器人实际上只是取得了一些“廉价的胜利”。

陶哲轩长期以来对人工智能工具能为他的领域做些什么感到好奇,但也持保留态度。我们在2024年秋季第一次交谈时,陶哲轩将聊天机器人比作“平庸但并非完全无能”的研究生。大约六个月后,他告诉我,这些模型在“某些类型的高层数学推理”方面有所进步,但缺乏创造力且会犯细微的错误。但在我们最近的谈话中,他的态度更加乐观。人工智能或许尚未处于解决世界上所有伟大数学问题的边缘,但聊天机器人已经达到了可以与人类数学家协作的水平。他说,在这个过程中,这项技术正在开辟一种不同的“做数学的方式”。

本次对话经过编辑,以求简练清晰。

马特奥·王: 最近,关于ChatGPT解决某些埃尔德什问题的能力引起了极大轰动。在过去一年左右的时间里,您看到生成式人工智能的数学能力是如何演变的?

陶哲轩: 有一大群人非常、非常希望看到人工智能的成功故事。与此同时,也有另一群截然相反的人想要抹杀所有人工智能的进展。而事实介于两者之间,是一个非常复杂且微妙的故事。

特别是在这些埃尔德什问题中,有一小部分是我们要真正解决的高知名度问题,然后还有长长的尾部,由非常冷僻的问题组成。人工智能非常擅长系统地探索这个长尾部分,并攻克其中最简单的问题。但这与人类的风格截然不同。人类不会系统地浏览所有1000个问题并挑选出最简单的12个来研究,而这正是人工智能正在做的事情。

这些问题之间确实存在着巨大的难度差异。看看迄今为止人工智能独立解决的问题,你会发现:哦,好吧,它们使用的是一种标准技术。如果一位专家花半天时间研究此事,也能解决出来。当然也有更复杂的、由人工智能辅助的解决方案。我认为在短期内,我们将通过纯人工智能方法在简单问题上获得许多快速胜利。而在接下来的几个月里,我认为我们将看到各种形式的人机混合贡献。

我也从出现的一些证明中学习。我喜欢阅读它们——也许它使用了某篇1960年论文中的技巧,而我之前并不知晓。所以它可能不是超级、超级有创造力,但它是新的,并且能做到那些审视该问题的人类专家所忽略的事情。

王: 您曾写道,当人类数学家面对一个新问题时,无论成功与否,他们都会产生见解供该领域的其他人构建基础——这是基于人工智能的证明所无法提供的。为什么会这样?

陶哲轩: 这些问题就像是你需要徒步前往的遥远地点。在过去,你必须踏上一段旅程。你可以放下路标供他人跟随,也可以绘制地图。

人工智能工具就像是用直升机把你直接空降到目的地。你错过了旅程本身的所有益处。你直接到达了终点,而这实际上只是解决这些问题价值的一部分。

王: 当您思考当今这些模型的能力时,除了让非数学家能够处理更高级的问题外,它们还能为您的领域做出什么贡献?

陶哲轩: 如今有很多非常乏味的数学工作是我们不喜欢做的,所以我们寻找巧妙的方法来绕过它们。但人工智能会很乐意猛冲通过这些繁琐的计算。当我们把人工智能整合到人类的工作流程中时,我们就可以滑过这些障碍。

我还认为数学家将开始在更大的规模上进行数学研究。想想科学研究中个案研究与人口调查之间的区别。如果你要在18世纪研究一种疾病,如果这是一种罕见病,你可能会研究一位患有此病的病人,记录其所有症状并做详尽的笔记。但在21世纪,你可以进行临床试验,给1000人用药,进行统计分析,从而获得关于药物效率更精确的信息。

数学仍然很大程度上处于个案研究的水平。一篇论文会选取一两个问题,以一种非常手工打造、高强度的方式对其进行透彻研究。这是我们的风格。但人工智能工具实现的是“群体研究”。

王: 您对人工智能模型在数学能力方面取得的进步感到惊讶吗?

陶哲轩: 有一点惊讶。发生的很多事情是我预料到的,但它们比我预期的时间表稍微提前了一点。并没有提前太多。

例如,在2023年,我为微软写了一篇文章,预测到2026年,人工智能将成为值得信赖的合著者——即其对技术论文的贡献将达到合著者的水平。那篇文章反响不一:有人说我太过雄心勃勃,也有人说我太过悲观。但我认为这基本上几乎完全符合时间表。我们基本上看到人工智能的使用水平达到了我预期初级人类合著者所能做出的贡献,尤其是那些非常乐意做苦差事并解决大量繁琐案例的合著者。

王: 在未来一两年内,您希望或期待生成式人工智能模型有哪些改进?

陶哲轩: 我们需要找到一个中间地带,既鼓励负责任地使用人工智能,又阻止不负责任的使用。这是一条需要小心行走的界线。但我们以前做到过。数学家经常使用计算机进行数值工作,当计算机辅助证明首次出现时,最初遭到了很多反对,因为人们质疑如何信任计算机代码?但我们在20或30年里解决了这个问题。不幸的是,现在的时间表被大大压缩了。所以我们必须在几年内制定出我们的标准。而我们的社区通常不会移动得那么快。

有一件非常基本的事情可以帮助数学社区:当人工智能给你一个问题的答案时,通常它不会很好地表明它对这个答案有多大的把握,或者它总是会说:“我完全确定这是真的。”人类也会这样做。无论他们对某事是否有信心,这都是非常重要的信息。暂时提出一些你不确定的事情是可以的,但重要的是要标记出你对此不确定。然而,人工智能工具并不能准确地评估它们自己的置信度。这降低了它们的有用性。我们会更欣赏诚实的人工智能。

此外,许多人工智能公司痴迷于“一键式”、完全自主的工作流程:你把任务交给人工智能,然后你去喝杯咖啡,回来时问题就解决了。这实际上并不理想。对于困难的问题,你真正想要的是人类与人工智能之间的对话。而人工智能公司并没有真正促进这种互动。

如果我们能与至少一些愿意开发更多互动平台的技术公司合作,那将会更容易被人们所接受。我们不想沦为只是按按钮的角色。

说明:本号刊发来自各方的文章,是为了获得更全面的信息,不代表本号支持文章中的观点。由于微信公众号每天只能推送一次,本站目前在腾讯新闻发布最新的文章,每天24小时不间断更新,请在腾讯新闻中搜索“邸钞”,或在浏览器中点击:

https://news.qq.com/omn/author/8QIf3nxc64AYuDfe4wc%3D

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
他是军统正局长,一生暗中帮我党,死后破例葬入八宝山,民族脊梁

他是军统正局长,一生暗中帮我党,死后破例葬入八宝山,民族脊梁

历史人文2
2026-02-24 16:10:55
杨瀚森缺席开拓者遭森林狼三杀 华子34分戈贝尔复出10+19

杨瀚森缺席开拓者遭森林狼三杀 华子34分戈贝尔复出10+19

醉卧浮生
2026-02-25 13:44:20
2月25日人民币对美元中间价调升93个基点

2月25日人民币对美元中间价调升93个基点

证券时报
2026-02-25 09:31:35
广西高速堵车一大哥在路边架锅卖炒粉,路过车主:才10元一份,味道好分量足

广西高速堵车一大哥在路边架锅卖炒粉,路过车主:才10元一份,味道好分量足

扬子晚报
2026-02-25 07:56:36
平顶山再通报“夫妻殴打15岁女生”:如此嚣张,离不开这三个原因

平顶山再通报“夫妻殴打15岁女生”:如此嚣张,离不开这三个原因

英军眼
2026-02-25 10:53:41
男同学写作文说长大娶我,我气得把他赶上树,我却成了他的新娘

男同学写作文说长大娶我,我气得把他赶上树,我却成了他的新娘

人间百态大全
2026-02-25 06:40:03
从左权之妻到改嫁左权秘书,再到山西夺权,刘志兰究竟经历了什么

从左权之妻到改嫁左权秘书,再到山西夺权,刘志兰究竟经历了什么

旧书卷里的长安
2026-02-22 00:08:58
Memes:永远别忘了雷霆当年因为霍福德太老就把他雪藏的事

Memes:永远别忘了雷霆当年因为霍福德太老就把他雪藏的事

林子说事
2026-02-25 10:48:49
一只励志的小黑猪:为了活命,拼命帮主人干活,最终获得免死金牌

一只励志的小黑猪:为了活命,拼命帮主人干活,最终获得免死金牌

狸猫之一的动物圈
2026-02-24 09:00:11
中国“创客三件套”,让老外心甘情愿掏腰包

中国“创客三件套”,让老外心甘情愿掏腰包

最华人
2026-02-24 09:22:25
“我就是她取精生子的工具”清华学霸哭诉,撕开了女富豪的遮羞布

“我就是她取精生子的工具”清华学霸哭诉,撕开了女富豪的遮羞布

北纬的咖啡豆
2026-02-20 19:12:17
《好好的时光》女主成败笔!大脸凸嘴还没演技,别再霍霍年代剧了

《好好的时光》女主成败笔!大脸凸嘴还没演技,别再霍霍年代剧了

林轻吟
2026-02-24 19:45:31
新加坡大满贯赛:世界亚军被淘汰!1:3不敌张本智和,向鹏3:0晋级

新加坡大满贯赛:世界亚军被淘汰!1:3不敌张本智和,向鹏3:0晋级

国乒二三事
2026-02-25 13:30:17
河南平顶山郏县再通报打人事件:犯罪嫌疑人刑期与赔偿全解析

河南平顶山郏县再通报打人事件:犯罪嫌疑人刑期与赔偿全解析

春树说法
2026-02-25 08:13:11
巴拿马强硬接管长和双港口,关键时刻,中方给特朗普访华泼了冷水

巴拿马强硬接管长和双港口,关键时刻,中方给特朗普访华泼了冷水

嫹笔牂牂
2026-02-25 11:35:46
“不合理不透明!”沪上新能源车充电,遭遇“三重收费”!市民直呼“太离谱”

“不合理不透明!”沪上新能源车充电,遭遇“三重收费”!市民直呼“太离谱”

新民晚报
2026-02-24 19:05:37
你有什么无心插柳的经历?网友:卖兽药的,一个半月,赚了190万

你有什么无心插柳的经历?网友:卖兽药的,一个半月,赚了190万

夜深爱杂谈
2026-02-24 20:10:07
戏子误国!2026年刚开年,就有3位明星相继塌房,个个荒唐

戏子误国!2026年刚开年,就有3位明星相继塌房,个个荒唐

不似少年游
2026-02-24 19:24:23
新加坡大满贯赛:8强对阵出炉!国乒3:1逆转获胜,头号种子被淘汰

新加坡大满贯赛:8强对阵出炉!国乒3:1逆转获胜,头号种子被淘汰

国乒二三事
2026-02-25 11:56:13
剑斩楼兰:乌军南线收复400平方公里,第聂伯罗全州解放

剑斩楼兰:乌军南线收复400平方公里,第聂伯罗全州解放

史政先锋
2026-02-24 15:00:08
2026-02-25 15:36:49
邸报
邸报
每天分享有意思的文章。
476文章数 120关注度
往期回顾 全部

科技要闻

“机器人只跳舞,没什么用”

头条要闻

15岁少女和姐姐吵架后失联半月 父亲悬赏100万寻人

头条要闻

15岁少女和姐姐吵架后失联半月 父亲悬赏100万寻人

体育要闻

曝雄鹿计划今夏追小卡 字母哥渴望与其并肩作战

娱乐要闻

撒贝宁到沈阳跑亲戚 老婆李白模特身材

财经要闻

春节档"开门黑" 电影票少卖了7000万张

汽车要闻

750km超长续航 2026款小鹏X9纯电版将于3月2日上市

态度原创

艺术
房产
数码
家居
游戏

艺术要闻

这位艺术家的马赛克画让人惊叹不已!

房产要闻

330万人涌入!春节全国楼市,第一个卖爆的区域出现了!

数码要闻

宏碁:今年PC价涨量跌 但整体销售额将维持成长

家居要闻

艺居办公 温度与效率

生化9总监是任天堂“死忠粉”?怪物设计一脉相承

无障碍浏览 进入关怀版