网易首页 > 网易号 > 正文 申请入驻

AI盯上奥数!谷歌DeepMind:能以人类金牌水平解决几何题

0
分享至

·从2000年至2022年奥数比赛中抽取的30道几何题中,AlphaGeometry解决了25道。从历史上看,在同一时间,人类金牌得主平均解决了25.9道。

·“解决奥数级别的几何问题是发展深度数学推理、迈向更先进和通用人工智能系统的一个重要里程碑。”

AlphaGeometry团队成员:(左起)Yuhuai Wu、Trieu H. Trinh、Quoc V. Le和Thang Luong。

当地时间1月17日,人工智能开发机构谷歌DeepMind推出了名为AlphaGeometry(阿尔法几何)的AI系统,称该系统可以以国际数学奥林匹克竞赛金牌得主的平均水平解决几何问题。

有关该研究的论文表示,这“代表了人类水平自动推理的一个显著里程碑”。科学家认为,证明数学定理的方法有一天可能会在通用人工智能系统中发挥作用。

此外,AlphaGeometry是一个“神经符号”系统。它将“擅长直觉”的神经网络语言模型(如ChatGPT)与“擅长推理”的符号引擎(如逻辑计算器)结合,可能会再次引发长期以来的争论,即人工智能系统应建立在符号操作基础上还是看起来更像人脑的神经网络上。

为什么要关注几何?

有关这一研究的论文17日发表在《自然》杂志上。AlphaGeometry的代码也在当天开源。

根据谷歌DeepMind人工智能科学家Trieu Trinh的展示,从2000年至2022年奥数比赛中抽取的30道几何题中,AlphaGeometry解决了25道题。从历史上看,在同一时间,人类金牌得主平均解决了25.9道题。Trinh还将问题交给了20世纪70年代开发的一个系统,该系统被认为是最强的几何定理证明器:只解决了10道题。

AlphaGeometry最复杂的合成证明的长度令人印象深刻,为247个步骤。最简单的证明只有一步。

加州大学洛杉矶分校数学家陶哲轩 (Terence Tao)是有史以来最年轻的奥数金牌获得者,获奖时只有12岁。他认为AlphaGeometry是“出色的工作”,并且取得了“令人惊讶的强劲结果”。

Trinh与另一位谷歌DeepMind的人工智能科学家Thang Luong在一篇博客文章中写道:“解决奥数级别的几何问题是发展深度数学推理、迈向更先进和通用人工智能系统的一个重要里程碑。”“(我们)希望……AlphaGeometry有助于在数学、科学和人工智能领域开辟新的可能性。”

为什么要关注几何?谷歌DeepMind表示,证明数学定理,或者从逻辑上解释为什么一个定理(例如毕达哥拉斯定理)是正确的,需要推理和从一系列可能的解决方案中进行选择的能力。这种解决问题的方法有一天可能会在通用人工智能系统中发挥作用。

“证明某个特定猜想的真假,可以扩展即使是当今最先进人工智能系统的能力。”谷歌DeepMind在新闻稿中写道 。

Trinh表示,他将尝试将该系统推广到数学领域及其他领域,考虑所有类型推理的“共同的基本原则”。

不过,人工智能研究机构xAI的联合创始人、曾在谷歌工作的克里斯蒂安·塞格迪(Christian Szegedy)对《纽约时报》表示,“这是一个非常有趣的概念证明”,但它“留下了很多悬而未决的问题”,并且“不容易推广到其他领域和其他数学领域”。

陶哲轩认为,微调人工智能系统来解决奥数问题可能不会提高其深度研究的技能,但在这种情况下,旅程可能比目的地更有价值。

神经网络与符号系统的结合

训练人工智能系统来解决几何问题面临着独特的挑战。由于将证明转换为机器可以理解的格式十分复杂,因此缺乏可用的几何训练数据。当今许多尖端的生成式人工智能模型虽然在识别数据模式和关系方面表现出色,但缺乏通过定理进行逻辑推理的能力。

谷歌DeepMind的解决方法有两重。在设计AlphaGeometry时,实验室将“神经语言”模型(在架构上类似于ChatGPT)与“符号演绎引擎”配对,该引擎利用规则(如数学规则)来推断问题的解决方案。符号引擎可能不灵活且缓慢,尤其是在处理大型或复杂的数据集时。但谷歌DeepMind通过让神经模型“引导”推演引擎找到给定几何问题的可能答案,从而缓解了这些问题。

谷歌DeepMind还创建了自己的合成数据来代替训练数据,生成1亿个“合成定理”和不同复杂性的证明。然后,实验室利用合成数据从头开始训练AlphaGeometry,并针对奥数几何问题对其进行评估。奥数几何问题基于需要添加“结构”才能解决的图表,例如点、线或圆。应用于这些问题时,AlphaGeometry的神经模型会预测哪些结构可能对添加有用,AlphaGeometry的符号引擎使用这些预测来对图表进行推论,以识别类似的解决方案。

AlphaGeometry生成的一些合成证明数据的视觉表示。

“有了这么多关于这些构造如何产生证明的例子,AlphaGeometry的语言模型能够在遇到奥数几何问题时为新构造提出很好的建议。”Trinh和 Luong写道,“一个系统提供快速、‘直观’的想法,而另一个系统则提供更加深思熟虑、理性的决策。”

更通俗点解释,一旦AlphaGeometry遇到一个问题,符号引擎就开始尝试解决;如果遇到困难,神经网络会提出增强证明论证的方法,继续循环直到解决方案实现或时间耗尽。用数学术语来说,这种增强过程被称为“辅助构造”,添加一条线、平分一个角、画一个圆——这就是数学家修补问题并寻找答案的方式。在这个系统中,神经网络学会了以类似人类的方式进行辅助构建。Trinh将其比作将橡皮筋缠绕在难打开的罐子盖上,以帮助手更好地抓握。

这项研究可能会再次引发神经网络和符号系统孰优孰劣的争论。符号系统通过定义专用于特定工作的符号操作规则集(例如在文字处理软件中编辑一行字)来解决任务,而神经网络则尝试通过统计近似值和从示例中学习来解决任务。

神经网络的支持者认为,智能行为(从语音识别到图像生成)只能从大量数据和计算中产生。神经网络是OpenAI的DALL·E 3和GPT-4等强大人工智能系统的基石。

但是,符号人工智能的支持者称,神经网络并不是最终解决方案。符号人工智能可能更适合有效地编码世界知识,通过复杂的场景进行推理,并“解释”如何得出答案。

作为类似于DeepMind开发的AlphaFold 2和AlphaGo的混合符号神经网络系统,AlphaGeometry或许证明了符号操作和神经网络这两种方法的结合是寻找通用人工智能的最佳路径。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陈飞宇对女搭档差别太大!与孙千是“社恐”,与迪丽热巴是“油”

陈飞宇对女搭档差别太大!与孙千是“社恐”,与迪丽热巴是“油”

风月得自难寻
2026-03-30 00:27:23
军采 “零容忍” 再亮剑:江苏苏净工程围标串标遭全链条惩戒

军采 “零容忍” 再亮剑:江苏苏净工程围标串标遭全链条惩戒

新浪财经
2026-03-29 23:09:57
大学生怒砸食堂后续!人已被抓,知情人曝料,几十万赔偿仅是开始

大学生怒砸食堂后续!人已被抓,知情人曝料,几十万赔偿仅是开始

娱乐圈见解说
2026-03-30 00:22:32
爱泼斯坦与朋友打趣,若霍金与未成年女孩发生性关系,他应获诺奖

爱泼斯坦与朋友打趣,若霍金与未成年女孩发生性关系,他应获诺奖

流史岁月
2026-02-28 10:00:49
1亿成本,首映仅449万,《蜂蜜的针》票房扑街,袁梅亏到怀疑人生

1亿成本,首映仅449万,《蜂蜜的针》票房扑街,袁梅亏到怀疑人生

电影票房预告片
2026-03-28 23:57:45
“一觉起来以为睡到晚上了”,南宁中午白昼如黑夜,气象台:雷雨强对流云团影响,目前已天晴

“一觉起来以为睡到晚上了”,南宁中午白昼如黑夜,气象台:雷雨强对流云团影响,目前已天晴

潇湘晨报
2026-03-29 18:17:27
李荣浩公开喊话单依纯,称对方在婉拒翻唱授权的情况下,强行侵权演唱《李白》:所以我释出的善意对于你来说就是“如何呢,又能怎”是吗?

李荣浩公开喊话单依纯,称对方在婉拒翻唱授权的情况下,强行侵权演唱《李白》:所以我释出的善意对于你来说就是“如何呢,又能怎”是吗?

大风新闻
2026-03-29 15:44:02
爸妈掏400万送我学区房,婆婆:没和我商量,退房!我:1分没拿,别BB

爸妈掏400万送我学区房,婆婆:没和我商量,退房!我:1分没拿,别BB

浮生实录集
2025-09-09 18:59:24
我爱上41岁女人,她开口:玩玩可以但不结婚,得知真相我瘫坐在地

我爱上41岁女人,她开口:玩玩可以但不结婚,得知真相我瘫坐在地

小月故事
2026-03-19 17:08:37
炸锅!曼联三大核心集体逼宫,新帅人选彻底稳了

炸锅!曼联三大核心集体逼宫,新帅人选彻底稳了

澜归序
2026-03-30 04:30:26
为啥女游泳运动员几乎都是“平胸”?其中的原因,不得不让人敬佩

为啥女游泳运动员几乎都是“平胸”?其中的原因,不得不让人敬佩

拳击时空
2026-03-30 06:14:45
医生发现:经常走路锻炼的脑梗人,过不了几月,身体会迎来6好处

医生发现:经常走路锻炼的脑梗人,过不了几月,身体会迎来6好处

蜉蝣说
2026-02-16 22:04:55
伊朗打对了,把伊斯兰世界最大的叛徒揪出来了!

伊朗打对了,把伊斯兰世界最大的叛徒揪出来了!

达文西看世界
2026-03-28 10:23:28
钟小平:柯文哲毫无羞耻心 警告郑丽文若上凯道“选票会崩”

钟小平:柯文哲毫无羞耻心 警告郑丽文若上凯道“选票会崩”

坠入二次元的海洋
2026-03-29 15:11:03
王晶没撒谎!和蓝颜知己12年后再牵手的林志玲 戳破日本丈夫真容

王晶没撒谎!和蓝颜知己12年后再牵手的林志玲 戳破日本丈夫真容

小徐讲八卦
2026-03-27 07:41:07
武磊接班人找到,连续2场国家队比赛均有建树,中国足球崛起有望

武磊接班人找到,连续2场国家队比赛均有建树,中国足球崛起有望

我就是一个说球的
2026-03-29 22:02:40
Ollama把本地大模型门槛砍到8G内存

Ollama把本地大模型门槛砍到8G内存

算力游侠
2026-03-29 07:20:22
喜讯!上港五位受伤球员恢复情况都超过外界预期,两人已提前复出

喜讯!上港五位受伤球员恢复情况都超过外界预期,两人已提前复出

二爷台球解说
2026-03-30 08:47:30
62岁老人查出阴茎癌!他的坏习惯为所有人敲响警钟!值得借鉴

62岁老人查出阴茎癌!他的坏习惯为所有人敲响警钟!值得借鉴

路医生健康科普
2026-03-27 17:42:19
痛心!江西跑友刘涛去世,仅51岁,生前坚持晨跑,是3家公司老板

痛心!江西跑友刘涛去世,仅51岁,生前坚持晨跑,是3家公司老板

离离言几许
2026-02-25 10:43:45
2026-03-30 09:56:49
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
885884文章数 5089244关注度
往期回顾 全部

科技要闻

DeepSeek“崩了”一夜,仍无法正常使用

头条要闻

牛弹琴:开战30天后 一场更猛烈的风暴即将到来

头条要闻

牛弹琴:开战30天后 一场更猛烈的风暴即将到来

体育要闻

绝杀卫冕冠军后,他单手指天把胜利献给父亲

娱乐要闻

汪峰定律再现!李荣浩喊话单依纯侵权

财经要闻

油价冲击,有些亚洲货币先扛不住了!

汽车要闻

岚图泰山X8配置曝光 四激光雷达/华为新一代座舱

态度原创

数码
教育
健康
本地
游戏

数码要闻

555.5万台!中国大陆投影仪稳居全球最大单一市场

教育要闻

被焦虑压垮的童年:中小学心理问题的系统性反思

干细胞抗衰4大误区,90%的人都中招

本地新闻

在潍坊待了三天,没遇到一个“潍坊人”

《无限机兵》DLC“厄瑞涅的战争熔炉”试玩报告:另辟蹊径

无障碍浏览 进入关怀版