网易首页 > 网易号 > 正文 申请入驻

谷歌AlphaProof攻克国际奥赛数学题 数学家会不会被淘汰?

0
分享至

谷歌DeepMind发布消息称,它所开发的AI系统AlphaProof和AlphaGeometry 2在数学上取得突破,解答了今年国际数学奥林匹克竞赛(IMO)6道题中的4道,相当于银牌水平。

谷歌还自豪宣称,这是AI第一次取得如此耀眼的成绩。可惜就像之前所鼓吹的其它AI一样,谷歌的说法也有夸大之嫌。

离金牌线只有一步之遥

根据谷歌的解释,AlphaProof用增强学习技术在开源求证辅助系统Lean环境中证明数学命题。Lean是微软公司计算机科学家莱昂纳多·德莫拉开发的,采用了由所谓“有效的老式人工智能”(GOFAI)——即从逻辑学汲取灵感的符号人工智能——所驱动的自动推理。

谷歌系统具备自我学习能力,它生成并验证数百万个数学证明,在解决复杂数学问题时进步明显。在此之前,谷歌开发过几何AI模型,AlphaGeometry 2相当于升级版本,它是谷歌以Gemini语言模型作为基础,用大量数据训练出来的。

知名数学家Sir Timothy Gowers和Dr. Joseph Myers用国际数学奥林匹克竞赛标准对谷歌AI系统进行评估,国际数学奥林匹克竞赛的金牌线为29分,总分42分,谷歌系统拿到28分,离金牌线只有一步之遥。在最难的问题上谷歌系统完美解答,今年只有5人解决此问题。

国际数学奥林匹克竞赛始于1959年,面向预科数学天才(也就是还没进入大学的数学天才),主要涉及代数、组合数学、几何和数论。

用竞赛问题测试AI已经成为评估AI推理能力的重要标准。AlphaProof解决了两个代数问题,一个数论问题;AlphaGeometry 2解决了一个几何问题,但谷歌AI被两个组合数学问题挫败。在解决问题时,有一个只用了几分钟,其它耗时较长,最多三天。

谷歌AI用于数学也有局限

为什么说谷歌的说法也有夸大之嫌呢?

首先,谷歌将竞赛问题转化为正式数学语言,方便AI模型处理。这一做法与官方竞赛流程不符,人类参赛者会直接面对问题。

AI模型可以生成文章或者其它形式的文本,但面对复杂数学问题时往往会捉襟见肘,因为当中牵涉到复杂的逻辑推理,这正是目前AI系统所欠缺的。复杂数学问题会涉及到抽象概念、子目标设定、回溯、尝试新路径,这些都给AI带来挑战。

专注于数学和AI研究的剑桥大学研究人员Katie Collins说:“如果你有办法检查答案(也就是正式语言),训练数学AI模型就会容易很多,难点在于网上自然语言(非正式语言)数据超级多,但正式数学语言数据却很少。”

谷歌DeepMind AI可以自动将用自然非正式语言编写的数学问题转化为正式语言,这是谷歌之所以取得突破的关键。爱丁堡大学混合AI讲师Wenda Li说,对于数学社区而言,自动将非正式语言转化为非正式语言是一大进步。

在参加今年的竞赛之前,AlphaGeometry 2曾尝试解答之前25年积累的国际数学奥林匹克竞赛几何问题,83%都能解答——之前的AI只能解答53%。面对今年的几何问题,谷歌系统只用19秒就给出答案。

其次,谷歌AI模型花费的时间有时显著过长。Sir Timothy Gowers承认DeepMind模型取得突破,表现远超之前的自动定理证明者,但AI解答时花费的时间远长于人类参赛者,有些问题需要的时间甚至超过60个小时,AI的处理速度本来比人类快很多,但还是需要更长时间,如果人类参赛者有同样长的时间解答,得分肯定更高。

Sir Timothy Gowers还说,在正式答题之前,人类已经手动将题目转化为正式语言Lean,然后AI才着手处理,虽然核心数学推理是由AI完成的,但“自动化”步骤却由人类操刀。

替代数学家还需时日

到底谷歌系统会给数学研究造成什么影响?Sir Timothy Gowers只能说“不确定”。他表示:“是不是到了数学家即将成为多余的地步?很难说。我想我们离这个目标还差一个或者两个突破。”

他认为,谷歌系统解答时需要更长时间说明AI并没有很好解决数学问题,但在操作时应该发生了一些有趣的事情。

虽然存在诸多局限性,Sir Timothy Gowers仍认为类似的AI系统将会成为富有价值的研究工具。在程序的辅助下,对于那些不是特别难的问题(几个小时就能解决),AI可以帮助数学家寻找答案,如此一来,即使AI本身无法解决开放问题,也能成为数学家的实用工具。

不管怎样,开发一套AI系统,让它解决富有挑战的数学问题,可以为未来的人机协作扫清障碍,还可以让人类深入了解自身是如何解决数学问题的。

当然必须意识到,在人类解决复杂数学问题方面,目前还有很多未解之谜,AI也一样。(小刀)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
每瓶仅含0.01克,喝几千瓶才抵一个桃!“饮料一哥”也翻车了?杭州多家超市在售,你可能也喝过

每瓶仅含0.01克,喝几千瓶才抵一个桃!“饮料一哥”也翻车了?杭州多家超市在售,你可能也喝过

都市快报橙柿互动
2026-05-24 20:48:16
金价、银价急跌!现货黄金下跌至每盎司4527.39美元 现货白银下跌至每盎司75.69美元

金价、银价急跌!现货黄金下跌至每盎司4527.39美元 现货白银下跌至每盎司75.69美元

闪电新闻
2026-05-26 16:02:41
马斯克说中了!当今世界抢的不是芯片,而是中国20万一台的变压器

马斯克说中了!当今世界抢的不是芯片,而是中国20万一台的变压器

潮鹿逐梦
2026-05-20 00:22:42
宣布认台岛为国!欧洲在野党一把手将窜访台岛,与赖清德见面!

宣布认台岛为国!欧洲在野党一把手将窜访台岛,与赖清德见面!

阿龙聊军事
2026-05-26 11:54:13
董文华:我这辈子最正确的决定,就是嫁给了一个平凡普通的丈夫

董文华:我这辈子最正确的决定,就是嫁给了一个平凡普通的丈夫

飘飘然的娱乐汇
2026-05-25 19:10:08
荨麻,不要读xún má,丢不起那个人!

荨麻,不要读xún má,丢不起那个人!

未央看点
2026-05-19 08:54:23
伊朗使用新武器

伊朗使用新武器

鲁中晨报
2026-05-26 09:06:47
连云港遭遇强暴雨致严重内涝:多车被淹 屋内积水70厘米 有市民街头游泳

连云港遭遇强暴雨致严重内涝:多车被淹 屋内积水70厘米 有市民街头游泳

闪电新闻
2026-05-26 11:01:42
五一新规后,倒查5年、3万入刑:一位医生的真心话(不吐不快)

五一新规后,倒查5年、3万入刑:一位医生的真心话(不吐不快)

医客
2026-05-26 12:12:04
半导体大佬集体减持后,杭州豪宅被抢疯了!

半导体大佬集体减持后,杭州豪宅被抢疯了!

樱桃大房子
2026-05-25 21:52:46
身家几十亿的“煤矿幕后老板”任铁柱,因82条人命可能彻底崩塌

身家几十亿的“煤矿幕后老板”任铁柱,因82条人命可能彻底崩塌

我想把最好的一面展现给你
2026-05-26 09:43:06
露笑科技:公司已攻克6/8/12英寸碳化硅晶体生长、衬底精密加工等关键核心技术

露笑科技:公司已攻克6/8/12英寸碳化硅晶体生长、衬底精密加工等关键核心技术

澎湃新闻
2026-05-25 16:44:08
美军空袭“暂时结束”!交战过程曝光:美战机袭击伊朗海军致多人死亡,伊方向美军舰开火,美军则对阿巴斯港东边进行空袭!特朗普最新表态

美军空袭“暂时结束”!交战过程曝光:美战机袭击伊朗海军致多人死亡,伊方向美军舰开火,美军则对阿巴斯港东边进行空袭!特朗普最新表态

每日经济新闻
2026-05-26 09:03:57
河南一女子超市购物抽奖中世界杯门票欲转让,网友称愿50万收票,超市方回应

河南一女子超市购物抽奖中世界杯门票欲转让,网友称愿50万收票,超市方回应

潇湘晨报
2026-05-26 15:11:42
老公不让我和男闺蜜单独去大理,我拉黑断联五天,回家后我傻眼了

老公不让我和男闺蜜单独去大理,我拉黑断联五天,回家后我傻眼了

萧竹轻语
2026-04-11 08:40:12
广州官宣:试点收购300万元以内、70㎡以下二手住宅,楼龄不限

广州官宣:试点收购300万元以内、70㎡以下二手住宅,楼龄不限

南方都市报
2026-05-26 12:17:57
重磅!马家人对金溥聪最后通牒:再伤害马英九就申请“辅助宣告”

重磅!马家人对金溥聪最后通牒:再伤害马英九就申请“辅助宣告”

明天后天大后天
2026-05-26 11:00:15
惨遭屠杀!夺冠概率出炉!NBA三国杀!谁被低估了?

惨遭屠杀!夺冠概率出炉!NBA三国杀!谁被低估了?

篮球盛世
2026-05-26 15:29:43
向太曝许氏家族每年收租上亿,自己就300多万

向太曝许氏家族每年收租上亿,自己就300多万

韩小娱
2026-05-26 07:36:51
职业生涯法网首胜!吴易昺三盘横扫过关,下轮将战10号种子

职业生涯法网首胜!吴易昺三盘横扫过关,下轮将战10号种子

全景体育V
2026-05-26 05:16:53
2026-05-26 16:35:00
极客网 incentive-icons
极客网
科技使能新商业
2961文章数 2629关注度
往期回顾 全部

科技要闻

今年秋季,麒麟芯片将首次落地"逻辑折叠"

头条要闻

外媒:中美身处两个"陷阱"之间 两国力求全都规避

头条要闻

外媒:中美身处两个"陷阱"之间 两国力求全都规避

体育要闻

上赛季差点降入英甲,下赛季要踢英超了

娱乐要闻

台媒贴脸!S妈被问大S嗑药当场沉默

财经要闻

中国铝行业爆单 下一个“煤炭”大周期?

汽车要闻

涉水加强 福特烈马亚马逊限量版上市 售价39.98万

态度原创

本地
亲子
游戏
公开课
军事航空

本地新闻

用云锦的方式,打开江苏南京

亲子要闻

备孕肌醇产品哪款值得买?2026热门肌醇品牌实测排行,协同滋养卵巢助力备孕

《黑旗RE》确认亮相腾讯发布会!系列首次中文配音

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美伊在阿巴斯港附近短暂交火 交战过程披露

无障碍浏览 进入关怀版