网易首页 > 网易号 > 正文 申请入驻

华为小艺AI竞赛Agent首战国际数学奥林匹克大赛(IMO)荣获佳绩!

0
分享至

在2025年国际数学奥林匹克竞赛(IMO)官方的特别邀请下,小艺AI竞赛Agent亮相本届全球顶尖的数学赛事。经过三天的激烈角逐,小艺AI竞赛Agent成功攻克6道难题中的5道,以34分的优异成绩摘得银牌,距离金牌分数线(35分)仅1分之差。这一历史性的突破,标志着华为AI的逻辑推理能力达到了一个新的高度。

IMO主席Gregor Dolinar教授对华为AI的表现给予了高度评价:“华为AI提交的答卷获得了34分(满分42分),这是一个了不起的成就。(The Huawei AI scripts received a grade of 34 out of 42, which is a remarkable result.)”

不止于答题:小艺AI竞赛Agent展现专家级解题艺术

与传统模型追求解题套路不同,小艺AI竞赛Agent在解题过程中展现了接近顶尖解题方式的创造力和严密性:

专家级推理能力:小艺AI竞赛Agent完美攻克第1至第4题,均获满分(7分)。其论证过程严谨、逻辑自洽、可读性强,此外在第3题中还灵活运用了“升幂定理”等技巧,展现了深厚的数学知识储备。值得说明的是第5题,评审组确认,尽管Agent因对平局情况的表述存在细微瑕疵被扣1分,但其核心思维过程已完整包含了对该情况的严谨证明。这表明,它实际上已具备了解答该题所需的全部数学能力。

闪耀的解题灵感:在第2题的证明中,小艺AI竞赛Agent精准预测并添加了唯一一个辅助点,便完成了整个复杂证明的生成。其解法之高效、思路之凝练,显著优于已知的公开解法。

接近完美的思考深度:第1题的解答思路流程完整,清晰简洁,对于n=3的情况讨论充分,归纳过程严谨;同时在第4题的解答中对所有情况讨论完备,证明的结构层级分明,易于理解。





> 对IMO竞赛感兴趣的开发者,可以前往GitHub了解小艺AI竞赛Agent完整的赛题解答,链接:https://github.com/Huawei-xiaoyi/IMO2025-solutions

技术揭秘:驱动巅峰表现的“双脑”协同架构

小艺AI竞赛Agent的卓越表现,源于其创新的“自然语言大模型 + 形式化证明”协同架构。这套系统如同一个拥有“左右脑”的数字大脑,将人类的直觉创造与机

器的严谨验证无缝融合。

1、思维风暴与“AI同行评审”:孕育创造性解法

面对难题,小艺AI竞赛Agent首先通过并行采样生成海量、多样化的解题思路,如同进行一场“思维风暴”。随后,启动独特的“AI同行评审”机制,让不同的AI模型互相审阅、辩论、评分,从而筛选出最优的思路路径。这一过程还会融合形式化证明的反馈,指导AI模型进行多轮自我修复与迭代优化,极大提升了模型攻克精英级难题的创造力。

2、迭代式多层级证明:构建严密的逻辑闭环

为克服高复杂度数学证明严谨性的挑战,华为小艺团队设计了迭代式多层级并行证明系统。该系统首先将复杂的证明目标分解为树状的多层级子问题,然后由形式化证明模型自下而上地对每个子节点进行大规模并行验证。一旦某个环节证明失败,具备反思和自我修正能力的模型将立刻启动修复流程,直至整个逻辑链条完美闭环。

里程碑与新起点:共探AI与教育的未来

此次赛事的成果,不仅是华为AI发展的重要里程碑,更充分地证明了基于大语言模型(LLM)的多Agent协同系统在解决高阶数学问题上的强大潜力。

与此同时华为小艺团队也意识到,当前系统在面对极高复杂度的数学问题时(如本届IMO第6题)仍有局限,未来将会继续提升小艺的抽象推理与问题建模能力,持续向高阶数学推理探索。

据悉,小艺AI竞赛Agent的核心能力,未来将逐步赋能于小艺教育Agent。华为小艺团队或将以白名单机制,优先向数学及AI领域的专业研究者开放,旨在共同推动智能解题方法论的创新,让顶级的思维能力普惠每一位学习者。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“取消双休”登上热搜!行内人警告:公务员不是焦点,你在劫难逃

“取消双休”登上热搜!行内人警告:公务员不是焦点,你在劫难逃

行走的知识库
2025-11-18 09:15:22
山姆会员店回应选品像普通超市

山姆会员店回应选品像普通超市

界面新闻
2025-11-18 00:05:03
112000吨航母将交付,可搭载75架五代机,技术或领先全球20年

112000吨航母将交付,可搭载75架五代机,技术或领先全球20年

寻途
2025-11-18 12:46:51
贾跃亭正加速清偿中国法下的债务,「下周回国」又提上日程了!

贾跃亭正加速清偿中国法下的债务,「下周回国」又提上日程了!

雷科技
2025-11-17 16:05:48
奥运冠军石智勇夺全运会举重73公斤级冠军,赛后宣布退役

奥运冠军石智勇夺全运会举重73公斤级冠军,赛后宣布退役

懂球帝
2025-11-18 11:15:10
惨遭逆转!河南女排24:26北京先失一局,朱婷局末发力难救主

惨遭逆转!河南女排24:26北京先失一局,朱婷局末发力难救主

老籣说体育
2025-11-18 14:26:31
向佑彻底没救了!现身南昌酒吧,新交的女友又胖又颓,烟酒不离手

向佑彻底没救了!现身南昌酒吧,新交的女友又胖又颓,烟酒不离手

姩姩有娱
2025-11-17 18:20:45
重大转变!“中国:0→47%,美国:88%→9%”

重大转变!“中国:0→47%,美国:88%→9%”

观察者网
2025-11-18 08:39:03
燕梳楼:如果日本驱逐薛剑,就是向中国宣战!

燕梳楼:如果日本驱逐薛剑,就是向中国宣战!

燕梳楼频道
2025-11-13 12:44:36
王楚钦被牵扯!央视揭露令人震惊的“隐私链条”真相!

王楚钦被牵扯!央视揭露令人震惊的“隐私链条”真相!

舞指飞扬
2025-11-18 09:10:27
确认裁员了,很严重,大家做好准备吧!

确认裁员了,很严重,大家做好准备吧!

关不羽
2025-11-18 09:03:23
初婚人口跌破1000万

初婚人口跌破1000万

谭谈投研
2025-11-17 12:17:54
正式确定!国安续约2大主力,太子再获2年合同,现役国脚终老球队

正式确定!国安续约2大主力,太子再获2年合同,现役国脚终老球队

体坛鉴春秋
2025-11-18 11:34:14
中国地铁,开始“断供”了!多地地铁申报被拒,债务风险亮红灯

中国地铁,开始“断供”了!多地地铁申报被拒,债务风险亮红灯

青梅侃史啊
2025-11-15 19:43:15
蔡崇信的“第一把火”——“阿里版顺丰”,静悄悄地撤退了

蔡崇信的“第一把火”——“阿里版顺丰”,静悄悄地撤退了

新商业派
2025-11-17 11:21:45
网传电商开始补税,有公司被要求补税9500万

网传电商开始补税,有公司被要求补税9500万

西虹市闲话
2025-11-17 15:49:41
杨亚洲大儿子一句话:“搬出去住”,倪萍当场落泪

杨亚洲大儿子一句话:“搬出去住”,倪萍当场落泪

青史楼兰
2025-11-18 11:56:35
“东宁忠诚伯冯锡范”这个称呼,问题有多严重?

“东宁忠诚伯冯锡范”这个称呼,问题有多严重?

名人苟或
2025-11-17 06:02:33
四川:成都市关于整治禁止三轮车的回复

四川:成都市关于整治禁止三轮车的回复

科学发掘
2025-11-18 09:02:32
南京到无锡规划地铁通联?官方回应

南京到无锡规划地铁通联?官方回应

财联社
2025-11-18 11:28:24
2025-11-18 15:11:00
焦点科技资讯
焦点科技资讯
展现科技资讯
1538文章数 7428关注度
往期回顾 全部

科技要闻

OPPO Reno15系列深评:实况封神+颜值暴击

头条要闻

高市早苗很叛逆:骑摩托玩摇滚 赢猜拳让老公跟自己姓

头条要闻

高市早苗很叛逆:骑摩托玩摇滚 赢猜拳让老公跟自己姓

体育要闻

直到退役那天,“海湾梅西”也没去欧洲踢球

娱乐要闻

曝喻恩泰离婚2年前转移走300箱茅台?

财经要闻

青云租陷兑付危机 集资与放贷的双面生意

汽车要闻

更加豪华 更加全地形 极石ADAMAS

态度原创

教育
数码
时尚
健康
本地

教育要闻

化简二次根式:看起来很难,常规考题常规方法

数码要闻

三星DDR5-5600 16GB内存韩国价格在三个月内暴涨3倍+

大风降温,就穿羊羔毛!

警惕超声报告这六大"坑"

本地新闻

这档古早综艺,怎么就成了年轻人的哆啦A梦?

无障碍浏览 进入关怀版