网易首页 > 网易号 > 正文 申请入驻

华为小艺AI竞赛Agent首战国际数学奥林匹克大赛(IMO)荣获佳绩!

0
分享至

在2025年国际数学奥林匹克竞赛(IMO)官方的特别邀请下,小艺AI竞赛Agent亮相本届全球顶尖的数学赛事。经过三天的激烈角逐,小艺AI竞赛Agent成功攻克6道难题中的5道,以34分的优异成绩摘得银牌,距离金牌分数线(35分)仅1分之差。这一历史性的突破,标志着华为AI的逻辑推理能力达到了一个新的高度。

IMO主席Gregor Dolinar教授对华为AI的表现给予了高度评价:“华为AI提交的答卷获得了34分(满分42分),这是一个了不起的成就。(The Huawei AI scripts received a grade of 34 out of 42, which is a remarkable result.)”

不止于答题:小艺AI竞赛Agent展现专家级解题艺术

与传统模型追求解题套路不同,小艺AI竞赛Agent在解题过程中展现了接近顶尖解题方式的创造力和严密性:

专家级推理能力:小艺AI竞赛Agent完美攻克第1至第4题,均获满分(7分)。其论证过程严谨、逻辑自洽、可读性强,此外在第3题中还灵活运用了“升幂定理”等技巧,展现了深厚的数学知识储备。值得说明的是第5题,评审组确认,尽管Agent因对平局情况的表述存在细微瑕疵被扣1分,但其核心思维过程已完整包含了对该情况的严谨证明。这表明,它实际上已具备了解答该题所需的全部数学能力。

闪耀的解题灵感:在第2题的证明中,小艺AI竞赛Agent精准预测并添加了唯一一个辅助点,便完成了整个复杂证明的生成。其解法之高效、思路之凝练,显著优于已知的公开解法。

接近完美的思考深度:第1题的解答思路流程完整,清晰简洁,对于n=3的情况讨论充分,归纳过程严谨;同时在第4题的解答中对所有情况讨论完备,证明的结构层级分明,易于理解。





> 对IMO竞赛感兴趣的开发者,可以前往GitHub了解小艺AI竞赛Agent完整的赛题解答,链接:https://github.com/Huawei-xiaoyi/IMO2025-solutions

技术揭秘:驱动巅峰表现的“双脑”协同架构

小艺AI竞赛Agent的卓越表现,源于其创新的“自然语言大模型 + 形式化证明”协同架构。这套系统如同一个拥有“左右脑”的数字大脑,将人类的直觉创造与机

器的严谨验证无缝融合。

1、思维风暴与“AI同行评审”:孕育创造性解法

面对难题,小艺AI竞赛Agent首先通过并行采样生成海量、多样化的解题思路,如同进行一场“思维风暴”。随后,启动独特的“AI同行评审”机制,让不同的AI模型互相审阅、辩论、评分,从而筛选出最优的思路路径。这一过程还会融合形式化证明的反馈,指导AI模型进行多轮自我修复与迭代优化,极大提升了模型攻克精英级难题的创造力。

2、迭代式多层级证明:构建严密的逻辑闭环

为克服高复杂度数学证明严谨性的挑战,华为小艺团队设计了迭代式多层级并行证明系统。该系统首先将复杂的证明目标分解为树状的多层级子问题,然后由形式化证明模型自下而上地对每个子节点进行大规模并行验证。一旦某个环节证明失败,具备反思和自我修正能力的模型将立刻启动修复流程,直至整个逻辑链条完美闭环。

里程碑与新起点:共探AI与教育的未来

此次赛事的成果,不仅是华为AI发展的重要里程碑,更充分地证明了基于大语言模型(LLM)的多Agent协同系统在解决高阶数学问题上的强大潜力。

与此同时华为小艺团队也意识到,当前系统在面对极高复杂度的数学问题时(如本届IMO第6题)仍有局限,未来将会继续提升小艺的抽象推理与问题建模能力,持续向高阶数学推理探索。

据悉,小艺AI竞赛Agent的核心能力,未来将逐步赋能于小艺教育Agent。华为小艺团队或将以白名单机制,优先向数学及AI领域的专业研究者开放,旨在共同推动智能解题方法论的创新,让顶级的思维能力普惠每一位学习者。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
长治反杀案反转!通话记录硬证曝光,三大漏洞印证正当防卫

长治反杀案反转!通话记录硬证曝光,三大漏洞印证正当防卫

花小猫的美食日常
2025-11-18 08:26:07
泰王不懂妻美!和苏提达王后参观北京航天城,对其使眼神表情严肃

泰王不懂妻美!和苏提达王后参观北京航天城,对其使眼神表情严肃

夜深爱杂谈
2025-11-17 20:54:37
詹姆斯正式回归湖人:我的肺感觉像新生儿 两年前也曾坐骨神经痛

詹姆斯正式回归湖人:我的肺感觉像新生儿 两年前也曾坐骨神经痛

罗说NBA
2025-11-18 06:26:45
知名平台人去楼空,涉案金额或超亿元,CEO被带走

知名平台人去楼空,涉案金额或超亿元,CEO被带走

21世纪经济报道
2025-11-18 09:57:42
德国6-0复仇!5连胜夺头名+直通2026世界杯 萨内双响 维尔茨2助攻

德国6-0复仇!5连胜夺头名+直通2026世界杯 萨内双响 维尔茨2助攻

侃球熊弟
2025-11-18 04:54:27
暂停!“感受到中方态度的严厉”

暂停!“感受到中方态度的严厉”

观察者网
2025-11-18 10:04:03
不要兴奋,打不起来

不要兴奋,打不起来

难得君
2025-11-17 09:10:27
江苏一市纪委监委通报:庄兆东被查,涉嫌严重违纪违法

江苏一市纪委监委通报:庄兆东被查,涉嫌严重违纪违法

鲁中晨报
2025-11-17 19:16:03
21+9+3+3!杨瀚森G联盟大爆发!斯普利特针对杨瀚森 极可能3大改

21+9+3+3!杨瀚森G联盟大爆发!斯普利特针对杨瀚森 极可能3大改

郝小小看体育
2025-11-17 11:51:42
贾跃亭正加速清偿中国法下的债务,「下周回国」又提上日程了!

贾跃亭正加速清偿中国法下的债务,「下周回国」又提上日程了!

雷科技
2025-11-17 16:05:48
1.5万亿美元,“打水漂”了

1.5万亿美元,“打水漂”了

中国新闻周刊
2025-11-17 12:26:10
“窗帘藏酒”真相再调查 原是服务员找来空箱装喝过的酒瓶 酒店表示:员工配合调查的时间算出勤

“窗帘藏酒”真相再调查 原是服务员找来空箱装喝过的酒瓶 酒店表示:员工配合调查的时间算出勤

扬子晚报
2025-11-17 22:06:24
许绍雄追悼会,选了3张照片!成龙古天乐不听劝,半个娱乐圈送别

许绍雄追悼会,选了3张照片!成龙古天乐不听劝,半个娱乐圈送别

东方不败然多多
2025-11-18 08:46:58
39年后,再看因流氓案“逃往”美国的龚雪,郭德纲说的话终于应验

39年后,再看因流氓案“逃往”美国的龚雪,郭德纲说的话终于应验

白面书誏
2025-11-06 16:13:06
重大损失!李敏勇在广州突发疾病去世,年仅49岁

重大损失!李敏勇在广州突发疾病去世,年仅49岁

南方都市报
2025-11-18 11:18:22
3200亿修超级运河!中国这条1988公里水道,为何让全球紧盯不放?

3200亿修超级运河!中国这条1988公里水道,为何让全球紧盯不放?

Hi科普啦
2025-11-17 10:48:58
英超新卡塞米罗冬窗愿加盟曼联!库尼亚看好其接班,要价仅4400万

英超新卡塞米罗冬窗愿加盟曼联!库尼亚看好其接班,要价仅4400万

罗米的曼联博客
2025-11-18 10:43:38
烧一赔三!轮到广汽掀桌子,10.48万的埃安i60开卖

烧一赔三!轮到广汽掀桌子,10.48万的埃安i60开卖

超电实验室
2025-11-17 18:25:48
外卖为什么突然没单了

外卖为什么突然没单了

大嘴説
2025-11-17 11:29:20
法乌签署《天空盾牌-2025》协议,法国将向乌克兰交付100架阵风

法乌签署《天空盾牌-2025》协议,法国将向乌克兰交付100架阵风

史政先锋
2025-11-17 22:21:10
2025-11-18 13:11:00
焦点科技资讯
焦点科技资讯
展现科技资讯
1538文章数 7428关注度
往期回顾 全部

科技要闻

马斯克破防了!贝索斯62亿美金入局"实体AI"

头条要闻

超市被员工偷到倒闭 收银员给1700元商品结账仅1元

头条要闻

超市被员工偷到倒闭 收银员给1700元商品结账仅1元

体育要闻

直到退役那天,“海湾梅西”也没去欧洲踢球

娱乐要闻

曝喻恩泰离婚2年前转移走300箱茅台?

财经要闻

青云租陷兑付危机 集资与放贷的双面生意

汽车要闻

更加豪华 更加全地形 极石ADAMAS

态度原创

教育
数码
游戏
家居
手机

教育要闻

2026高考缴费今日开启!详细操作步骤来了!(附缴费清单)

数码要闻

三个月暴涨超3倍:三星16GB DDR5内存价格在韩国失控

CDPR为《赛博朋克2077》中的强尼·银手庆祝生日

家居要闻

彰显奢华 意式经典风格

手机要闻

华为新款折叠屏最新架构技术曝光

无障碍浏览 进入关怀版