网易首页 > 网易号 > 正文 申请入驻

102分!AI首战中学奥赛拿下金牌,离超越人类已经不远?

0
分享至

在刚刚落幕的2025年全国中学生数学奥林匹克竞赛(CMO)决赛中,除了涌现出一批数学天赋出众的年轻选手,还有一个特殊的“考生”引人注目——AI大模型。

CMO是中国最高规格的数学奥林匹克竞赛,今年,主办方首次设立AI测试环节,邀请大模型与人类同场答题,并交由相同的评委专家组阅卷打分。上海人工智能实验室旗下的书生科学多模态大模型(Intern-S1-20251122)拿到102分。

据公开信息,今年CMO考生前三名得分分别为126(满分)、110分、102分,Intern-S1取得的成绩位列总分榜第三,在AI中排名第一。


本届CMO共有700余名选手参赛,223人获得金牌,前60名选手获得清华北大保送资格并入选国家集训队。AI目前虽未超越人类选手最高分,但其表现已远超大多数参赛者,甚至超过了许多金牌得主,本次金牌线为78分。

“AI在奥赛中超越人类是未来一定会发生的事。”上海人工智能实验室青年领军科学家陈恺对第一财经表示。他认为,正如AlphaGo最终战胜世界围棋冠军,AI在数学竞赛上的进步也是一个逐步发展的过程。现在AI已经能拿奥赛金牌了,未来超过奥赛顶尖的人类选手也大有可能。

“数学是推理能力的代表性领域,也是目前很多大模型团队重点投入优化的方向之一,因此进展相对更快。”不过,陈恺强调,奥赛只是数学里的一个任务,因此AI在奥赛中超过人类,并不意味着AI在数学或更广泛的能力上就能超过人。

“数学是个很宽泛深奥的领域,也有很多前沿的研究,在这方面AI还要更长的时间积累。”陈恺补充道。

中国人民大学附属中学教师、奥数金牌教练张端阳也是AI训练的“顾问”,在接触之初他对大模型的印象还停留在只能解答数学高考题的水平,大模型在CMO的表现,也让他惊讶于AI发展的速度之快,“就像 10 年前的围棋一样,突破可能就是一刹那。”

上海人工智能实验室发布的文章提到,此次Intern-S1 推理能力的提升得益于“通专融合”技术架构 SAGE(中文含义为智者),创新点在于以数学引理为核心的多轮分层推理机制,以及基于结果的过程校验模型,显著提升了模型在超长程思考和证明时的严谨,还有通用模型结合专业符号引擎,让通用模型掌握像人类科学家一样逐步推导、探索和修正的思路。

AI在数学和推理领域的突破意味着什么?陈恺认为,这对教育和科研领域的落地都会很有帮助,此外,数学能力也是复杂推理等各种能力的基础,因此这一能力的提升和演进能进一步帮助大模型提升智力水平。

让大模型辅助教育学习是已经在落地的方向之一,AI可以给出解答和思考过程。而AI在奥数能够拿金牌、达到人类第三的水平,就意味着在高中数学或者K12教育领域,AI的辅导能力更强了。此外,在科研方面,陈恺提到,有一些数学家已经在用大模型在其科研过程中帮助做一些定理证明、开阔思路。

对于这次Intern-S1的答卷,有阅卷专家认为,AI对第四题的解答是“一个新的解法,巧妙的调整法,在学生的解法中没有见过”。这意味着AI能突破人类解题思路局限,通过自主探索和分析找到新的解题方法,这对赋能科学发现有很大的意义。

上海人工智能实验室在官方发文中表示,计划将 Intern-S1 的长程推理能力拓展应用于物理、化学、生命科学等基础科研领域,通过与专业工具的打通与融合,实现从“长时间独立思考”向“长时间独立科研”转变,进而加速各领域科研范式的变革,为科学突破提供支撑。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
京沪高铁宣布,涨价!

京沪高铁宣布,涨价!

中国基金报
2026-05-11 19:58:07
《主角》主角差评如潮,出场十几秒,网友评价:双眼无神像瞎子

《主角》主角差评如潮,出场十几秒,网友评价:双眼无神像瞎子

剧芒芒
2026-05-11 12:21:15
女子因18元奶茶被亲姐拉黑,崩溃大哭:离婚带娃5年,都看不起我

女子因18元奶茶被亲姐拉黑,崩溃大哭:离婚带娃5年,都看不起我

辣媒专栏记录
2026-05-11 08:21:59
广东省为什么建好了深中通道,还要继续建设穗深通道呢?

广东省为什么建好了深中通道,还要继续建设穗深通道呢?

王姐懒人家常菜
2026-05-12 12:07:31
微信点一下“+”号,你被谁删了瞬间现形!

微信点一下“+”号,你被谁删了瞬间现形!

呼呼历史论
2026-05-12 07:55:47
合租女同事对我不避嫌,那晚进了她房间,我彻底醒悟

合租女同事对我不避嫌,那晚进了她房间,我彻底醒悟

雾岛夜话
2026-05-11 12:00:02
麻省理工发现:唤醒孩子自律最快的方法,竟是飞轮效应!

麻省理工发现:唤醒孩子自律最快的方法,竟是飞轮效应!

户外阿毽
2026-05-10 19:24:43
《主角》女演员:秦海璐脸不僵了,王晓晨变嫩了,王丽坤赢麻了

《主角》女演员:秦海璐脸不僵了,王晓晨变嫩了,王丽坤赢麻了

喵喵娱乐团
2026-05-11 16:47:23
摩根士丹利报告:中国正在调整经济底层逻辑,未来10年的机会在哪里?

摩根士丹利报告:中国正在调整经济底层逻辑,未来10年的机会在哪里?

新浪财经
2026-05-12 03:30:51
李连杰发文谈与利智婚姻现状:在家穿情侣T恤,打乒乓球不争输赢

李连杰发文谈与利智婚姻现状:在家穿情侣T恤,打乒乓球不争输赢

开开森森
2026-05-11 22:25:59
刘三姐“全裸演出”引争议,张艺谋惹怒全网

刘三姐“全裸演出”引争议,张艺谋惹怒全网

李东阳朋友圈
2026-05-10 12:12:45
多地市委书记调整

多地市委书记调整

上海法治声音
2026-05-11 15:46:11
人类全部的政治困境,都在这场会议里

人类全部的政治困境,都在这场会议里

尚曦读史
2026-05-11 07:04:06
尚格云顿这部科幻片,悄悄孵化了一部被遗忘的1997年美剧

尚格云顿这部科幻片,悄悄孵化了一部被遗忘的1997年美剧

追星雷达站
2026-05-11 11:41:27
罕见服软!张本智和赛后公开致歉,坦言日乒与国乒差距悬殊!

罕见服软!张本智和赛后公开致歉,坦言日乒与国乒差距悬殊!

田先生篮球
2026-05-11 12:40:12
俄乌战场“最破防”的,从来不是士兵,而是中国炮兵专家?

俄乌战场“最破防”的,从来不是士兵,而是中国炮兵专家?

阿器谈史
2026-05-10 04:07:48
匈牙利这波转向,让美俄很恼火!!!

匈牙利这波转向,让美俄很恼火!!!

山河路口
2026-05-11 23:55:18
《主角》口碑井喷,本是冲着张嘉益刘浩存来的,却被48岁女配惊艳

《主角》口碑井喷,本是冲着张嘉益刘浩存来的,却被48岁女配惊艳

冷紫葉
2026-05-11 23:11:14
人未来,车先到!北京街头疑似特朗普车队现身

人未来,车先到!北京街头疑似特朗普车队现身

阿龙聊军事
2026-05-11 19:59:00
美国最大金库被偷了?

美国最大金库被偷了?

每日经济新闻
2026-05-12 09:06:29
2026-05-12 14:20:49
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
252863文章数 622298关注度
往期回顾 全部

科技要闻

纳德拉法庭爆料:拒当“AI时代的IBM”

头条要闻

特朗普访华企业团名单披露:马斯克在列 没有黄仁勋

头条要闻

特朗普访华企业团名单披露:马斯克在列 没有黄仁勋

体育要闻

梁靖崑:可能是最后一届了,想让大家记住这个我

娱乐要闻

刘涛晒妈祖诞辰活动照 评论区变许愿池

财经要闻

特朗普要来了,我们且淡定

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

本地
时尚
艺术
旅游
公开课

本地新闻

用苏绣的方式,打开江西婺源

推广|| 你们都想要的绝美白衬衫,链接来了!

艺术要闻

这位画家的油画美人让人惊叹不已!

旅游要闻

【文旅中国快报05.12】首届中国新文创市集来了;自由自在响沙湾的风吹到了莫干山

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版