网易首页 > 网易号 > 正文 申请入驻

102分!AI首战中学奥赛拿下金牌,离超越人类已经不远?

0
分享至

在刚刚落幕的2025年全国中学生数学奥林匹克竞赛(CMO)决赛中,除了涌现出一批数学天赋出众的年轻选手,还有一个特殊的“考生”引人注目——AI大模型。

CMO是中国最高规格的数学奥林匹克竞赛,今年,主办方首次设立AI测试环节,邀请大模型与人类同场答题,并交由相同的评委专家组阅卷打分。上海人工智能实验室旗下的书生科学多模态大模型(Intern-S1-20251122)拿到102分。

据公开信息,今年CMO考生前三名得分分别为126(满分)、110分、102分,Intern-S1取得的成绩位列总分榜第三,在AI中排名第一。


本届CMO共有700余名选手参赛,223人获得金牌,前60名选手获得清华北大保送资格并入选国家集训队。AI目前虽未超越人类选手最高分,但其表现已远超大多数参赛者,甚至超过了许多金牌得主,本次金牌线为78分。

“AI在奥赛中超越人类是未来一定会发生的事。”上海人工智能实验室青年领军科学家陈恺对第一财经表示。他认为,正如AlphaGo最终战胜世界围棋冠军,AI在数学竞赛上的进步也是一个逐步发展的过程。现在AI已经能拿奥赛金牌了,未来超过奥赛顶尖的人类选手也大有可能。

“数学是推理能力的代表性领域,也是目前很多大模型团队重点投入优化的方向之一,因此进展相对更快。”不过,陈恺强调,奥赛只是数学里的一个任务,因此AI在奥赛中超过人类,并不意味着AI在数学或更广泛的能力上就能超过人。

“数学是个很宽泛深奥的领域,也有很多前沿的研究,在这方面AI还要更长的时间积累。”陈恺补充道。

中国人民大学附属中学教师、奥数金牌教练张端阳也是AI训练的“顾问”,在接触之初他对大模型的印象还停留在只能解答数学高考题的水平,大模型在CMO的表现,也让他惊讶于AI发展的速度之快,“就像 10 年前的围棋一样,突破可能就是一刹那。”

上海人工智能实验室发布的文章提到,此次Intern-S1 推理能力的提升得益于“通专融合”技术架构 SAGE(中文含义为智者),创新点在于以数学引理为核心的多轮分层推理机制,以及基于结果的过程校验模型,显著提升了模型在超长程思考和证明时的严谨,还有通用模型结合专业符号引擎,让通用模型掌握像人类科学家一样逐步推导、探索和修正的思路。

AI在数学和推理领域的突破意味着什么?陈恺认为,这对教育和科研领域的落地都会很有帮助,此外,数学能力也是复杂推理等各种能力的基础,因此这一能力的提升和演进能进一步帮助大模型提升智力水平。

让大模型辅助教育学习是已经在落地的方向之一,AI可以给出解答和思考过程。而AI在奥数能够拿金牌、达到人类第三的水平,就意味着在高中数学或者K12教育领域,AI的辅导能力更强了。此外,在科研方面,陈恺提到,有一些数学家已经在用大模型在其科研过程中帮助做一些定理证明、开阔思路。

对于这次Intern-S1的答卷,有阅卷专家认为,AI对第四题的解答是“一个新的解法,巧妙的调整法,在学生的解法中没有见过”。这意味着AI能突破人类解题思路局限,通过自主探索和分析找到新的解题方法,这对赋能科学发现有很大的意义。

上海人工智能实验室在官方发文中表示,计划将 Intern-S1 的长程推理能力拓展应用于物理、化学、生命科学等基础科研领域,通过与专业工具的打通与融合,实现从“长时间独立思考”向“长时间独立科研”转变,进而加速各领域科研范式的变革,为科学突破提供支撑。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
给女儿留过亿财产后,张雪峰身家被扒底朝天,李雪琴的话有人信了

给女儿留过亿财产后,张雪峰身家被扒底朝天,李雪琴的话有人信了

爱下厨的阿酾
2026-03-26 20:14:43
马龙刚到香港,张怡宁直接破例,这场家宴藏着体坛最真的交情

马龙刚到香港,张怡宁直接破例,这场家宴藏着体坛最真的交情

大鱼娱乐观
2026-03-25 23:45:34
你见过哪些闷声发大财的人?网友:干这个买三套房子,两个门面

你见过哪些闷声发大财的人?网友:干这个买三套房子,两个门面

夜深爱杂谈
2026-02-01 18:57:04
华人离境后人间蒸发!在新西兰买的房产竟不要了

华人离境后人间蒸发!在新西兰买的房产竟不要了

发现新西兰
2026-03-26 12:47:12
明天买不到了,今夜早点挂单吧

明天买不到了,今夜早点挂单吧

风风顺
2026-03-27 04:10:03
带孙 8 年,我终于明白,和儿子儿媳相处,最不该做的 3 件事

带孙 8 年,我终于明白,和儿子儿媳相处,最不该做的 3 件事

朗威谈星座
2026-03-26 17:49:39
断网之后,俄罗斯的普通人更快乐了!有人信吗?

断网之后,俄罗斯的普通人更快乐了!有人信吗?

走读新生
2026-03-25 10:58:41
FCC一纸禁令:60%家用路由器将被断供,你的Wi-Fi要涨价了

FCC一纸禁令:60%家用路由器将被断供,你的Wi-Fi要涨价了

赛博兰博
2026-03-25 14:31:11
儿子说接我们养老却先接岳父母住新房:我做个狠心决定,儿子慌了

儿子说接我们养老却先接岳父母住新房:我做个狠心决定,儿子慌了

奶茶麦子
2026-03-27 00:34:12
零出场10人!大连板凳藏着一支隐形军团 多名小妖去别队能打主力

零出场10人!大连板凳藏着一支隐形军团 多名小妖去别队能打主力

刀锋体育
2026-03-26 23:03:03
今年春天爆火的“Samba鞋”,百搭时髦又耐看!

今年春天爆火的“Samba鞋”,百搭时髦又耐看!

时尚穿搭生活馆
2026-03-26 22:08:27
炸锅!名宿开骂:英格兰 4 大废物不配入选,巨星落选有猫腻

炸锅!名宿开骂:英格兰 4 大废物不配入选,巨星落选有猫腻

奶盖熊本熊
2026-03-27 05:35:00
泰国U23国脚乌萨马谈红牌:中国球员先用力推我,还出言不逊

泰国U23国脚乌萨马谈红牌:中国球员先用力推我,还出言不逊

懂球帝
2026-03-26 16:09:08
巴基斯坦外长说美伊正进行间接谈判

巴基斯坦外长说美伊正进行间接谈判

新华社
2026-03-26 18:55:07
51岁男子突发心梗猝死!不想得心梗,牢记晚饭4不吃,睡前4不要!

51岁男子突发心梗猝死!不想得心梗,牢记晚饭4不吃,睡前4不要!

健康之光
2026-03-20 17:05:06
又跌了,下一轮大行情才刚刚开启!

又跌了,下一轮大行情才刚刚开启!

金投网
2026-03-26 17:26:35
这才是地球禁区!30秒毁全身细胞,剧毒万年不散,内部画面罕曝光

这才是地球禁区!30秒毁全身细胞,剧毒万年不散,内部画面罕曝光

历史的烟火
2026-03-16 17:16:46
岳云鹏现身上海,气场跟以前完全不一样了,助理当街抽烟也不避讳

岳云鹏现身上海,气场跟以前完全不一样了,助理当街抽烟也不避讳

仙味少女心
2026-03-24 16:47:29
回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

就一点
2025-11-22 10:36:39
美团:2025年营收3,648.5亿元人民币 同比增长8.1%

美团:2025年营收3,648.5亿元人民币 同比增长8.1%

财联社
2026-03-26 17:40:04
2026-03-27 06:24:49
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
248338文章数 621905关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:对伊朗能源设施空袭再推迟10天

头条要闻

特朗普:对伊朗能源设施空袭再推迟10天

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

本地
亲子
健康
数码
公开课

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

亲子要闻

试工育儿嫂被查出传染病,宝妈崩溃!家政服务“健康关”如何保障?

转头就晕的耳石症,能开车上班吗?

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版