网易首页 > 网易号 > 正文 申请入驻

从“解题高手”到“金牌教练” 中国AI变身奥数出题人

0
分享至

不仅能“解奥数题”,还能“出奥数题”。1月26日,国际学术期刊《自然·机器智能》发表了一项来自中国的研究成果,其中提到北京通用人工智能研究院联合北京大学心理与认知科学学院、智能学院、人工智能研究院及武汉人工智能研究院组成的科研团队,研发的“通矩模型”成为全球首个被验证能够同时完成“自主出题”与“自动解题”双重能力的通用人工智能系统。

国际数学奥林匹克竞赛(IMO)的几何题,因其对抽象推理和创造性构造的高要求,一直是检验AI智能水平的“试金石”之一。这类题目不仅要求严谨的形式逻辑推演,还要求一种类似人类灵感的创造性构造能力,例如添加巧妙的辅助线。其难度在于“组合爆炸”:每一步潜在的构造选择都会导致搜索空间呈指数级增长,传统计算方法难以应对。

2024年年初,谷歌旗下深层思维(DeepMind)研发的阿尔法几何(AlphaGeometry)系统在这一领域取得显著进展,展示了AI解决复杂几何问题的潜力,引发关注。

“它本质仍是一个依赖海量合成数据和庞大算力支撑的‘超级解题器’。”此次论文第一作者、北京通用人工智能研究院研究员张驰说,“通矩模型”系统取得的突破在于超越了以往人工智能中展现的“单一解题能力”,意味着AI不仅是一个能解题的“优等生”,还是一位能从无到有、创造出具备数学审美价值题目的“金牌教练”。

他告诉记者,选择IMO几何题作为突破口,正是因为它是衡量机器抽象推理能力的标志性挑战。它要求系统在理解抽象关系的基础上,进行复杂的逻辑链条构建,而最难的环节莫过于创造性地添加辅助元素,这正是传统AI的短板。因此,征服IMO几何题,被视为AI在逻辑推理领域取得实质性突破的关键象征。

“以往的系统,大多只学会了‘计算’,但并未理解‘美’。”张驰说,“我们的研究发现,一道优秀的奥赛几何题,往往具有一个鲜明特征,其证明过程的复杂性与难度,会显著高于题目初始图形的构建复杂度。”

与DeepMind AlphaGeometry主要依赖“大数据+大算力”的范式不同,“通矩模型”践行了一条“小数据、大任务”的创新路径。论文共同通讯作者、北京大学心理与认知科学学院助理教授朱毅鑫说:“‘小数据’并非不用数据,而是追求极致的数据利用效率。这更像人类的学习方式,孩子认识苹果,无需看遍世界上所有苹果的图片,通过少数几个样本和跨场景的推理就能掌握概念。”

在他看来,当前主流大模型训练严重依赖海量数据,如同“需要用堆积如山的煤才能把水烧开”。“通矩模型”则旨在构建一个“高效炉灶”,用少得多的“燃料”完成更复杂的“任务”。为了实现这一点,团队引入了创新的“规范化表示”技术,解决了长期困扰几何推理的“组合爆炸”难题。

能力的飞跃最终需要接受实践的检验。目前,“通矩模型”自主生成的3道原创的几何新题,已入选2024年全国中学生数学联赛(北京赛区)。这是全球范围内,人工智能生成的题目首次进入高规格的人类数学竞赛,标志着AI角色从一个被动应答的“学习者”,进化成为一个能够贡献新知识的“创作者”。

“这项研究的终极目标,始终是回归‘以人为本’。”朱毅鑫说,“发展人工智能,不是为了取代人类的思考,而是为了增强它。希望这项技术能帮助更多学生领略几何推理的乐趣与数学内在的和谐之美,培养下一代的逻辑思维与创新能力。”

来源:中国青年报

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊朗、中国和俄罗斯将举行联合海上演习

伊朗、中国和俄罗斯将举行联合海上演习

桂系007
2026-01-30 03:56:40
原来李莉就是“春晚钉子户”孙涛的老婆,难怪孙涛每年都能上春晚

原来李莉就是“春晚钉子户”孙涛的老婆,难怪孙涛每年都能上春晚

以茶带书
2026-01-29 19:19:17
黄金史诗级巨震,5500-5100-5450,2倍做空白银15%收益归零

黄金史诗级巨震,5500-5100-5450,2倍做空白银15%收益归零

金石随笔
2026-01-30 08:34:11
亚历山大30+6+8雷霆惨负森林狼 无缘追平乔丹公牛72胜纪录

亚历山大30+6+8雷霆惨负森林狼 无缘追平乔丹公牛72胜纪录

醉卧浮生
2026-01-30 13:05:12
32岁程序员猝死后续:公司邮件通报,将死因归为没体检,撇清责任

32岁程序员猝死后续:公司邮件通报,将死因归为没体检,撇清责任

王大嘴评说
2026-01-29 09:08:59
理想汽车的李想疯了

理想汽车的李想疯了

快刀财经
2026-01-29 22:14:21
东北女生晒春运“出国回家”攻略:连飞俄罗斯两地再坐船回黑龙江,比直飞还便宜

东北女生晒春运“出国回家”攻略:连飞俄罗斯两地再坐船回黑龙江,比直飞还便宜

上游新闻
2026-01-28 15:55:21
全线大跌,超22万人爆仓!刚刚,黄金、白银,直线跳水

全线大跌,超22万人爆仓!刚刚,黄金、白银,直线跳水

中国基金报
2026-01-30 09:29:21
末轮0-3出局!46岁名帅怒交辞职信:球员集体造反 执教13年第1次

末轮0-3出局!46岁名帅怒交辞职信:球员集体造反 执教13年第1次

风过乡
2026-01-30 08:03:11
挣再多钱有什么用,61岁崔培军如今的现状,给所有企业家提了醒

挣再多钱有什么用,61岁崔培军如今的现状,给所有企业家提了醒

揽星河的笔记
2026-01-29 18:52:42
美国大军逼近!特朗普发出最后通牒……伊朗:随时准备扣动扳机

美国大军逼近!特朗普发出最后通牒……伊朗:随时准备扣动扳机

新民周刊
2026-01-29 20:05:51
金晨60秒视频报价70万

金晨60秒视频报价70万

雷达财经
2026-01-29 14:50:11
谈崩了,哈梅内伊很紧张!!!

谈崩了,哈梅内伊很紧张!!!

山河路口
2026-01-29 19:17:53
山东某事业编今年的全年一次性奖金。。。

山东某事业编今年的全年一次性奖金。。。

据说无据
2026-01-30 10:54:43
直线大跳水!白银、黄金重挫8%、5%,网友:刚上车就1克亏了一百多......

直线大跳水!白银、黄金重挫8%、5%,网友:刚上车就1克亏了一百多......

扬子晚报
2026-01-30 07:24:34
从文学造诣上来看,《滕王阁序》和《岳阳楼记》,到底谁更胜一筹

从文学造诣上来看,《滕王阁序》和《岳阳楼记》,到底谁更胜一筹

铭记历史呀
2026-01-29 18:29:43
黄蜂准绝杀独行侠5连胜:弗拉格49分生涯新高 克尼佩尔34+8三分

黄蜂准绝杀独行侠5连胜:弗拉格49分生涯新高 克尼佩尔34+8三分

醉卧浮生
2026-01-30 12:20:39
曝贝克汉姆与维多利亚下最后通牒:布鲁克林不离婚,就别再回家!

曝贝克汉姆与维多利亚下最后通牒:布鲁克林不离婚,就别再回家!

可乐谈情感
2026-01-30 01:58:55
婴儿出生6天被月嫂摔至颅内出血,月子中心老板:我申请破产了,你找律师去;街道工作人员:会全程跟进

婴儿出生6天被月嫂摔至颅内出血,月子中心老板:我申请破产了,你找律师去;街道工作人员:会全程跟进

南国今报
2026-01-29 21:04:53
俄之霸权,正以肉眼可见的速度崩塌

俄之霸权,正以肉眼可见的速度崩塌

望岳
2026-01-29 20:54:25
2026-01-30 13:40:49
中国青年报 incentive-icons
中国青年报
有重大影响力的全国性综合日报
152185文章数 594126关注度
往期回顾 全部

科技要闻

单季狂赚3000亿;iPhone 17 全球卖疯了!

头条要闻

美驻华大使挑事:中方出口管制措施不合规

头条要闻

美驻华大使挑事:中方出口管制措施不合规

体育要闻

敢揍多尔特,此子必成大器?

娱乐要闻

金晨出事前 曾灵魂发问未收到春晚邀请

财经要闻

血铅超标工人,挡在“劳动关系”门槛外

汽车要闻

全面科技化 新款梅赛德斯-奔驰S级发布

态度原创

亲子
数码
本地
时尚
公开课

亲子要闻

“孩子掉下去了”,6天婴儿摔致颅内出血,涉事月子中心突然宣布破产要关停

数码要闻

最高省4000元!华为开启春节感恩回馈季活动,覆盖手机手表平板多品类

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

推广|| 冬天利用率超高的裙子,怎么搭都对!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版