网易首页 > 网易号 > 正文 申请入驻

可“解难题”也可“出好题”!中国科学家取得通用人工智能逻辑推理新突破

0
分享至

  新华社北京1月26日电(记者魏梦佳)中国科研团队近日自主研发出的一款“通矩模型”,该成果26日晚在线发表于国际权威学术期刊《自然-机器智能》。相关专家表示,这是国际首个同时具备自主出题和自动解题双重能力的通用人工智能系统,标志着中国科研团队在自动化推理的逻辑核心领域实现关键技术自研,并在性能与功能多样性上达到国际领先水平。

  据了解,长期以来,AI在逻辑推理领域面临着两大核心挑战:一是“组合爆炸”,即几何推理往往需要寻找并添加精妙的辅助线,每增加一个点或圆,搜索空间(即探索模型中所有可能的解决方案)都会呈指数级增长;二是“高质量数据匮乏”,即现有的几何题目库规模较小,难以支持大规模模型的训练。

  由北京通用人工智能研究院、北京大学心理与认知科学学院、北京大学智能学院、北京大学人工智能研究院以及北京大学武汉人工智能研究院组成的联合科研团队,通过开发一套精密的逻辑推理搜索架构,将复杂的几何世界抽象建模,使AI系统能像人类数学家一样,在逻辑推理每个节点上都能进行有序地系统性探索,避免了无效的重复尝试。

  据悉,团队创新性地引入了“规范化表示”技术。这套机制赋予了AI一种“识破伪装”的能力:在复杂的几何空间中,同一个命题往往会因为图形的旋转、翻转或缩放而产生无数种表现形式。通矩模型能自动识别并合并这些对称或同构的拓扑结构,将庞杂的搜索空间压缩了几个数量级。例如,无论一个三角形在空间中如何摆放,系统都能精准锁定其本质的几何关系。这种对物理对称性的深度利用,极大地提升了搜索效率。

  而在AI寻找解题“灵感”的过程中,系统通过价值函数来模拟人类的数学审美。借助强化学习技术,系统内置的“价值模型”能实时预判每一条推理路径的潜力——不仅判断结论是否成立,更在乎推导过程是否简洁。

  “当AI发现一个命题的证明难度显著高于其构建复杂度时,它便捕捉到了那一抹‘直觉性的灵感’。”论文第一作者、北京通用人工智能研究院研究员张驰说,这种“价值引导”能让模型从浩如烟海的空间组合中,精准捕捉到那些具备人类数学家审美标准的高质量题目,“实现了从‘模仿解题’到‘自主创造’的范式转变,这在国际上尚属首次。”


  图为团队成员正在讨论算法设计的几何问题。新华社发

  张驰介绍,通矩模型仅需单张消费级显卡即可在最多38分钟内解决2000年以来所有国际数学奥林匹克竞赛的几何难题。实验表明,其推理效率和准确率均达国际先进水平。

  论文共同通讯作者、北京大学心理与认知科学学院助理教授朱毅鑫表示,通矩模型的意义不仅在于解题速度的提升,更在于其通过模拟人类数学家的直觉和审美,实现了“小数据、大任务”的范式转化。

  “这种不依赖海量标注数据、通过内部逻辑自我演化的路径,正是通用人工智能发展的关键。我们的系统不仅能与国际最先进的AI系统对标,更在理解逻辑底层美学和自主发现科学规律方面走在了前列。”他说。

  据悉,目前,通矩模型自主生成的3道原创的几何新题,已入选2024年全国中学生数学联赛(北京赛区)。

  张驰表示,这一成果为未来自动化数学证明、个性化智能教育及科学大模型的开发提供了技术支撑,有助于为更多感兴趣的青少年提供优质题目和讲解服务。未来,团队将继续深耕通用智能模型,推动中国人工智能技术在更多复杂逻辑与科学发现领域实现领跑。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
牢A回国后,“大瓜”一个比一个劲爆,他火下去是好是坏?

牢A回国后,“大瓜”一个比一个劲爆,他火下去是好是坏?

文字里拾光
2026-01-26 19:36:46
广州一男子称电子交通卡被异常扣款一千四百多万元,工作人员:是小米钱包显示问题,并未造成实际扣款

广州一男子称电子交通卡被异常扣款一千四百多万元,工作人员:是小米钱包显示问题,并未造成实际扣款

大风新闻
2026-01-27 12:15:03
牢A为啥会突然爆红?因为他说了后半段真相!杨振宁那段话太可怕

牢A为啥会突然爆红?因为他说了后半段真相!杨振宁那段话太可怕

李健政观察
2026-01-26 16:53:00
“网红小胖”:曾参演《爱情公寓》等电视剧,如今已结婚生子,回归正常家庭生活

“网红小胖”:曾参演《爱情公寓》等电视剧,如今已结婚生子,回归正常家庭生活

大风新闻
2026-01-27 10:52:13
轮胎成为压垮电车车主的稻草,加上超高的保险费,省钱已成为笑话

轮胎成为压垮电车车主的稻草,加上超高的保险费,省钱已成为笑话

柏铭锐谈
2026-01-26 23:50:34
三色球衣成笑话 为啥NBA球队老板也不喜欢詹姆斯

三色球衣成笑话 为啥NBA球队老板也不喜欢詹姆斯

篮球小烟花
2026-01-27 08:00:03
布朗20分8篮板5助凯尔特人送开拓者连败,霍勒迪14分杨瀚森无出场

布朗20分8篮板5助凯尔特人送开拓者连败,霍勒迪14分杨瀚森无出场

湖人崛起
2026-01-27 11:39:15
传闻:霍老爷子生前将南沙财富独留长孙霍启刚,二房三房束手无策

传闻:霍老爷子生前将南沙财富独留长孙霍启刚,二房三房束手无策

卡西莫多的故事
2026-01-26 10:32:26
“牛鬼蛇神”扎堆,春晚第二次联排让人大失所望,网友们坐不住了

“牛鬼蛇神”扎堆,春晚第二次联排让人大失所望,网友们坐不住了

深析古今
2026-01-26 18:22:14
性行为缺失会促癌?华中大最新:性行为缺失会削弱抗癌免疫力,保持性行为则有利于抗癌

性行为缺失会促癌?华中大最新:性行为缺失会削弱抗癌免疫力,保持性行为则有利于抗癌

医诺维
2026-01-26 17:02:36
是什么逼的国企干部上门打人

是什么逼的国企干部上门打人

阿亮评论
2026-01-27 12:11:01
马德兴:邵佳一组织国足召开学习会,明确提出要向U23国足学习

马德兴:邵佳一组织国足召开学习会,明确提出要向U23国足学习

懂球帝
2026-01-27 11:55:12
为什么大众目前不需要担心尼帕病毒?

为什么大众目前不需要担心尼帕病毒?

阿司匹林42195米
2026-01-27 07:19:28
博晖创新推出尼帕病毒核酸检测试剂盒

博晖创新推出尼帕病毒核酸检测试剂盒

界面新闻
2026-01-27 10:44:03
舒马赫健康状况重大更新!滑雪事故13年后,车神不再卧床不起

舒马赫健康状况重大更新!滑雪事故13年后,车神不再卧床不起

全景体育V
2026-01-26 18:35:30
中央批准:省级党委常委跨省履新!近日,五个省级党委领导班子调整

中央批准:省级党委常委跨省履新!近日,五个省级党委领导班子调整

上观新闻
2026-01-26 22:42:05
航班大量取消!超市货架拿空!不少中国网友发文称滞留日本,“简直是灾难”…...

航班大量取消!超市货架拿空!不少中国网友发文称滞留日本,“简直是灾难”…...

鲁中晨报
2026-01-27 09:19:48
特朗普:开内阁会议闭眼是因为“极其无聊”,感觉自己状态和40年前一样

特朗普:开内阁会议闭眼是因为“极其无聊”,感觉自己状态和40年前一样

潇湘晨报
2026-01-27 11:47:28
退脏衣女记者全网社死!正脸很白净,坏到骨子里,山东文旅遭围攻

退脏衣女记者全网社死!正脸很白净,坏到骨子里,山东文旅遭围攻

李健政观察
2026-01-26 09:33:07
闫学晶风波终于落幕,6个男人惨遭牵连,儿媳与继女最不好过

闫学晶风波终于落幕,6个男人惨遭牵连,儿媳与继女最不好过

青橘罐头
2026-01-26 20:19:38
2026-01-27 13:35:00
新华社 incentive-icons
新华社
新华社是国家通讯社
646546文章数 2426666关注度
往期回顾 全部

科技要闻

理想开始关店“过冬”,否认“百家”规模

头条要闻

遭美国施压 卡尼:加拿大无意与中国达成自由贸易协定

头条要闻

遭美国施压 卡尼:加拿大无意与中国达成自由贸易协定

体育要闻

带着母亲遗愿战斗12年,交易添头成了队魂

娱乐要闻

张雨绮被曝代孕,春晚被拒,代言跑路

财经要闻

金价狂飙 “牛市神话”未完待续

汽车要闻

剑指小米YU7与特斯拉Model Y 问界M6要来了?

态度原创

时尚
家居
教育
艺术
数码

降温了!羽绒服这样穿显瘦又时髦

家居要闻

现代古典 中性又显韵味

教育要闻

坏孩子的杀伤力比校园霸凌更可怕,教会孩子识别身边的危险型人格

艺术要闻

日本东京国立博物馆中的100幅宋画

数码要闻

Intel高管:AMD集显竞争力不足!但没计划推Strix Halo竞品

无障碍浏览 进入关怀版