网易首页 > 网易号 > 正文 申请入驻

华中科技大学团队新发现:让AI像空间几何学家一样思考

0
分享至

你有没有过这种经历?问智能音箱“客厅茶几上的钥匙在哪”,它支支吾吾说不出;看AI机器人打扫卫生,明明前方有个拖鞋,它却直愣愣撞过去——不是这些AI不够聪明,而是它们缺了项 “基本功”:空间感。

最近,华中科技大学连世杰、吴长提团队联合中关村研究院、华东师大,在arXiv 平台(论文编号:arXiv:2509.24473v2)发表了个有趣发现:让AI像中学生一样解几何题,居然能帮它快速补上“空间感” 短板,从此判断 “杯子比碗小”“从卧室到门口该走哪条路”都准多了。

一、先搞懂:AI为啥连“小学生题”都犯难?

咱们随便一个人,闭着眼都能摸回自己的床——这背后是多年积累的空间判断能力:知道床的位置、房间的大小,甚至能预判走路时会不会碰到衣柜。但对现在能看能说的多模态AI来说,这点“本事”却特别难。

团队做过测试:给AI看正方体展开图,问它“折叠后哪两个面相对”,正确率不到30%;让它算“桌子和椅子的实际距离”,误差能差出半米——就像没学过几何的孩子,面对“怎么拼魔方”“怎么叠被子” 这类需要空间思维的事,根本摸不着头绪。

“既然人类学几何能练空间感,AI为啥不行?” 团队灵光一闪:几何学本身就是“空间规律说明书”啊!平行线永远不相交、圆柱侧面展开是长方形…… 这些课本里的知识,本质上是在总结现实世界的空间逻辑。就像学了乐理能更好地唱歌,AI 学了几何,或许也能掌握理解三维世界的 “通用公式”。

二、给AI编“几何练习册”:补全29695道题的 “短板”

想让 AI 学几何,先得有本好“练习册”。可团队翻遍现有数据集发现一个大问题:平面几何题倒有2万道,但立体几何题只有7000道——要知道,立体几何才是练三维空间感的关键,就像学游泳不能只练憋气,还得练划水和换气。

为了补上这个缺口,团队开始 “编教材”:

第一步,“找题”:从开源的Geometry3K、SolidGeo数据集里挑高质量题,再从中小学课本、数学竞赛题里新挖了4500道题,重点加立体几何 —— 比如 “圆锥怎么切能得到三角形”“长方体的表面积怎么算” 这类直接关联三维空间的题目。

第二步,“三道质检关”:

  1. 去重:用图像识别技术比对题目,把“换了个数字但题型一样”的重复题删掉,避免AI“刷题刷重复”;
  2. 拆题:把“求长方体体积和表面积”这种“一题两问” 的复合题拆开,让 AI 一次只练一个技能,不会混淆;
  3. 统一答案格式:把所有公式转成LaTeX格式(比如“2πr”和“2rπ”,系统能认出是同一个答案),不会因为写法不同误判AI答错。

最后一步:这本包含29695道题的“几何练习册”——Euclid30K数据集就成了AI 的专属教材,从初中的“三角形内角和”到高中的“球的体积”,覆盖了所有和空间思维相关的几何知识点。

三、教AI“刷题”:不用死记硬背,用 “闯关奖励” 练本事

有了教材,怎么教才管用?团队没让 AI 死记硬背答案(这是传统的 “监督学习”,遇到新题就懵),而是用了 “强化学习”——就像玩闯关游戏:答对一题给 “加分”,答错了就分析 “错在哪”,调整思路再试,慢慢找到解题规律。

这套训练有两个 “人性化设计”:

  • 判分不 “死板”:如果答案是公式(比如 “圆面积=πr²”),就用数学工具查 “是否等价”,哪怕AI写成 “r²π”,只要数学上对,就给分;如果是数字(比如 “体积 = 20立方厘米”),必须误差小于1%才算对,避免AI“蒙答案”。
  • 多模型 “一起练”:团队选了Qwen2.5VL(3B、7B、72B参数)和RoboBrain2.0(7B、32B参数)两个系列的 AI,在64个GPU上同时训练,每道题让AI出 8 个候选答案,选最优的来优化解题策略——就像几个学生一起做题,互相 “借鉴” 好思路。

练完近3万道题后,AI的变化很明显:之前连“正方体展开图”都认不准,现在不仅能解复杂几何题,面对现实中的空间问题也“有思路”了。

四、AI的“期末考试”:四个测试,成绩提升超明显

团队找了4套“空间考题” 给AI做“期末考试”,结果超出预期:

1. 真实场景 “应用题”(VSI-Bench)

5130个视频题,比如 “视频里有几张椅子”“从门口到餐桌该走哪条路”——这是最贴近生活的测试。

  • 所有模型平均准确率从34.5%升到40.5%;
  • 其中RoboBrain2.0-Euclid-7B冲到49.6%,超过了专门练空间推理的Spatial-MLLM(48.4%),甚至比商业模型Gemini-1.5 Pro(48.8%)还高。

2. 2D 图形 “基础题”(Super-CLEVR)

5000 道题,比如 “图里蓝色圆柱体有几个”“哪个方块在最上面”。

  • RoboBrain2.0-7B 的准确率从47.4%直接跳到85.2%,提升了37.8个百分点 ——差不多是从 “刚及格” 到 “接近满分” 的跨度。

3. 3D物体 “判断题”(Omni3D-Bench)

500道题,比如“两个盒子谁更大”“球离桌子有多远”。

  • Qwen2.5VL-7B从28.3%升到31.1%,对三维物体的大小、距离判断更准了——之前可能把“大箱子”认成“小盒子”,现在很少出错。

4. 动态视角 “难题”(MindCube)

考AI “视角变化”:比如 “相机绕着杯子转,下一秒看到的画面是什么样”。

  • 小参数的Qwen2.5VL-3B准确率达38.9%,超过了用12万条空间数据训练的Spatial-MLLM(32.1%)——要知道,Euclid30K才3万道题,性价比超高。

更关键的是对比实验:团队用同样多的 “空间专项数据” 训练AI,效果远不如学几何——这说明几何教给AI的是 “通用空间思维”,不是死记硬背某类题。

五、为啥学几何这么管用?三个“底层原因”
  1. 练的是 “综合基本功”:解一道立体几何题,AI得先认“这是正方体还是圆锥”(形状识别),再想 “哪个面和哪个面平行”(空间关系推理),最后算 “体积是多少”(数值计算)——就像练跑步时同时练耐力、步频、呼吸,一次能补多个短板。
  2. 知识能 “举一反三”:几何里的“比例”“相似”“平行”,在现实里处处能用:判断 “两条马路是否平行” 用得上 “平行线定理”,比较 “两个瓶子大小” 用得上 “相似图形”——AI学会了几何,遇到这些现实问题自然能 “套用知识”。
  3. 补了 “理论短板”:像RoboBrain2.0这类 AI,之前学过不少空间数据(比如 “桌子是方的”“球是圆的”),但没学过几何规律——就像会骑自行车却不懂 “平衡原理”,遇到新路况(比如窄路)就容易摔。几何正好帮它补了 “理论基础”,让空间判断更稳。

当然,这方法也有不足:几何讲的是“静态空间”,如果遇到 “判断杯子从桌子上掉下来的轨迹” 这类涉及时间的题,AI提升就不大——未来还得把几何训练和“时间推理” 结合起来。

六、AI 变 “空间高手”,能帮我们做啥?

这项研究不只是实验室里的突破,很快就能落地到生活里:

  • 家庭机器人更 “聪明”:学过几何的扫地机器人,能准确绕开沙发腿、拖鞋,不会再把杯子撞翻;找东西时,能根据 “遥控器在茶几左边”“在书本下面” 这类空间描述精准定位。
  • 自动驾驶更安全:汽车能更准判断 “和前车的距离”“行人会不会走到车前方”,遇到路口转弯时,也能更好预判 “旁边车道的车会不会并线”。
  • VR/AR体验更真实:玩VR游戏时,虚拟的“桌子”不会再“穿”过现实的墙;用AR导航时,手机里显示的 “左转5米” 能和实际路线完全对齐,不会再 “指错路”。
  • 数学辅导更精准:AI 能更懂学生解几何题的难点——比如 “不会找三角形的高”“算错圆锥体积”,然后针对性讲 “怎么画高”“为什么体积公式是1/3πr²h”,比单纯给答案管用。

更划算的是,不用为每个场景单独训练AI——一次学几何,多个空间任务都能提升,大大降低了AI开发的成本。

2000多年前,欧几里得写下《几何原本》,用几条公理总结了空间规律;今天,这套古老的知识成了AI理解三维世界的 “钥匙”。华中科大团队的研究告诉我们:有时候,解决复杂AI问题的办法,就藏在我们中学课本里。现在的 AI,空间感还只相当于“小学生水平”,未来要学的还有很多——比如结合时间理解 “物体怎么运动”,结合物理知识理解“杯子掉下来会碎”。如果你想看看 AI 是怎么解几何题的,可以精读一下这篇论文

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
28岁女歌星整容成瘾!缺钱整容自己动手:脸上注射香油和水泥!

28岁女歌星整容成瘾!缺钱整容自己动手:脸上注射香油和水泥!

莫地方
2026-05-22 01:45:03
马办风波有望平息?胡志强发声:马英九身边这人能解决!

马办风波有望平息?胡志强发声:马英九身边这人能解决!

天气观察站
2026-06-01 20:08:20
9岁儿童吃针筒糖误吸配件窒息死亡 食品公司被判承担60%赔偿责任

9岁儿童吃针筒糖误吸配件窒息死亡 食品公司被判承担60%赔偿责任

闪电新闻
2026-06-02 15:44:59
48岁男子每天坚持不吃晚饭,半年后体检,血糖和体重情况出乎意料

48岁男子每天坚持不吃晚饭,半年后体检,血糖和体重情况出乎意料

医学原创故事会
2026-05-24 23:59:03
冲着颜值和肉体,看完了这部Starz美剧

冲着颜值和肉体,看完了这部Starz美剧

i书与房
2026-06-02 11:39:07
父母不在了,这两种亲戚无需再走动:不是冷漠,是彻底清醒

父母不在了,这两种亲戚无需再走动:不是冷漠,是彻底清醒

心理观察局
2026-05-28 06:49:09
人口告别世界第一?二孩催生无效后,国家终于向住房方面动真格了

人口告别世界第一?二孩催生无效后,国家终于向住房方面动真格了

潮鹿逐梦
2026-06-01 22:43:07
研究表明:性生活次数不达标,不管男女容易早衰且癌症风险增高!

研究表明:性生活次数不达标,不管男女容易早衰且癌症风险增高!

黯泉
2026-05-03 20:25:37
探底回升 明天关注一点

探底回升 明天关注一点

趋势巡航
2026-06-02 14:51:47
美国人发现,美国近三十年来最大外交失误,可能就是阻止中国统一

美国人发现,美国近三十年来最大外交失误,可能就是阻止中国统一

流史岁月
2026-05-31 12:00:13
一盘木耳毒死7人?医生警告:木耳尽量别这样吃,比砒霜还毒

一盘木耳毒死7人?医生警告:木耳尽量别这样吃,比砒霜还毒

医学科普汇
2026-05-27 16:52:29
公司宣布破产,每人拿了7w的补偿金,就在大家收拾准备走人时,结果老板说:有个新公司谁愿意去?工资翻倍,但必须自愿放弃赔偿

公司宣布破产,每人拿了7w的补偿金,就在大家收拾准备走人时,结果老板说:有个新公司谁愿意去?工资翻倍,但必须自愿放弃赔偿

不二大叔
2026-05-31 21:25:29
我敢打赌99%的男人会选白衣服女孩做老婆,看腿型就知道

我敢打赌99%的男人会选白衣服女孩做老婆,看腿型就知道

周哥一影视
2026-06-02 09:27:09
央视三胎宣传片惹争议,脱离现实强行把孕妇塑造成超人式幸福?

央视三胎宣传片惹争议,脱离现实强行把孕妇塑造成超人式幸福?

番外行
2026-05-24 09:14:38
乌称遭俄73枚导弹656架无人机袭击 俄证实大规模空袭乌克兰

乌称遭俄73枚导弹656架无人机袭击 俄证实大规模空袭乌克兰

闪电新闻
2026-06-02 15:17:12
我爸和外人跑了20年,我买房银行却说:你爸一直在你汇款

我爸和外人跑了20年,我买房银行却说:你爸一直在你汇款

周哥一影视
2026-06-02 14:46:58
尼泊尔总理语出惊人,称尼泊尔多处侵占印度土地,引发轩然大波

尼泊尔总理语出惊人,称尼泊尔多处侵占印度土地,引发轩然大波

半身Naked
2026-06-01 18:10:23
日本杀人犯逃亡后整容,因太帅了走红,大量女粉丝为其应援求情

日本杀人犯逃亡后整容,因太帅了走红,大量女粉丝为其应援求情

莫地方
2026-05-12 00:45:03
5年最高3.01亿!太便宜了!

5年最高3.01亿!太便宜了!

篮球大图
2026-06-02 10:41:05
真相揭秘!原来俞飞鸿唯一公开过的男友,竟然是我们熟悉的他

真相揭秘!原来俞飞鸿唯一公开过的男友,竟然是我们熟悉的他

她时尚丫
2026-05-07 23:01:06
2026-06-02 16:39:00
DATAVIEW
DATAVIEW
时刻讨论和分析世界、行业、AI等热门话题,只提取高价值信息
32文章数 2关注度
往期回顾 全部

科技要闻

烧掉千亿后,美团、阿里、京东谁先止血?

头条要闻

男子离婚当晚杀害前妻逃亡17年被判死缓 检方抗诉成功

头条要闻

男子离婚当晚杀害前妻逃亡17年被判死缓 检方抗诉成功

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君补办婚礼超幸福

财经要闻

锂电“资源墙”高筑 全球性长期博弈开始

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

本地
房产
教育
家居
公开课

本地新闻

用剪纸的方式,打开江苏扬州

房产要闻

5200巨量投资曝光!未来五年,海南格局大变!

教育要闻

教育部等部门开展护航行动助力“平安高考”

家居要闻

流线型轮廓 包容多元身形

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版