网易首页 > 网易号 > 正文 申请入驻

复杂空间推理新SOTA,性能提升55%!中山大学新作SpatialDreamer

0
分享至


新智元报道

编辑:LRST

【新智元导读】中山大学等机构推出SpatialDreamer,通过主动心理想象和空间推理,显著提升了复杂空间任务的性能。模拟人类主动探索、想象和推理的过程,解决了现有模型在视角变换等任务中的局限,为人工智能的空间智能发展开辟了新路径。

尽管多模态大语言模型(MLLMs)在场景理解方面取得了显著进展,但在需要心理模拟的复杂空间推理任务上表现仍然有限。

现有方法多依赖于对空间数据的被动观察,缺乏人类在空间认知中特有的主动想象与动态更新内部表征的能力。

例如,在需要变换视角以判断遮挡物体位置的任务中,现有模型往往因视角单一而推理失败。

为此,来自MBZUAI与中山大学的研究团队提出了SpatialDreamer,一个基于强化学习的框架,旨在通过主动探索、视觉想象与证据融合的闭环过程,赋予MLLMs类人的空间心理模拟能力。


论文链接: https://arxiv.org/pdf/2512.07733


SpatialDreamer模拟人类的空间认知过程,构建了一个包含以下三个步骤的闭环推理流程:

1) 探索:模型根据当前场景推理出最优的自我中心动作(如「前进0.75米」或「左转45度」);

2) 想象:调用世界模型(如SVC)生成执行动作后的新视角图像;

3) 推理:整合所有累积的视觉证据,生成最终答案。

该过程使模型从「被动观察」转向「主动目标导向的想象」,实现了在内部三维环境中自主决定「去哪看、看什么、如何推理」。

为解决长序列推理任务中奖励稀疏的问题,研究团队提出了GeoPO,一种结合树状采样结构与几何一致性约束的策略优化方法:

1) 树状采样:每步采样多个动作分支,支持回溯与多路径探索;

2) 多级奖励设计:融合任务级奖励与步级奖励,提供细粒度反馈;

3) 几何惩罚机制:对冗余或冲突动作(如连续同向或反向移动)施加惩罚系数(如0.9),鼓励高效轨迹生成。

GeoPO在提升模型性能的同时,也显著加快了训练收敛速度。


为进一步引导模型学习「思考-想象-回答」的模式,构建了SpatialDreamer-SFT数据集包括单轮推理数据(single-pass) 以及反思式推理数据(reflective reasoning),其中反思式推理通过「错误注入 → 自我纠正 → 重建推理链」构建。

实验结果

研究团队在多个空间推理基准上验证了SpatialDreamer的有效性:

1) SAT:在真实与合成图像中均达到SOTA,平均准确率分别达93.9%与92.5%;

2) MindCube-Tiny:整体准确率84.9%,较基线Qwen2.5-VL-7B提升超过55%;

3) VSI-Bench:在物体计数、相对方向、路径规划等任务中全面领先,平均准确率62.2%

总结

迈向具备空间想象能力的通用智能

SpatialDreamer的意义不仅在于提升空间推理准确率,更关键的是:它证明MLLMs可以通过「想象力」增强推理能力,向人类般的空间智能迈出重要一步。

参考资料:

https://arxiv.org/pdf/2512.07733

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标,锁定新智元极速推送!


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
网友:到了东京以后,再也没学过日语

网友:到了东京以后,再也没学过日语

日本物语
2026-02-05 20:35:00
郭艾伦行程满满!虽丢了芝麻,但却捡了个大西瓜,NBA全明星不见不散

郭艾伦行程满满!虽丢了芝麻,但却捡了个大西瓜,NBA全明星不见不散

君马体育
2026-02-06 12:35:05
伊朗一队人赶到北京,关键时刻,美副总统称:我们被中国教训惨了

伊朗一队人赶到北京,关键时刻,美副总统称:我们被中国教训惨了

通鉴史智
2026-02-06 11:31:48
马筱梅说漏嘴了,难怪不让玥儿去周年祭,韩媒曝大S死因不简单

马筱梅说漏嘴了,难怪不让玥儿去周年祭,韩媒曝大S死因不简单

秋姐居
2026-02-05 09:33:52
一路走好!3天4位名人离世,车祸、中毒,死因各不相同,令人唏嘘

一路走好!3天4位名人离世,车祸、中毒,死因各不相同,令人唏嘘

林轻吟
2026-02-02 11:35:26
乌克兰:悔到肠子青,当年卖给中国三架“废铁”,今成大国重器?

乌克兰:悔到肠子青,当年卖给中国三架“废铁”,今成大国重器?

素衣读史
2026-01-26 18:51:48
罗荣桓提议由贺龙担任国防部长,毛主席闻言说道:还是让贺老总出任军委第二副主席吧

罗荣桓提议由贺龙担任国防部长,毛主席闻言说道:还是让贺老总出任军委第二副主席吧

清风鉴史
2025-12-27 19:37:17
遭父母断网后,印度3姐妹深夜跳下9楼!其父:她们极度痴迷“韩流”

遭父母断网后,印度3姐妹深夜跳下9楼!其父:她们极度痴迷“韩流”

红星新闻
2026-02-06 12:27:21
中方已被做局?澳政府通知中企,交出资产,54万吨油菜籽白买了?

中方已被做局?澳政府通知中企,交出资产,54万吨油菜籽白买了?

宝哥精彩赛事
2026-02-05 15:35:40
杨幂工作室喊话微博之夜“给个说法”,微博之夜道歉

杨幂工作室喊话微博之夜“给个说法”,微博之夜道歉

红星新闻
2026-02-06 11:22:09
南京博物院一陶俑撞脸郭德纲,院方:的确在历史馆展出

南京博物院一陶俑撞脸郭德纲,院方:的确在历史馆展出

上游新闻
2026-02-03 14:41:06
刘虎与巫英蛟,因写一篇自媒体文章被刑拘,是否有法可依

刘虎与巫英蛟,因写一篇自媒体文章被刑拘,是否有法可依

读鬼笔记
2026-02-06 12:20:18
40小时左右骤降21.7℃,北京“断崖式降温”,明晨更冷

40小时左右骤降21.7℃,北京“断崖式降温”,明晨更冷

新京报
2026-02-06 11:59:03
优化公务员退出机制,减少人力资源错配

优化公务员退出机制,减少人力资源错配

南方都市报
2026-02-06 07:06:36
港中大校长段崇智,默许港独学生暴行,被英国颁奖,如今怎么样?

港中大校长段崇智,默许港独学生暴行,被英国颁奖,如今怎么样?

鬼菜生活
2026-02-03 18:35:49
1942年,日军集结36万精锐死磕四川,眼看重庆不保,裕仁为何突然尖叫“停”?

1942年,日军集结36万精锐死磕四川,眼看重庆不保,裕仁为何突然尖叫“停”?

老杉说历史
2026-01-08 21:32:13
吴君如很早就说过了,陈妍希私下就是这样穿

吴君如很早就说过了,陈妍希私下就是这样穿

八星人
2026-01-21 15:14:26
钠电上车!长安宁德时代推出全球首款量产乘用车

钠电上车!长安宁德时代推出全球首款量产乘用车

中国能源网
2026-02-06 12:26:06
iPhone 18 Pro九月震撼登场!苹果憋出终极大招

iPhone 18 Pro九月震撼登场!苹果憋出终极大招

小兔子发现大事情
2026-02-05 18:10:33
上海炒股大赛冠军的箴言:如果手里只有10万,不妨死磕"七大口诀"

上海炒股大赛冠军的箴言:如果手里只有10万,不妨死磕"七大口诀"

一方聊市
2026-01-19 13:13:48
2026-02-06 13:20:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14489文章数 66590关注度
往期回顾 全部

科技要闻

微信封禁元宝红包后,又把阿里千问封了

头条要闻

媒体:损失惨重 在台湾问题上碰瓷的立陶宛"知道错了"

头条要闻

媒体:损失惨重 在台湾问题上碰瓷的立陶宛"知道错了"

体育要闻

西甲射手榜第2,身价不到姆巴佩1/40

娱乐要闻

微博之夜红毯好精彩,堪比婚礼现场

财经要闻

很意外,美债危机要化解了

汽车要闻

标配华为乾崑解决方案 华境S完成六座满载冬测

态度原创

家居
本地
数码
旅游
教育

家居要闻

现代轻奢 温馨治愈系

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

数码要闻

英伟达DLSS 4.5六倍多帧生成与动态多帧生成特性将于4月上线

旅游要闻

推出近百场特色活动 解锁郑州航空港新春新玩法

教育要闻

换成你如何回答孩子?是像梅宇一样继续误导孩子,还是有别的方式!

无障碍浏览 进入关怀版