网易首页 > 网易号 > 正文 申请入驻

复杂空间推理新SOTA,性能提升55%!中山大学新作SpatialDreamer

0
分享至

来源:市场资讯

(来源:新智元)


新智元报道

编辑:LRST

【新智元导读】中山大学等机构推出SpatialDreamer,通过主动心理想象和空间推理,显著提升了复杂空间任务的性能。模拟人类主动探索、想象和推理的过程,解决了现有模型在视角变换等任务中的局限,为人工智能的空间智能发展开辟了新路径。

尽管多模态大语言模型(MLLMs)在场景理解方面取得了显著进展,但在需要心理模拟的复杂空间推理任务上表现仍然有限。

现有方法多依赖于对空间数据的被动观察,缺乏人类在空间认知中特有的主动想象与动态更新内部表征的能力。

例如,在需要变换视角以判断遮挡物体位置的任务中,现有模型往往因视角单一而推理失败。

为此,来自MBZUAI与中山大学的研究团队提出了SpatialDreamer,一个基于强化学习的框架,旨在通过主动探索、视觉想象与证据融合的闭环过程,赋予MLLMs类人的空间心理模拟能力。


论文链接: https://arxiv.org/pdf/2512.07733


SpatialDreamer模拟人类的空间认知过程,构建了一个包含以下三个步骤的闭环推理流程:

1) 探索:模型根据当前场景推理出最优的自我中心动作(如「前进0.75米」或「左转45度」);

2) 想象:调用世界模型(如SVC)生成执行动作后的新视角图像;

3) 推理:整合所有累积的视觉证据,生成最终答案。

该过程使模型从「被动观察」转向「主动目标导向的想象」,实现了在内部三维环境中自主决定「去哪看、看什么、如何推理」。

为解决长序列推理任务中奖励稀疏的问题,研究团队提出了GeoPO,一种结合树状采样结构与几何一致性约束的策略优化方法:

1) 树状采样:每步采样多个动作分支,支持回溯与多路径探索;

2) 多级奖励设计:融合任务级奖励与步级奖励,提供细粒度反馈;

3) 几何惩罚机制:对冗余或冲突动作(如连续同向或反向移动)施加惩罚系数(如0.9),鼓励高效轨迹生成。

GeoPO在提升模型性能的同时,也显著加快了训练收敛速度。


为进一步引导模型学习「思考-想象-回答」的模式,构建了SpatialDreamer-SFT数据集包括单轮推理数据(single-pass) 以及反思式推理数据(reflective reasoning),其中反思式推理通过「错误注入 → 自我纠正 → 重建推理链」构建。

实验结果

研究团队在多个空间推理基准上验证了SpatialDreamer的有效性:

1) SAT:在真实与合成图像中均达到SOTA,平均准确率分别达93.9%与92.5%;

2) MindCube-Tiny:整体准确率84.9%,较基线Qwen2.5-VL-7B提升超过55%;

3) VSI-Bench:在物体计数、相对方向、路径规划等任务中全面领先,平均准确率62.2%

总结

迈向具备空间想象能力的通用智能

SpatialDreamer的意义不仅在于提升空间推理准确率,更关键的是:它证明MLLMs可以通过「想象力」增强推理能力,向人类般的空间智能迈出重要一步。

参考资料:

https://arxiv.org/pdf/2512.07733

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标,锁定新智元极速推送!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
24胜1负!18胜13负!NBA最危险球队诞生,不夺冠就该提前解体了

24胜1负!18胜13负!NBA最危险球队诞生,不夺冠就该提前解体了

世界体育圈
2026-02-15 00:25:09
最低3℃!强冷空气明天到货!深圳春节天气……

最低3℃!强冷空气明天到货!深圳春节天气……

深圳晚报
2026-02-15 09:18:10
王毅会见挪威外交大臣艾德

王毅会见挪威外交大臣艾德

界面新闻
2026-02-15 09:33:12
李保田:我一生不接广告,不和张国立、王刚合作,不参加儿子婚礼

李保田:我一生不接广告,不和张国立、王刚合作,不参加儿子婚礼

小熊侃史
2026-02-15 07:25:11
丈夫破产负债10亿妻子卖珠宝帮还债,“反正钱都是你赚回来的,你去哪我就跟去哪,你别扔掉我就可以了”

丈夫破产负债10亿妻子卖珠宝帮还债,“反正钱都是你赚回来的,你去哪我就跟去哪,你别扔掉我就可以了”

观威海
2026-02-15 09:46:04
尤文巨头主帅彻底破防!集体围攻裁判 混乱一幕托出齐沃的睿智

尤文巨头主帅彻底破防!集体围攻裁判 混乱一幕托出齐沃的睿智

国际足球冷雪
2026-02-15 08:10:07
光线传媒:公司参与的影片《飞驰人生3》《惊蛰无声》《熊猫计划之部落奇遇记》已定于2026年大年初一上映

光线传媒:公司参与的影片《飞驰人生3》《惊蛰无声》《熊猫计划之部落奇遇记》已定于2026年大年初一上映

证券之星
2026-02-12 19:35:58
“高中女孩”与“职高女孩”的对比图火了,家长直言:差距太大了

“高中女孩”与“职高女孩”的对比图火了,家长直言:差距太大了

妍妍教育日记
2026-01-25 07:50:03
Seedance一骑绝尘背后:中国AI春节前为何“杀疯了”?

Seedance一骑绝尘背后:中国AI春节前为何“杀疯了”?

澎湃新闻
2026-02-15 07:50:28
中国重金打造游泳赛事,美国媒体:这些钱是我们所能提供的十多倍

中国重金打造游泳赛事,美国媒体:这些钱是我们所能提供的十多倍

杨华评论
2026-02-14 19:00:38
约翰逊夺冠!史上最无聊的扣篮大赛!NBA全明星沦为鸡肋

约翰逊夺冠!史上最无聊的扣篮大赛!NBA全明星沦为鸡肋

篮球教学论坛
2026-02-15 09:35:41
杨颖携小海绵返沪过年!全身奢侈品价值超15万,手腕佩戴满金手链

杨颖携小海绵返沪过年!全身奢侈品价值超15万,手腕佩戴满金手链

一盅情怀
2026-02-14 18:46:40
5年了,第一批在鹤岗买房的年轻人:房子2万,工资2000,后悔了

5年了,第一批在鹤岗买房的年轻人:房子2万,工资2000,后悔了

财叔
2025-11-14 17:03:10
意甲3-2大战!国米90分钟绝杀10人尤文!豪取6连胜,领先米兰8分

意甲3-2大战!国米90分钟绝杀10人尤文!豪取6连胜,领先米兰8分

球叮足球
2026-02-15 09:18:13
旦增,被双开!他理想信仰崩塌,求神拜佛搞迷信活动,顶风违纪,收受巨额财物,半年前主动投案

旦增,被双开!他理想信仰崩塌,求神拜佛搞迷信活动,顶风违纪,收受巨额财物,半年前主动投案

每日经济新闻
2025-10-09 15:44:18
诺尔高:希望球队能在足总杯中走得更远,若能再进决赛将不可思议

诺尔高:希望球队能在足总杯中走得更远,若能再进决赛将不可思议

云隐南山
2026-02-15 09:45:26
平均每人负债1300万,书记吴仁宝去世10年后,华西村的现况如何?

平均每人负债1300万,书记吴仁宝去世10年后,华西村的现况如何?

哄动一时啊
2026-01-24 21:29:54
马云预言应验了?未来5年,把存款换成4个资产,或将衣食无忧?

马云预言应验了?未来5年,把存款换成4个资产,或将衣食无忧?

璀璨幻行者
2026-01-31 18:59:25
128%效率炸裂!王思雨激活张子宇,女篮内线悬念揭晓

128%效率炸裂!王思雨激活张子宇,女篮内线悬念揭晓

卿子书
2026-02-15 08:37:26
戴笠随意处置国军高官?别被电视剧骗了!他连为何应钦站岗都不配

戴笠随意处置国军高官?别被电视剧骗了!他连为何应钦站岗都不配

鹤羽说个事
2026-01-30 10:46:27
2026-02-15 10:20:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2221414文章数 5480关注度
往期回顾 全部

科技要闻

字节跳动官宣豆包大模型今日进入2.0阶段

头条要闻

牛弹琴:鲁比奥演讲获热烈掌声 欧洲人又被美国忽悠了

头条要闻

牛弹琴:鲁比奥演讲获热烈掌声 欧洲人又被美国忽悠了

体育要闻

最戏剧性的花滑男单,冠军为什么是他?

娱乐要闻

春晚第五次联排路透 明星积极饭撒互动

财经要闻

谁在掌控你的胃?起底百亿"飘香剂"江湖

汽车要闻

星光730新春促销开启 80天销量破2.6万台

态度原创

本地
游戏
教育
时尚
军事航空

本地新闻

下一站是嘉禾望岗,请各位乘客做好哭泣准备

逆水寒新春版本、延期一个月的年度大更,谁才是春节档赢家

教育要闻

5747是哪个学校?揭秘成都文理学院代码

推广中奖名单-更新至2026年2月3日推广

军事要闻

钓鱼岛、黄岩岛、仁爱礁已充满中国年味

无障碍浏览 进入关怀版