网易首页 > 网易号 > 正文 申请入驻

初探空间智能尺度效应:商汤开源SenseNova-SI-1.3,八大空间智能榜单综合评分登顶

0
分享至


商汤科技正式开源空间智能模型日日新SenseNova-SI-1.3,在空间测量、视角转换、综合推理等核心任务中展现出显著提升,另外对比之前的版本增强了回答简答题的能力。在集成多项权威空间智能榜单的综合评测平台EASI上,SenseNova-SI-1.3综合性能超越Gemini-3-Pro,均分斩获EASI-8(八个权威空间智能榜单的混合评测)标准第一,在多个高难度空间任务(尤其是视角转换)中表现优异。


刁钻考题验证:SenseNova-SI-1.3精准突破空间智能核心难点

EASI-8包含一系列专门考察空间理解能力的高难度测试题,让Gemini-3-Pro等模型都频频踩坑。那么SenseNova-SI-1.3表现如何呢?(下列问题在测试模型时使用的原题为英文,为便于读者理解翻译为中文)。


题目要求统计两张照片中建筑模型的总数量,核心难点是理解两张图的对应关系,以此避免遮挡漏数和重复多数。图2视角下显现出图 1 中被遮挡的深灰色建筑,且部分模型在两图中重复出现。Gemini-3-Pro未完全去重,误数为 6 个;SenseNova-SI-1.3则给出 “4 个”的准确答案。


题目给出两张书房局部照片,已知 iMac 位于房间北部,询问学生写作业区域的方位。需先理解两张图片属于同一空间,再通过视觉线索拼接场景。Gemini-3-Pro误判学习区在西侧;SenseNova-SI-1.3精准定位 “西北角”,完全符合空间逻辑。


题目要求以 “未戴眼镜男士的自身视角” 判断身旁戴眼镜男士的方位,考察 “参照系转换” 能力,模型很容易以“观察者视角”来判断方向。Gemini-3-Pro就误选了 “右边”;SenseNova-SI-1.3则能正确给出 “左边” 的正确答案。


题目给出粉色瓶子前、后、左、右 4 张照片,询问图 4 角度下瓶子左边物体。这道题需整合多视角线索重构房间全局布局,再切换至目标视角判断方位 —— 第 4 张照片中瓶子左侧完全处于视觉盲区,仅能通过前 3 张图中的窗户、床、衣柜等线索还原空间关系。Gemini-3-Pro误选 “窗户和蓝色窗帘”,SenseNova-SI-1.3精准锁定正确答案 “衣柜和门”。


以双层巴士与公交站的场景为题,需避免陷入“英国巴士靠左行驶,因此靠站的是左侧”的常识陷阱,而是通过实际的视觉画面判断方位。Gemini-3-Pro误判 “左侧” 为答案;而 SenseNova-SI-1.3 则准确理解 “右侧” 为正确答案。

空间智能是极其独特的多模态能力


Core Knowledge Deficits in Multi-Modal Language Models (2025)发现视角转换任务与其它多模态任务的相关性(红框内)呈蓝色,即代表相关性较低

一篇2025年发表于机器学习顶会ICML的论文《Core Knowledge Deficits in Multi-Modal Language Models》揭示了一个有趣的发现:视角转换(Perspective)和所有传统多模态模型的能力的相关性均异常得低,这代表主流算法路径可能不是空间智能的形成的有效路径,这也解释了为什么领先的多模态大模型在空间智能相关的任务上表现不佳。


Core Knowledge Deficits in Multi-Modal Language Models (2025)发现增大模型尺寸对提升视角转换任务效果不佳

这篇论文也发现,空间智能似乎存在反尺度效应的现象:更大的模型并不能更好地解决空间智能任务。另外,在EASI的官方报告中也可以找到相似的描述,指出视角转换任务(Perspective-taking)依然是最具挑战的基础能力之一。

空间智能需要全新的学习范式。

从3D世界数据匮乏到空间智能的尺度效应


空间智能的核心——视角转换任务被拆解成了三个关键步骤:建立跨视角关联、理解视角移动、想象视角变换,并围绕着解决这三个基础能力构造大量训练数据

学术界现有数据集多着重于目标识别与场景理解,模型往往停留在图像模式匹配阶段,难以形成稳定的空间理解能力。基于这一洞察,想要解决空间智能尤其是视角转换任务,简单扩充相关数据规模是不够的。为了解决这一根本问题,我们将视角转换看作从二维视觉信息迈向三维空间关系理解的关键桥梁,并将其拆解为递进的能力阶段,由易到难、难度递增的三个任务层级(建立跨视角关联、理解视角移动、想象视角变换),并构造大量且层次分明的训练数据,使模型建立完备的空间理解能力。

同时,在数据规模持续扩大的过程中,SenseNova-SI团队挖掘并重组多视角学术数据资源,将许多过去未被充分利用的标注转化为视角转换训练数据。例如,多目关联数据集 MessyTable提供了高物体复杂度场景,其中跨视角物体一致性信息与精确的相机位姿标注,可用于训练物体对应与相机运动推理能力;而部分室内场景扫描数据如CA-1M中包含物体自身朝向标注的样本,则被用于补充模型进行视角转换与想象所需的稀缺数据。这种跨数据源的重组与再利用,使积累大量丰富而系统的空间理解数据成为可能。


空间智能的尺度效应:SenseNova-SI在视角转换任务上超越GPT-5

大规模高质量的空间智能数据在SenseNova-SI团队的手中最终验证了空间智能的尺度效应:SenseNova-SI的8B参数基模型最终超越了强闭源模型如GPT-5,而2B参数的小模型也表现不俗,在相同数据规模下,甚至超越了纽约大学的Cambrian-S和字节的VST两个7B参数的模型。


只在Ego-Exo4D上训练第一/第三人称视角匹配的模型可以大幅提升(+90.4%)在MMSI的2D迷宫导航问题上的表现

更有趣的是,团队在研究中似乎发现了一些智能涌现的先兆:一些看起来毫无关联的但也许细想之下有底层能力联系的任务可以协同发展。另外,团队也发现在视角转换任务上训练的模型也可以增强如心智重建(Mental Reconstruction)、综合空间推理(Comprehensive Reasoning)等能力。

商汤引领空间智能普惠生态

SenseNova-SI-1.3模型的升级发布背后,是商汤科技始终致力于打破技术壁垒,让顶尖空间智能技术惠及更多开发者与企业。对科研人员而言,SenseNova-SI-1.3通过在空间智能上验证数据尺度效应提供了一个与现有基座模型完全兼容,但又长于空间智能的强力预训练模型和基线(SenseNova-SI已被VSI-Bench, MMSI-Bench等权威榜单官方收录),可以直接在其之上设计创新算法或者续训,推动空间智能向人类水平迈进;对企业来说,可直接基于 SenseNova-SI-1.3快速落地应用,缩短研发周期、降低技术门槛;对普通用户而言,未来将有更多搭载先进空间智能的产品走进生活 —— 从智能家电到自动驾驶,从工业机器人到教育设备,都将更懂 “空间逻辑”、更贴合实际需求。


SenseNova-SI在具身任务上的探索了空间智能的重要性开源地址

SenseNova-SI模型家族:https://huggingface.co/collections/sensenova/sensenova-si

SenseNova-SI开源代码:https://github.com/OpenSenseNova/SenseNova-SI

Discord 社区邀请码:https://discord.gg/WBzH62bk

SenseNova-SI入群码:

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
反转!曝梅西香港行原计划出场,未登场原因曝光:球王本人不知情

反转!曝梅西香港行原计划出场,未登场原因曝光:球王本人不知情

二疯说球
2026-02-06 10:21:42
彻底摊牌了!哈登轰动NBA!主动离队原因曝光,火箭或成最大赢家

彻底摊牌了!哈登轰动NBA!主动离队原因曝光,火箭或成最大赢家

现代小青青慕慕
2026-02-05 22:10:12
广州男子因狗吠乱拉投毒致宠物狗死亡,法院最终判决

广州男子因狗吠乱拉投毒致宠物狗死亡,法院最终判决

爱下厨的阿酾
2026-02-06 17:10:03
《人民日报》:70%的病跟情绪有关!很多人被亲人给慢性折磨死的

《人民日报》:70%的病跟情绪有关!很多人被亲人给慢性折磨死的

诗词中国
2026-01-23 18:47:36
一位中国交易员重仓做空白银,账面浮盈超20亿!

一位中国交易员重仓做空白银,账面浮盈超20亿!

汇商Forexpress
2026-02-06 15:57:52
台湾统一方式或出乎意料,特朗普才发现:中国真高明,自己学不来

台湾统一方式或出乎意料,特朗普才发现:中国真高明,自己学不来

卷史
2026-01-29 16:18:40
春晚主持人官宣第一天, 尼格买提被骂冤不冤?

春晚主持人官宣第一天, 尼格买提被骂冤不冤?

娱娱娱影在线
2026-02-06 09:41:12
300169,被证监会立案!

300169,被证监会立案!

证券时报e公司
2026-02-06 19:47:08
77年邓华复出,叶剑英问他有何要求,邓华:让我老哥重回部队工作

77年邓华复出,叶剑英问他有何要求,邓华:让我老哥重回部队工作

兴趣知识
2026-02-01 08:24:57
2300吨油轮轻松拖走!中国解放军亮底牌,收拾仁爱礁破船稳了

2300吨油轮轻松拖走!中国解放军亮底牌,收拾仁爱礁破船稳了

一个有灵魂的作者
2026-02-06 20:13:31
广西壮族自治区党委副书记王维平、党委常委农生文,当选新职

广西壮族自治区党委副书记王维平、党委常委农生文,当选新职

极目新闻
2026-02-06 12:30:02
盖茨、马斯克、王室全翻车!恶魔岛曝光2000段视频,内容辣眼睛

盖茨、马斯克、王室全翻车!恶魔岛曝光2000段视频,内容辣眼睛

小鱼爱鱼乐
2026-02-05 18:34:00
离开了中国好几天,斯塔默是越想越不对劲,在国会议会上罕见发飙

离开了中国好几天,斯塔默是越想越不对劲,在国会议会上罕见发飙

墨兰史书
2026-02-06 20:25:03
早上网友看见老公挂的衣服!不由失笑:日子怎么可能和谁过都一样

早上网友看见老公挂的衣服!不由失笑:日子怎么可能和谁过都一样

另子维爱读史
2026-02-06 20:18:22
华裔二、三代为啥越来越不像中国人?餐桌与阳光能重塑东方面孔?

华裔二、三代为啥越来越不像中国人?餐桌与阳光能重塑东方面孔?

向航说
2026-02-06 00:20:03
钱再多有什么用,64岁郎平如今的现状,给所有运动员们提了个醒

钱再多有什么用,64岁郎平如今的现状,给所有运动员们提了个醒

削桐作琴
2025-12-10 16:53:18
2003年,106岁的宋美龄在美国去世,银行余额曝光令世人惊讶

2003年,106岁的宋美龄在美国去世,银行余额曝光令世人惊讶

朝夕说史
2025-08-07 08:20:03
重庆两名干部接受审查调查

重庆两名干部接受审查调查

潇湘晨报
2026-02-06 19:33:08
海军又出硬核院士何琳,实力不输马伟明,带中国潜艇奔向深蓝

海军又出硬核院士何琳,实力不输马伟明,带中国潜艇奔向深蓝

寄史言志
2026-01-30 23:21:08
封神!段永平加仓茅台,6天狂赚1700万

封神!段永平加仓茅台,6天狂赚1700万

大佬灼见
2026-02-06 09:58:10
2026-02-06 20:56:49
猎云网
猎云网
聚焦科技创业创新,钻研产业趋势,用心服务创业者。
58447文章数 327109关注度
往期回顾 全部

科技要闻

独角兽版图巨变:SpaceX奔万亿 中美差在哪

头条要闻

三只羊拿下"无语哥"全球运营权 部分主播复播风格已变

头条要闻

三只羊拿下"无语哥"全球运营权 部分主播复播风格已变

体育要闻

西甲射手榜第2,身价不到姆巴佩1/40

娱乐要闻

微博之夜红毯好精彩,堪比婚礼现场

财经要闻

爱尔眼科董事长旗下7家精神病院骗保

汽车要闻

宝马"本命年"关键词:20款新车与"新世代"耐力赛

态度原创

房产
亲子
健康
艺术
公开课

房产要闻

新春三亚置业,看过这个热盘再说!

亲子要闻

家长们要注意的七个习惯

转头就晕的耳石症,能开车上班吗?

艺术要闻

Kristin Vestgard:挪威当代画家

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版