网易首页 > 网易号 > 正文 申请入驻

初探空间智能尺度效应:商汤开源SenseNova-SI-1.3,八大空间智能榜单综合评分登顶

0
分享至

商汤科技正式开源空间智能模型日日新SenseNova-SI-1.3,在空间测量、视角转换、综合推理等核心任务中展现出显著提升,另外对比之前的版本增强了回答简答题的能力。在集成多项权威空间智能榜单的综合评测平台EASI上,SenseNova-SI-1.3综合性能超越Gemini-3-Pro,均分斩获EASI-8(八个权威空间智能榜单的混合评测)标准第一,在多个高难度空间任务(尤其是视角转换)中表现优异。


刁钻考题验证:SenseNova-SI-1.3精准突破空间智能核心难点

EASI-8包含一系列专门考察空间理解能力的高难度测试题,让Gemini-3-Pro等模型都频频踩坑。那么SenseNova-SI-1.3表现如何呢?(下列问题在测试模型时使用的原题为英文,为便于读者理解翻译为中文)。


题目要求统计两张照片中建筑模型的总数量,核心难点是理解两张图的对应关系,以此避免遮挡漏数和重复多数。图2视角下显现出图 1 中被遮挡的深灰色建筑,且部分模型在两图中重复出现。Gemini-3-Pro未完全去重,误数为 6 个;SenseNova-SI-1.3则给出 “4 个”的准确答案。


题目给出两张书房局部照片,已知 iMac 位于房间北部,询问学生写作业区域的方位。需先理解两张图片属于同一空间,再通过视觉线索拼接场景。Gemini-3-Pro误判学习区在西侧;SenseNova-SI-1.3精准定位 “西北角”,完全符合空间逻辑。


题目要求以 “未戴眼镜男士的自身视角” 判断身旁戴眼镜男士的方位,考察 “参照系转换” 能力,模型很容易以“观察者视角”来判断方向。Gemini-3-Pro就误选了 “右边”;SenseNova-SI-1.3则能正确给出 “左边” 的正确答案。


题目给出粉色瓶子前、后、左、右 4 张照片,询问图 4 角度下瓶子左边物体。这道题需整合多视角线索重构房间全局布局再切换至目标视角判断方位 —— 第 4 张照片中瓶子左侧完全处于视觉盲区,仅能通过前 3 张图中的窗户、床、衣柜等线索还原空间关系。Gemini-3-Pro误选 “窗户和蓝色窗帘”,SenseNova-SI-1.3精准锁定正确答案 “衣柜和门”。


以双层巴士与公交站的场景为题,需避免陷入“英国巴士靠左行驶,因此靠站的是左侧”的常识陷阱,而是通过实际的视觉画面判断方位。Gemini-3-Pro误判 “左侧” 为答案;而 SenseNova-SI-1.3 则准确理解 “右侧” 为正确答案。

空间智能是极其独特的多模态能力


Core Knowledge Deficits in Multi-Modal Language Models (2025)发现视角转换任务与其它多模态任务的相关性(红框内)呈蓝色,即代表相关性较低

一篇2025年发表于机器学习顶会ICML的论文《Core Knowledge Deficits in Multi-Modal Language Models》揭示了一个有趣的发现:视角转换(Perspective)和所有传统多模态模型的能力的相关性均异常得低,这代表主流算法路径可能不是空间智能的形成的有效路径,这也解释了为什么领先的多模态大模型在空间智能相关的任务上表现不佳。


Core Knowledge Deficits in Multi-Modal Language Models (2025)发现增大模型尺寸对提升视角转换任务效果不佳

这篇论文也发现,空间智能似乎存在反尺度效应的现象:更大的模型并不能更好地解决空间智能任务。另外,在EASI的官方报告中也可以找到相似的描述,指出视角转换任务(Perspective-taking)依然是最具挑战的基础能力之一。

空间智能需要全新的学习范式。

从3D世界数据匮乏到空间智能的尺度效应


空间智能的核心——视角转换任务被拆解成了三个关键步骤:建立跨视角关联、理解视角移动、想象视角变换,并围绕着解决这三个基础能力构造大量训练数据

学术界现有数据集多着重于目标识别与场景理解,模型往往停留在图像模式匹配阶段,难以形成稳定的空间理解能力。基于这一洞察,想要解决空间智能尤其是视角转换任务,简单扩充相关数据规模是不够的。为了解决这一根本问题,我们将视角转换看作从二维视觉信息迈向三维空间关系理解的关键桥梁,并将其拆解为递进的能力阶段,由易到难、难度递增的三个任务层级(建立跨视角关联、理解视角移动、想象视角变换),并构造大量且层次分明的训练数据,使模型建立完备的空间理解能力。

同时,在数据规模持续扩大的过程中,SenseNova-SI团队挖掘并重组多视角学术数据资源,将许多过去未被充分利用的标注转化为视角转换训练数据。例如,多目关联数据集 MessyTable提供了高物体复杂度场景,其中跨视角物体一致性信息与精确的相机位姿标注,可用于训练物体对应与相机运动推理能力;而部分室内场景扫描数据如CA-1M中包含物体自身朝向标注的样本,则被用于补充模型进行视角转换与想象所需的稀缺数据。这种跨数据源的重组与再利用,使积累大量丰富而系统的空间理解数据成为可能。


空间智能的尺度效应:SenseNova-SI在视角转换任务上超越GPT-5

大规模高质量的空间智能数据在SenseNova-SI团队的手中最终验证了空间智能的尺度效应:SenseNova-SI的8B参数基模型最终超越了强闭源模型如GPT-5,而2B参数的小模型也表现不俗,在相同数据规模下,甚至超越了纽约大学的Cambrian-S和字节的VST两个7B参数的模型。


只在Ego-Exo4D上训练第一/第三人称视角匹配的模型可以大幅提升(+90.4%)在MMSI的2D迷宫导航问题上的表现

更有趣的是,团队在研究中似乎发现了一些智能涌现的先兆:一些看起来毫无关联的但也许细想之下有底层能力联系的任务可以协同发展。另外,团队也发现在视角转换任务上训练的模型也可以增强如心智重建(Mental Reconstruction)、综合空间推理(Comprehensive Reasoning)等能力。

商汤引领空间智能普惠生态

SenseNova-SI-1.3模型的升级发布背后,是商汤科技始终致力于打破技术壁垒,让顶尖空间智能技术惠及更多开发者与企业。对科研人员而言,SenseNova-SI-1.3通过在空间智能上验证数据尺度效应提供了一个与现有基座模型完全兼容,但又长于空间智能的强力预训练模型和基线(SenseNova-SI已被VSI-Bench, MMSI-Bench等权威榜单官方收录),可以直接在其之上设计创新算法或者续训,推动空间智能向人类水平迈进;对企业来说,可直接基于 SenseNova-SI-1.3快速落地应用,缩短研发周期、降低技术门槛;对普通用户而言,未来将有更多搭载先进空间智能的产品走进生活 —— 从智能家电到自动驾驶,从工业机器人到教育设备,都将更懂 “空间逻辑”、更贴合实际需求。


SenseNova-SI在具身任务上的探索了空间智能的重要性

开源地址

SenseNova-SI模型家族:https://huggingface.co/collections/sensenova/sensenova-si

SenseNova-SI开源代码:https://github.com/OpenSenseNova/SenseNova-SI

Discord 社区邀请码:https://discord.gg/WBzH62bk

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美国十大领域全球领跑,差距还在拉大,正视实力才是真清醒!

美国十大领域全球领跑,差距还在拉大,正视实力才是真清醒!

保德全
2026-02-03 19:30:03
第三国下场后,长和发布公告,中方反制就绪,巴拿马将付出代价

第三国下场后,长和发布公告,中方反制就绪,巴拿马将付出代价

似水流年忘我
2026-02-05 21:47:30
福建一村党总支原书记、村委会主任涉嫌严重违纪违法被查

福建一村党总支原书记、村委会主任涉嫌严重违纪违法被查

大闽门户
2026-02-06 19:17:15
谁碰中巴项目灭谁?瓜达尔港遇袭,48小时击毙177人,中方4字回应

谁碰中巴项目灭谁?瓜达尔港遇袭,48小时击毙177人,中方4字回应

东极妙严
2026-02-05 20:44:26
长和港口照常运转,巴拿马法院没出判决,这事到底谁在传?

长和港口照常运转,巴拿马法院没出判决,这事到底谁在传?

起喜电影
2026-02-06 10:33:14
腐乳被关注!研究发现:癌症患者吃辣腐乳,不过多久或有几变化

腐乳被关注!研究发现:癌症患者吃辣腐乳,不过多久或有几变化

鬼菜生活
2026-02-06 19:04:38
凌晨!全线暴跌,超43万人爆仓!美股、黄金、白银、比特币、石油全崩了

凌晨!全线暴跌,超43万人爆仓!美股、黄金、白银、比特币、石油全崩了

券商中国
2026-02-06 07:27:12
魔兽世界:春节活动彻底疯狂!猎人带鸟“闪瞎”全队,坐骑半天暴涨2000 ,土豪开启撒钱模式

魔兽世界:春节活动彻底疯狂!猎人带鸟“闪瞎”全队,坐骑半天暴涨2000 ,土豪开启撒钱模式

一起玩魔兽硬核哥
2026-02-05 21:37:19
小米新车正式亮相!真的太帅了

小米新车正式亮相!真的太帅了

花果科技
2026-02-06 21:27:24
梅婷:拍父母爱情,片酬300万,郭涛只有8.8万。44集,一集两千块

梅婷:拍父母爱情,片酬300万,郭涛只有8.8万。44集,一集两千块

南权先生
2026-02-04 16:01:47
以色列总理称已做好严厉打击伊朗准备

以色列总理称已做好严厉打击伊朗准备

闪电新闻
2026-02-06 14:34:47
谁碰中巴项目灭谁?瓜达尔港遇袭,48小时击毙177人,中方4字回应

谁碰中巴项目灭谁?瓜达尔港遇袭,48小时击毙177人,中方4字回应

快看张同学
2026-02-06 16:25:35
“秦岚”也太凡尔赛了吧!穿一身瑜伽服凹凸有致,巴掌腰太抢镜

“秦岚”也太凡尔赛了吧!穿一身瑜伽服凹凸有致,巴掌腰太抢镜

巧手晓厨娘
2025-12-30 18:59:18
她让我戴套,还让我扶她上厕所—这些体贴,掩盖不了强奸的本质

她让我戴套,还让我扶她上厕所—这些体贴,掩盖不了强奸的本质

没有偏旁的常庆
2026-02-04 07:25:06
为啥普通人家的房子“宁空不租”,房东说:空着,比租出去还省钱

为啥普通人家的房子“宁空不租”,房东说:空着,比租出去还省钱

装修秀
2026-02-04 11:25:03
暴跌超21万,越卖越亏!曾靠豪车高溢价吃尽红利的车商卖不动了?

暴跌超21万,越卖越亏!曾靠豪车高溢价吃尽红利的车商卖不动了?

财经八卦
2026-02-05 20:11:48
圣彼得堡帮全线撤退!后普京时代已经到来

圣彼得堡帮全线撤退!后普京时代已经到来

李荣茂
2026-02-06 19:06:20
英国首相斯塔默承认后悔了:前驻美国大使,背叛了国家!警方已启动刑事调查

英国首相斯塔默承认后悔了:前驻美国大使,背叛了国家!警方已启动刑事调查

每日经济新闻
2026-02-05 21:33:06
中国的社保压力超乎想象。

中国的社保压力超乎想象。

流苏晚晴
2026-02-06 20:42:14
306:159!日本选情逆转要变天,高市兵分两路,对中国稀土出手

306:159!日本选情逆转要变天,高市兵分两路,对中国稀土出手

东极妙严
2026-02-05 16:30:15
2026-02-07 00:48:49
硅星Breaknews incentive-icons
硅星Breaknews
Break news
6846文章数 70关注度
往期回顾 全部

科技要闻

独角兽版图巨变:SpaceX奔万亿 中美差在哪

头条要闻

电动车行业"老三"冲刺上市 分股东2亿克扣员工社保3亿

头条要闻

电动车行业"老三"冲刺上市 分股东2亿克扣员工社保3亿

体育要闻

西甲射手榜第2,身价不到姆巴佩1/40

娱乐要闻

微博之夜抢C风波 杨幂工作室9字讨说法

财经要闻

爱尔眼科董事长旗下7家精神病院骗保

汽车要闻

宝马"本命年"关键词:20款新车与"新世代"耐力赛

态度原创

教育
时尚
房产
本地
军事航空

教育要闻

高考地理中的蒸散量

豆瓣8.5分,人美剧甜衣品好,小韩拍恋爱剧还是有两把刷子

房产要闻

新春三亚置业,看过这个热盘再说!

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

军事要闻

美国“肯尼迪”号核动力航母完成首次海试

无障碍浏览 进入关怀版