网易首页 > 网易号 > 正文 申请入驻

商汤开源SenseNova-SI-1.3,八大空间智能榜单综合评分登顶

0
分享至

商汤科技正式开源空间智能模型日日新SenseNova-SI-1.3,在空间测量、视角转换、综合推理等核心任务中展现出显著提升,另外对比之前的版本增强了回答简答题的能力。在集成多项权威空间智能榜单的综合评测平台EASI上,SenseNova-SI-1.3综合性能超越Gemini-3-Pro,均分斩获EASI-8(八个权威空间智能榜单的混合评测)标准第一,在多个高难度空间任务(尤其是视角转换)中表现优异。



刁钻考题验证:SenseNova-SI-1.3精准突破空间智能核心难点

EASI-8包含一系列专门考察空间理解能力的高难度测试题,让Gemini-3-Pro等模型都频频踩坑。那么SenseNova-SI-1.3表现如何呢?(下列问题在测试模型时使用的原题为英文,为便于读者理解翻译为中文)。



题目要求统计两张照片中建筑模型的总数量,核心难点是理解两张图的对应关系,以此避免遮挡漏数和重复多数。图2视角下显现出图 1 中被遮挡的深灰色建筑,且部分模型在两图中重复出现。Gemini-3-Pro未完全去重,误数为 6 个;SenseNova-SI-1.3则给出 “4 个”的准确答案。



题目给出两张书房局部照片,已知 iMac 位于房间北部,询问学生写作业区域的方位。需先理解两张图片属于同一空间,再通过视觉线索拼接场景。Gemini-3-Pro误判学习区在西侧;SenseNova-SI-1.3精准定位 “西北角”,完全符合空间逻辑。



题目要求以 “未戴眼镜男士的自身视角” 判断身旁戴眼镜男士的方位,考察 “参照系转换” 能力,模型很容易以“观察者视角”来判断方向。Gemini-3-Pro就误选了 “右边”;SenseNova-SI-1.3则能正确给出 “左边” 的正确答案。



题目给出粉色瓶子前、后、左、右 4 张照片,询问图 4 角度下瓶子左边物体。这道题需整合多视角线索重构房间全局布局再切换至目标视角判断方位 —— 第 4 张照片中瓶子左侧完全处于视觉盲区,仅能通过前 3 张图中的窗户、床、衣柜等线索还原空间关系。Gemini-3-Pro误选 “窗户和蓝色窗帘”,SenseNova-SI-1.3精准锁定正确答案 “衣柜和门”。



以双层巴士与公交站的场景为题,需避免陷入“英国巴士靠左行驶,因此靠站的是左侧”的常识陷阱,而是通过实际的视觉画面判断方位。Gemini-3-Pro误判 “左侧” 为答案;而 SenseNova-SI-1.3 则准确理解 “右侧” 为正确答案。

空间智能是极其独特的多模态能力



Core Knowledge Deficits in Multi-Modal Language Models (2025)发现视角转换任务与其它多模态任务的相关性(红框内)呈蓝色,即代表相关性较低

一篇2025年发表于机器学习顶会ICML的论文《Core Knowledge Deficits in Multi-Modal Language Models》揭示了一个有趣的发现:视角转换(Perspective)和所有传统多模态模型的能力的相关性均异常得低,这代表主流算法路径可能不是空间智能的形成的有效路径,这也解释了为什么领先的多模态大模型在空间智能相关的任务上表现不佳。



Core Knowledge Deficits in Multi-Modal Language Models (2025)发现增大模型尺寸对提升视角转换任务效果不佳

这篇论文也发现,空间智能似乎存在反尺度效应的现象:更大的模型并不能更好地解决空间智能任务。另外,在EASI的官方报告中也可以找到相似的描述,指出视角转换任务(Perspective-taking)依然是最具挑战的基础能力之一。

空间智能需要全新的学习范式。

从3D世界数据匮乏到空间智能的尺度效应



空间智能的核心——视角转换任务被拆解成了三个关键步骤:建立跨视角关联、理解视角移动、想象视角变换,并围绕着解决这三个基础能力构造大量训练数据

学术界现有数据集多着重于目标识别与场景理解,模型往往停留在图像模式匹配阶段,难以形成稳定的空间理解能力。基于这一洞察,想要解决空间智能尤其是视角转换任务,简单扩充相关数据规模是不够的。为了解决这一根本问题,我们将视角转换看作从二维视觉信息迈向三维空间关系理解的关键桥梁,并将其拆解为递进的能力阶段,由易到难、难度递增的三个任务层级(建立跨视角关联、理解视角移动、想象视角变换),并构造大量且层次分明的训练数据,使模型建立完备的空间理解能力。

同时,在数据规模持续扩大的过程中,SenseNova-SI团队挖掘并重组多视角学术数据资源,将许多过去未被充分利用的标注转化为视角转换训练数据。例如,多目关联数据集MessyTable提供了高物体复杂度场景,其中跨视角物体一致性信息与精确的相机位姿标注,可用于训练物体对应与相机运动推理能力;而部分室内场景扫描数据如CA-1M中包含物体自身朝向标注的样本,则被用于补充模型进行视角转换与想象所需的稀缺数据。这种跨数据源的重组与再利用,使积累大量丰富而系统的空间理解数据成为可能。

转载来源:商汤科技

本文为量子位获授权转载,观点仅为原作者所有。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
打起来了!美航母中东开了第一枪,伊朗果然好猛,各大势力选边站

打起来了!美航母中东开了第一枪,伊朗果然好猛,各大势力选边站

历史有些冷
2026-02-04 20:20:03
勇士送上大礼!湖人1日内5喜临门,詹姆斯的第五冠真的有戏了

勇士送上大礼!湖人1日内5喜临门,詹姆斯的第五冠真的有戏了

小路看球
2026-02-06 18:49:35
反制生效?巴总统提出新方案,或归还长和经营权,但有一个条件

反制生效?巴总统提出新方案,或归还长和经营权,但有一个条件

墨兰史书
2026-02-06 19:17:29
反转!曝梅西香港行原计划出场,未登场原因曝光:球王本人不知情

反转!曝梅西香港行原计划出场,未登场原因曝光:球王本人不知情

二疯说球
2026-02-06 10:21:42
世间最平和的国家分裂,一国拆分为两个国家,如今两国的关系却格外亲密

世间最平和的国家分裂,一国拆分为两个国家,如今两国的关系却格外亲密

文史明鉴
2026-02-05 18:26:10
克林顿夫妇要求直播并公开听证会,特朗普回应真可惜

克林顿夫妇要求直播并公开听证会,特朗普回应真可惜

山河路口
2026-02-06 13:49:32
一位中国交易员重仓做空白银,账面浮盈超20亿!

一位中国交易员重仓做空白银,账面浮盈超20亿!

汇商Forexpress
2026-02-06 15:57:52
虽远必诛!不到24小时,中国三项反击砸向巴拿马,美国高兴太早了

虽远必诛!不到24小时,中国三项反击砸向巴拿马,美国高兴太早了

奇葩游戏酱
2026-02-07 00:36:47
英超活化石,英超历史上49%的球员都曾与米尔纳同场竞技过

英超活化石,英超历史上49%的球员都曾与米尔纳同场竞技过

懂球帝
2026-02-06 10:01:09
名记曝光莫兰特被交易真因:灰熊确实想送走他,但报价极低

名记曝光莫兰特被交易真因:灰熊确实想送走他,但报价极低

林子说事
2026-02-06 07:52:02
我国每年近千万人做肠镜!医生直言:做一次肠镜,或管十年无碍

我国每年近千万人做肠镜!医生直言:做一次肠镜,或管十年无碍

白宸侃片
2026-02-01 19:13:01
脊背发凉,萝莉岛与被叫停的跨国领养

脊背发凉,萝莉岛与被叫停的跨国领养

枫冷慕诗
2026-02-05 13:52:16
SU7 Ultra团队内幕曝光,捅了雷军一刀

SU7 Ultra团队内幕曝光,捅了雷军一刀

品牌头版
2026-02-05 18:38:16
中方反击次日,巴拿马提解决方案,或归还长和经营权,但有个前提

中方反击次日,巴拿马提解决方案,或归还长和经营权,但有个前提

起喜电影
2026-02-06 18:55:44
霍金也被爱泼斯坦档案害惨了,都瘫痪成这样,真的还能玩女人吗?

霍金也被爱泼斯坦档案害惨了,都瘫痪成这样,真的还能玩女人吗?

我心纵横天地间
2026-02-05 19:14:54
大家坐稳扶好了,下周一周二周三三天,牛市或将再次加速主升浪!

大家坐稳扶好了,下周一周二周三三天,牛市或将再次加速主升浪!

另子维爱读史
2026-02-06 17:43:18
杜兰特31分火箭不敌黄蜂2连败,申京仅7分鲍尔20分6篮板

杜兰特31分火箭不敌黄蜂2连败,申京仅7分鲍尔20分6篮板

湖人崛起
2026-02-06 11:18:47
后场大将复出后第二场立刻爆砍高分,湖人的战绩有望出现回暖?

后场大将复出后第二场立刻爆砍高分,湖人的战绩有望出现回暖?

稻谷与小麦
2026-02-07 01:24:54
武汉:中心城区放开摩托车上牌

武汉:中心城区放开摩托车上牌

故乡江城之声
2026-02-06 19:55:47
黄金、白银飙升!大消息,伊朗在伊美谈判中表示绝不接受“零浓缩”

黄金、白银飙升!大消息,伊朗在伊美谈判中表示绝不接受“零浓缩”

证券时报e公司
2026-02-06 21:53:38
2026-02-07 01:55:00
量子位 incentive-icons
量子位
追踪人工智能动态
12126文章数 176373关注度
往期回顾 全部

科技要闻

独角兽版图巨变:SpaceX奔万亿 中美差在哪

头条要闻

女生被51岁推拿技师猥亵:没等到道歉 还遭网暴

头条要闻

女生被51岁推拿技师猥亵:没等到道歉 还遭网暴

体育要闻

西甲射手榜第2,身价不到姆巴佩1/40

娱乐要闻

微博之夜抢C风波 杨幂工作室9字讨说法

财经要闻

爱尔眼科董事长旗下7家精神病院骗保

汽车要闻

宝马"本命年"关键词:20款新车与"新世代"耐力赛

态度原创

健康
游戏
本地
时尚
公开课

转头就晕的耳石症,能开车上班吗?

T2总裁回应GTA6争议:给他爱新DLC力证老作热度不减

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

豆瓣8.5分,人美剧甜衣品好,小韩拍恋爱剧还是有两把刷子

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版