网易首页 > 网易号 > 正文 申请入驻

开源又赢闭源!商汤8B模型空间智能碾压GPT-5,AI看懂世界又进了一步

0
分享至


智东西
作者 江宇
编辑 漠影

智东西11月11日报道,昨晚,商汤正式发布并开源SenseNova-SI系列空间智能大模型,涵盖2B与8B两个版本

该系列模型在多个空间智能基准测试中均表现突出,其中SenseNova-SI-8B模型在VSI-Bench、MMSI-Bench、MindCube-Tiny与ViewSpatial四个核心任务上获得60.99的平均成绩,不仅大幅领先Qwen3-VL-8B(40.16)、BAGEL-7B(35.01)等同级别开源通用模型,以及SpatialMLLM(35.05)、ViLaSR-7B(36.41)等专注空间理解的模型。

值得注意的是,在保持8B参数规模的前提下,该模型的均成绩已领先GPT-5(49.68)与Gemini-2.5-Pro(48.81)


▲SenseNova-SI系列模型在多个空间智能基准测试(VSI、MMSI、MindCube、ViewSpatial)中的评测成绩

此次性能跃升,得益于商汤在训练机制上的系统性设计,其研究团队构建了“空间能力分类体系”,并扩充空间理解数据规模,首次在该领域验证了“尺度效应”的存在

这一技术突破也回应了当前多模态大模型面临的核心挑战之一空间智能短板仍未补齐。尽管当前大模型在语言、代码、逻辑推理等任务上已展现出较强性能,但在需要空间理解能力的场景中,仍容易“栽跟头”。

例如,GPT-5可以正确解出复杂图形逻辑题,但面对判断立方体俯视图这类空间题时,却出现了明显错误。这类题对人类儿童来说往往是直觉判断,却仍难住了顶级模型。


SenseNova-SI的构建与训练聚焦空间理解,其开源也为大模型在空间智能方向上的能力优化,提供了新的样本。

GitHub:https://github.com/OpenSenseNova/SenseNova-SI

Hugging Face:https://huggingface.co/collections/sensenova/sensenova-si

一、空间智能也有“Scaling Law”?商汤团队首次验证

SenseNova-SI的性能提升并非单点优化,而是建立在系统训练范式上的整体进化。商汤基于自研的空间能力分类体系,将空间智能划分为六大核心维度空间测量、空间重构、空间关系、视角转换、空间形变与空间推理

在训练数据层面,商汤团队整合多模态感知、视觉模型等方向的积累,系统扩展空间理解数据规模,并首次在空间智能领域验证了“尺度效应”——即随着数据量与质量的持续增长,模型的空间认知能力将同步增强。

这一方法具备通用性,能支持多种基座模型(如InternVL)进行空间能力的增强迁移。商汤团队称,后续将发布完整的技术报告,进一步阐述具体的技术方案。

二、面对空间题,GPT-5“犯难”,SenseNova-SI表现更稳定

在SITE-Bench和MindCube两大空间智能基准测试中,商汤研究团队选取了六道典型题目,涉及俯视图判断、视角转换、物体方位与移动方向推理等任务,分别对GPT-5与SenseNova-SI-8B进行了测试。

从结果来看,GPT-5在多项题目中出现了误判,而SenseNova-SI-8B则连续给出正确答案,呈现出更稳定的空间理解能力:

1、俯视图选择题:在立方体组合图形中,要求选择正确俯视图。GPT-5选择了错误的D选项,SenseNova-SI-8B选择了正确的B选项。


2、相对方位判断题:模拟从相机操作者视角判断摩托车在左侧还是右侧。GPT-5误判为左侧(A),SenseNova-SI-8B正确判断为右侧(B)。


3、交通行为预测题:在多车道道路场景中预测黄色汽车的后续动作。GPT-5判断为静止(C),SenseNova-SI-8B判断为右转(D),正确答案为D。

4、视角变换下的方向判断题(户外):通过两张场景图判断观察者的移动方向。GPT-5选择了C,SenseNova-SI-8B选择了正确答案D,即向左前方移动。


5、视角变换下的方向判断题(室内):在白板、椅子、沙发等室内场景中,判断物体位置变化所代表的观察者移动方向。GPT-5选择D,SenseNova-SI-8B选中正确答案A(向左前方移动)。


6、物体相对位置识别题:要求从正面视角图中判断桌子右侧的物体。GPT-5选B,SenseNova-SI-8B选C,正确答案为C,即门的位置。


这组题覆盖了空间智能的多个关键维度,从结果来看,SenseNova-SI在空间理解与推理上的表现更具稳定性。

三、空间智能走向落地,SenseNova-SI接入“悟能”平台

SenseNova-SI的推出,也是商汤整体空间智能战略的一部分。

今年7月,商汤发布“悟能”具身智能平台,提出以“开悟”世界模型为核心,推动机器人在物理世界中的自主理解与适应能力。SenseNova-SI作为空间能力组件,将补强模型在三维结构认知方面的基础能力。

与此同时,商汤还同步开源了空间智能测评平台EASI及其“英雄榜”,为统一测评口径、展示模型进展和推动开源生态合作。


结语:让AI真正“看懂”物理世界

当前AI在语言、知识与逻辑推理方面已有扎实积累,但三维空间的理解、感知与推理能力仍是其通向物理世界的重要挑战。

空间智能作为支撑具身智能与世界模型发展的核心能力,正成为衡量下一阶段AI模型“真实世界理解力”的一大指标。相关能力的持续构建,将为自动驾驶、机器人等落地应用提供更坚实的基础。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
万万没想到,毕福剑败光的体面,如今却被29岁“丑女儿”挣回来了

万万没想到,毕福剑败光的体面,如今却被29岁“丑女儿”挣回来了

小徐讲八卦
2026-02-12 16:25:04
孤独的婚车获全网祝福,新郎服务区发糖显格局,两人正面照曝光

孤独的婚车获全网祝福,新郎服务区发糖显格局,两人正面照曝光

林轻吟
2026-02-12 14:27:31
内部对话被爆出来了!‌"你们只要跟俄罗斯打起来,扛住10天就行!"

内部对话被爆出来了!‌"你们只要跟俄罗斯打起来,扛住10天就行!"

喀秋莎大世界
2026-02-12 23:54:53
人类为什么不能永生?答:基因不同意!

人类为什么不能永生?答:基因不同意!

宇宙时空
2026-02-11 20:15:03
差点退出中国的山姆“亲爹”,彻底开窍了

差点退出中国的山姆“亲爹”,彻底开窍了

金错刀
2026-02-12 18:36:00
李玮锋:董方卓水平不行曼联能花钱买他?李铁踢英超70分钟没体能

李玮锋:董方卓水平不行曼联能花钱买他?李铁踢英超70分钟没体能

念洲
2026-02-12 08:47:23
意外!曝足协曾接触前中超新贵主帅,因报价太高才签约邵佳一

意外!曝足协曾接触前中超新贵主帅,因报价太高才签约邵佳一

体坛鉴春秋
2026-02-12 12:40:50
这跟不穿有啥区别?格莱美红毯女星穿衣大胆,连美国网友都无语了

这跟不穿有啥区别?格莱美红毯女星穿衣大胆,连美国网友都无语了

梦醉为红颜一笑
2026-02-10 14:52:10
反转!皇马神锋离队在即,曼联介入交易,姆巴佩成唯一核心

反转!皇马神锋离队在即,曼联介入交易,姆巴佩成唯一核心

祥谈体育
2026-02-12 13:19:32
腾讯与特斯拉共同升级座舱体验,覆盖中国市场超百万辆Model 3、Model Y车型

腾讯与特斯拉共同升级座舱体验,覆盖中国市场超百万辆Model 3、Model Y车型

财闻
2026-02-11 14:28:39
哈登主场首秀13+11!骑士15连胜奇才 梅里尔32+9三分米切尔30分

哈登主场首秀13+11!骑士15连胜奇才 梅里尔32+9三分米切尔30分

醉卧浮生
2026-02-12 10:29:48
利物浦防线目标曝光!巴萨27岁铁卫或被挖角,转会费高达8000万欧

利物浦防线目标曝光!巴萨27岁铁卫或被挖角,转会费高达8000万欧

锐评利物浦
2026-02-12 23:58:35
杨瀚森2+1+1补扣!开拓者惨败遭森林狼双杀 兰德尔狂轰41+7

杨瀚森2+1+1补扣!开拓者惨败遭森林狼双杀 兰德尔狂轰41+7

醉卧浮生
2026-02-12 11:36:56
央视版《太平年》被举报,三大平台连夜改台词,网友:太离谱了

央视版《太平年》被举报,三大平台连夜改台词,网友:太离谱了

长风文史
2026-02-10 16:01:08
一眼沦陷!183cm世界小姐中国总冠军陈蕾娜闪耀全场

一眼沦陷!183cm世界小姐中国总冠军陈蕾娜闪耀全场

可乐谈情感
2026-02-12 20:06:51
为何很多藏传佛教高僧都痛恨金庸?为了写好这个大反派,他到底干了什么出格的事?

为何很多藏传佛教高僧都痛恨金庸?为了写好这个大反派,他到底干了什么出格的事?

历史回忆室
2026-01-13 22:56:07
第一代小米SU7正式停产,总计交付超36万辆 雷军:部分产线正在改造,为新一代SU7做准备

第一代小米SU7正式停产,总计交付超36万辆 雷军:部分产线正在改造,为新一代SU7做准备

每日经济新闻
2026-02-10 23:09:18
猫和人类不是同类,为啥猫却喜欢和人类一起生活呢?有啥科学解释

猫和人类不是同类,为啥猫却喜欢和人类一起生活呢?有啥科学解释

向航说
2026-02-07 04:25:03
U17亚洲杯分组:中国+日本+印尼同组!正常发挥,以下8队进世界杯

U17亚洲杯分组:中国+日本+印尼同组!正常发挥,以下8队进世界杯

小火箭爱体育
2026-02-12 16:23:39
长城汽车人均年终奖超5万元!魏建军回应:具体发多少不知道 肯定多一些

长城汽车人均年终奖超5万元!魏建军回应:具体发多少不知道 肯定多一些

快科技
2026-02-12 17:17:04
2026-02-13 00:32:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11225文章数 116969关注度
往期回顾 全部

科技要闻

10倍速的一夜:三大模型春节前的暗战

头条要闻

美称中国已购买美国出售的委内瑞拉石油 中方回应

头条要闻

美称中国已购买美国出售的委内瑞拉石油 中方回应

体育要闻

31岁首次参加冬奥,10年前她是个水管工

娱乐要闻

《惊蛰无声》违规抢占排片遭影院控诉

财经要闻

“影子万科”如何掘金万科?

汽车要闻

开212 T01柴油版去穿越 连牧马人都跟不上

态度原创

艺术
数码
本地
房产
公开课

艺术要闻

福州鼓楼区第一高楼封顶,兴业银行20亿建新地标!

数码要闻

速率最高可至13Gbps!三星宣布HBM4正式量产

本地新闻

下一站是嘉禾望岗,请各位乘客做好哭泣准备

房产要闻

999元开线上免税店?海南爆出免税大骗局,多人已被抓!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版