网易首页 > 网易号 > 正文 申请入驻

开源又赢闭源!商汤8B模型空间智能碾压GPT-5,AI看懂世界又进了一步

0
分享至


智东西
作者 江宇
编辑 漠影

智东西11月11日报道,昨晚,商汤正式发布并开源SenseNova-SI系列空间智能大模型,涵盖2B与8B两个版本

该系列模型在多个空间智能基准测试中均表现突出,其中SenseNova-SI-8B模型在VSI-Bench、MMSI-Bench、MindCube-Tiny与ViewSpatial四个核心任务上获得60.99的平均成绩,不仅大幅领先Qwen3-VL-8B(40.16)、BAGEL-7B(35.01)等同级别开源通用模型,以及SpatialMLLM(35.05)、ViLaSR-7B(36.41)等专注空间理解的模型。

值得注意的是,在保持8B参数规模的前提下,该模型的均成绩已领先GPT-5(49.68)与Gemini-2.5-Pro(48.81)


▲SenseNova-SI系列模型在多个空间智能基准测试(VSI、MMSI、MindCube、ViewSpatial)中的评测成绩

此次性能跃升,得益于商汤在训练机制上的系统性设计,其研究团队构建了“空间能力分类体系”,并扩充空间理解数据规模,首次在该领域验证了“尺度效应”的存在

这一技术突破也回应了当前多模态大模型面临的核心挑战之一空间智能短板仍未补齐。尽管当前大模型在语言、代码、逻辑推理等任务上已展现出较强性能,但在需要空间理解能力的场景中,仍容易“栽跟头”。

例如,GPT-5可以正确解出复杂图形逻辑题,但面对判断立方体俯视图这类空间题时,却出现了明显错误。这类题对人类儿童来说往往是直觉判断,却仍难住了顶级模型。


SenseNova-SI的构建与训练聚焦空间理解,其开源也为大模型在空间智能方向上的能力优化,提供了新的样本。

GitHub:https://github.com/OpenSenseNova/SenseNova-SI

Hugging Face:https://huggingface.co/collections/sensenova/sensenova-si

一、空间智能也有“Scaling Law”?商汤团队首次验证

SenseNova-SI的性能提升并非单点优化,而是建立在系统训练范式上的整体进化。商汤基于自研的空间能力分类体系,将空间智能划分为六大核心维度空间测量、空间重构、空间关系、视角转换、空间形变与空间推理

在训练数据层面,商汤团队整合多模态感知、视觉模型等方向的积累,系统扩展空间理解数据规模,并首次在空间智能领域验证了“尺度效应”——即随着数据量与质量的持续增长,模型的空间认知能力将同步增强。

这一方法具备通用性,能支持多种基座模型(如InternVL)进行空间能力的增强迁移。商汤团队称,后续将发布完整的技术报告,进一步阐述具体的技术方案。

二、面对空间题,GPT-5“犯难”,SenseNova-SI表现更稳定

在SITE-Bench和MindCube两大空间智能基准测试中,商汤研究团队选取了六道典型题目,涉及俯视图判断、视角转换、物体方位与移动方向推理等任务,分别对GPT-5与SenseNova-SI-8B进行了测试。

从结果来看,GPT-5在多项题目中出现了误判,而SenseNova-SI-8B则连续给出正确答案,呈现出更稳定的空间理解能力:

1、俯视图选择题:在立方体组合图形中,要求选择正确俯视图。GPT-5选择了错误的D选项,SenseNova-SI-8B选择了正确的B选项。


2、相对方位判断题:模拟从相机操作者视角判断摩托车在左侧还是右侧。GPT-5误判为左侧(A),SenseNova-SI-8B正确判断为右侧(B)。


3、交通行为预测题:在多车道道路场景中预测黄色汽车的后续动作。GPT-5判断为静止(C),SenseNova-SI-8B判断为右转(D),正确答案为D。

4、视角变换下的方向判断题(户外):通过两张场景图判断观察者的移动方向。GPT-5选择了C,SenseNova-SI-8B选择了正确答案D,即向左前方移动。


5、视角变换下的方向判断题(室内):在白板、椅子、沙发等室内场景中,判断物体位置变化所代表的观察者移动方向。GPT-5选择D,SenseNova-SI-8B选中正确答案A(向左前方移动)。


6、物体相对位置识别题:要求从正面视角图中判断桌子右侧的物体。GPT-5选B,SenseNova-SI-8B选C,正确答案为C,即门的位置。


这组题覆盖了空间智能的多个关键维度,从结果来看,SenseNova-SI在空间理解与推理上的表现更具稳定性。

三、空间智能走向落地,SenseNova-SI接入“悟能”平台

SenseNova-SI的推出,也是商汤整体空间智能战略的一部分。

今年7月,商汤发布“悟能”具身智能平台,提出以“开悟”世界模型为核心,推动机器人在物理世界中的自主理解与适应能力。SenseNova-SI作为空间能力组件,将补强模型在三维结构认知方面的基础能力。

与此同时,商汤还同步开源了空间智能测评平台EASI及其“英雄榜”,为统一测评口径、展示模型进展和推动开源生态合作。


结语:让AI真正“看懂”物理世界

当前AI在语言、知识与逻辑推理方面已有扎实积累,但三维空间的理解、感知与推理能力仍是其通向物理世界的重要挑战。

空间智能作为支撑具身智能与世界模型发展的核心能力,正成为衡量下一阶段AI模型“真实世界理解力”的一大指标。相关能力的持续构建,将为自动驾驶、机器人等落地应用提供更坚实的基础。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
俄乌最新:诡异的反攻也许并不存在,只是俄罗斯叙事的修正

俄乌最新:诡异的反攻也许并不存在,只是俄罗斯叙事的修正

山河路口
2026-02-11 13:08:30
成了!从ICU捡回一条命,蔡磊干成了医生都没做到的事!

成了!从ICU捡回一条命,蔡磊干成了医生都没做到的事!

财经要参
2026-01-22 17:05:37
十年前,桑兰能成功索要18亿美金的赔偿,如今想要二胎却很困难?

十年前,桑兰能成功索要18亿美金的赔偿,如今想要二胎却很困难?

北有南栀
2026-02-07 18:05:03
A股:刚刚,中央一部门发布,释放一信号,2月13日周五将这样走

A股:刚刚,中央一部门发布,释放一信号,2月13日周五将这样走

夜深爱杂谈
2026-02-12 18:41:39
驻日武官王庆简:为日本潜伏20年出卖军事机密,却因一动作暴露身份

驻日武官王庆简:为日本潜伏20年出卖军事机密,却因一动作暴露身份

睡前讲故事
2026-02-03 20:55:43
南海爆炸声,菲军拦截中方战机,B-52投下一串实弹

南海爆炸声,菲军拦截中方战机,B-52投下一串实弹

破镜难圆
2026-02-11 20:54:08
Seedance2.0刷爆全网!知名财作家:女主播找工作时间不会很多了

Seedance2.0刷爆全网!知名财作家:女主播找工作时间不会很多了

火山詩话
2026-02-11 06:17:37
印度飞饼师傅被认定为专家最新进展:多部门介入调查,胡锡进称没必要“上纲上线”,网友炸锅

印度飞饼师傅被认定为专家最新进展:多部门介入调查,胡锡进称没必要“上纲上线”,网友炸锅

文字里拾光
2026-02-11 16:23:33
50岁以后,别心疼钱,少吃花生,多吃8种“碱性食物”,气色好

50岁以后,别心疼钱,少吃花生,多吃8种“碱性食物”,气色好

美食店主
2026-02-12 00:08:26
震惊!你绝对想不到艾滋病高发地是这里!

震惊!你绝对想不到艾滋病高发地是这里!

特约前排观众
2026-01-15 00:10:08
精神小妹的生活原来是这样的!网友:终于知道她们为啥都这么瘦了

精神小妹的生活原来是这样的!网友:终于知道她们为啥都这么瘦了

深度报
2026-02-11 23:35:03
女孩故意穿丑去相亲,本想劝退竟被当场相中,网友:男子太精明了

女孩故意穿丑去相亲,本想劝退竟被当场相中,网友:男子太精明了

观察鉴娱
2026-02-11 15:07:58
广州一教育机构爆雷,办公室关闭!有人称交钱了还没上

广州一教育机构爆雷,办公室关闭!有人称交钱了还没上

番禺台
2026-02-11 23:52:36
研究发现高功率超快充电桩会让电动车动力电池的老化速度几乎翻倍

研究发现高功率超快充电桩会让电动车动力电池的老化速度几乎翻倍

cnBeta.COM
2026-02-10 01:06:23
华中大最新研究显示:保持性行为有利于抗癌?

华中大最新研究显示:保持性行为有利于抗癌?

马拉松跑步健身
2026-02-12 06:30:09
3岁遭抛弃,被养父家8个姐姐宠爱,红遍亚洲后亲生父母上门认亲

3岁遭抛弃,被养父家8个姐姐宠爱,红遍亚洲后亲生父母上门认亲

顾史
2026-01-15 12:12:40
原来有这么多工作需要保密!网友:牺牲12年的爸爸竟然回来了!

原来有这么多工作需要保密!网友:牺牲12年的爸爸竟然回来了!

另子维爱读史
2026-01-16 18:29:22
上海静安寺下面压着“黄泉路”?老静安打死也不说的那些事儿!

上海静安寺下面压着“黄泉路”?老静安打死也不说的那些事儿!

小蜜情感说
2026-02-12 00:16:11
年薪5400万,又一次赛季报销!交易彻底失败,你也应该退役了

年薪5400万,又一次赛季报销!交易彻底失败,你也应该退役了

篮球扫地僧
2026-02-09 23:23:15
39元铜葫芦卖爆1000万件,这家公司,算把中年男人消费玩明白了!

39元铜葫芦卖爆1000万件,这家公司,算把中年男人消费玩明白了!

李砍柴
2026-02-06 16:36:05
2026-02-12 20:52:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11225文章数 116969关注度
往期回顾 全部

科技要闻

10倍速的一夜:三大模型春节前的暗战

头条要闻

9岁抗癌小网红"米粒"离世 去世前一天喊了一夜的妈妈

头条要闻

9岁抗癌小网红"米粒"离世 去世前一天喊了一夜的妈妈

体育要闻

31岁首次参加冬奥,10年前她是个水管工

娱乐要闻

《惊蛰无声》违规抢占排片遭影院控诉

财经要闻

“影子万科”如何掘金万科?

汽车要闻

开212 T01柴油版去穿越 连牧马人都跟不上

态度原创

艺术
旅游
游戏
家居
公开课

艺术要闻

孟新宇 油画作品选

旅游要闻

中国年 · 在忻州 | 好戏 “马”上官宣!忻州古城年味浓度已加载100%

Xbox第一方大作将登陆PS5!销量惨淡但XGP热度出色

家居要闻

本真栖居 爱暖伴流年

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版