网易首页 > 网易号 > 正文 申请入驻

商汤日日新发布并开源空间智能模型,性能超越GPT-5、Geminil

0
分享至

今天,商汤日日新在空间智能领域实现重要突破,正式发布并开源SenseNova-SI系列模型。在多项权威评测的空间理解和推理任务上,SenseNova-SI 不仅大幅度领先同量级开源多模态大模型,还超越了 GPT-5 和 Gemini 2.5 Pro 等国际顶尖闭源模型的表现。

空间智能短板与系统性解决

当下行业领先的大模型,虽然在知识、写作、推理、编程等方面展示了突出的性能,但是普遍存在一个重要的缺陷,就是对空间结构的理解和推理存在很严重的短板,而这恰恰是具身智能体与世界交互所需要的关键基础能力。

我们来看一个例子,左图源自最强大脑的图形推理题,对人类都具有相当的难度,GPT-5能够轻松破解,可见它在非空间智能问题上已具备很强能力。反观右图,是一道人类儿童都能轻易解决的简单空间问题,要求选择正确俯视图,GPT-5却令人意外地犯起了难,错误地选择了"A”。


以上例子恰好暴露了当前大模型在空间理解上的短板。因此要让AI真正"看懂"三维世界,空间智能一直是关键的试金石。

商汤围绕空间智能进行了深入创新探索,找到了提升空间智能的系统性训练方法,打造了日日新·空间智能大模型系列 SenseNova-SI 并正式开源。

评测表现多项任务超越GPT-5,显著领先同量级开源模型

这次开源的SenseNova-SI空间智能大模型系列包括 2B 和 8B 两个规格。

最新评测数据显示,SenseNova-SI系列模型在空间智能多个基准测试(VSI、MMSI、MindCube、ViewSpatial)中表现突出,具体如下:


数据来源:https://github.com/OpenSenseNova/SenseNova-SI

其中SenseNova-SI-8B模型在四个基本评测中获得 60.99 的平均成绩,不仅大幅领先Qwen3-VL-8B(40.16)、BAGEL-7B(35.01)等开源通用多模态模型,以及 SpatialMLLM(35.05)、ViLaSR-7B(36.41) 等专门的空间智能模型,还以相对轻量的模型规格实现了对GPT-5(49.68)、Gemini-2.5-Pro(48.81)等顶级闭源模型的超越。这里显著的性能提升反映了模型在空间智能上获得了质的突破,而不是简单的性能改善。

基于"尺度效应"的训练范式,实现能力系统性提升​

SenseNova-SI的性能飞跃,源于商汤从训练数据到方法上的系统性方案。依托商汤提出的空间能力分类体系和过往多样化的数据的积累,团队采用系统化的方法扩充空间理解数据的规模,首次在空间智能领域验证了“尺度效应”,即通过高质量、大规模数据训练,可显著提升模型的空间认知能力。

商汤提出的训练范式具备通用性,能够针对不同架构的基模型(如InternVL等)进行有效增强,使其在空间智能六大核心维度上——包括空间测量、空间重构、空间关系、视角转换、空间形变与空间推理——实现一致性的能力提升。

商汤稍后将发布详细的技术报告,详细阐述具体的技术方案。

以下为GPT-5和SenseNova-SI-8B模型面对空间智能问题,给出的答案对比。


​​给出的立方体组合图形,要求选择正确俯视图。GPT-5选择答案D,SenseNova-SI-8B选择答案B,正确答案为B。(例题源自SITE-Bench)
假设我站在手持相机人的位置,并且面朝他现在面朝的方向。摩托车是位于我的左侧还是右侧? GPT-5选择答案A(左侧),SenseNova-SI-8B选择答案B,​​正确答案为B(右侧)。(例题源自SITE-Bench) 多车道道路场景,判断黄色汽车的后续动作(如直行、转向等)。GPT-5选择答案C(静止),SenseNova-SI-8B选择答案(D),​​正确答案为D(右转)​​。(例题源自SITE-Bench) 同一户外场景,通过视角变化判断移动方向。GPT-5选择答案C,SenseNova-SI-8B选择答案D,正确答案为向左前方移动(选项D)。(例题源自MindCube) 同一室内空间,包含白板、椅子和沙发等,通过物体位置变化分析移动方向。GPT-5选择答案D,SenseNova-SI-8B选择答案A,正确答案为向左前方移动(选项A)。(例题源自MindCube) 从不同角度拍摄带黑色衣物的桌子,从正面视角(图1)判断桌子右侧物体。GPT-5选择答案B,SenseNova-SI-8B选择答案C,正确答案为门(选项C)。(例题源自MindCube) 推动世界模型和具身智能生态发展

空间智能是世界模型与具身智能理解物理世界的基础能力。今年7月,商汤正式发布“悟能”具身智能平台,该平台以商汤“开悟”世界模型为核心引擎,旨在为机器人和智能设备提供在物理世界中自主探索和进化的能力。

此次发布的空间智能大模型SenseNova-SI,与“开悟”世界模型相辅相成,将更好地解决多模态模型从数字空间走向物理世界的基础挑战,并在未来进一步推动AI在自动驾驶、机器人等场景的应用。

此外,商汤还同步开源了空间智能测评平台 EASI(https://github.com/EvolvingLMMs-Lab/EASI)与“英雄榜”,旨在推动空间智能技术评估标准的统一,持续跟踪并展示开源和闭源模型的性能进展,为学术界和工业界提供权威的评估基准,促进协同创新。

商汤SenseNova-SI的推出标志着AI在三维世界理解能力上迈出关键一步,也为下一代通用人工智能技术融入物理世界打下坚实基础。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
黎真主党导弹袭击以国防部及军营

黎真主党导弹袭击以国防部及军营

北青网-北京青年报
2026-03-26 10:19:17
吴柳芳:我本不想跳擦边!被管晨辰指责后失去收入 直播1年赚40万

吴柳芳:我本不想跳擦边!被管晨辰指责后失去收入 直播1年赚40万

念洲
2026-03-26 13:14:22
32.29万起!全新一代A6L正式上市,华为乾崑智驾上车!

32.29万起!全新一代A6L正式上市,华为乾崑智驾上车!

小南看车
2026-03-25 22:59:29
电饭锅哪个牌子质量好?2026电饭煲排名前十盘点!大众主流精选

电饭锅哪个牌子质量好?2026电饭煲排名前十盘点!大众主流精选

小柱解说游戏
2026-03-25 17:56:15
跟着黄仁勋下注:如今的token可能就是20年的房子

跟着黄仁勋下注:如今的token可能就是20年的房子

梦大明白
2026-03-24 11:05:49
快讯!美军拒绝为以色列作战!

快讯!美军拒绝为以色列作战!

达文西看世界
2026-03-26 09:54:51
伊朗伊斯兰革命卫队责令一艘擅自通过霍尔木兹海峡船只返航

伊朗伊斯兰革命卫队责令一艘擅自通过霍尔木兹海峡船只返航

财联社
2026-03-25 02:02:18
是什么,让这个日本自卫官竟敢对中国大使馆举刀?

是什么,让这个日本自卫官竟敢对中国大使馆举刀?

环球时报国际
2026-03-26 00:13:51
于东来:30岁开始吃药,CT拍了上百次,身体出什么问题都不足为奇,哪天说没就没了

于东来:30岁开始吃药,CT拍了上百次,身体出什么问题都不足为奇,哪天说没就没了

每日经济新闻
2026-03-25 23:58:31
破防!小县城殡仪馆大屏流出,中年人扎堆离世,网友:还争什么?

破防!小县城殡仪馆大屏流出,中年人扎堆离世,网友:还争什么?

川渝视觉
2026-03-23 19:26:44
日媒曝光强闯我驻日使馆不法之徒照片;案发前行动轨迹公布:乘坐新干线到达东京,在网吧过夜,现场发现的刀具,其称是在车站附近购买

日媒曝光强闯我驻日使馆不法之徒照片;案发前行动轨迹公布:乘坐新干线到达东京,在网吧过夜,现场发现的刀具,其称是在车站附近购买

大风新闻
2026-03-26 12:13:02
欧洲芯片巨头官宣:我已在中国大陆,制造40nm芯片了

欧洲芯片巨头官宣:我已在中国大陆,制造40nm芯片了

互联网.乱侃秀
2026-03-25 09:45:10
郑晓龙执导白宇章若楠主演《冬去春来》首播8集,观众评价竟一致

郑晓龙执导白宇章若楠主演《冬去春来》首播8集,观众评价竟一致

亦暖追剧随笔
2026-03-25 18:01:42
人类史上最高级零元购,榨干印度200年,留下45万亿天价账单

人类史上最高级零元购,榨干印度200年,留下45万亿天价账单

掠影后有感
2026-03-26 10:39:36
短短1年,灵活就业者暴增4千万

短短1年,灵活就业者暴增4千万

深度报
2026-03-23 21:47:58
80后伊拉克女记者,受伤后来中国旅游,感叹:身为中国人真幸福

80后伊拉克女记者,受伤后来中国旅游,感叹:身为中国人真幸福

千秋文化
2026-03-25 21:48:28
2025年演唱会票房最高的10位歌手排行榜,这些歌手太赚钱了!

2025年演唱会票房最高的10位歌手排行榜,这些歌手太赚钱了!

小椰的奶奶
2026-03-26 08:40:13
80年陈云建议陈锡联辞职,陈锡联猛拍桌:让我干啥,我绝无二话!

80年陈云建议陈锡联辞职,陈锡联猛拍桌:让我干啥,我绝无二话!

抽象派大师
2026-03-25 12:04:28
横店巨变!20万群演困境:美女泛滥懒汉遍地,降薪后路在何方?

横店巨变!20万群演困境:美女泛滥懒汉遍地,降薪后路在何方?

网络易不易
2026-03-25 10:31:12
昨天杭州有医院门诊突然多了不少“跑友”,主动要求检查心脏功能!医生:长期跑步不等于心肺功能没问题

昨天杭州有医院门诊突然多了不少“跑友”,主动要求检查心脏功能!医生:长期跑步不等于心肺功能没问题

都市快报橙柿互动
2026-03-26 08:00:05
2026-03-26 20:00:49
界面新闻 incentive-icons
界面新闻
只服务于独立思考的人群
1044108文章数 1332029关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

旅游
家居
手机
房产
数码

旅游要闻

鲁冰花开啦!快来新乡南太行八里沟 赴一场春日之约

家居要闻

傍海而居 静观蝴蝶海

手机要闻

狂揽307万!红米杀疯了:K90破150万、Turbo 5破百万,性价比赢麻

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

数码要闻

1+4核,英特尔酷睿3 304处理器现身基准测试

无障碍浏览 进入关怀版