网易首页 > 网易号 > 正文 申请入驻

商汤日日新发布并开源空间智能模型,性能超越GPT-5、Geminil

0
分享至

来源:市场资讯

(来源:界面新闻)

今天,商汤日日新在空间智能领域实现重要突破,正式发布并开源SenseNova-SI系列模型。在多项权威评测的空间理解和推理任务上,SenseNova-SI 不仅大幅度领先同量级开源多模态大模型,还超越了 GPT-5 和 Gemini 2.5 Pro 等国际顶尖闭源模型的表现。

空间智能短板与系统性解决

当下行业领先的大模型,虽然在知识、写作、推理、编程等方面展示了突出的性能,但是普遍存在一个重要的缺陷,就是对空间结构的理解和推理存在很严重的短板,而这恰恰是具身智能体与世界交互所需要的关键基础能力。

我们来看一个例子,左图源自最强大脑的图形推理题,对人类都具有相当的难度,GPT-5能够轻松破解,可见它在非空间智能问题上已具备很强能力。反观右图,是一道人类儿童都能轻易解决的简单空间问题,要求选择正确俯视图,GPT-5却令人意外地犯起了难,错误地选择了"A”。


以上例子恰好暴露了当前大模型在空间理解上的短板。因此要让AI真正"看懂"三维世界,空间智能一直是关键的试金石。

商汤围绕空间智能进行了深入创新探索,找到了提升空间智能的系统性训练方法,打造了日日新·空间智能大模型系列 SenseNova-SI 并正式开源。

评测表现多项任务超越GPT-5,显著领先同量级开源模型

这次开源的SenseNova-SI空间智能大模型系列包括 2B 和 8B 两个规格。

最新评测数据显示,SenseNova-SI系列模型在空间智能多个基准测试(VSI、MMSI、MindCube、ViewSpatial)中表现突出,具体如下:


数据来源:https://github.com/OpenSenseNova/SenseNova-SI

其中SenseNova-SI-8B模型在四个基本评测中获得 60.99 的平均成绩,不仅大幅领先Qwen3-VL-8B(40.16)、BAGEL-7B(35.01)等开源通用多模态模型,以及 SpatialMLLM(35.05)、ViLaSR-7B(36.41) 等专门的空间智能模型,还以相对轻量的模型规格实现了对GPT-5(49.68)、Gemini-2.5-Pro(48.81)等顶级闭源模型的超越。这里显著的性能提升反映了模型在空间智能上获得了质的突破,而不是简单的性能改善。

基于"尺度效应"的训练范式,实现能力系统性提升​

SenseNova-SI的性能飞跃,源于商汤从训练数据到方法上的系统性方案。依托商汤提出的空间能力分类体系和过往多样化的数据的积累,团队采用系统化的方法扩充空间理解数据的规模,首次在空间智能领域验证了“尺度效应”,即通过高质量、大规模数据训练,可显著提升模型的空间认知能力。

商汤提出的训练范式具备通用性,能够针对不同架构的基模型(如InternVL等)进行有效增强,使其在空间智能六大核心维度上——包括空间测量、空间重构、空间关系、视角转换、空间形变与空间推理——实现一致性的能力提升。

商汤稍后将发布详细的技术报告,详细阐述具体的技术方案。

以下为GPT-5和SenseNova-SI-8B模型面对空间智能问题,给出的答案对比。


​​给出的立方体组合图形,要求选择正确俯视图。GPT-5选择答案D,SenseNova-SI-8B选择答案B,正确答案为B。(例题源自SITE-Bench)


假设我站在手持相机人的位置,并且面朝他现在面朝的方向。摩托车是位于我的左侧还是右侧? GPT-5选择答案A(左侧),SenseNova-SI-8B选择答案B,​​正确答案为B(右侧)。(例题源自SITE-Bench)


多车道道路场景,判断黄色汽车的后续动作(如直行、转向等)。GPT-5选择答案C(静止),SenseNova-SI-8B选择答案(D),​​正确答案为D(右转)​​。(例题源自SITE-Bench)


同一户外场景,通过视角变化判断移动方向。GPT-5选择答案C,SenseNova-SI-8B选择答案D,正确答案为向左前方移动(选项D)。(例题源自MindCube)


同一室内空间,包含白板、椅子和沙发等,通过物体位置变化分析移动方向。GPT-5选择答案D,SenseNova-SI-8B选择答案A,正确答案为向左前方移动(选项A)。(例题源自MindCube)


从不同角度拍摄带黑色衣物的桌子,从正面视角(图1)判断桌子右侧物体。GPT-5选择答案B,SenseNova-SI-8B选择答案C,正确答案为门(选项C)。(例题源自MindCube) 推动世界模型和具身智能生态发展

空间智能是世界模型与具身智能理解物理世界的基础能力。今年7月,商汤正式发布“悟能”具身智能平台,该平台以商汤“开悟”世界模型为核心引擎,旨在为机器人和智能设备提供在物理世界中自主探索和进化的能力。

此次发布的空间智能大模型SenseNova-SI,与“开悟”世界模型相辅相成,将更好地解决多模态模型从数字空间走向物理世界的基础挑战,并在未来进一步推动AI在自动驾驶、机器人等场景的应用。

此外,商汤还同步开源了空间智能测评平台 EASI(https://github.com/EvolvingLMMs-Lab/EASI)与“英雄榜”,旨在推动空间智能技术评估标准的统一,持续跟踪并展示开源和闭源模型的性能进展,为学术界和工业界提供权威的评估基准,促进协同创新。

商汤SenseNova-SI的推出标志着AI在三维世界理解能力上迈出关键一步,也为下一代通用人工智能技术融入物理世界打下坚实基础。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
不是那个年代的,你真看不懂

不是那个年代的,你真看不懂

深度报
2026-02-15 23:01:53
3人爆冷出局!王皓脸色铁青,国乒男单到底怎么了

3人爆冷出局!王皓脸色铁青,国乒男单到底怎么了

江湖第一菜鸡
2026-02-25 11:15:32
航发这块也开始飚速!光是WS-10的产量就已接近1000台/年

航发这块也开始飚速!光是WS-10的产量就已接近1000台/年

Thurman在昆明
2026-02-23 12:44:40
毛奇、李佩霞2026年近况公布,两人服刑结局给所有人提了醒

毛奇、李佩霞2026年近况公布,两人服刑结局给所有人提了醒

娱乐督察中
2026-02-21 03:23:47
48年廖耀湘被我军俘虏,邓华听闻后走到廖跟前:给你一根好烟抽抽

48年廖耀湘被我军俘虏,邓华听闻后走到廖跟前:给你一根好烟抽抽

明月清风阁
2026-02-26 08:15:07
财政压力的下半场:退休人员占比近四成,才是硬账

财政压力的下半场:退休人员占比近四成,才是硬账

超先声
2026-01-09 16:45:39
小杨阿姨挺怕丢掉工作的,再没有接到汪小菲电话的时候,她心不安

小杨阿姨挺怕丢掉工作的,再没有接到汪小菲电话的时候,她心不安

魔都姐姐杂谈
2026-02-25 19:24:42
63岁黄仁勋生日宴请了30位SK海力士工程师:亲自倒酒 只为HBM4内存供应

63岁黄仁勋生日宴请了30位SK海力士工程师:亲自倒酒 只为HBM4内存供应

快科技
2026-02-25 16:44:08
大杨扬冬奥后发声直戳中国短道痛点,分组负责+队内选拔或能破局

大杨扬冬奥后发声直戳中国短道痛点,分组负责+队内选拔或能破局

杨华评论
2026-02-25 21:29:15
笑麻了!娃他爸别再打电话了,你娃很忙且不想你!评论区太逗了

笑麻了!娃他爸别再打电话了,你娃很忙且不想你!评论区太逗了

另子维爱读史
2026-02-25 22:07:46
成都中小学即将迎来近年来“最短春季学期”

成都中小学即将迎来近年来“最短春季学期”

爱看头条
2026-02-25 10:42:02
真正的“逆龄运动”,坚持一年大脑年轻2.3岁!不是跑步、走路……

真正的“逆龄运动”,坚持一年大脑年轻2.3岁!不是跑步、走路……

人民日报健康客户端
2026-02-25 07:34:27
当时很多蒙古考察日记中,都提到蒙古人性交随意,得病者极多!

当时很多蒙古考察日记中,都提到蒙古人性交随意,得病者极多!

老范谈史
2026-02-24 14:51:55
【独家】魅族手机或将成为历史:业务实质性停摆,3月正式退市

【独家】魅族手机或将成为历史:业务实质性停摆,3月正式退市

界面新闻
2026-02-25 18:25:25
步数2万,事发后镇长微信运动被曝,平顶山被打女孩舆论发酵很快

步数2万,事发后镇长微信运动被曝,平顶山被打女孩舆论发酵很快

社会日日鲜
2026-02-25 05:48:12
上海楼市“新七条”落地当天:两类群体咨询升温,有房东重新挂牌

上海楼市“新七条”落地当天:两类群体咨询升温,有房东重新挂牌

澎湃新闻
2026-02-25 22:22:28
扎哈罗娃警告被击落的美荷飞行员别指望怜悯

扎哈罗娃警告被击落的美荷飞行员别指望怜悯

纵拥千千晚星
2026-02-24 14:23:43
日经指数期货开盘上涨860点,报59630点

日经指数期货开盘上涨860点,报59630点

每日经济新闻
2026-02-26 07:45:04
古巴内务部:美籍快艇闯入古巴领海并开火,古方还击打死4人!美方展开调查

古巴内务部:美籍快艇闯入古巴领海并开火,古方还击打死4人!美方展开调查

每日经济新闻
2026-02-26 06:09:05
中国游客亲历莫斯科机场关闭:滞留时很焦虑,后续行程全打乱

中国游客亲历莫斯科机场关闭:滞留时很焦虑,后续行程全打乱

南方都市报
2026-02-25 16:52:10
2026-02-26 08:56:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2265512文章数 5541关注度
往期回顾 全部

科技要闻

“机器人只跳舞,没什么用”

头条要闻

中方对日方出口管制措施落地后 高市早苗表态了

头条要闻

中方对日方出口管制措施落地后 高市早苗表态了

体育要闻

勇士爆冷惜败鹈鹕 梅尔顿28分赛季新高

娱乐要闻

黄晓明新恋情!与小22岁美女同游新加坡

财经要闻

短剧市场风云突变!有人投百万赔得精光

汽车要闻

750km超长续航 2026款小鹏X9纯电版将于3月2日上市

态度原创

健康
艺术
游戏
时尚
房产

转头就晕的耳石症,能开车上班吗?

艺术要闻

一幅眼花缭乱草书:从书法创作到青少年书法教育的思考

《FF7重制版》NS2版克劳德头发有锯齿 官方回应

伦敦时装周|2026秋冬流行趋势早知道

房产要闻

海南楼市春节热销地图曝光!三亚、陵水又杀疯了!

无障碍浏览 进入关怀版