网易首页 > 网易号 > 正文 申请入驻

群核科技发布空间大模型,旨在解决AI视频空间一致性难题

0
分享至

8月25日,在首届技术开放日(TechDay)上,群核科技正式发布了其空间大模型的最新成果:新一代空间语言模型SpatialLM 1.5与空间生成模型SpatialGen,并宣布将延续开源战略,逐步向全球开发者开放模型。

作为专注于3D室内场景认知与生成的模型体系,群核空间大模型主要围绕真实感全息漫游、结构化可交互及复杂室内场景处理三个方向构建其技术优势。

本次发布的SpatialLM 1.5是一款基于大语言模型训练的空间语言模型 。群核科技首席科学家周子寒在技术交流中解释,SpatialLM并非在视觉语言模型(VLM)上增加新模态,而是让大语言模型学会了一种新的“空间语言”。这种语言能以数字文本的形式,精确描述场景中物体的空间结构、几何信息、相互关系及物理参数。

通过对话系统SpatialLM-Chat,用户输入简单的文本指令,模型即可自动生成包含物理正确信息的结构化3D场景脚本,并智能匹配家具进行布局。该模型还能通过自然语言进行场景问答与编辑,例如,在现场演示中,当输入“去客厅餐桌拿药”指令后,模型不仅理解了物体对象,还调用工具自动规划出行动路径,展示了其在机器人场景中的应用潜力。

群核科技联合创始人兼董事长黄晓煌在演讲中提到,当前空间智能发展的一大瓶颈在于三维可交互数据的稀缺,尤其是在物理世界对应的室内空间数据获取难度极大。SpatialLM 1.5能够快速、批量地生成大量符合要求且多样化的场景,可直接用于机器人路径规划、避障和任务执行等训练,为解决当前机器人训练数据不足的难题提供了有效途径。

与SpatialLM专注于“理解与交互”不同,SpatialGen模型则聚焦于“生成与呈现”。它是一款基于扩散模型架构的多视角图像生成模型,可根据文字、参考图和3D空间布局,生成具有时空一致性的多视角图像。

群核科技AI产品总监龙天泽指出,当前主流AI视频生成工具基于2D图像序列学习,缺乏对3D空间和物理规则的真正理解,因此在视角切换或复杂运动时,常出现物体位置偏移、背景混乱、模型穿模等空间逻辑错误。

SpatialGen通过生成空间属性和物理关系在不同镜头下保持一致的多视角图像,并能进一步生成3D高斯(3DGS)场景,最终渲染出可供用户自由漫游的视频 。这一方案旨在从根本上解决当前AIGC视频生成中的时空一致性难题 。龙天泽透露,公司正在研发一款深度融合3D能力的AI视频生成产品,计划于年内发布。

黄晓煌在活动现场分享了群核科技的空间智能战略布局,其核心是“空间编辑工具-空间合成数据-空间大模型”构成的空间智能飞轮 。通过酷家乐等工具的广泛应用,沉淀海量数据;利用这些数据加速模型训练;再以强大的模型能力反哺和提升工具体验,从而形成正向循环 。截至2025年6月30日,群核科技已拥有超过4.41亿个3D模型及超过5亿个结构化3D空间场景。

黄晓煌表示,开源是群核科技战略的重要组成部分,公司自2018年起便开始逐步开放数据和算法能力。他认为,当前空间大模型尚处初级阶段,希望通过开源与全球开发者共同将“蛋糕”做大,推动技术快速前进。

据悉,本次发布的两款模型将陆续在Hugging Face、GitHub和魔搭社区等平台开源 。其中,SpatialGen在技术开放日当天已开放下载,而SpatialLM 1.5未来也将以“SpatialLM-Chat”的形式完成开源。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
泰国国王哇集拉隆功将对中国进行国事访问

泰国国王哇集拉隆功将对中国进行国事访问

上观新闻
2025-11-06 15:29:39
销量第一被“绝杀”!终于疲态显现,比亚迪快装不下去了?

销量第一被“绝杀”!终于疲态显现,比亚迪快装不下去了?

小李车评李建红
2025-11-04 07:41:58
大快人心,缅北白家判了,那些为四大家族站台的曾志伟们没事了

大快人心,缅北白家判了,那些为四大家族站台的曾志伟们没事了

电影票房预告片
2025-11-05 22:46:05
中方下了“最后通牒”,认定荷兰100%担责,再不悔改一切后果自负

中方下了“最后通牒”,认定荷兰100%担责,再不悔改一切后果自负

阿柒的讯
2025-11-06 14:30:28
不到24小时,人民日报四次点名全红婵,陈若琳的话终于有人信了

不到24小时,人民日报四次点名全红婵,陈若琳的话终于有人信了

枫尘余往逝
2025-11-05 21:01:12
离谱!东南亚电诈园区办公室里,竟然出现了中文横幅……

离谱!东南亚电诈园区办公室里,竟然出现了中文横幅……

麦杰逊
2025-11-05 12:52:35
不请洋帅 足协为何请经验不足的邵佳一做国足主帅 主要有3点原因

不请洋帅 足协为何请经验不足的邵佳一做国足主帅 主要有3点原因

零度眼看球
2025-11-06 06:40:10
演员祝新运:凭借潘冬子火遍全国,却娶了离异还大3岁的妻子

演员祝新运:凭借潘冬子火遍全国,却娶了离异还大3岁的妻子

揽星河的笔记
2025-11-05 13:55:47
《新闻女王2》的播出告诉观众:错误的营销方式,真的很毁剧!

《新闻女王2》的播出告诉观众:错误的营销方式,真的很毁剧!

海绵宝宝的心事
2025-11-06 12:15:59
小米员工晒地库被群嘲!3款同色YU7一字排开,网友:别尬演了

小米员工晒地库被群嘲!3款同色YU7一字排开,网友:别尬演了

公子麦少
2025-11-05 15:37:08
杜兰特连续低迷火箭仍赢球!记者:幸好他失常次数少

杜兰特连续低迷火箭仍赢球!记者:幸好他失常次数少

运动全视界
2025-11-06 15:30:22
村里建广场我赞助40万,却发现没我名字我淡定离开,三天后村长懵了

村里建广场我赞助40万,却发现没我名字我淡定离开,三天后村长懵了

眼泪博物
2025-08-22 18:21:23
刘强东问蔡磊钱够吗?蔡哽咽:儿子才1岁!随后刘的决定令蔡泪崩

刘强东问蔡磊钱够吗?蔡哽咽:儿子才1岁!随后刘的决定令蔡泪崩

瑶卿文史
2025-10-29 22:56:09
蒋介石死后,无子女的宋美龄,靠啥在美国过了28年奢华生活?

蒋介石死后,无子女的宋美龄,靠啥在美国过了28年奢华生活?

牛马搞笑
2025-11-01 09:52:48
米切尔46+8赛季新高骑士力克76人 马克西27+7+9探花14中3

米切尔46+8赛季新高骑士力克76人 马克西27+7+9探花14中3

醉卧浮生
2025-11-06 10:36:33
欧冠狂欢夜:曼城4-1多特 切尔西2-2+巴萨3-3 穆里尼奥开局4连败

欧冠狂欢夜:曼城4-1多特 切尔西2-2+巴萨3-3 穆里尼奥开局4连败

侃球熊弟
2025-11-06 05:06:12
被剪刀差剪掉的一生:1.8亿农村老人为何只能靠百元养老金度日?

被剪刀差剪掉的一生:1.8亿农村老人为何只能靠百元养老金度日?

霹雳炮
2025-11-02 20:52:08
神二十飞船疑遭撞击,没预警系统?3名航天员、4鼠乘组延期返回

神二十飞船疑遭撞击,没预警系统?3名航天员、4鼠乘组延期返回

普陀动物世界
2025-11-06 00:12:28
湖人险胜!东契奇35+9+13,赛后谁留意老詹?走入场内和队友庆祝

湖人险胜!东契奇35+9+13,赛后谁留意老詹?走入场内和队友庆祝

担酒
2025-11-06 14:14:13
被谢贤养了12年,用青春换来2000万的Coco,已经走上了另一条道路

被谢贤养了12年,用青春换来2000万的Coco,已经走上了另一条道路

徐徐道史
2025-11-04 18:34:05
2025-11-06 16:08:49
36氪 incentive-icons
36氪
让一部分人先看到未来
149755文章数 2847180关注度
往期回顾 全部

科技要闻

苹果“认输”!曝每年10亿美元租用谷歌AI

头条要闻

男子打车将手机遗忘车内 司机将手机"丢"到300公里外

头条要闻

男子打车将手机遗忘车内 司机将手机"丢"到300公里外

体育要闻

送走两位全明星,公牛成了东部第一

娱乐要闻

白百何好友揭露争奖细节

财经要闻

南银法巴加速发展背后:资金饥渴症待解

汽车要闻

是我眼花了么?怎么大猩猩都来参加新车发布了?

态度原创

游戏
家居
教育
艺术
公开课

95%好评动作×模拟经营单机二游:你想要的全都有

家居要闻

别样府院 畅享诗意生活

教育要闻

江苏科技大学就业好不好?就业服务贯穿全周期,太实了!

艺术要闻

“塑料凳”大厦?西安新地标213米造型引热议!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版