网易首页 > 网易号 > 正文 申请入驻

群核科技发布空间大模型,旨在解决AI视频空间一致性难题

0
分享至

8月25日,在首届技术开放日(TechDay)上,群核科技正式发布了其空间大模型的最新成果:新一代空间语言模型SpatialLM 1.5与空间生成模型SpatialGen,并宣布将延续开源战略,逐步向全球开发者开放模型。

作为专注于3D室内场景认知与生成的模型体系,群核空间大模型主要围绕真实感全息漫游、结构化可交互及复杂室内场景处理三个方向构建其技术优势。

本次发布的SpatialLM 1.5是一款基于大语言模型训练的空间语言模型 。群核科技首席科学家周子寒在技术交流中解释,SpatialLM并非在视觉语言模型(VLM)上增加新模态,而是让大语言模型学会了一种新的“空间语言”。这种语言能以数字文本的形式,精确描述场景中物体的空间结构、几何信息、相互关系及物理参数。

通过对话系统SpatialLM-Chat,用户输入简单的文本指令,模型即可自动生成包含物理正确信息的结构化3D场景脚本,并智能匹配家具进行布局。该模型还能通过自然语言进行场景问答与编辑,例如,在现场演示中,当输入“去客厅餐桌拿药”指令后,模型不仅理解了物体对象,还调用工具自动规划出行动路径,展示了其在机器人场景中的应用潜力。

群核科技联合创始人兼董事长黄晓煌在演讲中提到,当前空间智能发展的一大瓶颈在于三维可交互数据的稀缺,尤其是在物理世界对应的室内空间数据获取难度极大。SpatialLM 1.5能够快速、批量地生成大量符合要求且多样化的场景,可直接用于机器人路径规划、避障和任务执行等训练,为解决当前机器人训练数据不足的难题提供了有效途径。

与SpatialLM专注于“理解与交互”不同,SpatialGen模型则聚焦于“生成与呈现”。它是一款基于扩散模型架构的多视角图像生成模型,可根据文字、参考图和3D空间布局,生成具有时空一致性的多视角图像。

群核科技AI产品总监龙天泽指出,当前主流AI视频生成工具基于2D图像序列学习,缺乏对3D空间和物理规则的真正理解,因此在视角切换或复杂运动时,常出现物体位置偏移、背景混乱、模型穿模等空间逻辑错误。

SpatialGen通过生成空间属性和物理关系在不同镜头下保持一致的多视角图像,并能进一步生成3D高斯(3DGS)场景,最终渲染出可供用户自由漫游的视频 。这一方案旨在从根本上解决当前AIGC视频生成中的时空一致性难题 。龙天泽透露,公司正在研发一款深度融合3D能力的AI视频生成产品,计划于年内发布。

黄晓煌在活动现场分享了群核科技的空间智能战略布局,其核心是“空间编辑工具-空间合成数据-空间大模型”构成的空间智能飞轮 。通过酷家乐等工具的广泛应用,沉淀海量数据;利用这些数据加速模型训练;再以强大的模型能力反哺和提升工具体验,从而形成正向循环 。截至2025年6月30日,群核科技已拥有超过4.41亿个3D模型及超过5亿个结构化3D空间场景。

黄晓煌表示,开源是群核科技战略的重要组成部分,公司自2018年起便开始逐步开放数据和算法能力。他认为,当前空间大模型尚处初级阶段,希望通过开源与全球开发者共同将“蛋糕”做大,推动技术快速前进。

据悉,本次发布的两款模型将陆续在Hugging Face、GitHub和魔搭社区等平台开源 。其中,SpatialGen在技术开放日当天已开放下载,而SpatialLM 1.5未来也将以“SpatialLM-Chat”的形式完成开源。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
李湘多个平台账号被禁止关注

李湘多个平台账号被禁止关注

界面新闻
2026-01-16 10:56:48
《寻秦记》开慰劳宴,古天乐强颜欢笑,账面亏损1亿

《寻秦记》开慰劳宴,古天乐强颜欢笑,账面亏损1亿

光影新天地
2026-01-14 18:04:04
老公坚持AA八年,我确诊癌,他问:30万治疗费能分期A吗?

老公坚持AA八年,我确诊癌,他问:30万治疗费能分期A吗?

真实人物采访
2026-01-15 14:00:03
高考719分我骗女友考408,她转身跟学霸去清华!开学我们四目相对

高考719分我骗女友考408,她转身跟学霸去清华!开学我们四目相对

星宇共鸣
2026-01-13 09:20:02
升西部第二!文班22+10受伤惊魂 马刺最多领先39分大胜雄鹿

升西部第二!文班22+10受伤惊魂 马刺最多领先39分大胜雄鹿

醉卧浮生
2026-01-16 11:23:40
“深圳奇迹”何以续写?“新三驾马车”,正驶向星辰大海

“深圳奇迹”何以续写?“新三驾马车”,正驶向星辰大海

智谷趋势
2026-01-15 22:18:36
周六周日,北京全市降雪,主要时段公布,白天最高气温降至0℃以下

周六周日,北京全市降雪,主要时段公布,白天最高气温降至0℃以下

鲁中晨报
2026-01-16 12:27:05
没有伴侣,健康会更差吗?来自50万中国人的长期追踪证据

没有伴侣,健康会更差吗?来自50万中国人的长期追踪证据

严肃的人口学八卦
2026-01-16 15:15:42
天龙集团的7.86万股民彻底赢麻

天龙集团的7.86万股民彻底赢麻

看财经show
2026-01-15 13:20:26
北京一女子在超市6次盗窃车厘子,被警方刑拘;其在单位做法务、收入高,一斤车厘子价格才30元

北京一女子在超市6次盗窃车厘子,被警方刑拘;其在单位做法务、收入高,一斤车厘子价格才30元

大风新闻
2026-01-15 11:59:04
“装死”小羊身价飙至30万,专家:“装死”非“演技”在线,系因遗传缺陷,可以人工繁殖更多只

“装死”小羊身价飙至30万,专家:“装死”非“演技”在线,系因遗传缺陷,可以人工繁殖更多只

极目新闻
2026-01-16 11:05:37
A股:今天,放量并未大涨,迹象明显了,不出所料,很可能这样走

A股:今天,放量并未大涨,迹象明显了,不出所料,很可能这样走

八斗小先生
2026-01-16 12:17:56
从11000例手术到强制腾退:嫣然天使儿童医院困境揭示明星公益沉疴

从11000例手术到强制腾退:嫣然天使儿童医院困境揭示明星公益沉疴

看看新闻Knews
2026-01-16 12:37:21
A股:大家做好准备了,下周一(1月19日),A股或将迎来大变盘?

A股:大家做好准备了,下周一(1月19日),A股或将迎来大变盘?

财经大拿
2026-01-16 13:41:32
原来他就是聂卫平长子,移民日本改国籍娶日本妻,拒绝让儿子姓聂

原来他就是聂卫平长子,移民日本改国籍娶日本妻,拒绝让儿子姓聂

一娱三分地
2026-01-15 16:10:35
第三轮中日争端打响,日本要登岛调查,简直强词夺理,中方表态了

第三轮中日争端打响,日本要登岛调查,简直强词夺理,中方表态了

时时有聊
2026-01-15 20:34:48
与辉同行3只“皖西麻黄鸡”84元?协会会长:这个价连半只都买不到!实探生产厂商注册地:村民称附近没有养殖场或屠宰场

与辉同行3只“皖西麻黄鸡”84元?协会会长:这个价连半只都买不到!实探生产厂商注册地:村民称附近没有养殖场或屠宰场

每日经济新闻
2026-01-16 00:38:17
牛鬼神蛇现原形!聂卫平去世仅一天,私生活被扒,王刚郎平被牵连

牛鬼神蛇现原形!聂卫平去世仅一天,私生活被扒,王刚郎平被牵连

春露秋霜
2026-01-16 06:27:20
关闭102家门店!胡锡进:贾国龙不该那么蠢,互联网也不该这么狠

关闭102家门店!胡锡进:贾国龙不该那么蠢,互联网也不该这么狠

火山诗话
2026-01-16 06:11:54
中国证监会召开2026年系统工作会议

中国证监会召开2026年系统工作会议

界面新闻
2026-01-16 15:34:22
2026-01-16 16:20:49
36氪 incentive-icons
36氪
让一部分人先看到未来
150436文章数 2847765关注度
往期回顾 全部

科技要闻

被网友"催"着走,小米紧急"抄"了特斯拉

头条要闻

洪秀柱:既然早晚要统一 不如赶快统一吧

头条要闻

洪秀柱:既然早晚要统一 不如赶快统一吧

体育要闻

全队身价=登贝莱,他们凭什么领跑法甲?

娱乐要闻

黄慧颐手撕保剑锋 曾黎意外卷入风波

财经要闻

深圳有白银商家爆雷 维权群超350人

汽车要闻

方程豹品牌销量突破30万辆 2026年还将推出轿跑系列

态度原创

房产
健康
亲子
教育
手机

房产要闻

突发!商业用房购房贷款最低首付比例下调至30%

血常规3项异常,是身体警报!

亲子要闻

当何美延开始亲自带孩子,世界都变得和谐了

教育要闻

西安交通大学出国怎么样?破解留学冲刺困局!解锁范式!

手机要闻

消息称vivo X300 Ultra或配多光谱镜头,影像实力值得期待

无障碍浏览 进入关怀版