网易首页 > 网易号 > 正文 申请入驻

SIGGRAPH Asia 2025 | 让3D场景生成像「写代码」一样灵活可控

0
分享至



随着生成式 AI 的快速发展,从文本生成图像、视频,到构建完整的三维世界,AI “创造空间” 的能力正以前所未有的速度突破边界。然而,现有 3D 场景生成方法仍存在明显局限:模型往往直接输出每个物体的几何参数(位置、大小、方向等),结果容易出现漂浮、重叠、穿模等问题;场景结构缺乏逻辑一致性,难以编辑或复用,更无法像程序那样精确控制空间关系与生成逻辑。

想象这样一个画面:你输入一句话 ——

“在黄昏的码头上,一位渔夫坐在木椅上,旁边是一盏摇曳的灯。”

AI 不再只是 “摆放” 这些元素,而是生成一段可执行的三维构建脚本:从灯光的照射角度到渔夫与木椅的相对位置,都由程序逻辑自动推导与控制。

这种 “从语言到程序再到场景” 的新范式,正是由布朗大学(Brown University)与加州大学圣地亚哥分校(UC San Diego)的研究团队提出的 Procedural Scene Programs(PSP) 框架。

与传统的几何直接生成方法不同,PSP 让 AI 不再是 “画” 出一个世界,而是像程序员一样 “写” 出世界的生成逻辑。模型输出的不是静态的三维网格,而是一段可运行的场景脚本,具备高度的可编辑性、可复用性与结构可控性—— 为 AI 世界构建带来了新的语言与思维方式。

该研究已被计算机图形学顶会 SIGGRAPH Asia 2025 接收。





  • 论文题目:Procedural Scene Programs for Open-Universe Scene Generation: LLM-Free Error Correction via Program Search
  • 作者:Maxim Gumin, Do Heon Han, Seung Jean Yoo, Aditya Ganeshan, R. Kenny Jones, Kailiang Fu(傅楷量), Rio Aguina-Kang, Stewart Morris, Daniel Ritchie
  • 论文链接:https://arxiv.org/abs/2510.16147

方法

研究团队提出的 Procedural Scene Programs(PSP) 是一个两阶段的程序化场景生成系统。它的核心思想是:让 AI 不再直接输出三维几何,而是先生成可执行的构建脚本,再通过程序执行构建出完整场景。

整个系统由两大关键组件组成:

1.Procedural Scene Description Language(PSDL)—— 用来 “写” 出生成世界的程序语言;

2.Program Search 纠错模块—— 在程序执行后自动检测并修复几何错误。

PSDL 负责 “生成逻辑”,Program Search 负责 “结果修正”。这种 “先生成、再调试” 的机制,使得 AI 不仅能自动搭建三维场景,还能在程序层面自我修复错误,从而生成结构合理、物理一致的世界。

1. 程序化生成语言 PSDL:让 AI 写出世界的规则

传统的三维场景生成模型通常直接预测每个物体的位置、大小和方向。然而,由于 AI 并不具备完善的空间想象与物理推理能力,这种方法往往会导致物体漂浮、重叠等问题。为此,PSP 引入了 Procedural Scene Description Language(PSDL),让模型不再 “直接想象空间”,而是以程序逻辑来表达空间关系。PSDL 嵌入在 Python 中,支持函数、循环、条件与变量绑定,使模型能够通过编写规则的方式来定义场景的结构与布局。

例如:

foriin range (3):

place ('chair', around='table', angle=i*120)

这样的语句不仅表达了 “放三把椅子” 的结果,也清晰地定义了 “围绕桌子等角放置” 的空间关系。这种形式让生成过程具备了可编辑、可扩展、可复用的特性,使模型真正具备了 “程序化建模” 的能力。



2. 纠错模块 Program Search:自动修复几何错误

在生成完成后,PSP 会通过 Program Search 模块对场景进行结构与几何一致性检测。与传统需要反复调用大模型修正错误的方式不同,PSP 直接在程序空间中搜索修复方案,无需再次推理。

研究团队定义了多种几何一致性指标,如物体重叠率、支撑关系和遮挡情况。当检测到异常时,系统会自动替换变量或微调表达式,从程序层修复问题。

实验结果显示,PSP 平均只需 约 7 次程序修改 即可修复大多数错误,且完全无需重新调用 LLM。这种符号级修正机制让生成过程更稳定、更具可解释性,并显著提升了三维场景的物理合理性。



效果与对比

在 70 个开放世界场景提示(涵盖自然、建筑、幻想等多样主题)上,研究团队对比了三种代表性方法:声明式布局系统 DeclBase、约束驱动的 Holodeck,以及本文提出的 Procedural Scene Programs(PSP)。

结果显示,PSP 在人类主观评测中显著领先 ——在与 DeclBase 的对比中获得 82.9% 的偏好率,与 Holodeck 的对比中则达到 94.3%。同时,PSP 的生成速度也更快:从文本到完整场景平均仅需约 38 秒,而 DeclBase 与 Holodeck 分别需要 40.8 秒 与 约 42 秒。



除了人类主观评测外,研究团队还提出了一种基于多模态 LLM 的自动化评估方法,用于衡量生成场景在语义一致性与视觉合理性上的表现。在 PSP 与 DeclBase、Holodeck 的对比中,该自动评测方法分别给出 77.1% 与 90.0% 的 PSP 偏好选择率,与人类主观偏好(82.9% 与 94.3%)趋势一致,证明了其在未来三维场景生成质量评测中的可靠性与参考价值。



意义与展望

这项研究揭示了一个重要趋势:未来的 3D 场景生成,可以不再只是从文本到几何的单向映射,而是一个“程序写世界(Program the World)”的过程。

通过 Procedural Scene Programs(PSP),AI 的 “想象力” 可以与 “编程逻辑” 深度融合:它既继承了命令式生成的灵活性与层次表达能力,又以符号化修正机制弥补了大模型在空间推理与逻辑一致性上的脆弱。这一范式转变,让模型不只是理解世界的观察者,而成为主动构建世界的开发者。

正如论文作者所言:

“Our approach re-establishes the strengths of imperative scene layout programs while overcoming their fragility to LLM errors.”

PSP 通过程序语言与自动纠错机制的结合,为 3D 内容生成带来了前所未有的可控性与自解释性。无论是虚拟城市、游戏关卡,还是具身智能的视觉环境,这一框架都为 AI 世界的构建提供了新的逻辑与基础。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
原“亚洲最大宜家门店”即将关闭!会有清仓活动吗?宜家中国回应

原“亚洲最大宜家门店”即将关闭!会有清仓活动吗?宜家中国回应

大风新闻
2026-01-07 23:21:03
郑州一业主因物业纠纷堵住小区车辆入口6次报警,民警强制传唤致其受伤 法院判决:超出必要限度

郑州一业主因物业纠纷堵住小区车辆入口6次报警,民警强制传唤致其受伤 法院判决:超出必要限度

红星新闻
2026-01-07 23:38:19
韩国大胆提议:建设首尔至北京高铁,但有一个条件,中方须先答应

韩国大胆提议:建设首尔至北京高铁,但有一个条件,中方须先答应

华史谈
2026-01-07 07:07:21
湖人惨败马刺,东契奇空砍38+10+10!一战看清5个现实:3人该交易

湖人惨败马刺,东契奇空砍38+10+10!一战看清5个现实:3人该交易

毒舌NBA
2026-01-08 13:13:52
雷军全面回应“营销大师”标签:娱乐节目中刘强东团队开个玩笑,被人放大利用,现在听到营销两个字都有点恶心

雷军全面回应“营销大师”标签:娱乐节目中刘强东团队开个玩笑,被人放大利用,现在听到营销两个字都有点恶心

每日经济新闻
2026-01-08 00:48:20
宜家的问题已经挺严重了

宜家的问题已经挺严重了

蔚然未来消费
2026-01-08 08:34:50
布伦森26+7尼克斯击沉快船结束4连败,唐斯20+11+7小卡25分

布伦森26+7尼克斯击沉快船结束4连败,唐斯20+11+7小卡25分

湖人崛起
2026-01-08 10:53:40
女子为打压丈夫,长期喂猪饲料致其增重260斤,最终结果来了

女子为打压丈夫,长期喂猪饲料致其增重260斤,最终结果来了

思思夜话
2026-01-05 14:46:08
委代理总统召开工作会议 强调营救马杜罗夫妇等

委代理总统召开工作会议 强调营救马杜罗夫妇等

环球网资讯
2026-01-08 06:20:32
湖南一男子在高速上开车使用辅助驾驶,酣睡20公里后撞上护栏

湖南一男子在高速上开车使用辅助驾驶,酣睡20公里后撞上护栏

环球网资讯
2026-01-07 19:35:13
为什么总统被绑架,委内瑞拉股票和债券反而双双暴涨?背后有一个冷酷的真相!

为什么总统被绑架,委内瑞拉股票和债券反而双双暴涨?背后有一个冷酷的真相!

识局Insight
2026-01-08 07:19:46
德媒:中国技术最大的原罪,就是害德国人太上瘾了,想戒都戒不掉

德媒:中国技术最大的原罪,就是害德国人太上瘾了,想戒都戒不掉

不似少年游
2026-01-08 07:11:36
74岁王石坐公务舱出行!没戴假发状态疲惫,拿手机坐窗口认真拍照

74岁王石坐公务舱出行!没戴假发状态疲惫,拿手机坐窗口认真拍照

李健政观察
2026-01-07 23:45:35
中方反制后,日本萌生大胆想法,西方媒体发出提醒,别忘了16年前

中方反制后,日本萌生大胆想法,西方媒体发出提醒,别忘了16年前

博览历史
2026-01-07 17:10:36
黄仁勋的“物理AI”,对中国制造来说真不是好消息

黄仁勋的“物理AI”,对中国制造来说真不是好消息

星海情报局
2026-01-07 18:34:49
就换个LOGO?格力海报被抄袭,怒喊友商:“抄得挺像的,下次别抄了”

就换个LOGO?格力海报被抄袭,怒喊友商:“抄得挺像的,下次别抄了”

LOGO研究所
2026-01-08 09:32:19
闫学晶奢侈风波升级!官媒出手锐评,韩红却因一特殊举动口碑暴增

闫学晶奢侈风波升级!官媒出手锐评,韩红却因一特殊举动口碑暴增

李健政观察
2026-01-06 21:18:10
“刚买的新车,就要拆发动机大修!”知名大牌汽车,引发沪上消费者“集体维权”

“刚买的新车,就要拆发动机大修!”知名大牌汽车,引发沪上消费者“集体维权”

新民晚报
2026-01-07 20:30:39
2026央视春晚彩排曝光,令人担心的事还是发生了:不该来的都来了

2026央视春晚彩排曝光,令人担心的事还是发生了:不该来的都来了

银河史记
2026-01-06 17:22:24
75比93狂输18分!女篮争冠大热被掀翻:张子宇7分1板被锁死了?

75比93狂输18分!女篮争冠大热被掀翻:张子宇7分1板被锁死了?

篮球快餐车
2026-01-08 01:23:41
2026-01-08 13:31:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12077文章数 142531关注度
往期回顾 全部

科技要闻

雷军:现在听到营销这两个字都有点恶心

头条要闻

委内瑞拉外长:感谢中方支持

头条要闻

委内瑞拉外长:感谢中方支持

体育要闻

约基奇倒下后,一位故人邪魅一笑

娱乐要闻

2026春节档将有六部电影强势上映

财经要闻

微软CTO韦青:未来人类会花钱"戒手机"

汽车要闻

不谈颠覆与奇迹,智驾企业还能聊点什么?

态度原创

房产
教育
亲子
数码
时尚

房产要闻

三亚新房,又全国第一了!

教育要闻

孩子的科技教育怎么跟上时代?

亲子要闻

你别做饭了,让孩子放学啃绿化带!宝妈抱怨女儿挑食,晒照后被怼

数码要闻

CES微星携手英特尔硬核升级,第三代Ultra重塑AI PC

蓝色+灰色、红色+棕色,这4组配色怎么搭都好看!

无障碍浏览 进入关怀版