三维内容生成有个老毛病叫"双面神问题"——模型总把正面和背面特征混在一起,造出前后矛盾的形象。一支研究团队重新设计了负提示算法,让原本只能跑二维图像的扩散模型直接输出三维资产。
核心改动在采样阶段。传统方法靠文本反向描述来排除不想要的结果,新方案把负提示的干预时机和强度重新编排,让模型在生成过程中自发学习空间一致性。实验显示,这种方法不需要重新训练基础模型,即插即用。
![]()
更意外的是副作用。同样的思路应用到视频生成时,时间轴上的闪烁和不连贯明显减轻。团队认为这揭示了扩散模型的一个深层特性:负提示不只是"减法",它的调度方式决定了模型对三维结构或时间连续性的理解程度。
![]()
论文已公开,代码仓库即将发布。对做3D资产生成或视频生成的团队来说,这可能是个不用换模型的低成本改进方案。
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.